Oagapov (обсуждение | вклад) м Oagapov переименовал страницу Kafka в Подключение Kafka и Clickhouse без оставления перенаправления |
Oagapov (обсуждение | вклад) Нет описания правки |
||
| Строка 1: | Строка 1: | ||
==== Краткое описание архитектуры подключения Платформы Эра к Kafka и СУБД Clickhouse ==== | |||
Связка Kafka и ClickHouse широко используется для хранения и обработки больших объёмов статистики, особенно в системах, где данные поступают непрерывно и в реальном времени. Kafka в этом тандеме выполняет роль промежуточного буфера: она собирает события из платформы Эра и надёжно сохраняет их в очередях — топиках. Kafka обеспечивает масштабируемость, высокую отказоустойчивость и гарантированную доставку данных, даже если аналитическая система временно недоступна. | |||
ClickHouse, в свою очередь, используется как высокопроизводительная аналитическая база данных, идеально подходящая для хранения больших массивов информации и молниеносного выполнения SQL-запросов. Благодаря колонковой архитектуре и эффективной компрессии, ClickHouse позволяет выполнять сложную аналитику на миллиардах строк практически мгновенно. В сочетании с Kafka получается гибкая, надёжная и масштабируемая архитектура: данные поступают в реальном времени, хранятся с минимальными затратами и мгновенно доступны для анализа, визуализации и построения отчётов. | |||
Рекомендация более 10 млн строк рассмотрите вариант использования Kafka в архивных таблицах | Рекомендация более 10 млн строк рассмотрите вариант использования Kafka в архивных таблицах | ||
Версия от 18:46, 1 апреля 2025
Краткое описание архитектуры подключения Платформы Эра к Kafka и СУБД Clickhouse
Связка Kafka и ClickHouse широко используется для хранения и обработки больших объёмов статистики, особенно в системах, где данные поступают непрерывно и в реальном времени. Kafka в этом тандеме выполняет роль промежуточного буфера: она собирает события из платформы Эра и надёжно сохраняет их в очередях — топиках. Kafka обеспечивает масштабируемость, высокую отказоустойчивость и гарантированную доставку данных, даже если аналитическая система временно недоступна.
ClickHouse, в свою очередь, используется как высокопроизводительная аналитическая база данных, идеально подходящая для хранения больших массивов информации и молниеносного выполнения SQL-запросов. Благодаря колонковой архитектуре и эффективной компрессии, ClickHouse позволяет выполнять сложную аналитику на миллиардах строк практически мгновенно. В сочетании с Kafka получается гибкая, надёжная и масштабируемая архитектура: данные поступают в реальном времени, хранятся с минимальными затратами и мгновенно доступны для анализа, визуализации и построения отчётов.
Рекомендация более 10 млн строк рассмотрите вариант использования Kafka в архивных таблицах
Наличие значимых таймаутов в построении отчетов (более 30 секунд)
Коробочный предельный таймаут построения отчетов 60 секунд.
Ожидаемый эффект - ожидаемый таймаут не более 1 секунды. Время построения отчетоа не зависит от количества строк в архивных таблицах.
Мониторинг ресурсов виден
Мониторинг сервисов не увидим
Тестировщик??
Поднять Kafka и Clickhouse достпные друг другу
В домене создать storage на кафку и clickhouse
Трейс для поднятия.
DMS использует Click house
Создаем класс, где в качестве хранилища используется. Хранилище типа transaction log
"storage_mode": "transaction_log"
storage:instance - название storage из шага выше.