Обзор системы Digital Q.DataFlows от компании Диасофт

Digital Q.DataFlows – универсальная платформа для управления данными, которая превратит разрозненную информацию в мощный инструмент для принятия управленческих решений.

Платформа поможет быстро интегрировать данные из множества источников и поддерживать их высокое качество, снижая затраты и время на обработку данных.

Типичные вызовы при работе с данными

  1. Разрозненность и разные форматы данных: Данные могут поступать из разных источников и в разных форматах, что требует дополнительной работы по их очистке и объединению.
  2. Отсутствие единого стандарта и структуры: В разных системах данные могут записываться по-разному, что затрудняет их сравнение и анализ.
  3. Недостаток навыков работы с данными: Часто требуется специфическая техническая экспертиза, чтобы понять, очистить и проанализировать данные, что усложняет работу для неспециалистов.
  4. Сложность интеграции и совместного использования данных: Данные могут находиться в разных системах или отделах, что затрудняет их объединение и совместное использование.

Как мы решаем задачи управления данными?

  • Сбор и интеграция данных из разных источников: Возможность подключения к различным источникам данных (базы данных, файлы, API). Инструменты для унификации и трансформации данных из разных форматов и систем в единую структуру.
  • Поддержка управления метаданными и lineage: Управление метаданными для понимания структуры данных и упрощения поиска. Возможность отслеживания происхождения данных (data lineage), чтобы понять их источник и влияние на каждом этапе.
  • Удобство работы для разных категорий пользователей: Интуитивно понятный интерфейс, доступный как для технических специалистов, так и для бизнес-пользователей. Набор функций, позволяющий работать с данными на разных уровнях сложности.
  • Автоматизация рабочих процессов и обработки данных в реальном времени: Генерация ETL-процессов на основании логических объектов. Возможность обеспечить своевременное обновление данных в режиме около реального времени.

Что предлагает платформа Digital Q.DataFlows?

  • База знаний о данных: Вся информация о данных и их источниках в одном месте.
  • Взаимосвязь данных: Визуализируйте происхождение данных.
  • Потоки данных: Создавайте быстро и легко свои потоки трансформации и извлечения данных.
  • Контроль качества: Повысьте качество данных, чтобы ускорить принятие решений.
  • Batch & Streaming: Реализуйте оптимальный сценарий доступа к данным.

Digital Q.DataFlows в цифрах

  • До 10-ти раз экономия времени за счет интуитивно понятного интерфейса.
  • 54 подключения к источникам за счет использования open-source решений.
  • 1 TB/час скорость загрузки за счет использования специализированных сервисов, тесно интегрированных с БД, и распараллеливания потоков.
  • 700 готовых проверок данных.

Data Catalog

Автоматизирует управление метаданными из любой информационной системы в едином месте, предоставляя пользователям полный контекст для аналитики данных и отчетности. Визуализирует путь данных на детальном уровне от источников до конечных витрин и отчетов. Data Catalog позволяет собирать данные из всех источников данных банка: учетные системы, файлы, Хранилище банка, Отчетность, регистрировать процессы преобразования данных.

Data Streamer

Позволяет быстро создавать процессы извлечения и преобразования данных в простом интерфейсе. Работает как в режиме streaming, так и в режиме batch. Автоматизирует сложные процессы из множества потоков данных для работы с «озером» и хранилищем данных. Data Streamer работает с реляционными базами данных (Postgres, Oracle, MS SQL, MySQL), специализированными аналитическими СУБД (Arenadata DB, Clickhouse), интеграцией с веб-сервисами через REST API, SOAP, документарными базами данных ElasticSearch, поддерживает Hadoop и работу с очередью сообщений Kafka.

Data Quality

Позволяет проверять качество данных с помощью конструктора проверок. Встраивает процессы проверки в потоки данных для контроля качества информации в рамках общих процессов организации. Формирует аналитику и визуализирует результаты проверок и протоколов в дашбордах качества данных. Data Quality позволяет контролировать качество данных в едином реестре проверок с использованием конструктора контроля, настраивать последовательность и периодичность контроля на любых источниках данных, выявлять проблемы в данных, визуализировать метрики качества в отчетах и дашбордах.

CIO-NAVIGATOR