Cluster DB - архитектура

Работа WiseData Cluster DB основана на массово-параллельной обработке данных (МРР - massive parallel processing). Кластер БД создаётся на основе СУБД PostgreSQL и представляет из себя кластер хранения SQL данных по архитектуре shared nothing architecture (SN), где каждая из Datanode содержит собственный набор данных. Кластер БД включает в себя следующие компоненты:

Coordinator — узел подключения клиентов к кластеру PostgreSQL.

GTM — менеджер транзакций, ключевой компонент обеспечивающий уникальность транзакций в рамках распределённого кластера.

Datanode — узел хранения данных SQL.

Кластер поддерживает 2 основных типа распределения данных:

Технология распределённых вычислений работает следующим образом:

Coordinator при получении пользовательского запроса анализирует его структуру, составляет оптимальный план его выполнения и рассылает на Datanode, где и происходит обработка. Затем, каждый Datanode отправляет в Coordinator свою часть результата обработки, а он агрегирует их и готовит итоговый результат. С помощью такой архитектуры можно получить высокую скорость обработки добавляя в хранилище новые Datanode.