VMware Tanzu Greenplum

Документация

Книги

  • Data Warehousing with Greenplum by Marshall Presser. July 2019: Second Edition 978-1-492-05810-6

Organizing Data in Greenplum

  • Distribution - распределение данных таблицы по разным сегментам кластера GP (разным экземплярам PostgreSQL)
  • Partitioning - определяет, как данные хранятся в каждом сегменте (в одном экземпляре PostgreSQL)

Distribution - по одному столбцу с int, bigint

Partition - по столбцу с date

Каждая row-oriented таблица хранится в одном файле.

Колоночная таблица (column oriented) - каждое поле хранится в отдельном файле. Рекомендуется для таблиц, в которых изменяется небольшое количество столбцов.