VMware Tanzu Greenplum
Книги
- Data Warehousing with Greenplum by Marshall Presser. July 2019: Second Edition 978-1-492-05810-6
Organizing Data in Greenplum
- Distribution - распределение данных таблицы по разным сегментам кластера GP (разным экземплярам PostgreSQL)
- Partitioning - определяет, как данные хранятся в каждом сегменте (в одном экземпляре PostgreSQL)
Distribution - по одному столбцу с int, bigint
Partition - по столбцу с date
Каждая row-oriented таблица хранится в одном файле.
Колоночная таблица (column oriented) - каждое поле хранится в отдельном файле. Рекомендуется для таблиц, в которых изменяется небольшое количество столбцов.