Greenplum索引设计的规范

来源:这里教程网 时间:2026-03-14 20:01:12 作者:

1.   原则上,数据仓库中的数据表不建立索引。只有提供给外部用户访问的表,才考虑按用户访问特性,针对常用查询字段建立索引; 2.   对于跑批的中间表和临时表,不允许创建索引; 3.   对于记录数在百万级别以下的小表,建议不使用索引; 4.   创建组合索引时,必须将经常作为查询条件且可选择性最大的列设置为索引的首列; 5.   不允许创建冗余索引和重复索引; 6.   对于区别度高的索引,应使用B-tree索引,例如账号、合同号等等;对于区别度低的索引,应使用Bitmap索引, 例如机构、产品类型等等; 7.   创建组合索引时,建议列数不要超过5列; 8.   每张数据表的索引数,建议不超过5个; 9.   在创建和更新索引后,必须执行Analyze操作,更新索引的统计信息; 10.  在对大表进行数据加载的时候,如果存在索引,建议先删除索引,待数据加载完成,再重新创建索引; 11.  对频繁更新的数据表,应定期对其执行reindex 操作,以重建索引; 12.  如果在分区表中使用了索引,不允许在子表上单独创建和修改索引;通常,删除顶级分区的索引,系统会自动删除相关 子表的索引,但如果子表的索引有缺失,将不能自动删除子表的索引,需要挨个手动删除。 13.  确认不再使用的索引必须删除.

相关推荐