GaussDB分布式数据倾斜处理

2025/2/22 2:24:12 来源：https://blog.csdn.net/qq_42869878/article/details/145083126 浏览: 次关键词：GaussDB分布式数据倾斜处理

常规数据倾斜巡检
在库中表个数少于1W的场景，直接使用倾斜视图查询当前库内所有表的数据倾斜情况
SELECT * FROM pgxc_get_table_skewness ORDER BY totalsize DESC;在库中表个数非常多（至少大于1W）的场景，因PGXC_GET_TABLE_SKEWNESS涉及全库查并计算非常全面的倾斜字段，所以可能会花费比较长的时间（小时级），请根据PGXC_GET_TABLE_SKEWNESS视图定义，直接使用table_distribution()函数自定义输出，减少输出列进行计算优化，例如SELECT schemaname,tablename,max(dnsize) AS maxsize, min(dnsize) AS minsize 
FROM pg_catalog.pg_class c 
INNER JOIN pg_catalog.pg_namespace n ON n.oid = c.relnamespace 
INNER JOIN pg_catalog.table_distribution() s ON s.schemaname = n.nspname AND s.tablename = c.relname 
INNER JOIN pg_catalog.pgxc_class x ON c.oid = x.pcrelid AND x.pclocatortype = 'H' 
GROUP BY schemaname,tablename;

建议：
分布健选择：

字段的值尽量离散；
选择分布健唯一键；
根据业务场景选择多的字段作为分布健。

GaussDB分布式数据倾斜处理

相关资讯

热文排行

最新新闻

推荐新闻

热搜词