“k ≈ 3 对应 99.7% 置信度” 出现在统计学或异常检测中,和正态分布有关。
✅ 一、先说正态分布:
正态分布(高斯分布)是一个钟形曲线,中间高、两边低,大多数数据都集中在平均值附近。
✅ 二、k 是标准差的倍数
- 在正态分布中,k 表示距离均值多少个标准差(standard deviation)。
- 比如:
- k=1:表示均值 ± 1个标准差范围内的数据;
- k=2:表示均值 ± 2个标准差范围内的数据;
- k=3:表示均值 ± 3个标准差范围内的数据。
✅ 三、各个 k 对应的置信度(覆盖率):
k值 | 覆盖的概率(置信度) | 意义 |
---|---|---|
1 | 68.3% | 数据有68.3%落在 ±1σ 内 |
2 | 95.4% | 数据有95.4%落在 ±2σ 内 |
3 | 99.7% | 数据有99.7%落在 ±3σ 内 |
✅ 四、所以这句话的意思是:
“如果数据服从正态分布,那么距离均值3个标准差范围内会包含约99.7%的样本。”
换句话说:
- 超出这个范围的值只占 0.3%,
- 通常我们会把它们当成异常点或极端值。
📌 应用场景示例:
在异常检测中可能会看到这样的判断:
if abs(x - mean) > 3 * std:# 这是异常值(只有0.3%的可能性属于正常)
这就是“k≈3对应99.7%置信度”的实际用法。