数学语言描述:
在区间[a,b]中有一组符合某分布的数据:
1.求相同区间中另一组符合同样分布的数据与这组数据的均方误差
2.求区间中点与数据的均方误差
3.求在区间中均匀分布的一组数据与这组数据的均方误差
一:同分布数据随机映射
假设在区间[a,b]上有两组数据,分别用随机变量X和Y表示,它们均独立且服从相同的概率分布:
求X和Y的MSE,即:
由
代入得
二:区间中值映射
令区间中点为
求X与m的MSE,即:
则
当随机变量X在区间[a,b]分布均匀且关于均值对称时有,此时:
三、均匀分布数据随机映射
已知
则
求X与Z的MSE,即
有
则
于是
若X的均值和均匀分布Z的均值相同
则
总结
综上在区间[a,b]有
在实际应用中应该考虑数据方差与区间宽度选择具体方案。一般来说,若提前对数据进行标准化则数据的均值为0,方差为1,则:
若仅考虑最优方案则可直接排除,即仅需要判断1与
的大小关系。于是
则选取方案一。