曼哈顿距离(Manhattan Distance),也称为城市街区距离(Taxicab Distance),是两点之间的距离度量方式。它衡量的是在一个网格状的平面上,从一个点到另一个点的距离,计算时只能沿着水平和垂直方向移动。
具体而言,曼哈顿距离计算公式为:
[
d = |x_1 - x_2| + |y_1 - y_2|
]
其中,((x_1, y_1)) 和 ((x_2, y_2)) 是平面上两个点的坐标。距离是这两个点在横轴和纵轴上差值的绝对值之和。
曼哈顿距离通常用于计算在城市街区或网格图形中的最短路径,因为在这些环境中,移动只能沿着网格的边界,而不是沿着对角线。
例如,假设有两个点 ( A(1, 2) ) 和 ( B(4, 6) ),那么它们的曼哈顿距离为:
[
d = |1 - 4| + |2 - 6| = 3 + 4 = 7
]
这种距离度量与欧几里得距离(即直线距离)不同,后者是沿着对角线的最短路径。
2
切比雪夫距离(Chebyshev Distance)是一种在网格空间中衡量两个点之间“最大”坐标差异的距离度量方式。与曼哈顿距离和欧几里得距离不同,切比雪夫距离关注的是在多个坐标轴上的差值中的最大值。
切比雪夫距离的计算公式为:
[
d = \max(|x_1 - x_2|, |y_1 - y_2|)
]
其中,((x_1, y_1)) 和 ((x_2, y_2)) 是平面上两个点的坐标。
解释
切比雪夫距离的核心概念是“最大坐标差”。它计算两个点在各个轴上的绝对差值,并取这些差值中的最大值。例如,如果我们要计算从点 (A(1, 2)) 到点 (B(4, 6)) 的切比雪夫距离,则我们会计算:
[
d = \max(|1 - 4|, |2 - 6|) = \max(3, 4) = 4
]
应用
切比雪夫距离常用于棋盘等网格状的场景,特别是在棋类游戏中,例如国际象棋。在这种情况下,棋盘上的王(King)可以向任何一个方向移动一格(包括对角线方向),因此从一个点到另一个点的最短路径长度可以通过切比雪夫距离来计算。
特点
- 曼哈顿距离:移动只能沿着水平或垂直方向。
- 欧几里得距离:沿直线的最短路径。
- 切比雪夫距离:考虑沿任何方向的最大移动步数。
3
闵式距离(Minkowski Distance)是一类距离度量的泛化形式,包括了欧几里得距离、曼哈顿距离和切比雪夫距离等作为特例。闵式距离的一般定义为:
[
d_p = \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{1/p}
]
其中,( x = (x_1, x_2, \dots, x_n) ) 和 ( y = (y_1, y_2, \dots, y_n) ) 是 n 维空间中的两个点,( p ) 是一个正数,称为距离的阶数(也可以称为“闵式指数”)。闵式距离的定义可以通过不同的 ( p ) 值得到不同的距离度量。
特别情况
- 当 ( p = 1 ) 时,闵式距离变为曼哈顿距离(L1距离):
[
d_1 = \sum_{i=1}^{n} |x_i - y_i|
] - 当 ( p = 2 ) 时,闵式距离变为欧几里得距离(L2距离):
[
d_2 = \left( \sum_{i=1}^{n} |x_i - y_i|^2 \right)^{1/2}
] - 当 ( p \to \infty ) 时,闵式距离变为切比雪夫距离:
[
d_\infty = \max_{i} |x_i - y_i|
]
解释
闵式距离通过参数 ( p ) 控制了度量的敏感度。随着 ( p ) 的增大,度量对坐标差异较大的维度会变得更加敏感。当 ( p ) 趋近于无穷大时,闵式距离就转化为切比雪夫距离,关注的是最大的坐标差异。
应用
闵式距离广泛用于机器学习、数据分析和优化问题中。它是计算高维数据之间相似性的一种常见方法。不同的 ( p ) 值可能适用于不同的应用场景,尤其是在聚类、分类、推荐系统等任务中。
4
当 ( p → ∞ ) ( p \to \infty ) (p→∞)时,闵式距离变为切比雪夫距离,这一现象的原因可以通过闵式距离的定义公式和极限过程来解释。
闵式距离的定义:
闵式距离的定义为:
[
d_p = \left( \sum_{i=1}^{n} |x_i - y_i|^p \right)^{1/p}
]
其中,( x = (x_1, x_2, \dots, x_n) ) 和 ( y = (y_1, y_2, \dots, y_n) ) 是 ( n ) 维空间中的两个点,( p ) 是一个正实数。
当 ( p \to \infty ) 时,闵式距离的行为:
我们可以考虑闵式距离在 ( p \to \infty ) 时的极限行为。假设我们有 ( n ) 个坐标差 ( |x_i - y_i| ) 对应于 ( i = 1, 2, \dots, n )。
当 ( p ) 增加时,( |x_i - y_i|^p ) 对较大的坐标差更加敏感。为了更清楚地说明这一点,假设我们有以下几个差值:
[
|x_1 - y_1| = 3, \quad |x_2 - y_2| = 1, \quad |x_3 - y_3| = 2
]
随着 ( p ) 增大,( |x_1 - y_1|^p = 3^p ) 会迅速增大,而 ( |x_2 - y_2|^p = 1^p = 1 ) 和 ( |x_3 - y_3|^p = 2^p ) 的增长速度远低于 ( 3^p )。因此,( |x_1 - y_1|^p ) 在总和中占据主导地位。此时,整体的距离更依赖于最大值的坐标差,而对小的坐标差的贡献可以忽略不计。
极限过程:
因此,当 ( p \to \infty ) 时,闵式距离的计算会变为:
[
d_\infty = \max_{i} |x_i - y_i|
]
也就是说,闵式距离的极限值就是所有坐标差中的最大值,这正是切比雪夫距离的定义。
总结:
当 ( p \to \infty ) 时,闵式距离变为切比雪夫距离的原因是:在极大的 ( p ) 下,较大的坐标差主导了距离的计算,而较小的坐标差对总和的贡献变得微不足道,从而使得闵式距离的计算结果转化为最大坐标差,即切比雪夫距离。