欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 房产 > 建筑 > 离散概率分布:正态分布,二项分布,连续分布,正态分布的性质

离散概率分布:正态分布,二项分布,连续分布,正态分布的性质

2025/3/21 4:33:31 来源:https://blog.csdn.net/weixin_48846514/article/details/146350657  浏览:    关键词:离散概率分布:正态分布,二项分布,连续分布,正态分布的性质

离散概率分布

对于任何具有离散分布的随机变量,其样本空间(可能的取值集合)是有限的可数无穷的,并且每个可能的取值都对应一个概率。

  • 概率质量函数(PMF): 定义离散随机变量 X 取某个特定值的概率:

    f(x)=P(X=x)

  • 累积分布函数(CDF): 定义随机变量 XXX 小于或等于某个值的概率:

    F(x)=P(X≤x)

  • 性质

    1. 概率总和为 1:
      ∑ i = 1 ∞ P ( X = x i ) = 1 \sum_{i=1}^{\infty} P(X = x_i) = 1 i=1P(X=xi)=1

    2. 概率非负: P(X=xi)≥0

    3. 不可能出现的事件概率为 0,而一定发生的事件概率为 1: 0≤P(X=x)≤1

示例:掷一个公平的六面骰子

假设 XXX 表示掷一个公平六面骰子的结果,其可能的取值是:

X∈{1,2,3,4,5,6}

由于骰子是公平的,所以每个面出现的概率都是相等的,即:
P ( X = x ) = { 1 6 , x ∈ { 1 , 2 , 3 , 4 , 5 , 6 } 0 , otherwise P(X = x) = \begin{cases} \frac{1}{6}, & x \in \{1, 2, 3, 4, 5, 6\} \\ 0, & \text{otherwise} \end{cases} P(X=x)={61,0,x{1,2,3,4,5,6}otherwise
这就是骰子的概率质量函数(PMF)

二项分布与连续分布

1. 二项分布(Binomial Distribution)

二项分布是用于建模二项试验(Bernoulli Trials)**的离散概率分布,适用于独立重复试验的场景,每次试验只有**成功或失败两种结果。

  • 设随机变量 X 表示 n 次独立伯努利试验中成功的次数,每次试验成功的概率为 p,则 X 服从二项分布

    X∼Bin(n,p)

  • 概率质量函数(PMF)
    P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , 2 , . . . , n P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0,1,2,...,n P(X=k)=(kn)pk(1p)nk,k=0,1,2,...,n
    其中:
    ( n k ) = n ! k ! ( n − k ) ! \binom{n}{k} = \frac{n!}{k!(n-k)!} (kn)=k!(nk)!n!
    是组合数,表示从 n次试验中选 k次成功的可能方式。
    p k p^k pk
    表示 kkk 次成功的概率。
    ( 1 − p ) n − k (1-p)^{n-k} (1p)nk
    表示其余 n−k 次失败的概率。

  • 均值与方差

    E(X)=np,Var(X)=np(1−p)

  • 示例: 如果一枚硬币抛 10 次,每次正面朝上的概率是 0.5,则 XXX(出现正面的次数)服从二项分布:

    X∼Bin(10,0.5)

    计算 P(X=5):
    P ( X = 5 ) = ( 10 5 ) ( 0.5 ) 5 ( 0.5 ) 5 = 10 ! 5 ! 5 ! × 0. 5 10 = 0.246 P(X = 5) = \binom{10}{5} (0.5)^5 (0.5)^5 = \frac{10!}{5!5!} \times 0.5^{10} = 0.246 P(X=5)=(510)(0.5)5(0.5)5=5!5!10!×0.510=0.246


2. 连续分布(Continuous Distributions)

如果随机变量 X 取值为不可数的无限多个值,则它服从连续概率分布。例如,一个人的身高可以是任意实数(如 170.5cm),而不是离散的整数值(如 170cm 或 171cm)。

  • 概率密度函数(PDF): 对于连续随机变量,点概率 P(X=x)=0P(X = x) = 0P(X=x)=0,但可以通过概率密度函数 f(x)f(x)f(x) 计算一个区间的概率:
    P ( a ≤ X ≤ b ) = ∫ a b f ( x ) d x P(a \leq X \leq b) = \int_{a}^{b} f(x) dx P(aXb)=abf(x)dx
    性质

    • f(x)≥0(密度非负)

    • 总概率为 1
      ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x) dx = 1 f(x)dx=1

    • 累计分布函数(CDF)
      F ( x ) = P ( X ≤ x ) = ∫ − ∞ x f ( t ) d t F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) dt F(x)=P(Xx)=xf(t)dt

  • 示例:标准正态分布正态分布是最常见的连续分布,表示为:

    X∼N(μ,σ^2)

    其中:

    • μ 是均值(期望值)

    • σ^2 是方差(标准差 σ的平方)

    • 概率密度函数(PDF)
      f ( x ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} f(x)=2πσ2 1e2σ2(xμ)2

    示例计算: 在 R 语言中,dnorm(10, 10, 0.1) 计算的是 N(10,0.12) 在 x=10x 处的概率密度:

    dnorm(10, 10, 0.1)
    

连续型概率分布概率密度函数(PDF)\中,确实可能出现 f(x)>1 的情况。这并不违反概率的基本规则。原因如下:

1. PDF 的关键性质

一个概率密度函数 f(x) 必须满足以下条件:

  1. 非负性:对所有 x ,都有 f(x)≥0

  2. 总概率为 1:整个定义域上的积分必须等于 1,即:
    ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty} f(x)dx = 1 f(x)dx=1

2. 为什么 f(x)>1可能成立?

在连续分布中,f(x) 表示的是概率密度,而不是具体的概率值。概率密度的物理意义是单位区间内的概率值,而不是点的概率值。因此,f(x) 只要在整个定义域上的面积(积分)仍然是 1,就不会违反概率规则。

  • 例如:均匀分布 U(0, 0.5)
    f ( x ) = { 2 , 0 ≤ x ≤ 0.5 0 , 其他 f(x) = \begin{cases} 2, & 0 \leq x \leq 0.5 \\ 0, & 其他 \end{cases} f(x)={2,0,0x0.5其他
    这里 f(x)=2明显大于 1,但满足:
    ∫ 0 0.5 2 d x = 1 \int_0^{0.5} 2dx = 1 00.52dx=1
    所以仍然是合法的概率密度函数。

3. 何时 f(x)不可能大于 1?

对于离散型分布(如二项分布、泊松分布),概率质量函数(PMF)P(X=x) 必须满足 P(X=x)≤1,因为它表示具体的概率值,而不是概率密度。因此,在离散分布中,不可能出现概率大于 1 的情况

总结

  • 连续分布的 PDF 允许 f(x)>1,只要总概率(积分)仍然等于 1。
  • 离散分布的 PMF 不能大于 1,因为它表示具体的概率。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词