3.多维随机变量及其分布¶
约 2723 个字 预计阅读时间 9 分钟
二维随机变量的定义¶
在实际问题中,某些
定义:设随机试验
多维随机变量:若
是定义在同一个样本空间 上的 个随机变量,则称 是 维随机变量, 称为第 个分量。
二维随机变量
二维随机变量的联合分布函数
定义:设
为二维随机变量
同样,对于二维随机变量的联合分布函数,我们有单调性,有界性(和为
二维离散型随机变量¶
二维离散型随机变量的联合分布律:称
- 有
二维离散型随机变量的联合分布函数:
二维连续型随机变量¶
定义:对二维随机变量
则称
符号 "
" 在统计学和概率论中常常表示“服从”或“遵循”的意思。当描述随机变量和其概率分布或概率密度函数的关系时,这个符号非常有用。以下是几个常见的用法:
- 随机变量的分布:
:随机变量 服从概率分布 。
:对于连续型随机变量,表示 有概率密度函数 。 特定的分布:
:随机变量 服从均值为 、方差为 的正态分布。 :随机变量 服从参数为 和 的二项分布。 ... 以及其他众多分布。
多元随机变量:
:随机变量对 有联合概率密度函数 。 条件分布:
:给定 时,随机变量 的条件概率密度函数是 。
- 对
,在 的连续点处,我们有
- 设
是平面上的某个区域,则
边缘分布¶
已知二维随机变量
边缘分布函数求法
已知
离散型随机变量的联合分布律
对于
连续型随机变量的概率密度
对于
对于
条件分布¶
回忆一下条件概率公式:
表示
二维离散随机变量
类比条件概率公式,对固定的
为在
二维连续型随机变量
我们用一个小量
辅助,通过 然后类比离散型的公式进行推导,最后可以得到连续型的条件分布和概率密度。最后在 很小的时候线性近似得到想要的解。 可以消去。
设二维随机变量
在
回顾一下贝叶斯定理
其中:
-
贝叶斯定理与条件分布
当我们涉及到随机变量和它们的分布时,贝叶斯定理可以推广到条件分布。考虑两个随机变量
其中:
-
贝叶斯定理在机器学习中的应用:
- 参数估计:在贝叶斯统计中,我们可以使用贝叶斯定理来估计模型参数。先验分布表示我们在观察数据之前对参数的信仰或知识,而似然表示数据与参数值之间的关系。将这两者结合起来,我们可以得到参数的后验分布。
- 贝叶斯分类器:在这种方法中,我们使用贝叶斯定理来估计给定特征的类标签的概率。
- 概率图模型:如贝叶斯网络,使用贝叶斯定理作为其核心组成部分来表示和推断随机变量之间的关系。
相互独立的随机变量¶
二维随机变量的独立性是指两个随机变量之间不存在任何统计关系。具体来说,如果两个随机变量
以下是描述二维随机变量
- 累积分布函数 (CDF):如果
和 是独立的,那么它们的联合CDF等于它们各自的边缘CDF的乘积:
其中
- 概率密度/质量函数 (PDF/PMF):对于独立的
和 ,它们的联合PDF(对于连续随机变量)或PMF(对于离散随机变量)是它们各自的边缘PDF或PMF的乘积:
- 期望和方差:独立性在计算期望和方差时也很有用。例如,如果
和 是独立的,则:
并且
- 条件概率:如果
和 是独立的,那么:
同样地,对于
多维正态分布¶
多维正态分布是高维空间中的正态分布的扩展。它在多元统计分析、机器学习和许多其他领域都有广泛的应用。下面是多维正态分布的主要概念和性质:
定义
一个
是一个 -维向量,表示每个组件的期望值。 是一个 正定协方差矩阵,表示组件之间的协方差。
概率密度函数
多维正态分布的概率密度函数 (PDF) 给出为:
其中
独立性和协方差
如果
线性变换
如果
边缘分布
考虑
条件分布
考虑一个
这只是多维正态分布的基本性质和概念。这个分布在多元统计、多变量回归、机器学习和其他许多领域中都有广泛的应用,因为其数学性质非常优雅,并且与实际数据的许多场景相吻合。
施工中
- 多维随机变量函数分布
- 最大值最小值分布