1.随机事件与概率¶

约 2662 个字预计阅读时间 9 分钟

随机试验¶

通过研究随机试验来研究随机现象。随机试验既包括科学实验，也包括对某一事物的某一特征的观察。

随机试验 \(E\) 满足以下三个条件：

试验可以在相同条件下重复进行；
每次试验的可能结果不止一个，并且能事先明确试验的所有可能结果；
进行一次试验之前不能确定哪一个结果会出现

样本空间¶

样本空间：随机试验所有可能结果组成的集合，记为 \(S\) 或 \(\Omega\)

样本点：随机试验的每个结果，称为样本点，记为 \(e\)

样本空间 \(S\) 是由全体样本点 \(e\) 构成的集合： \(S=\{e\}\)

随机事件¶

在实际中，进行 \(E\) 时，我们只关心样本空间中发生的一部分的事件。这就引出了随机事件这一概念。

随机事件：样本空间 \(S\) 的子集称为 \(E\) 的随机事件，用 \(A,B\) 等表示，简称事件

事件发生：在每次试验中，当且仅当随机事件中的一个样本点出现，称此事件发生（否则随机事件不发生）

基本事件：由一个样本点组成的单点集称为基本事件

必然事件：样本空间 \(S\) 包含所有样本点在每次试验中它总发生，故称为必然事件

不可能事件：空集 \(\phi\) 不包含任样本点在每次试验中都不发生，称为不可能事件

事件间的关系及运算法则¶

包含关系 \(A \subset B\)
相等关系 \(A=B\)，或有 \(A\subset B \;and\;B\subset A\)
互斥关系 \(AB=\phi\)
对立关系 \(AB=\phi\), \(A\cup B=\Omega\)

两互逆事件又称对立事件。

运算可以分为和、交、差、逆运算。

和、交、逆事件有如下运算规律：

交换律：\(A\cup B=B\cup A\;,\;A\cap B=B\cap A\)；
结合律：\(A\cup(B\cup C)=(A\cup B)\cup C\;,\;A(BC)=(AB)C\)；
分配律：\(A(B\cup C)=(AB)\cup(AC)\;,\;(AB)\cup C=(A\cup C)(B\cup C)\)；
对偶律 / 德摩根定律(De Morgan's law)：\(\overline{\bigcup^n_{j=1}A_j}=\bigcap^n_{j=1}\overline{A_j}\;,\;\overline{\bigcap^n_{j=1}A_j}=\bigcup^n_{j=1}\overline{A_j}\)

事件运算顺序约定为先进行逆运算，然后进行交运算，最后进行并或差运算。

频率和概率¶

频率：在相同条件下进行 \(n\) 次试验中事件 \(A\) 发生的频数，比值 \(\frac{n_A}{n}\) 称为事件 \(A\) 发生的频率，记为 \(f_n(A)\)

当 \(n\rightarrow +\infty\) 时，\(f_n(A)\) 会稳定与某个确定的常数。称为频率的稳定性。也是随机现象的统计规律性。

概率的公理化定义：设 \(E\) 是随机试验， \(S\) 是它的样本空间。对于 \(E\) 的每一个事件 \(A\) 赋予一个实数，记为 \(P(A)\)，如果集合函数 \(P( \cdot )\) 满足下列条件：

非负性：对每一个事件 \(A\)，有 \(P(A)\geq0\)
规范性：对必然事件 \(S\)，有 \(P(S)=1\)
可列可加性：设 \(A_1,A_2,\dots,A_n,\dots\) 是两两互不相容的事件，有： \(P(A_1 \cup A_2 \cup \dots \cup A_n \cup \dots)=P(A_1)+P(A_2)+\dots +P(A_n)+\dots\)

概率的重要性质：

\(P(\phi)=0\)
有限可加性：设 \(A_1,A_2,\dots,A_n\) 是两两互不相容的事件，即 \(A_iA_j=\phi,i\neq j, \ i,j=1,2,\dots,n\)，有 \(P(A_1 \cup A_2 \cup \dots \cup A_n)=P(A_1)+P(A_2)+\dots +P(A_n)\)
减法公式：设 \(A,B\) 是任意两个事件，则 \(P(A-B)=P(A)-P(AB)\)
单调性：设 \(A,B\) 是两个事件，若 \(B\subset A\)，则 \(P(A-B)=P(A)-P(B), \ P(A)\geq P(B)\)
有界性：对任一事件\(A\)，有 \(P(A)\leq1\)
逆事件概率：对任一事件 \(A\)，有 \(P(\bar A)=1-P(A)\)
加法公式：对于任意两个事件 \(A,B\)，有 \(P(A\cup B)=P(A)+P(B)-P(AB)\)

这些性质都可以通过公理化定义推出。

古典概型¶

加法原理，乘法原理，排列：\(P^m_n=\frac{n!}{(n-m)!}\)，可重复排列：\(N=n\times n\times \dots n=n^m\)，组合：\(C^m_n= \tbinom{n}{m}=\frac{P^m_n}{m!}=\frac{n!}{m!(n-m)!}\)。

古典概型

若随机试验 \(E\) 满足：

样本空间 \(S\) 只含有有限个样本点， \(S=\{e_1,e_2,\dots,e_n\}\)
每个基本事件（样本点）发生的可能性相同

则称此随机试验的概率模型为等可能模型，也称为古典概型。

古典概型中，事件 \(A=\{e_{i1},e_{i2},\dots,e_{i_k}\}\)发生的概率为：

\[ P(A)=\frac{k}{n}=\frac{\text{A包含的基本事件数}}{\text{S中的基本事件总数}} \]

几何概型¶

若随机试验 \(E\) 满足：

样本空间 \(S\) 是 \(R^n\) 中的一个可度量的几何区域；
每个样本点出现的概率相等，即样本点落入 \(S\) 某一可度量的子区域 \(A\) 的可能性大小与 \(A\) 的几何度量（长度，面积，体积）成正比，而与 \(A\) 的位置及形状无关。

那么事件 \(A={\text{样本点落入区域A}}\) 的概率为

\[ P(A)=\frac{\text{A的几何度量}}{\text{S的几何度量}} \]

条件概率¶

这一部分主要关注规范性的写法，对后续的全概率公式、贝叶斯公式的推导理解有重要作用。

定义：设 \(A,B\) 是两个事件，且 \(P(A)>0\)，称 \(P(B|A)=\frac{P(AB)}{P(A)}\) 为在事件 \(A\) 发生的条件下事件 \(B\) 发生的条件概率。

\(P(AB)\) 是在样本空间为 \(S\) 时， \(A,B\) 同时发生的可能性
\(P(B|A)\) 则表示在 \(A\) 发生的条件下，\(B\) 发生的可能性。此时的样本空间为 \(A\) 而不再是 \(S\)

条件概率的性质

当 \(P(A)>0\) 时，

\(P(B|A)\geq0\)
\(P(S|A)=1,P(\phi|A)=0\)
\(P(B\cup C \ | \ A) = P(B|A)+P(C|A)-P(BC|A)\)
\(P(B-C|A)=P(B|A)-P(BC|A)\)
\(P(\bar B |A)=1-P(B|A)\)

乘法公式

将上面条件概率公式变形，可以得到：

\[ P(AB)=P(A)P(B|A) \]

同样，若 \(P(B)>0\)，有 \(P(AB)=P(B)P(A|B)\)

推广：若 \(P(AB)>0\)，则有 \(P(ABC)=P(A)P(B|A)P(C|AB)\)

设 \(A_1,A_2,\cdots,A_n\) 为 \(n\) 个事件， \(n\geq2\)，且 \(P(A_1A_2\cdots A_{n-1})>0\)，则有：

\[ P(A_1A_2\cdots A_{n-1}A_n)=P(A_1)P(A_2|A_1)P(A_3|A_1A_2)\cdots P(A_n|A_1A_2 \cdots A_{n-1}) \]

需要注意 \(i<j\) ， \(A_i\) 先于 \(A_j\) 发生

全概率公式¶

样本空间的划分：设 \(S\) 为试验 \(E\) 的样本空间， \(B_1,B_2,\cdots,B_n\) 为 \(E\) 的一组事件。若

\(B_iB_j=\phi(i\neq j)\)
\(B_1 \cup B_2 \cup \cdots \cup B_n=S\)

则称 \(B_1,B_2,\cdots,B_n\) 为样本空间 \(S\) 的一个划分（完备事件组）。对每次实验，事件\(B_1,B_2,\cdots,B_n\) 中必有一个且仅有一个发生。

全概率公式：设试验 \(E\) 的样本空间为 \(S\)，\(A\) 为 \(E\) 的事件，\(B_1,B_2,\cdots,B_n\)为 \(S\) 的一个划分，且 \(P(B_i)>0\)，则

\[ P(A)=\sum^n_{i=1}P(B_i)\cdot P(A|B_i) \]

可以通过 \(P(A)=P(AS)\) 然后拆分 \(S\) 进行推导。由互不相容，可以得到 \(\sum^n_{i=1}P(AB_i)\) 进而得到全概率公式。

贝叶斯公式¶

全概率事件求得是 \(P(A)\)，贝叶斯公式求的是 \(P(B_i|A)\)。我们可以通过全概率公式来推导贝叶斯公式。

\[ P(B_i|A)=\frac{P(AB_i)}{P(A)}=\frac{P(B_i)P(A|B_i)}{\sum^n_{j=1}P(B_j)\cdot P(A|B_j)} \]

观察可以发现，分母为全概率公式，分子是分母中的某一项。

一道贝叶斯公式的典型例题：

设第一个是红球的概率为 \(A\)，取到第 \(i\) 个盒子的概率为 \(B_i\)，然后用贝叶斯公式做

下面进行更普遍的贝叶斯公式的介绍。

贝叶斯公式基本定义：

\[ P(A|B) = \frac{P(B|A) \times P(A)}{P(B)} \]

其中：

\(P(A|B)\)：在已知事件 B 发生的情况下，事件 A 发生的条件概率。
\(P(B|A)\)：在已知事件 A 发生的情况下，事件 B 发生的条件概率。
\(P(A)\)：事件 A 发生的先验概率。
\(P(B)\)：事件 B 发生的边缘概率。

边缘概率：

边缘概率描述了某一随机事件发生的概率，不考虑与其他随机事件的关联。例如，两个随机变量 \(X\) 和 \(Y\) 的边缘概率为：

\(P(X=x) = \sum_{y} P(X=x, Y=y)\)

扩展的贝叶斯公式：

当面对一组互斥且完备的事件 \(B_1, B_2, ... B_n\) 时，特定事件 \(B_i\) 在已知某事件 \(A\) 发生的情况下的条件概率为：

\[ P(B_i|A) = \frac{P(B_i)P(A|B_i)}{\sum^n_{j=1}P(B_j)\cdot P(A|B_j)} \]

其中：

\(P(A)\)：在任何 \(B_i\) 发生的情况下，事件 \(A\) 发生的总概率。
\(P(A) = \sum^n_{j=1}P(B_j)\cdot P(A|B_j)\)：所有可能的 \(B_j\) 导致事件 \(A\) 的总概率。

也就是说，拓展情况下，分母把普遍情况下的 \(P(A)\) 拆分开来。这里也可以直接理解为 \(P(A)\) 的概率。

基本贝叶斯公式：
具体意义：描述了两个事件的条件概率关系。它在概率论和统计学中都是非常基础的，适用于任何两个事件之间的关系。
应用范围：非常广泛，适用于各种情境，不仅限于互斥和完备的事件集。
扩展的贝叶斯公式：
具体意义：用于处理一组互斥且完备的事件情境，为给定的证据提供了每个特定假设的条件概率。
应用范围：特定于互斥且完备的事件集的问题，如分类任务、医学诊断、多分类问题等。

应用

贝叶斯统计：贝叶斯公式允许我们结合观测数据（似然）和先验信念（先验概率）来更新我们的信念（后验概率）。
例子：在医学诊断中，存在多种可能的疾病导致某一症状，我们可以使用贝叶斯公式计算在已知某症状的情况下，患有某一特定疾病的概率。

独立性¶

设 \(A,B\) 为两个事件，如果其中任何一个事件发生的概率不受另一个事件发生与否的影响，则称事件 \(A\) 与 \(B\) 相互独立。

如果有两事件相互独立，则有：

\[ P(AB)=P(A)P(B) \]

这另外可以推出 \(P(B|A)=P(B)\)

独立与互不相容没有关系。独立的事件可能同时发生（例如，在两次有放回的抽牌中都抽到红色牌，因为两次抽牌事件互不影响），而互不相容的事件则不能（一张牌不能同时是红色和黑色）。

必然事件以及不可能事件与任意事件相互独立。

若事件 \(A,B\) 相互独立，那么 \(A\) 与 \(\bar B\) 等四种情况都相互独立。

\(n\) 个试验的独立性

定义：设 \(A_1,A_2,\cdots,A_n\) 是 \(n \ (n\geq 2)\) 个事件，如果对于其中任意 \(2\) 个，\(3\) 个 \(\cdots\) \(n\) 个事件的概率都等于各事件概率的乘积，则称事件 \(A_1,A_2,\cdots,A_n\) 相互独立。