概率初步
概述
本文介绍一些概率论的基础概念。
为了简单起见,本文中提到的所有集合都默认是 有限集。如想了解更一般的理论,请阅读任何一本大学概率论课本,或者期待本文的后续更新(如果有这回事的话)。
事件
样本输出、样本空间、随机事件
在一次随机试验 中可能发生的不能再细分的结果被称为 样本输出。在随机试验中可能发生的所有样本输出的集合称为 样本空间,用 来表示。
也就是说,进行一次随机试验 ,其结果一定符合 中的恰好一个元素,不可能是零个或多个。例如在一次掷骰子的随机试验中,如果用获得的点数来表示样本输出,那么一共可能出现 个样本输出,则样本空间可以表示为 。
一个 随机事件 是样本空间 的子集,它由样本空间 中的元素构成,用大写字母 表示。例如在掷两个骰子的随机试验中,设随机事件 为“获得的点数和大于 ”,则 是由下面 个样本输出组成的集合:。
事件的计算
因为事件在一定程度上是以集合的含义定义的,因此可以把事件当作集合来对待。
和事件:相当于 并集。若干个事件中只要其中之一发生,就算发生了它们的和事件。
积事件:相当于 交集。若干个事件必须全部发生,才算发生了它们的积事件。
概率
定义
古典定义
如果一个试验满足两条:
- 试验只有有限个基本结果;
- 试验的每个基本结果出现的可能性是一样的;
这样的试验便是古典试验。 对于古典试验中的事件 ,它的概率定义为 ,其中 表示该试验中所有可能出现的基本结果的总数目, 表示事件 包含的试验基本结果数。
统计定义
如果在一定条件下,进行了 次试验,事件 发生了 次,如果随着 逐渐增大,频率 逐渐稳定在某一数值 附近,那么数值 称为事件 在该条件下发生的概率,记做 。
公理化定义
设 是随机试验, 是它的样本空间;再设 是样本空间 的幂集的一个非空子集,称为事件空间。对事件空间 的每一个元素(称为事件) 赋予一个实数,记为 ,称为事件 的概率。其中:
满足以下条件:
-
;
-
若 ,则 ;
-
若 ,则 。
简言之,就是事件空间 对其所有元素的补运算、并运算是封闭的,且包含元素 。
是一个从集合到实数的映射,满足以下公理:
-
非负性:对于一个事件 ,有概率 。
-
规范性:样本空间的概率值为 ,即 。
-
可加性:若 ,则 。
由 构成的这样的一个系统称为一个 概率空间。
例如在掷一个骰子的随机试验中,如果用获得的点数来表示样本输出,则样本空间可以表示为 ,事件空间可以表示为 。设事件 表示得到的点数大于 ,事件 表示得到的点数是偶数,则 ,。
计算
- 广义加法公式: 对任意两个事件 ,
- 条件概率: 记 表示在 事件发生的前提下, 事件发生的概率,则 (其中 为事件 和事件 同时发生的概率)。
- 乘法公式:
- 全概率公式:若事件 构成一组完备的事件且都有正概率,即 且 ,则有 。
- 贝叶斯定理:
随机变量
直观地说,一个随机变量,是一个取值由随机事件决定的变量。
如果基于概率的公理化定义,那么一个随机变量——形式化地说——是一个从样本空间 到实数集 (或者 的某个子集)的映射 。如果 ,你可以直观理解为:当随机实验 取结果 时,该随机变量取值 。
由此可以看到,“随机变量 取值 ”(简记为 )也对应着一个能实现该命题的单位事件集合,因此它也是一个事件,于是也有与之对应的概率 。
独立性
直观地说,我们认为两个东西独立,当它们在某种意义上互不影响。例如,一个人出生的年月日和他的性别,这两件事是独立的;但一个人出生的年月日和他现在的头发总量,这两件事就不是独立的,因为一个人往往年纪越大头发越少。
数学中的独立性与这种直观理解大体相似,但不尽相同。
随机事件的独立性
我们称两个事件 独立,当 。
我们称若干个事件 互相独立,当对于其中任何一个子集,该子集中的事件同时发生的概率,等于其中每个事件发生概率的乘积。形式化地说:
由此可见,若干事件 两两独立 和 互相独立 是不同的概念。请注意这一点。
随机变量的独立性
以下用 表示随机变量 的取值范围。即,如果把 看作一个映射,则 就是其值域。
我们称两个随机变量 独立,当 ,即 取任意一组值的概率,等于 和 分别取对应值的概率乘积。
我们称若干个随机变量 互相独立,当 取任意一组值的概率,等于每个 分别取对应值的概率乘积。形式化地说:
由此可见,若干随机变量 两两独立 和 互相独立 是不同的概念。请注意这一点。
期望
定义
如果一个随机变量的取值个数有限(比如一个表示骰子示数的随机变量),或可能的取值可以一一列举出来(比如取值范围为全体正整数),则它称为 离散型随机变量。
形式化地说,一个随机变量被称为离散型随机变量,当它的值域大小 有限 或者为 可列无穷大。
一个离散型随机变量 的 数学期望 是其每个取值乘以该取值对应概率的总和,记为 。
其中 表示随机变量 的值域, 表示 所在概率空间的样本集合。
请读者自行验证连等式中的第二个等号。
连续型随机变量的期望
如果一个随机变量的取值不可列(比如值域为 ),则称其为 连续型随机变量。 若有一个连续型随机变量 取值为 的概率为 ,则定义其期望 为:
性质
- 全期望公式:,其中 是随机变量, 是在 成立的条件下 的期望(即“条件期望”)。可由全概率公式证明。
- 期望的线性性: 对于任意两个随机变量 (不要求相互独立),有 。利用这个性质,可以将一个变量拆分成若干个互相独立的变量,分别求这些变量的期望值,最后相加得到所求变量的值。
- 乘积的期望: 当两个随机变量 相互独立时,有 。
例题
NOIP2017 初赛 T14, T15
NOIP2016 换教室(概率期望 DP)
build本页面最近更新:,更新历史
edit发现错误?想一起完善? 在 GitHub 上编辑此页!
people本页面贡献者:OI-wiki
copyright本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用