正态分布是统计学中非常重要的概率分布,其概率密度函数和累积分布函数是核心概念。以下是相关公式的简要说明:
正态分布的概率密度函数
$$f(x) = frac{1}{sigma sqrt{2pi}} e^{-frac{(x-mu)^2}{2sigma^2}}$$
其中:
$f(x)$ 表示随机变量 $X$ 取值为 $x$ 时的概率密度。
$mu$ 表示分布的均值。
$sigma$ 表示分布的标准差。
$e$ 是自然对数的底数。
正态分布的累积分布函数
$$F(x) = int_{-infty}^{x} f(t) dt = frac{1}{2} [1 + text{erf}(frac{x-mu}{sigmasqrt{2}})]$$
其中:
$F(x)$ 表示随机变量 $X$ 小于等于 $x$ 的累积概率。
$text{erf}$ 表示误差函数。
正态分布的标准差
标准差($sigma$)是衡量数据离均值的距离的指标,它表示样本或总体内所有数据点与平均值之间差异的平方的平均值的平方根。
正态分布的图形特征
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
曲线与横轴间的面积总等于1:相当于概率密度函数的积分从负无穷到正无穷的概率为1。
正态分布的计算步骤
1. 确定随机变量 $X$ 的均值 $mu$ 和标准差 $sigma$。
2. 使用概率密度函数计算特定 $x$ 值处的概率密度 $f(x)$。
3. 使用累积分布函数计算随机变量 $X$ 小于等于特定 $x$ 值的累积概率 $F(x)$。
示例
假设你想计算随机变量 $X$ 小于等于某个值 $x$ 的概率,你可以使用累积分布函数 $F(x)$:
$$F(x) = frac{1}{2} [1 + text{erf}(frac{x-mu}{sigmasqrt{2}})]$$
其中,$mu$ 是 $X$ 的均值,$sigma$ 是 $X$ 的标准差。