方差是衡量一组数据离散程度的统计量,其计算公式为:
$$
sigma^2 = frac{sum_{i=1}^{n} (x_i - mu)^2}{n}
$$
其中:
$sigma^2$ 表示方差;
$x_i$ 表示数据集中的每个数据点;
$mu$ 表示数据集的平均值;
$n$ 表示数据点的数量。
方差有以下几个重要性质:
1. 如果数据集中的每个数据点都等于某个常数 $c$,则方差为 0。
2. 如果数据集中的每个数据点都乘以一个常数 $c$,则方差变为原来的 $c^2$ 倍。
3. 如果数据集中的两个随机变量 $X$ 和 $Y$ 相互独立,则它们的和的方差等于它们各自方差的和。
4. 方差为 0 的充分必要条件是随机变量 $X$ 以概率为 1 取常数值 $c$,即 $P{X=c}=1$,其中 $E(X)=c$。
5. 对于两个随机变量 $X$ 和 $Y$,它们的和的方差可以表示为:
$$
D(X+Y) = D(X) + D(Y) + 2text{Cov}(X,Y)
$$
其中 $text{Cov}(X,Y)$ 是 $X$ 和 $Y$ 的协方差。如果 $X$ 和 $Y$ 相互独立,则协方差为 0,此时方差简化为:
$$
D(X+Y) = D(X) + D(Y)
$$
方差的另一种形式是标准差,它是方差的平方根,用于衡量数据的波动程度。标准差的计算公式为:
$$
sigma = sqrt{sigma^2}
$$
方差和标准差在统计学中非常重要,它们被广泛应用于各种领域,包括金融、物理、社会科学等。