在数据分析和科学研究中,统计学扮演着至关重要的角色。它不仅帮助我们理解数据背后的规律,还提供了预测未来趋势的有效工具。为了便于学习和应用,本文将对一些常用的统计学公式进行整理与总结。
一、描述性统计
1. 均值(Mean)
均值是数据集中所有数值的算术平均值,计算公式为:
\[
\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}
\]
其中 \(x_i\) 表示第 \(i\) 个观测值,\(n\) 是总观测数。
2. 中位数(Median)
中位数是将数据从小到大排序后位于中间位置的值。如果数据个数为偶数,则取中间两个数的平均值。
3. 众数(Mode)
众数是指数据集中出现频率最高的值。
二、概率论基础
1. 条件概率
条件概率表示事件 \(A\) 在事件 \(B\) 已发生的条件下发生的概率,计算公式为:
\[
P(A|B) = \frac{P(A \cap B)}{P(B)}
\]
2. 联合概率
联合概率表示事件 \(A\) 和事件 \(B\) 同时发生的概率,记作 \(P(A \cap B)\)。
三、分布理论
1. 正态分布(Normal Distribution)
正态分布的概率密度函数为:
\[
f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}
\]
其中 \(\mu\) 是均值,\(\sigma\) 是标准差。
2. 二项分布(Binomial Distribution)
二项分布描述了独立重复试验中成功次数的概率分布,其概率质量函数为:
\[
P(X=k) = C(n, k) p^k (1-p)^{n-k}
\]
其中 \(C(n, k)\) 是组合数。
四、假设检验
1. Z 检验
Z 检验用于判断样本均值是否显著不同于总体均值,公式为:
\[
Z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}
\]
2. T 检验
T 检验适用于小样本情况下的均值比较,公式为:
\[
t = \frac{\bar{x} - \mu}{s / \sqrt{n}}
\]
其中 \(s\) 是样本标准差。
以上仅为统计学公式的一部分,实际应用中还需结合具体场景灵活运用。希望这份汇总能为大家提供一定的参考价值!