【最小二乘法的公式是什么】在数学、统计学和工程学中,最小二乘法是一种常用的数学优化技术,用于寻找最佳拟合数据点的直线或曲线。其核心思想是通过最小化观测值与模型预测值之间的平方误差之和,来确定模型参数。
一、最小二乘法的基本原理
最小二乘法主要用于回归分析,尤其适用于线性回归问题。假设我们有一组数据点 $(x_1, y_1), (x_2, y_2), \dots, (x_n, y_n)$,我们希望找到一条直线 $y = ax + b$,使得这条直线尽可能接近所有数据点。
目标是最小化误差平方和:
$$
S = \sum_{i=1}^{n}(y_i - (ax_i + b))^2
$$
通过求导并令导数为零,可以得到参数 $a$ 和 $b$ 的最优解。
二、最小二乘法的公式总结
以下是线性最小二乘法中参数 $a$ 和 $b$ 的计算公式:
公式名称 | 公式表达式 | 说明 |
斜率 $a$ | $a = \frac{n\sum x_i y_i - \sum x_i \sum y_i}{n\sum x_i^2 - (\sum x_i)^2}$ | 用于计算回归直线的斜率 |
截距 $b$ | $b = \frac{\sum y_i - a \sum x_i}{n}$ | 用于计算回归直线的截距 |
回归方程 | $y = ax + b$ | 最佳拟合直线的表达式 |
其中:
- $n$ 是数据点的数量;
- $\sum x_i$ 是所有 $x_i$ 的总和;
- $\sum y_i$ 是所有 $y_i$ 的总和;
- $\sum x_i y_i$ 是所有 $x_i y_i$ 的总和;
- $\sum x_i^2$ 是所有 $x_i^2$ 的总和。
三、示例说明
假设我们有以下数据点:
$x$ | $y$ |
1 | 2 |
2 | 4 |
3 | 5 |
4 | 4 |
5 | 5 |
根据上述公式,我们可以计算出:
- $\sum x_i = 1+2+3+4+5 = 15$
- $\sum y_i = 2+4+5+4+5 = 20$
- $\sum x_i y_i = 1×2 + 2×4 + 3×5 + 4×4 + 5×5 = 2+8+15+16+25 = 66$
- $\sum x_i^2 = 1² + 2² + 3² + 4² + 5² = 1+4+9+16+25 = 55$
代入公式:
$$
a = \frac{5×66 - 15×20}{5×55 - 15^2} = \frac{330 - 300}{275 - 225} = \frac{30}{50} = 0.6
$$
$$
b = \frac{20 - 0.6×15}{5} = \frac{20 - 9}{5} = \frac{11}{5} = 2.2
$$
因此,回归方程为:
$$
y = 0.6x + 2.2
$$
四、总结
最小二乘法是一种简单但强大的方法,广泛应用于数据分析、机器学习和工程建模中。通过最小化误差平方和,它能够提供对数据趋势的最佳估计。掌握其基本公式和应用方式,有助于更好地理解和分析实际问题中的数据关系。