3多元梯度下降法

多元梯度下降法

代价函数

多元函数的梯度下降

特征缩放

将特征量缩放至-1与1之间范围来使梯度下降更快捷

均值归一化

使每个特征量的平均值都是0

学习率选择

可以小,但不能大

为了保证效率,绘制J(o)-迭代次数曲线,观察是否收敛

3倍为基础,尝试选择学习率