The Beginning
矩阵标准化的目的是,通过标准化处理,得到均值为0,标准差为1的服从标准正态分布的数据。(相对一维数据来说,也就是相对矩阵的每一列,数据的每一个维度)矩阵标准化方法是样本数据减去均值然后除以标准差。
1)、方便处理数据。在一些实际问题中,我们得到的样本数据都是多个维度的,即一个样本是用多个特征来表征的。比如在预测房价的问题中,影响房价的因素有房子面积、卧室数量等,我们得到的样本数据就是有关房子面积与卧室数量的一些样本点,这里的样本点对又被称为特征向量。很显然,这些特征的量纲和数值的量级都是不一样的,在预测房价时,如果直接使用原始的数据值,那么他们对房价的影响程度将是不一样的,而通过标准化处理,可以使得不同的`特征具有相同的Scale。这样,在使用梯度下降法学习参数的时候,不同特征对参数的影响程度就一样了。
简而言之,当原始数据不同维度上的特征的尺度(单位)不一致时,需要标准化步骤对数据矩阵进行预处理。
2)、加快收敛速度。大部分数据矩阵归一化后收敛速度会加快。
3)、提升精度。
4)、防止梯度爆炸。
THE END