特征选择 数据表示 将数据规范为特征表示,选择”好的”来改进模型表现,即提高模型泛化能力 计算机视觉中的特征 SIFT Spin imgae HoG RIFT Textons GLOH 文本分类中的特征 输入文本 词袋表示 特征选择 特征少会增加模型偏差 特征多会增加模型方差 特征选择:偏差和方差的权衡 特征选择的正则化 L2正则化(岭回归Ridge) L1正则化(套索LASSO) 特征选择方法 无监督 有监督 线性 非线性 案例分析:特征选择方法学习 案例分析:实际表现