Skip to content

Latest commit

 

History

History
49 lines (27 loc) · 713 Bytes

79_特征选择_课程笔记.md

File metadata and controls

49 lines (27 loc) · 713 Bytes

特征选择

数据表示

将数据规范为特征表示,选择”好的”来改进模型表现,即提高模型泛化能力

计算机视觉中的特征

  • SIFT
  • Spin imgae
  • HoG
  • RIFT
  • Textons
  • GLOH

文本分类中的特征

  • 输入文本
  • 词袋表示

特征选择

  • 特征少会增加模型偏差
  • 特征多会增加模型方差
  • 特征选择:偏差和方差的权衡

特征选择的正则化

  • L2正则化(岭回归Ridge)
  • L1正则化(套索LASSO)

特征选择方法

无监督

有监督

线性

非线性

案例分析:特征选择方法学习

案例分析:实际表现