机器学习

来自iCenter Wiki
2017年8月10日 (四) 13:35Zhenchen讨论 | 贡献的版本

跳转至: 导航搜索

机器学习定义

机器学习(Machine Learning),是指计算机从数据中自动分析获得规律,并利用规律对未知数据进行预测。因此,机器学习又称为统计学习(statistical learning)或统计机器学习(statistical machine learning)。

机器学习的一个简洁的定义:对于某类任务T(Task)和性能度量P(Performance),一个计算机程序被认为可以从经验E(Experience)中学习是指通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。

机器学习的内容

机器学习的内容可以分为监督学习(Supervised Learning)、非监督学习(unsupervised Learning)和半监督学习(Semi-Supervised Learning),还有强化学习(reinforcement learning)和推荐算法(Recommender algorithm)等。

机器学习的主要任务是预测(Regression)与分类(Classification)。

机器学习的特点

李航在《统计学习方法》一书中,总结为:

  1. 以计算机为平台
  2. 以数据为研究对象
  3. 以方法为中心
  4. 汇聚概率论,计算理论等学科的交叉学科
  5. 形成独有的理论体系和方法论

预测

  • 线性预测:

线性回归模型

分类

二元分类的逻辑斯提回归模型

多元分类的逻辑斯提回归模型

工具

(Python)

scikit-learn (Source Code)

阅读材料

  1. Jordan, M. I., and T. M. Mitchell. "Machine learning: Trends, perspectives, and prospects." Science 349, no. 6245 (2015): 255-260. Machine_Learning_Science_2015
  2. 李航,统计学习方法,清华大学出版社。

参考课程

  1. STA414 (U. Toronto), Statistical Methods for Machine Learning and Data Mining, https://www.cs.toronto.edu/~rsalakhu/STA414_2015/.
  2. CS229 (Stanford U.), Machine Learning, http://cs229.stanford.edu/.