“机器学习”版本间的差异
来自iCenter Wiki
(→机器学习定义) |
(→工具) |
||
第32行: | 第32行: | ||
= 工具 = | = 工具 = | ||
− | '''Python''' | + | ([https://www.python.org '''Python''']) |
[http://scikit-learn.org scikit-learn] | [http://scikit-learn.org scikit-learn] |
2017年8月10日 (四) 13:33的版本
机器学习定义
机器学习(Machine Learning),是指计算机从数据中自动分析获得规律,并利用规律对未知数据进行预测。因此,机器学习又称为统计学习(statistical learning)或统计机器学习(statistical machine learning)。
机器学习的一个简洁的定义:对于某类任务T和性能度量P,一个计算机程序被认为可以从经验E中学习是指通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。
机器学习的内容可以分为监督学习(Supervised Learning)、非监督学习(unsupervised Learning)和半监督学习(Semi-Supervised Learning),还有强化学习(reinforcement learning)和推荐算法(Recommender algorithm)等。
机器学习的主要任务是预测(Regression)与分类(Classification)。
机器学习的特点
李航在《统计学习方法》一书中,总结为:
- 以计算机为平台
- 以数据为研究对象
- 以方法为中心
- 汇聚概率论,计算理论等学科的交叉学科
- 形成独有的理论体系和方法论
预测
- 线性预测:
线性回归模型
分类
二元分类的逻辑斯提回归模型
多元分类的逻辑斯提回归模型
工具
(Python)
阅读材料
- Jordan, M. I., and T. M. Mitchell. "Machine learning: Trends, perspectives, and prospects." Science 349, no. 6245 (2015): 255-260. Machine_Learning_Science_2015
- 李航,统计学习方法,清华大学出版社。
参考课程
- STA414 (U. Toronto), Statistical Methods for Machine Learning and Data Mining, https://www.cs.toronto.edu/~rsalakhu/STA414_2015/.
- CS229 (Stanford U.), Machine Learning, http://cs229.stanford.edu/.