“机器学习”版本间的差异

来自iCenter Wiki
跳转至: 导航搜索
机器学习定义
机器学习的特点
第17行: 第17行:
 
#以数据为研究对象
 
#以数据为研究对象
 
#以方法为中心
 
#以方法为中心
#汇聚概率论,计算理论等学科的交叉学科
+
#概率论、计算理论、最优化理论和计算机科学等学科的交叉学科
#形成独有的理论体系和方法论
+
#具有独有的理论体系和方法论
  
 
=预测=
 
=预测=

2017年8月10日 (四) 13:37的版本

机器学习定义

机器学习(Machine Learning),是指计算机从数据中自动分析获得规律,并利用规律对未知数据进行预测。因此,机器学习又称为统计学习(statistical learning)或统计机器学习(statistical machine learning)。

机器学习的一个简洁的定义:对于某类任务T(Task)和性能度量P(Performance),一个计算机程序被认为可以从经验E(Experience)中学习是指通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。

机器学习的内容

机器学习的内容可以分为监督学习(Supervised Learning)、非监督学习(unsupervised Learning)和半监督学习(Semi-Supervised Learning),还有强化学习(reinforcement learning)和推荐算法(Recommender algorithm)等。

机器学习的主要任务是预测(Regression)与分类(Classification)。

机器学习的特点

李航在《统计学习方法》一书中,总结为:

  1. 以计算机为平台
  2. 以数据为研究对象
  3. 以方法为中心
  4. 概率论、计算理论、最优化理论和计算机科学等学科的交叉学科
  5. 具有独有的理论体系和方法论

预测

  • 线性预测:

线性回归模型

分类

二元分类的逻辑斯提回归模型

多元分类的逻辑斯提回归模型

工具

(Python)

scikit-learn (Source Code)

阅读材料

  1. Jordan, M. I., and T. M. Mitchell. "Machine learning: Trends, perspectives, and prospects." Science 349, no. 6245 (2015): 255-260. Machine_Learning_Science_2015
  2. 李航,统计学习方法,清华大学出版社。

参考课程

  1. STA414 (U. Toronto), Statistical Methods for Machine Learning and Data Mining, https://www.cs.toronto.edu/~rsalakhu/STA414_2015/.
  2. CS229 (Stanford U.), Machine Learning, http://cs229.stanford.edu/.