“机器学习”版本间的差异

来自iCenter Wiki
跳转至: 导航搜索
分类
机器学习的特点
第19行: 第19行:
 
#概率论、计算理论、最优化理论和计算机科学等学科的交叉学科
 
#概率论、计算理论、最优化理论和计算机科学等学科的交叉学科
 
#具有独有的理论体系和方法论
 
#具有独有的理论体系和方法论
 +
 +
 +
=主要机器学习方法=
 +
 +
==感知机 ==
 +
 +
==k近邻 ==
 +
构建kd树
 +
 +
 +
==决策树==
 +
ID3算法
 +
 +
C4.5算法
 +
 +
CART算法
 +
 +
==朴素贝叶斯方法 ==
 +
 +
==最大熵 ==
 +
 +
==支撑向量机==
 +
 +
 +
==AdaBoost==
 +
 +
==隐马尔可夫==
 +
 +
==条件随机场==
  
 
=机器学习的任务=
 
=机器学习的任务=

2017年9月15日 (五) 15:32的版本

机器学习的定义

机器学习(Machine Learning),是指计算机从数据中自动分析获得规律,并利用规律对未知数据进行预测。因此,机器学习又称为统计学习(statistical learning)或统计机器学习(statistical machine learning)。

机器学习的一个简洁的定义:对于某类任务T(Task)和性能度量P(Performance),一个计算机程序被认为可以从经验E(Experience)中学习是指通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。

机器学习的内容

机器学习的内容可以分为监督学习(Supervised Learning)、非监督学习(unsupervised Learning)和半监督学习(Semi-Supervised Learning),还有强化学习(reinforcement learning)和推荐算法(Recommender algorithm)等。

机器学习的主要任务是预测(Regression)与分类(Classification)。

机器学习的特点

李航在《统计学习方法》一书中,总结为:

  1. 以计算机为平台
  2. 以数据为研究对象
  3. 以方法为中心
  4. 概率论、计算理论、最优化理论和计算机科学等学科的交叉学科
  5. 具有独有的理论体系和方法论


主要机器学习方法

感知机

k近邻

构建kd树


决策树

ID3算法

C4.5算法

CART算法

朴素贝叶斯方法

最大熵

支撑向量机

AdaBoost

隐马尔可夫

条件随机场

机器学习的任务

预测

  • 线性预测:

线性回归模型

分类

  • 二元分类的逻辑斯提回归模型
  • 多元分类的逻辑斯提回归模型

软件工具

(Python)

scikit-learn (Source Code)

阅读材料

  1. Jordan, M. I., and T. M. Mitchell. "Machine learning: Trends, perspectives, and prospects." Science 349, no. 6245 (2015): 255-260. Machine_Learning_Science_2015
  2. 李航,统计学习方法,清华大学出版社。

参考课程

  1. STA414 (U. Toronto), Statistical Methods for Machine Learning and Data Mining, https://www.cs.toronto.edu/~rsalakhu/STA414_2015/.
  2. CS229 (Stanford U.), Machine Learning, http://cs229.stanford.edu/.