|
|
(2位用户的26个中间修订版本未显示) |
第1行: |
第1行: |
− | == 人工智能 == | + | ==序言== |
| | | |
− | 人工智能(Artificial Intelligence),是指计算机系统具备从听说读写到搜索、推理、决策和回答问题等类人智能的能力,即感知、理解、决策的能力。
| + | 技术科学的进步历程往往是理论通过实践开辟道路的过程。 |
| | | |
− | === 人工智能历史 === | + | == 人工/机器智能 == |
| | | |
− | 过去经历了2次高潮与2次低谷
| + | [[人工智能]]/机器智能(Artificial / Machine Intelligence),是指计算机系统具备从听说读写到搜索、推理、决策和回答问题等类人智能的能力,即感知、理解、决策的能力。 |
| | | |
− | 网络和云计算所支持的计算能力
| + | [[人工智能实现思路]] |
| | | |
− | 基于大数据的机器学习的算法进步
| + | === 发展历史 === |
| | | |
− | === 四个层面 ===
| + | [[人工神经网络的历史]] |
| | | |
− | * 目标与功能
| + | =实验竞赛数据集 = |
| | | |
− | : 语音识别、机器视觉、自然语言理解
| + | [[实验数据集]] |
− | : 智能问答是综合以上功能的高级系统
| + | |
− | | + | |
− | * 核心技术
| + | |
− | | + | |
− | : 特定算法、机器学习算法、深度神经网络
| + | |
− | | + | |
− | * 软件工具
| + | |
− | | + | |
− | : TensorFlow / Caffe / Torch
| + | |
− | | + | |
− | * 底层硬件
| + | |
− | | + | |
− | : 可编程逻辑阵列 FPGA / 通用图形处理器 GPGPU / 通用处理器 CPU 群集
| + | |
− | | + | |
− | === 国际研究 ===
| + | |
− | | + | |
− | [http://research.google.com/teams/brain/ Google Brain] | + | |
− | ([http://research.google.com/pubs/jeff.html Jeffrey Dean])
| + | |
− | | + | |
− | [https://research.facebook.com/ai Facebook AI Research (FAIR)]
| + | |
− | ([http://yann.lecun.com/ Yann LeCun])
| + | |
− | | + | |
− | [https://www.microsoft.com/en-us/research/group/dltc/ MSR Deep Learning Technology Center (DLTC)]
| + | |
− | ([https://www.microsoft.com/en-us/research/people/deng/ Li Deng])
| + | |
− | | + | |
− | [https://www.openai.com/blog/ OpenAI]
| + | |
− | ([http://www.cs.toronto.edu/~ilya/ Ilya Sutskever])
| + | |
− | | + | |
− | == 机器学习 ==
| + | |
− | | + | |
− | 机器学习(Machine Learning),是指机器从数据中自动分析获得规律,并利用规律对未知数据进行预测。
| + | |
− | | + | |
− | === 阅读材料 ===
| + | |
− | | + | |
− | # Jordan, M. I., and T. M. Mitchell. "Machine learning: Trends, perspectives, and prospects." Science 349, no. 6245 (2015): 255-260. [http://science.sciencemag.org/content/349/6245/255 Machine_Learning_Science_2015]
| + | |
− | | + | |
− | === 工具 ===
| + | |
− | | + | |
− | '''Python'''
| + | |
− | | + | |
− | [http://scikit-learn.org scikit-learn]
| + | |
− | ([https://github.com/scikit-learn/scikit-learn Source Code])
| + | |
| | | |
| == 深度学习 == | | == 深度学习 == |
第63行: |
第21行: |
| 深度学习(Deep Learning),机器学习中一种基于对数据进行表征学习的方法,试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 | | 深度学习(Deep Learning),机器学习中一种基于对数据进行表征学习的方法,试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 |
| | | |
− | === 神经网络 ===
| + | [[深度学习]] |
− | | + | |
− | 深度神经网络,Deep Neural Networks,简称DNN
| + | |
− | | + | |
− | [[卷积神经网络]],Convolutional Neural Networks,简称CNN
| + | |
− | | + | |
− | 历史:The rebirth of neural networks, ISCA 2010.
| + | |
− | [http://pages.saclay.inria.fr/olivier.temam/homepage/ISCA2010web.pdf Rebirth_NN]
| + | |
− | | + | |
− | === 阅读材料 ===
| + | |
− | | + | |
− | [[深度学习-入门导读]] | + | |
− | | + | |
− | === 工具 ===
| + | |
− | | + | |
− | '''Google'''
| + | |
− | | + | |
− | [https://www.tensorflow.org/ TensorFlow]
| + | |
− | ([https://github.com/tensorflow/tensorflow Source Code])
| + | |
− | | + | |
− | [http://download.tensorflow.org/paper/whitepaper2015.pdf TensorFlow_Whitepaper]
| + | |
− | | + | |
− | '''Facebook'''
| + | |
− | | + | |
− | [http://torch.ch/ Torch]
| + | |
− | ([https://github.com/torch/torch7 Source Code])
| + | |
− | | + | |
− | [https://github.com/facebook/fbcunn fbcunn]
| + | |
− | | + | |
− | '''Microsoft'''
| + | |
− | | + | |
− | [http://cntk.ai CNTK]
| + | |
− | ([https://github.com/microsoft/cntk Source Code])
| + | |
− | | + | |
− | '''[http://dmlc.ml/ DMLC]'''
| + | |
− | | + | |
− | [http://mxnet.io/ MXNet]
| + | |
− | ([https://github.com/dmlc/mxnet Source Code])
| + | |
− | | + | |
− | '''Université de Montréal'''
| + | |
− | | + | |
− | [http://www.deeplearning.net/software/theano/ Theano]
| + | |
− | ([https://github.com/Theano/Theano/ Source Code])
| + | |
| | | |
| == 增强学习 == | | == 增强学习 == |
第111行: |
第27行: |
| 增强学习(Reinforcement Learning),是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。 | | 增强学习(Reinforcement Learning),是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。 |
| | | |
− | === 阅读材料 ===
| + | [[增强学习]] |
− | | + | |
− | [[增强学习-入门导读]] | + | |
− | | + | |
− | === 工具 ===
| + | |
− | | + | |
− | '''Google'''
| + | |
− | | + | |
− | [https://github.com/deepmind/lab DeepMind Lab]
| + | |
− | | + | |
− | '''OpenAI'''
| + | |
− | | + | |
− | [https://universe.openai.com/ OpenAI Universe]
| + | |
− | ([https://github.com/openai/universe Source Code])
| + | |
| | | |
| == 机器感知 == | | == 机器感知 == |
| | | |
− | 机器感知(Machine Perception),如语音,图像,视频,手势,姿态等
| + | 机器感知(Machine Perception),如语音,图像,视频,手势,姿态等 |
− | | + | |
− | 以下重点讨论
| + | |
− | '''基于深度学习的机器感知'''
| + | |
| | | |
| === 语音识别 === | | === 语音识别 === |
| | | |
− | 语音识别(Automatic Speech Recognition),简称ASR
| + | [[语音识别]],Automatic Speech Recognition,简称ASR |
− | | + | |
− | 传统方法综述
| + | |
− | | + | |
− | :#Karpagavalli, S., and E. Chandra. "A Review on Automatic Speech Recognition Architecture and Approaches." International Journal of Signal Processing, Image Processing and Pattern Recognition 9, no. 4 (2016): 393-404.
| + | |
− | | + | |
− | 基本工具
| + | |
− | | + | |
− | *: Long short term memory neural network (LSTM)
| + | |
− | :# Long short term memory neural computation, Neural computation 9 (8), 1735-1780, 1997. [http://ieeexplore.ieee.org/document/6795963 LSTM]
| + | |
− | | + | |
− | *: Connectionist temporal classification (CTC)
| + | |
− | :# Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks, ICML 2006.
| + | |
− | | + | |
− | *: Gated Recursive Unit (GRU)
| + | |
− | :# On the Properties of Neural Machine Translation: Encoder-Decoder Approaches, SSST-8, 2014.
| + | |
− | | + | |
− | [http://www.cs.toronto.edu/~graves/ Alex Graves],DeepMind研究员,语音识别多项技术开创者。 | + | |
− | | + | |
− | :# Towards End-To-End Speech Recognition with Recurrent Neural Networks, ICML 2014.
| + | |
− | :# Speech recognition with deep recurrent neural networks, 2013.
| + | |
− | :# Hybrid speech recognition with deep bidirectional LSTM, ASRU 2013.
| + | |
− | :# Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks, ICML 2006.
| + | |
− | | + | |
− | Google Speech
| + | |
− | | + | |
− | :# Google Speech Processing from Mobile to Farfield, CHiME 2016. [http://spandh.dcs.shef.ac.uk/chime_workshop/presentations/CHiME_2016_Bacchiani_keynote.pdf Google_Speech_Processing]
| + | |
| | | |
| === 计算机视觉 === | | === 计算机视觉 === |
| | | |
− | 计算机视觉(Computer Vision),简称 CV
| + | [[计算机视觉]],Computer Vision,简称CV |
| | | |
− | Object Detection
| + | == 机器认知 == |
| | | |
− | [http://www.rossgirshick.info/ Ross Girshick],FAIR研究员,R-CNN算法的开创者。
| + | 机器认知(Machine Cognition),自然语言理解、推理、注意、知识、学习、决策、交互等。 |
| | | |
− | :<B>R-CNN (Region-based Convolutional Network method)</B>
| + | '''技术手段:''' |
− | ::#Region based convolutional networks for accurate object detection and segmentation, TPAMI, 2015.
| + | 深度学习(Deep Learning)+ 增强学习(Reinforcement Learning) |
− | ::#Rich feature hierarchies for accurate object detection and semantic segmentation, CVPR 2014.
| + | |
| | | |
− | :<B>Fast R-CNN (Fast Region-based Convolutional Network method)</B>
| + | === 自然语言理解 === |
− | ::#Fast R-CNN, ICCV 2015.
| + | |
| | | |
− | :<B>Faster R-CNN (Faster Region-based Convolutional Network method)</B>
| + | 自然语言理解(Natural Language Understanding),使用的技术称为自然语言处理(Natural Language Processing,简称NLP)。 |
− | ::#Faster R-CNN Towards real-time object detection with region proposal networks, NIPS, 2015.
| + | |
| | | |
− | ::• R-CNN(Matlab): https://github.com/rbgirshick/rcnn
| + | === 智能问答 === |
| | | |
− | ::• Fast_R-CNN(Python): https://github.com/rbgirshick/fast-rcnn
| + | 整合语音识别ASR,计算机视觉CV和自然语言处理NLP的问答系统QA。 |
| | | |
− | ::• Faster_R-CNN(Matlab): https://github.com/ShaoqingRen/faster_rcnn
| + | ==语音合成== |
| | | |
− | ::• Faster_R-CNN(Python): https://github.com/rbgirshick/py-faster-rcnn
| + | [[语音合成]] |
| | | |
− | == 机器认知 == | + | == 计算机游戏 == |
| | | |
− | 机器认知(Machine Cognition),自然语言理解、推理、注意、知识、学习、决策、交互等。
| + | [[计算机游戏]] |
| | | |
− | '''技术手段:'''
| + | ==机器翻译== |
− | 深度学习(Deep Learning)+ 增强学习(Reinforcement Learning)
| + | |
| | | |
− | == 前沿应用进展 ==
| + | [[机器翻译]] |
| | | |
− | === 自然语言理解 === | + | ==推荐系统== |
| | | |
− | 自然语言理解(Natural Language Understanding),使用的技术称为自然语言处理(Natural Language Processing,简称NLP)。
| + | [[推荐系统]] |
| | | |
− | === 智能问答 ===
| |
| | | |
− | 整合语音识别ASR,计算机视觉CV和自然语言处理NLP的问答系统QA。
| |
| | | |
− | 相关阅读:
| + | ==相关资料== |
− | Reasoning in vector space: An exploratory study of question answering, ICLR 2016.
| + | |
| | | |
| 相关课程: | | 相关课程: |
| [[实验室探究课-智能问答与智能系统]] | | [[实验室探究课-智能问答与智能系统]] |
深度学习(Deep Learning),机器学习中一种基于对数据进行表征学习的方法,试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。
自然语言理解(Natural Language Understanding),使用的技术称为自然语言处理(Natural Language Processing,简称NLP)。