=版权申明=
CC BY-NC-SA
=课程介绍=
45单元-智能问答与智能系统
=教学团队=
==saturnLab介绍==
==学生准备==
携带笔记本,智能手机
(Bring your own laptop computers and camera-ready smart phones)
===搜索引擎的原理===
#爬取网页
#建立索引
===搜索引擎的系统===
#爬虫系统-Crawler
#索引系统-Indexer
===索引系统===
索引(Index)是加快查找的数据结构(data structure)
#倒排索引(Inverted Index)是搜索引擎使用的数据结构
#倒排索引将关键字(keyword)映射到文档(document)
#倒排索引多采用倒排列表(posting list)的数据结构
#倒排列表用来存放文档编号,单词频率和文档位置等,来配合单词编号,文档频率和文档位置进行查找。倒排列表用来存放文档编号,单词频率和文档位置等,来配合单词编号,文档频率和文档位置进行查找
==开源搜索引擎==
==智能助手IPA==
智能助手(Intelligent Personal Assistants, IPAs),是一种新型的人机交互方式,使用者通过语音,图像等自然方式与机器交互。
==智能问答==
苹果Siri,微软Cortana,谷歌Now,亚马逊Echo。苹果Siri,微软Cortana,谷歌Now,亚马逊Echo
===IBM沃森===
====危险边缘(Jeopardy)====
危险边缘(Jeopardy)是一个真人竞争答题的电视节目。
#危险边缘设置3个竞赛选手互相对抗,通过丰富的自然语言回答主题涉及广泛的各种问题。
#回答问题必须具有置信度、准确度以及回答速度,基本上3秒之内完成答题。
====IBM Watson====
2011年沃森参与危险边缘(Jeopardy),并战胜对手,获得奖金。Watson是继1997年5月深蓝战胜人类世界冠军卡斯帕罗夫,人机竞赛的一个新里程碑。
===数据库===
三元数据库
[http://virtuoso.openlinksw.com/ Virtuoso Universal Server]
===开放知识库===
[http://wiki.dbpedia.org/ DBpedia]
===机器感知===
语音识别 voice recognition
===图片搜索===
腾讯优图团队
===人脸识别===
旷视科技Face++,偏重于人脸识别与计算机视觉旷视科技 [http://www.faceplusplus.com/ Face++] 偏重于人脸识别与计算机视觉
===语音识别===
出门问问Mobvoi,偏重自然语言处理与语音识别出门问问 [http://chumenwenwen.com/ MobVoi] 偏重自然语言处理与语音识别
=致谢=
本课程获得微软Azure云计算与机器学习捐赠支持。
感谢微软公司 杨滔经理,章艳经理,刘士君工程师,闫伟工程师。