更改

实验室探究课-智能问答与智能系统

删除752字节2017年3月1日 (三) 07:17
/* 搜索引擎 */
==搜索引擎==
===搜索引擎的原理=== # 爬取网页# 建立索引# 排序# 搜索词处理 ===搜索引擎的系统=== # 爬虫系统-Crawler# 索引系统-Indexer# 排序系统-Sorting# 用户接口-UI ===索引系统=== 索引(Index)是加快查找的数据结构(Data Structure) # 倒排索引(Inverted Index)是搜索引擎使用的数据结构# 倒排索引将关键字(keyword)映射到文档(document)# 倒排索引多采用倒排列表(Posting List)的数据结构# 倒排列表用来存放文档编号,单词频率和文档位置等,来配合单词编号,文档频率和文档位置进行查找 ===开源搜索引擎=== [https://lucene.apache.org/solr/ Solr] [http://nutch.apache.org Nutch搜索引擎[https://pypi.python.org/pypi/Whoosh Whoosh]
==智能助手IPA==
行政员管理员
6,105
个编辑