==搜索引擎==
===搜索引擎的原理=== # 爬取网页# 建立索引# 排序# 搜索词处理 ===搜索引擎的系统=== # 爬虫系统-Crawler# 索引系统-Indexer# 排序系统-Sorting# 用户接口-UI ===索引系统=== 索引(Index)是加快查找的数据结构(Data Structure) # 倒排索引(Inverted Index)是搜索引擎使用的数据结构# 倒排索引将关键字(keyword)映射到文档(document)# 倒排索引多采用倒排列表(Posting List)的数据结构# 倒排列表用来存放文档编号,单词频率和文档位置等,来配合单词编号,文档频率和文档位置进行查找 ===开源搜索引擎=== [https://lucene.apache.org/solr/ Solr] [http://nutch.apache.org Nutch搜索引擎] [https://pypi.python.org/pypi/Whoosh Whoosh]
==智能助手IPA==