更改

大数据索引

添加44字节2017年2月1日 (三) 06:26
/* Inverted Index */
倒排索引(Inverted Index)是搜索引擎使用的数据结构。
倒排索引将关键字(keyword)映射到文档(document),在信息检索(Information Retrieval)中发挥重要作用。在信息检索(Information Retrieval)中,倒排索引的功能是将关键字(keyword)映射到文档(document)。倒排索引在信息检索中发挥重要作用。
在倒排索引中,每个关键词对应一个倒排链表(Inverted List),记录了该关键词出现的所有文档的编号。
* 倒排索引上的最重要的运算是集合交(Conjunction),并(Disjunction)和非(Negation)。 
* 倒排索引在实际实现中,可以采用位图(Bitmap)与整数链表(Integer List)两种结构形式。
* 倒排索引上的交,并和非运算,对应的整数链表操作是Intersection/Unions操作,对应位图是比特AND,OR,NOT操作。
行政员管理员
6,105
个编辑