产品中心

我们专注于文档服务外包!



全文信息检索

2016-05-16 14:40:00

全文搜索的操作方式类似Google(谷歌)、 Baidu(百度), 具有联想检索,比如检索mobile那么相关手机的关键词也会出现。

全文检索在全文索引库的基础上进行检索,可以根据“切词”“同义词”技术对全文进一步的优化检索。

全文搜索的速度比数据库检索的速度要快数倍,因为有索引库的建立。

全文检索管理主要是创建全文索引库功能。创建全文索引库是将档案保存描述性PDI和关联电子文件原文组合成索引库。支持全文检索的格式有doc、htm、txt、pdf、ppt、xls等。

全文检索库的建立粒度需要根据用户常用检索模式、档案数据结构、系统性能问题、授权问题综合考虑。例如工程档案索引库的建立参考“工程-分步工程-分项工程”建立。建立的原则是资料内容稳定,和档案库树型结构的叶子节点基本一致。

索引库的管理主要包括索引的建立、增量、减量、重构操作。这些工作可以定义任务,归属于系统调度,由计算机自动调度执行。

其他基础信息管理,包括检索词库、同义词库等应在系统底层组织,不需要呈现给最终用户。

档案管理系统中的非结构化数据的全文检索系统是档案利用的核心技术,它整合在档案信息利用模块上,提供全文索引服务,实现对以空格拆分的检索关键短语完成或操作检索。检索结果受权限控制,并能够和借阅审批模块实现无缝连接。

延伸阅读