1. 多操作系统、多平台、多数据库支持
本产品支持的操作系统、应用服务器、数据库如下:
操作系统 Windows
Linux
Unix
应用服务器 Tomcat
Weblogic
Websphere
Resin
Apache
IIS
数据库 Mysql、Sql Server、Oracle、DB2、达梦数据库、人大金仓、其它……
其它必备环境 JDK1.5 以上版本
2. 支持多数据源检索
除了基于数据库的搜索以外,线点科技全文检索产品还支持文件检索方式,可以通过指定文件所在目录进行高效检索,并内置文件解析器,可对PDF、WORD、HTML、TXT多种文件格式自动解析。同时根据用户需要产品也支持从其它各类数据源获取要检索的数据内容,例如:XML文件、其它数据池等等。即使在同一个应用中,也可以通过配置同时从多个数据源获取数据并提供检索服务。
3. 智能化的检索服务
线点科技全文检索产品在全文检索过程中采用相关智能技术以达到迅速、准确、全面定位目标信息。例如采用相关度分析技术,使相关度较高的结果排在结果列表的前面,相关度较低的结果排在后面,并屏蔽无用和错误的信息;构造强大的语义规则库,使系统能够正确地判断与检索词相关的同义词、近似词、上位词、下位词,帮助用户判断结果的相关度,并进行进一步的查询;支持完善的信息分类体系,对检索结果自动分类或者信息聚类;提供智能化的概念扩展查询等。通过这些技术,能够满足大多数智能化搜索需求。
4. 海量数据高效处理
线点科技全文检索产品不仅提供了快速检索功能(在千万级数据下,全文检索能在1秒钟之内完成),同时也有着高效的海量数据处理能力。每小时能处理百万的数据库数据,或是几十万篇的文档。包括中文的分词和建立数据索引。我们的产品在多个大型项目中经过了实际的检验,成功实施过多个超过5千万数据规模的项目。
5. 中文分词技术
中文分词是搜索引擎必须具备的技术之一,应用中文分词技术才能使搜索结果更加符合用户习惯,更加接近用户的期望结果,线点科技全文检索产品集成了中文分词技术,并有着40万词库的支持,用户也可以根据自己的需要和行业特色来添加和维护词库。中文分词技术的准确率和召回率都达到96%以上。
6. 搜索结果多样化展现方式
无论是数据来源于数据库中,或者是各类文件,对于搜索的展示结果,用户可以通过接口或委托线点科技开发进行个性化、多样化的展现,也可以类似数据库那样,对于数据字段进行自由调用查询和展现。
7. 支持多种语言开发接口,与业务系统无缝集成
线点科技全文检索产品以标准的WebService方式提供多种语言开发接口,支持的语言包括.NET,JAVA,PHP等。可与各类WEB应用进行无缝集成。同时提供完善的二次开发API手册帮助及应用示例。
8. 提供丰富检索语法
结合搜索业务的需要,线点科技全文检索产品提供丰富的检索语法支持,包括多字段组合查询、多字段组合排序、支持模糊匹配查询、支持大于,等于,小于,不等于操作符、支持*?等模式匹配,支持位置运算符,字符串的先后顺序、字符的后方截词、中间截词等等。也可以根据用户需要定制开发特殊检索规则。
9. 分布式系统支持
当信息数量超过一台计算机的负载能力,而无法达到要求的查询效率,或是系统需要承受更大的访问压力时,分布式系系统无疑是最好的解决方案。通过分布式系统的支持,系统的数据负载能力可以从300万提高到8000万,甚至更多。
10. 操作简易、维护方便
线点科技全文检索产品提供完整的后台界面,所有配置和操作都可以通过IE访问产品后台进行,操作简易,维护方便,同时也不影响服务器的安全性。