关于【迅搜全文检索】技术说明
admin | 2017-05-24 23:51 阅 3074 评 0
搜全文检索:迅搜全文检索是国产研发的一款全文检索系统,中文分词也比较完善。他是目前国内唯一的一款全文检索系统。对于中文是很好的!适用于中国范儿! 
ElasticSearch全文检索相对于迅搜功能更加强大,拥有数据化界面,智能分析,一目了然。这个是【迅搜】没有的。同时,ElasticSearch全文检索在技术上更加成熟。是国际十大全文检索之一。 


Xunsearch 是一个高性能、全功能的全文检索解决方案。 


Xunsearch 旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。 

Xunsearch 中文译名为“迅搜”,代码中的经常被缩写为 XS,既是英文名称的缩略也是中文声母缩写。 这儿的“迅”是快速的意思,至少包含了两层涵义:其一代表了搜索结果的响应能力,其二则为二次开发难度、速度。 
Xunsearch 采用结构化分层设计,包含后端服务、前端开发包两大部分,层次清晰而不交叉。 其中后端是采用 C/C++ 编写的守护进程,而前端采用最为流行的脚本语言 PHP ,对于 web 搜索项目更为方便。 具体参见架构设计 
Xunsearch 极大程度降低的搜索开发的难度,除了常规的中文分词、字段检索、布尔语法等功能外, 还比其它免费的解决方案提供了用户急需的相关搜索、拼音搜索、结果高亮、搜索建议等等。 具体的清单请参见我们的功能列表 
Xunsearch 真正全面开源,并使用最流行的开源许可协议 GPL 发布。您可以免费获取本项目的全部源代码, 自由的使用它,并在许可条件下修改和再分发,具体参见授权声明文件。 
1. 应用领域前提是要有一定的 PHP (或其它对应的 SDK 语言) 开发能力,并备有 Unix 类型操作系统的服务器至少一台。 
Xunsearch 可以帮助您建立各种行业门户/垂直搜索、BBS 论坛搜索、CMS/Web站内搜索、文档/文献资料检索, 以及各种基于现有数据库系统的全文检索。 
2. 历史渊源大约在 2006 年创始人 hightman 开始了全文检索的相关探索,先是发布了纯 PHP 实现的中文分词代码, 之后又推出了 MySQL/MyISAM 全文索引的中文分词补丁 MyFT。经过一系列不断完善和改进后,于 2007 年正式发布中文分词项目 scws 并一直维护至今。 
起初开发分词的目的就是为了解决中文的全文检索,全文检索技术虽然已经趋于成熟,但多为商业产品。免费开源、 并且要好用的还真难找了,于是萌动了自己开发全文检索的念头。2008 年推出了比较粗糙的搜索解决方案 FTPHP, 之后于 2010 年又开启了 Xungle 项目,直接免去各种技术需求,为用户提供包含软硬环境在内的搜索服务。 
在 Xungle 项目的运作过程中,我们发现还有大量的用户出于各种原因,不得不自行解决搜索技术。此外, 我们发现了国外一个优秀的开源搜索引擎基础库 Xapian,它采用 C/C++ 开发,并且性能卓越,久经考验。 但是并没有整合中文分词,并且开发难度、复杂度也较大。于是我们下决心整合 Xapian 和 Scws,并在此基础上 提供更多、更常用的搜索功能。这就是 Xunsearch ,目前版本发布正在准备中,代码也已托管到 github 中。 
3. 开发团队本项目由杭州云圣网络科技公司创立并维护,同时也是唯一就 Xunsearch 提供相应的商业技术服务、支持的公司。
说说我的看法
最新评论
    快来抢沙发...