垂直搜索引擎的特点技术 垂直搜索引擎有哪些?

就是通过针对专业某一领域或者某一行业内容的专业而深入地分析挖掘,筛选过滤,将信息定位于更加准确的专业搜索。其实就是将搜索引擎进行细分与扩展,有针对性地为某一特定领域、某一特定人群或某一特定需求提供的专门信息检索服务,以满足用户个性化的信息需求。

垂直搜索引擎可以定向收集与垂直搜索范围有关的页面,并优先收集与内容有关和适合后续加工的页面。它的信息采集可采用人工设置网址与网页分析相结合的方法,从定向分字段中提取所需数据,经过加工后以一定的形式回传至用户。

拓展信息:

垂直搜索引擎主要有四大关键技术

1、聚焦、实时和可管理的网页采集技术

垂直搜索只对局部来源的网页进行采集,采集的网页数量适中。但是它需要收集到的页面是全面的,而且一定要到达更深层次,收集到的动态页面优先级比较高。在实践中,垂直搜索网页获取技术可以根据需求控制获取对象与范围,根据需求支持深度获取以及根据需求支持复杂动态网页获取等。

2、从非结构化内容到结构化数据的网页解析技术

由于垂直搜索引擎服务具有特殊性,通常需要根据需要给出时间,出处,作者等元数据解析(包括从网页上对特定内容的提取)。

3、精要,准确,全面地建立全文索引,采用联合检索技术

垂直搜索因其信息专业性强、使用价值要求高等特点,可以支持全文检索、精确检索、根据需要提供各种结果排序方式等。另外,一些垂直搜索引擎还要求按需支持结构化和非结构化数据联合检索。

4、高度智能化的文本挖掘技术

垂直搜索是以结构化数据为最小单位。在结构化数据与全文数据相结合的基础上,垂直搜索才能够给用户带来更到位,更具价值的信息。整个结构化信息抽取贯穿于网页解析至网页加工处理过程。

垂直搜索引擎的特点技术 垂直搜索引擎有哪些?
版权声明:本站文章大部分为原创,有小部分整理于自互联网。主要目的在于分享信息,版权归原作者所有,内容仅供读者参考。如有侵权请发送邮件至shenma006@gmial.com删除。备案号:晋ICP备2023001592号-1
(0)

相关推荐

发表回复

登录后才能评论