| 免费索取产品资料 |
| 主页 | 关于我们 | 产品中心 | 成功案例 | 合作模式 | 技术服务 | 行业咨讯 | 诚聘英才 | 联系我们 |
|
智能采集分类系统
产品简介
互联网上丰富的信息资源一直是其魅力的源泉,但是如果没有优秀的信息处理工具,人们面对这些海量信息将无从下手,而被淹没在信息的海洋中不知所措。如何将网上大量有用的信息高效自动采集处理,使其能够被方便利用一直是各种用户的难题。聚川智能采集分类系统即针对该问题,面向国内广大的市场应用,以最先进的技术服务国内用户。
聚川智能采集分类系统能够全自动智能化完成指定信息的采集、分类和发布等一系列信息处理环节,让这些分散在互联网上各个角落的数以亿计的海量信息为我所用。 同时聚川智能采集分类系统具有丰富的接口,可以为网站、集成商的多种软件系统、平台等提供强大的信息处理应用,提高系统的应用价值,拓展市场份额。 功能特点
* 强大的信息采集能力
聚川智能采集分类系统以聚川先进的搜索技术为核心,并针对专业用户所要求的搜索深度深、采集精度高和抓取速度快等进行了专门的优化,采用了分布式多线程并发指令执行体系结构,95%信息分钟级到达本地。能够采集多种动态和静态网页类型(如htm、html、shtml、xml、php、asp、jsp、javascript等),以及多种文档类型(如txt、pdf、rtf、doc、xls、ppt等),同时高速度网页实时增量采集技术实现分秒监测网站信息变化动态,为您提供强大充沛的信息采集动力。 * 准确的自动分类 聚川智能采集分类系统具有灵活准确的自动分类模块,不仅能够根据关键字、布尔逻辑,以及来源等多种信息属性进行自动分类;更采用了先进的KNN和SVM算法的自然语义智能自动分类。用户可以单独使用关键字分类系统或自然语义智能分类系统,或者将二者组合使用,既能提高分类的准确度,使用起来也更加方便灵活。 * 安全的信息浏览 聚川智能采集分类系统为用户提供安全可靠的信息浏览方式,可以通过设置用户权限来控制每个用户所能浏览的信息内容。同时针对国内一些企事业单位和政府机构的特殊的网络安全要求,能够在绝对物理隔离的网络环境中,满足内网用户不用访问外网,即可安全浏览丰富的互联网信息。 * 分秒级的实时检索 聚川智能采集分类系统采用独有的增量实时索引技术保证信息即时采集即时检索,使用户随时检索到行业/地区最新的信息。 * 全面的检索功能 聚川智能采集分类系统秉承聚川优秀的检索功能和性能,为用户提供强大丰富的检索功能。如完全支持布尔逻辑检索、支持n阶渐进检索、支持同义词检索、支持自定义用户词典,拼音检索,相关检索,模糊检索等,并可以由系统管理员人工过滤不当网页,为用户提供最为适当的检索结果。 * 精确的检索结果 聚川智能采集分类系统采用中文切词技术,避免中文检索的歧义与多义现象,同时采用相关性算法对网页进行排序,保证检索相关性最高的页面放在最前面。 * 规范数据输出接口 聚川智能采集分类系统具有多种灵活的数据接口,包括标准的XML结构数据接口和数据库输入接口等。可以轻松结合其它应用系统或平台,提供大量丰富的数据信息,满足用户多种应用需求。 系统架构
领先优势
* 高速度网络信息采集,95%的信息分钟级采集到本地
* 高效率实时监控,分秒监测众多网络信息源变化态势,而带宽占用极少 * 高效准确的自动分类技术,可将关键字分类和自然语义分类分别或组合使用,分类准确 度高达85%以上 * 独有的相关性检索,拼音检索功能满足多种检索需要 * 标准规范的数据接口,可直接调用XML数据,或导入到标准数据库中 |
|||||||||||||||||||
©2008 juchuan 聚川在线科技(北京)有限公司