智能信息采集系统
该系统采用最新的智能化主题信息采集技术以及分布式、异构数据库搜索技术,实现对网络资源的搜索、定位、获取、整合、关联、存储、索引以及本地专题服务等操作。是主题门户建设、学科馆员服务以及用户个人信息查询代理的重要工具。
| |
特色 |
|
△采用智能化、多代理技术,实现对多用户、多采集任务的分时处理。
△基于主题的信息发现与分析策略,采准率高。引入“主题 - 子主题”描述方式,实现复杂主题的精确描述,自动语 种判断,自动文本抽取,内容分析与结构分析等。
△信息采集覆盖面广,采全率高。系统同时支持对静态网页和动态网页的搜索。
△全文级信息采集。不仅采集元数据信息,对于开放资源、授权资源,系统可以采集全文。
△个性化、可定制的采集策略。采集器的多任务、分时策略以及多代理机制等均可按用户个人需要定制,系统既满足 用户的个性需求,同时也保证了快速高效的采集性能。
△内容整合与重组使信息更规范,支持跨系统迁移。元数据抽取、内容标引、自动参考链接建立、相关度计算等。
△基于角色的权限管理,保护个人信息组织的隐私权,并支持用户间的共享与协作
|