搜索结果: 31-45 共查到“知识库 图书分类学”相关记录125条 . 查询时间(2.203 秒)
一个基础教育网站搜索引擎的设计与实现
主题蜘蛛 网站分类 信息提取 搜索引擎
2007/12/27
[摘要]在研究网站元数据的基础上,介绍一个以基础教育网站为检索对象的搜索引擎系统。结合基础教育网站的特点,分析该系统的关键技术,如主题蜘蛛搜索、网站分类、网站信息提取等,并对系统的整体架构、功能模块进行详细描述。
学术数据库与普及型搜索引擎的合作研究
学术数据库 Google Scholar 搜索引擎 跨界合作 发展研究
2007/12/27
[摘要]以维普资讯数据库与Google Scholar的合作实例,阐述学术数据库在跨界合作领域的探索和研究,包括观念前提、技术机制、品牌互动以及现实意义。就我国学术数据库在网络时代的发展战略提出思考。跨界合作双方需要统一观念,能够平衡社会价值与商业价值。跨界合作产生的互换网络广告、文献应用评价以及建立开放的信息传递机制将学术数据库行业引入新的发展领域。
学科领域本体的构建与进化----以经济学领域本体为例
本体 领域本体 学科领域本体 领域本体进化
2007/12/27
[摘要]概述国内外领域本体构建方法及本体进化的研究现状;介绍以《中国分类主题词表》为基础构建“经济学领域本体”初始版本的基本过程,阐述经济学领域本体进化的基本设想,以及具体进化过程及方法,包括获取进化实验数据集,抽取候选关键词,获得本体新概念,建立概念关联等。
[摘要]提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTML标签树上节点的相似度从而识别出潜在记录块,利用启发式规则从潜在记录块中将结果记录块和后续页面链接分别识别出来,然后利用其在标签树上的位置信息分别构造Wrapper。实验结论及与已有方法的比较表明,该方法简单可行且高效。
面向主题的个人实时搜索引擎的设计与实现
搜索引擎 网络爬虫 个人化
2007/12/27
[摘要]介绍一种专为个人用户量身订做的搜索引擎,它使用启发式实时搜索算法,为用户提供最新的主题相关信息。该系统能够结合用户需求,很好地解决综合性搜索引擎中普遍存在的主题固化、信息滞后等问题,同时为搜索引擎的个人化提供理论和实践依据。
面向开放互操作环境的本体存储库研究*
本体 本体存储库 Web服务 元模型
2007/12/27
[摘要]提出一种新颖的本体存储库系统体系结构,支持在大型开放企业环境中的语义信息共享。采用文档方式SOAP Web服务的松耦合机制实现应用程序、用户对本体的存取。系统使用本体Web服务(OWS)封装对本体的操作功能,支持概念的平滑转换,自动检验本体的完整一致性。原型实验显示系统对支持智能信息处理的可行性。
领域本体中的概念及其领域属性研究*
领域本体 通用概念 领域属性 农业初级本体
2007/12/27
[摘要]采用语义分析、系统开发等方法,论述构建领域本体的复杂性,提出利用本体中概念具有的“领域属性”来表示和构建领域本体的观点。并举实例说明在基于农业初级本体的文献检索系统中利用概念的领域属性达到了排除岐义的效果。
[摘要]分析现有中文引文数据库的优缺点,针对其存在的问题,利用元搜索引擎的原理,提出一种改进的中文数据库引文分析系统模型,并详细论述该系统的各项功能。
基于叙词表的主题爬虫技术研究*
主题爬虫 叙词表 搜索引擎
2007/12/27
[摘要]将叙词表同传统的信息检索技术相结合,提出用叙词表的族对爬虫的主题进行描述的方法并用该方法设计实现一主题爬虫。实验结果证明本文提出模型和算法的有效性。
基于网页摘要分析的元搜索引擎研究*
元搜索 摘要分析 相关度
2007/12/27
[摘要]针对目前搜索引擎返回结果的海量性,构建一个元搜索引擎,旨在高效利用多个成员搜索引擎返回的结果。介绍元搜索引擎的基本架构及当前结果融合的主要方法,应用统计学方法研究网页标题、网页摘要与网页文本之间的相关性关系,从而确定相关度权值进行结果相关性判断。实验证明,元搜索引擎搜索结果的平均准确率比各个成员引擎的搜索结果平均准确率都有较大提高。
基于统计-规则方法的网页层次分类技术研究
网页层次分类技术
2007/12/27
[摘要]基于统计的自动分类是网页层次分类中常用的技术,但其有不足之处,主要表现为当子类之间出现严重的特征交叉现象时,分类精确率将大大下降。而网页层次分类的本质决定了同一大类下的子类存在许多相同的特征。针对这一局限性,结合基于规则的自动分类技术的优点,我们提出了一种基于统计-规则方法的网页层次分类技术。实验表明,基于统计-规则方法的网页层次分类技术能够获得比较理想的分类效果。
[摘要]结合粗糙集的属性约简和RBF神经网络的分类机理,提出一种新的文本分类混合算法。试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本。
基于泛用型中文域名与关键词的生物学信息超链接技术实现
生物信息 泛中文域名 关键词 超链接
2007/12/27
[摘要]检索过程中,关键词灵活、易用,检索效率低。通过中文域名与关键词相结合技术对Web上生物学资源检索途径进行研究,通过泛域名解析技术、重定向技术和添加算法,实现生物学的站点、专题与网页的搜索技术。
基于本体实现网页规则分类的方法
本体 规则分类 层次结构
2007/12/27
[摘要]探讨一种新的文档分类方法——基于本体的规则分类法。该方法首先根据分类体系建立每个类的本体,然后根据本体和规则对网页的主要标记信息进行分类。实验表明,这种方法比Rocchio分类法查全率略低,但查准率较高。