论文:几种信息检索神经网络模型matlab比较

一种有效的信息检索模型_论文_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
享专业文档下载特权
&赠共享文档下载特权
&10W篇文档免费专享
&每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
一种有效的信息检索模型
中国最大最早的专业内容网站|
总评分0.0|
&&提出基于用户查询行为和查询扩展的信息检索模型,给出了设计思想及其算法和实现的关键技术。实验结果表明,该模型能有效提高信息检索性能,有很高的实际应用价值和广阔的前景。
试读已结束,如果需要继续阅读或下载,敬请购买
定制HR最喜欢的简历
你可能喜欢文本数据分析与信息检索论文
文本数据分析与信息检索就是从一个庞大的数据库中提取出隐藏的并且有预见性的信息,它是一项能够帮助企业和个人把焦点集中在他们的数据仓库中重要的信息上的、有强大的功能并且很有潜力的新技术。文本数据分析工具能够预见远景趋势和行为,允许企业和个人进行前摄的、知识挖掘的决策。由文本数据分析技术提供的、具有自动化和预期性的分析超过那些具有回朔工具支持的典型系统对旧数据的分析。文本数据分析工具能够解决那些企业和个人传统上由于时间太紧而未能解决的问题。文本数据分析工具能以隐藏的模式刷新数据库,找到那些因超出专家预期而错过的信息。
关键词:数据分析;文本查询;信息检索;文本分析
Text data analysis and information
retri, the extraction of hidden predictive information from large
databases , is a powerful new technology with great potential to
help Individual and companies focus on the most important
information in their data warehouses . Data analysis of the text
tools predict future trends and behaviors , allowing Individual and
businesses to make proactive , knowledge-driven decisions . The
automated , prospective analyses offered by data analysis of the
text move beyond the analyses of past events provided by
retrospective tools typical of decision support systems . Data
analysis of the text tools can answer Individual and business
questions that traditionally were too time consuming to resolve .
They scour databases for hidden patterns , finding predictive
information that experts may miss because it lies outside their
expectations .
Key Words: D Text
M information S Text Analysis
第一章 绪论&1
第一节 选题背景&1
一、课题来源&1
二、课题目的和意义&1
三、本系统在国内外的发展概况&1
第二节 文本分析与信息检索知识&2
一、文本挖掘技术&2
二、文本信息检索和文本信息提取&3
三、信息检索技术的热点&4
四、信息检索不等于搜索引擎&5
第二章 设计原理&7
第一节 基于关键字的关联分析&7
第二节 全文检索原理&8
第三节 后控词检索原理&9
第四节 文本自动分类&10
第五节 文档自动分类&12
一、文本检索的基本度数&13
二、基于关键字和基于相似性的检索&14
三、潜在语义标引&14
四、其他文本检索标引技术&15
第三章 方案论证&17
第一节 需求分析&17
第二节 系统要求&17
第三节 运行要求&17
第四节 本课题的设计指导思想&18
第四章 系统设计&20
第一节 总体设计&20
一、系统流程分析&20
二、系统设计应考虑到的问题&20
三、方案设计技术流程&21
第二节 详细设计&21
一、存储文本单词模块的设计&21
二、单词装入顺序容器模块的设计&22
三、标点符号去除模块的设计&22
四、单词去后缀模块的设计&22
五、处理单词大小写模块的设计&22
六、去除无用词模块的设计&23
七、单词重新排列模块的设计&23
此套论文,全套包括开题+源程序+论文+可执行文件+答辩稿,可以直接作毕业论文/设计使用.
包售后,包通过,保证唯一.双钻信誉保证&&&
需要此套论文,联系QQ
(先加此QQ为好友,再联系)
第五章 编码与测试&24
第一节 开发环境、工具及特点&24
一、&Visual
二、&面向对象程序设计的特点&24
三、&面向对象编程的基本特征&25
第二节 编码&26
一、&核心部分&26
二、核心部分的实现代码&27
第三节 软件测试&37
一、软件测试的目的&37
二、软件测试的方法&37
三、测试用例设计&37
四、测试&38
五、结果分析&40
第六章 结论&42
第一节 开发过程中遇到的问题及不足&42
第二节 对系统的建议&42
第三节 设计总结&42
参考文献&45
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。信息检索结课论文1_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
享专业文档下载特权
&赠共享文档下载特权
&10W篇文档免费专享
&每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
信息检索结课论文1
阅读已结束,下载本文需要
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,同时保存到云知识,更方便管理
加入VIP
还剩7页未读,
定制HR最喜欢的简历
你可能喜欢几种信息检索模型比较_百度知道
几种信息检索模型比较
关键词:信息检索模型;相关性;查询;搜索引擎中图分类号:TP391 文献标识码:A 文章编号: (0-02Comparision on Information Retrieva ModelsSong Yawei,Xiao Cheng(Jiangsu Provincial Communications Planning and Design Institute Co.,LTD,Nanjing 210005,China)Abstract:This article described the main contents and the construction strategy of the models of information retrieval,demonstrated a lot of methods in common usages,which is to calculate the model of information retrieval.And in this article,the advantages and disadvantages were analyzed,the problems that is still existing have been researched.In addition,the current situation of this research and the development tendency of the model of information retrieval were deeply summarizad in this article.Keywords:InformatRISearch engine当前,随着互联网的普及和网上信息的爆炸式增长,信息检索系统及其核心技术搜索引擎的性能和效率问题已成为人们研究和关注的焦点。影响一个搜索引擎系统的性能有很多因素,但最主要的是信息检索模型,其研究内容包括文档和查询的表示方法、评价文档和用户查询相关性的匹配策略、查询结果的排序方法和用户进行相关度反馈的机制。本文从研究文档与用户查询“相关性”匹配的角度出发,对信息检索模型研究的主要内容和构建策略进行了详细的描述,并给出了几种常用的信息检索模型相关性算法,分析了它们的优缺点及存在的问题,总结了当前信息检索模型的研究现状和发展趋势,其目的在于提高信息检索、查询的性能和效率。一、构建信息检索模型的策略当前,构建信息检索模型的主要策略有以下两个:(一)通用的信息检索模型构建一个通用的信息检索模型,研究优化的匹配算法,提高查询速度、查全率和查准率,最大程度地满足一般用户的查询需求。(二)用户兴趣模型根据特定用户查询兴趣要求构建用户兴趣模型或共同兴趣模型,能够尽可能地满足特殊用户查询的需求。它可以构建一个适合行业或专业应用语义要求信息获取模型。如google就能推断用户的使用意图,提供动态的、即时的用户“个性化定制”信息,帮助用户快速、准确地定位到所需要的信息。二、常用的信息检索相关性算法(一)布尔模型布尔模型是基于特征项的严格匹配模型,文本查询的匹配规则遵循布尔运算的法则。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索引擎则根据事先建立的倒排文件结构,确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。查询结果一般不进行相关性排序。在布尔模型中,一个文档通过一个关键词条的集合来表示,这些词条都来自一个词典。在查询与文档匹配的过程中,主要看该文档中的词条是否满足查询条件。布尔模型用文档的检索状态值作为一种评价查询和文档相似性的一种方法。这里,首先定义关键词集合S,关键词为t1,t2,…,tn。这些关键词可以和逻辑操作符AND,OR和NOT形成不同的条件查询。如果得到条件表达式的值为True,该文档相对于此条查询的检索状态值为1;如果若干文档相对于此条查询的检索状态值都为1,则可以认为,这些文档与此用户的查询是相关的。布尔模型的主要优点有两点:一是实现起来比较容易,速度快,计算的代价相对较少。二是查询语言表达简单,用户可以使用任意复杂的查询表达式,易于表示同义关系(如:聋教育OR特殊教育)和词组(如:计算机AND基础AND课程改革)。它的缺点是,由于所有检索到的与用户查询条件相关的文档具有相同的检索状态值,则不能对查询结果按照相关性进行排序;另外关键词也没有考虑权重的影响,缺乏定量分析和灵活性以及不能表述模糊匹配。而为了克服布尔型信息获取模型查询结果的无序性,在查询结果处理中引进了模糊逻辑运算,将所检索的数据库文档信息与用户的查询要求进行模糊逻辑比较,按照相关的优先次序排列查询结果。(二)向量空间模型向量空间模型把信息库中的文本以及用户的查询都表示成向量空间中的点(向量),用它们之间夹角的余弦作为相似性度量。向量空间模型是现在的文本检索系统以及网络搜索引擎的基础。在向量空间模型中,信息检索系统如果涉及n个关键词Term,则建立n维的向量空间,每一维都代表不同的关键词Term。首先要建立文本和用户查询的向量,一个n元组的文档向量Di的每个坐标都通过对应关键字的权重来表示,查询向量中的权重表示对应关键词对于用户来说的重要程度。然后进行查询向量和文本向量的相似性计算。并可以在匹配结果的基础上进行相关反馈,优化用户的查询。在知道了文档向量与查询向量后,查询与文档的相似性就可以通过公式(2)求解。 (2)在公式(2)中,文档Di可以用n维的向量表示,其中每个分量表示某一Term在整篇文档中的权重。Q = (q1,q2,…,qn)中ql表示Terml在Q中的权重。向量空间模型的优点在于:1.检索词加权改进了检索效果。2.部分匹配策略允许检索出与查询条件相近的文献。3.可以根据相似度对文献进行排序。它的缺点是,在这种模型中的基本假设,关键词Term向量之间被假设为相互无关的,而实际是有时它们之间大多是依赖关系,如在自然语言中,词或短语之间存在着十分密切的联系。所以这一假设对计算结果的可靠性造成一定的影响。另外,在查询中,也不能像布尔模型一样使用关键词之间的逻辑运算关系。(三)概率模型概率模型主要是基于概率排序原则:即如果文档按照与查询的概率相关性的大小排序,那么排在最前面的是最有可能被获取的文档。它主要针对信息检索中相关性判断的不确定性以及查询信息表示的模糊性。在前面的向量模型中,我们假定关键词Term向量是正交的,不考虑Term向量之间的依赖关系。而在概率模型中,可以通过概率计算表达关键词Term之间,以及关键词Term和文档之间的依赖关系,预测文档与用户查询的相关概率,并可以对获取的结果按照相关度概率的大小进行排序(简称PRP)。概率模型有两个主要的参数:一个文档和用户查询的相关概率Pr(rel)及不相关概率Pr(nonrel),并且Pr(rel)=1-Pr(nonrel)。即Pr[term t in document|document is relevant]=Rt/R (3)Pr[term t in document | document is irrelevant]= (ft-Rt)/(N- Rt) (4)其中:R表示与用户查询相关的文档数;Rt表示在相关R中出现关键词Term t的文档数;N表示文档数;ft表示在N个文档中出现关键词Term t的文档数。由式(3)和(4),可以得到:Pr[term t is not in document| document is relevant]= (R- Rt)/R (5)Pr[term t is not in document | document is irrelevant]=(N-ft-(R- Rt))/(N- Rt) (6)根据上面所给的“条件概率”,可以计算出关键词Term t的权重: (7)在公式(7)中,如果wt&0,表明词Term t出现的文档与用户查询相关;如果wt
采纳率:68%
为您推荐:
其他类似问题
您可能关注的内容
信息检索的相关知识
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。 上传我的文档
 上传文档
 下载
 收藏
粉丝量:132
该文档贡献者很忙,什么也没留下。
 下载此文档
(论文)国内重要的全文检索系统功能比较
下载积分:1500
内容提示:(论文)国内重要的全文检索系统功能比较
文档格式:PDF|
浏览次数:3|
上传日期: 20:40:21|
文档星级:
全文阅读已结束,如果下载本文需要使用
 1500 积分
下载此文档
该用户还上传了这些文档
(论文)国内重要的全文检索系统功能比较
关注微信公众号

我要回帖

更多关于 神经网络模型的应用 的文章

 

随机推荐