1、基于论文检索系统的热度曲线基于论文检索系统的热度曲线的设计与实现的设计与实现 姓姓 名:名:张钰童张钰童 学学 号:号:2009080304304 学学 院:院:信息学院信息学院 专专 业:业:通信工程通信工程 指指 导导 教教 师:师:张欢张欢 目录目录课题背景和意义课题背景和意义研究方案研究方案数据分析数据分析 总结总结课题背景和意义课题背景和意义随着网络数据的迅速膨胀,数据挖掘技术已成为网络数据分析领域的重要方向。历史信息数据作为一种非常重要的网络数据,它分析并记录了过去一段时间内某一用户群体对某一对象的行为,受到了非常广泛的关注。本文就是通过对历史信息数据进行分析,采集出潜在有用的信息
2、,根据论文衡量指标计算出论文热度值,绘制出一条实时的论文时间热度曲线,更准确、更直观的反应一篇学术论文的质量以及受欢迎程度。课题背景和意义课题背景和意义论文检索系统设计热度曲线是一个全新的创新,用户可以通过观察论文的时间热度曲线来衡量一篇论文的质量以及受欢迎程度,同时有助于帮助用户掌握一篇论文或不同论文在过去一段时间内的更新和索引情况,掌握不同研究方向的不同关注程度,更直观的看到广大用户对该篇论文的评价指标,有利于更准确的选择研究方向。研究方案研究方案本文在了解国内外论文检索系统的研究现状的情况下,从学术论文衡量指标中的被引频次、影响因子、H指数以及用户评这四个指标出发,发现它们的侧重点各不相
3、同,分别从论文本身、期刊、作者以及论文检测系统用户评价的角度来衡量一篇学术论文的受欢迎程度,进一步分析四个学术论文衡量指标的权重,计算出论文时间热度值,并建立论文数据库,通过更新索引等功能得到相应数据,并运用Applet编程语言绘制论文时间热度曲线,来评价一片论文的质量以及受欢迎程度。数据分析数据分析被引频次CF:0.4;影响因子TF:0.2;H 指 数HI:0.3;用户评价UE:0.1。论文热度值计算公式为:论文热度值计算公式为:论文热度值=被引频次*0.4+影响因子*0.2+H指数*0.3+用户评价*0.1数据分析数据分析学术论文基本信息学术论文基本信息数据分析数据分析学术论文数据库热度表
4、学术论文数据库热度表数据分析数据分析学术论文相应期刊总值学术论文相应期刊总值数据分析数据分析学术论文时间热度曲线学术论文时间热度曲线本文在论文检索系统的基础上,建立相应学术论文的数据库,通过索引得到论文的四个衡量指标:被引频次、影响因子、H指数以及用户评价,并分析得到学术论文的热度值,通过Applet程序编程绘制出了一条实时性的论文时间热度曲线。实现了基于论文检索系统设计热度曲线的理论以及实践基础,是一项全新的尝试。在这次毕业设计过程中,我充分了解了国内外论文检索系统的现状,并认识了一些知名的论文检索系统,为以后工作以及生活中查阅资料奠定了一定的基础,同时还学到了很多软件的环境变量配置过程,了解了SQL Server 2008、Tomcat、java等软件的相关知识,学会了数据库建立的基本功能和更新索引的使用方法,了解了完成一项开发工作的相应流程,更加深了自己对所学知识的认识以及理解。总结总结