1、提纲v背景概念v理论方法v工具介绍v注意问题背景信息爆炸时间有限科学计量学理论方法信息可视化技术发展相关概念v信息可视化信息可视化 将抽象数据用可视的形式表示,用于知识发现、决策制定、文献信息分析等领域。v科学知识图谱(科学知识图谱(Mapping Knowledge Domain)又称知识图谱、知识地图。又称知识图谱、知识地图。用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,用可视化的图谱形象地展示学科的核心框架、发展历史、前沿领域以及整体知识架构的多学科融合的一种研究方法。信息获取信息获取 知识挖掘知识挖掘 可视化可视化科学知识图谱科学知识图
2、谱科学知识历史科学知识历史研究热点、前沿、趋势研究热点、前沿、趋势相邻学科间关系相邻学科间关系研究人物、机构研究人物、机构提纲v背景概念v理论方法v工具介绍v注意问题理论方法1.引文分析法引文分析法2.共被引分析法共被引分析法3.多元统计分析方法多元统计分析方法4.词频分析法词频分析法5.社会网络分析方法社会网络分析方法理论方法1.引文分析法引文分析法Citation Analysis尤金加菲尔德EugeneGarfield引文分析方法的创立者SCI之父HistCite的发明者 利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象
3、进行分析,揭示其数量特征和内在规律的一种文献计量分析方法。邱均平邱均平文献计量学文献计量学http:/www.garfield.library.upenn.edu/青蒿素研究引文编年图理论方法2.共被引分析法共被引分析法co-citation Analysis 文献共被引分析是计量文献之间关系的一种新方法。即2篇文献共同被1篇文献引用,这2篇文献就构成共引关系。共被引频率定义为这2篇文献一起被引用频次马沙科娃马沙科娃斯莫斯莫尔(苏联、美国科学记录学家)尔(苏联、美国科学记录学家)citing papercitation理论方法3.多元统计分析方法多元统计分析方法 对若干相关的随机变量观测值的分
4、析,包括:因子分析、多维尺度分析和聚类分析。这些方法将在关系矩阵上运算。如某领域文献群组的共被引矩阵。埃格赫埃格赫信息计量学导论信息计量学导论国际科学学主流领域图。刘则渊,陈悦,侯海燕,等.科学知识图谱:方法与应用M.北京:人民出版社,2008.沈建通,姚乐野.多元统计与社会网络分析法在知识图谱应用的实证研究J.情报杂志,2009,(8).理论方法4.词频分析法词频分析法 齐普夫George Kingsley Zipf 齐普夫第一定律 fr*r=C 在文献中,不同词汇的使用与出现频率是有一定规律的。按词频高低进行统计以供分析齐普夫齐普夫 计量学传统方法。http:/www.glottopedi
5、a.de/index.php/History_of_quantitative_linguistics理论方法5.社会网络分析方法社会网络分析方法 Social Nework Analysis 将社会结构界定为一个网络,网络由成员之间的联系进行连接,社会网络分析更多地聚焦于成员之间的联系而非个体特征,并把共同体视为“个人的共同体”,即视为人们在日常和生活中所建立、维护并应用的个人关系的网络WetherellWetherell等等提纲v背景概念v理论方法v工具介绍v注意问题工具简介HistCite Bibexcel、SATI、Thomson Data AnalyzerCiteSpacePajekU
6、cinetVosviewerSPSSAurekaCiteSpace美籍华人陈超美德雷塞尔(Drexel)大学信息科学与技术学院http:/cluster.cis.drexel.edu/cchen/citespace/基于JAVA的可视化文献分析软件 能够显示一个学科或知识域在一定时期发展的趋势、动向及热点,形成若干研究前沿领域的演进历程。http:/cluster.cis.drexel.edu/cchen/bio.htmlCiteSpacev研究前沿(研究前沿(Research FrontsResearch Fronts)普赖斯最早提出“研究前沿”的概念,某个领域的研究前沿是由科学家积极引用的
7、文章所体现的。大概由40 50篇最近发表的文章组成。Citespace定义研究前沿是正在兴起或突然涌现的理论趋势和新主题,代表一个研究领域的思想现状。v知识基础(知识基础(Intellective BaseIntellective Base)在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共引轨迹。CiteSpace的概念模型http:/cluster.cis.drexel.edu/cchen/citespace/CiteSpaceCiteSpace的安装的安装是否安是否安装装JAVAJAVA开机开机进入网站:进入网站:http:/cluster.cis.drexel.e
8、du/cchen/citespace/OR OR 离线开启离线开启下载下载JAVAJAVA并并安装安装否是CitespaceCitespace的操作步骤的操作步骤确定数据库和检索词确定数据库和检索词收集数据收集数据提取研究前沿术语提取研究前沿术语时区分割时区分割阈值选择阈值选择精简和合并精简和合并可视化显示可视化显示图表解读、验证图表解读、验证downloadxx.txt格式选择数据选择数据分析年代分析年代选择数据选择数据切分年代切分年代突现词来源突现词来源选择节点类型选择节点类型阈值调节阈值调节C C引文数量、引文数量、CCCC共被引频次、共被引频次、CCVCCV共被共被引系数三个层次设定阀
9、值,其余的由引系数三个层次设定阀值,其余的由线性内插值决定。线性内插值决定。选择数据选择数据分析年代分析年代选择数据选择数据切分年代切分年代突现词来源突现词来源选择节点点类型选择节点点类型阈值调节阈值调节剪切连线剪切连线1 1、寻径、寻径2 2、最小生成树、最小生成树3 3、修剪切片网、修剪切片网4 4、修剪合并网、修剪合并网可视化显示可视化显示保存图谱保存图谱/图像图像图谱背景色图谱背景色寻找聚类寻找聚类寻找最佳寻找最佳聚类聚类用用termterm标标记聚类记聚类用用keywordkeyword标记聚类标记聚类用摘要词用摘要词标记聚类标记聚类图谱大小调谐图谱大小调谐年代色标年代色标按年显示按年显示频次频次中心性中心性调谐调谐termterm字体、字体、节点大小节点大小调谐调谐nodenode字体、字体、节点大小节点大小聚类视图聚类视图时间视图时间视图时区视图时区视图调谐图谱颜色、调谐图谱颜色、亮度、透明度、亮度、透明度、显示速度等显示速度等阿尔茨海默早期诊断研究国家提纲v背景概念v理论方法v工具简介v注意问题注意问题v安装软、硬件条件v数据清理v有些聚类效果不理想(时间视图)v图谱的判读v其他工具方法的扩展