1、CONTENTS1 大大 数数据据2 大大 数数 据据 与与 心心 理理学学3 创创 意意 应应用用4 优优 点点 缺缺点点1大数据大数据Big Data什么是大数据?又称海量数据,是指所涉及的数据又称海量数据,是指所涉及的数据量规模巨大到无法通过人工在合理量规模巨大到无法通过人工在合理时间内达到截取、管理、处理、并时间内达到截取、管理、处理、并 整理成为人类所能解读的信息。整理成为人类所能解读的信息。数据体量巨大(数据体量巨大(VolumeVolume)数据类型繁多(数据类型繁多(VarietyVariety)数据处理速度快(数据处理速度快(VelocityVelocity)2大数据与心理学
2、Big data and psychology“”Gestalt大数据与格式塔心理学大数据展示了格式塔心理学中“整体大于部分之和”的优势。在总数据量相同的情况下,与分别分析独立的小型数据集(类似于经典心理学研究中的样本)相比,将各个小型数据集合并(类似于总体)后进行分析可以得出更多额外的信息。这些信息可以用来判定消费者喜好、预测选举结果、监控疾病疫情或测定实时交通路况等,如谷歌的流感趋势就是利用大数据对流感进行的预测。能够有诸如上述众多应用开发正是大数据风靡的原因。 谷歌的流感趋势+ 谷歌设计人员认为,人们输入的搜索 关键词代表了他们的即时需要,反映出 用户情况。+ 为便于建立关联,设计人员编
3、入“一揽 子流感关键词,包括温度计、流感症状、肌肉疼痛、胸闷等。只要用户输入这些关键词,系统就会展开跟踪分析,创建地区流感图表和流感地图。+ 为验证谷歌流感趋势预警系统的正确性,谷歌多次把测试结果与美国疾病控制和预防中心的报告做比对,证实两者结论存在很大相关性。大数据的兴起为心理学研究 带来了极大的机遇 + 科学心理学研究立足于反映心理活动的外部表现的客观材料, 即建立在客观数据的基础之上。+ 然而由于条件所限,长期以来心理学研究者几乎无法获取覆盖 研究对象全体的客观数据,从而不得不发展出一套以实验室实 验和抽样统计为核心的学科操作规范。这种操作规范为心理学 研究者进行符合现代科学标准的探索提
4、供了极大便利,使得心理 学学科知识得以迅速积累,但同时也使研究结果的真实性、可用 性和可推广性受到极大约束。+ 大数据理论与技术的出现,特别是当下数据采集技术的飞速发展 和应用范围的极大拓展,使得我们有可能开展极大规模的用户实 验,进行全时全程的跟踪记录,并实现数据颗粒度的灵活变化, 从而使得心理学研究的数据基础更全面坚实,为心理学研究带来 新的发展机遇。对心理学研究两方面的促进对心理学研究逻辑的促进:心理学假设检验的研究逻辑是先验的,是在得出结果之前做出的推断。不同于心理学的研究逻辑,大数据是根据数据分析得出结论,其研究逻辑是后验的。心理学采用先验逻辑,是对经典研究方法只能获得部分、有限的数
5、据这一现实的妥协。大数据的出现为心理学提供了一个后验的可能,进而提高心理学研究的科学性,同时也更符合从实践到理论再到实践的哲学思想。对心理学研究方法的促进:(1)样本代表性(2)客观性(3)数据的收集和处理(4)时效性3创新应用Innovative Application 用户体验用户体验是用户在使用一个产品或服务的过程中建立起来的主观心理感受,对用户体验的理解和把握直接服务于产品的设计和改进。普通用户在产品使用的过程中产生大量的行为数据,利用大数据方法对使用行为进行深入分析,将大大提高研究者和设计者对用户主观感受的洞察能力,并据此开发满足用户主观需求的设计。 随着对个体行为数据记录的普遍化与
6、集成化,通过大数据分析,能够实现对反映公众态度与情绪等影响因素进行监控,预测社会态势如群体性事件的趋势变化,从而实现对群体性事群体性事件的预警。件的预警。 在线心理干预在线心理干预是指将传统的心理干预方法与流程寄托于网络,传统的干预方法受到从业人员数量的限制,而利用大数据技术将心理干预的信息获取、干预实施、反馈收集等流程在线化,能够大大提升心理干预服务的效率和覆盖率。 4基于大数据计算建模的心理测评Psychological evaluation based on large data modeling研究介绍:通过数据挖掘技术,建立基于外部表现或行为特征的心理预测模型。借助于超级计算资源 ,
7、利用心理预测模型实现对大规模用户的实时计算分析。依靠大数据技术的优势对大量网络用户的数据进行分析挖掘 、得出心理特征模型 。构建心理特征预测模型的一般步骤 : 数据标注数据标注 : 数据处理数据处理 : 建立模型:建立模型: 模型评估:模型评估: 标注用户标注用户 清洗清洗 、转换、转换 、 用如机器学用如机器学 分类分类 (准确率召回准确率召回心理特征心理特征 特征设计、特征设计、 习等技术习等技术 率率) ;回归;回归 (相关系数相关系数 平均误平均误 ) 基于大数据进行人格预测的研究思路多任务回归、增量回归的方法 从网络行为中预测五大格 , 结果显示不同人格维度与微博行为之间的关系呈显著
8、相关特征。 Support Vector Machine(SVM)和 Pace回归两种算法建立人格特征预测模型,表明基于微博行为建立的人 格特征预测模型具有良好的预测效果。抑郁预测的研究, 机器学习的方法对网络行为进行建模,预测具有高自杀可能性的人群。白朔天李琳胡泉 + 利用网络用户的网络使用客观行为数据, 通过机器学习的方法建立基于网络使用行为的人格特征预测模型。 5优点与缺点Advantage and Disadvantage优点一方面一方面 ,能大大提高许多研究的效率;,能大大提高许多研究的效率;另一方面,可在验证阶段实现对新发现知另一方面,可在验证阶段实现对新发现知识的快速修正。心理学
9、的持续发展,不仅识的快速修正。心理学的持续发展,不仅需要横向拓展更多研究领域,而且需要纵需要横向拓展更多研究领域,而且需要纵 向挖掘更深层的关系。得益于大数据的理向挖掘更深层的关系。得益于大数据的理论论 、技术和资源,未来心理学的研究必将、技术和资源,未来心理学的研究必将越来越稳固地建立在对客观数据的全面准越来越稳固地建立在对客观数据的全面准确分析之上,并在研究的效率和效果上实确分析之上,并在研究的效率和效果上实现新的飞跃现新的飞跃 。缺点哈佛大学、美国东北大学的几位学者联合撰写的论文“谷歌流感的寓言:大数据分析中的陷阱”其作者认为:大数据的分析是很复杂的,但由于大数据的收集过程,很难保证有像传统“小数据”那样缜密,难免会出现失准的情况,作者以谷歌流感趋势失准为例,指出“大数据傲慢(Big Data Hubris)”是问题的根源。科学一文还认为,“大数据傲慢(Big Data Hubris)”还体现在,存在一种错误的思维方式,即误认为大数据模式分析出的“统计学相关性”,可以直接取代事物之间真实的因果和联系,从而过度应用这种技术。比如:在某个时间很多人搜索“流感”,不一定代表流感真的暴发,完成有可能只是上映了一场关于流感的电影或流行了一个有关流感的段子。