第一届自然语言处理与中文计算会议课件.pptx

上传人(卖家):三亚风情 文档编号:3018907 上传时间:2022-06-23 格式:PPTX 页数:30 大小:381.89KB
下载 相关 举报
第一届自然语言处理与中文计算会议课件.pptx_第1页
第1页 / 共30页
第一届自然语言处理与中文计算会议课件.pptx_第2页
第2页 / 共30页
第一届自然语言处理与中文计算会议课件.pptx_第3页
第3页 / 共30页
第一届自然语言处理与中文计算会议课件.pptx_第4页
第4页 / 共30页
第一届自然语言处理与中文计算会议课件.pptx_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、微博情感分析评测总结1关注我呗2019年4月21任务设置观点句识别情感倾向性判断针对观点句情感要素抽取针对观点句2关注我呗2019年4月21数据集来自腾讯微博数据原始数据集20话题主要是热门事件,如“三亚春节宰客”约17500条微博约32000个句子3关注我呗2019年4月21数据集数据标注三标注者对同一数据标注数据集大小2023条微博3416个句子1209个非观点句2207个观点句407正面、1766负面、34其他2361个对象441正面、1910负面、10其他4关注我呗2019年4月21数据集标注标准关于观点句个人意愿、心情不是观点句,如“我感到很高兴”表达了明显观点的反问句属于观点句,如

2、“体育竞技有不残酷的吗?”关于观点句倾向性正面、负面,其他(Other)三类,“其他”表示中性或无法确定正负的情况不进行5关注我呗2019年4月21数据集标注标准关于观点句情感对象情感对象优先从当前句子抽取,但可以跨越当前句子从前面的句子或后面的句子中抽取(前面的邻近句子优先)情感对象尽可能完整和明确,事件按细粒度标注: “ipad的屏幕很棒!”- “ipad的屏幕” “官二代陶汝坤:作案动机极其卑劣”- “作案动机”对象本身不是情感表达: ”#官二代求爱不成将少女毁容# 这种畜生是怎么被教育出来的啊!” - “官二代”人称代词需要尽可能在当前微博内进行指代消解: “小明就读于北京大学,他是名

3、优秀的学生。”-”小明“抽取出句子中每个情感片段所对应的情感对象: “你根本已经不是个人了,你比蛇还冷血,你比畜生还畜生。” - “你” “你” “你”6关注我呗2019年4月21参评单位34支队伍包括全国重点高校与科研机构观点句识别:53组情感倾向判断:48组情感对象抽取:22组7关注我呗2019年4月21观点句识别任务要求识别每条微博中各个句子是观点句还是非观点句评价标准准确率、召回率、F值微平均宏平均8关注我呗2019年4月21观点句识别微平均0.5000.5500.6000.6500.7000.7500.8000.8500.9000.9501.0000.0000.2000.4000.6

4、000.8001.000PrecisionPrecisionRecallRecall9关注我呗2019年4月21观点句识别微平均0.0%5.0%10.0%15.0%20.0%25.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.00百百分分比比F-measureF-measure10关注

5、我呗2019年4月21观点句识别宏平均0.5000.5500.6000.6500.7000.7500.8000.8500.9000.9501.0000.0000.1000.2000.3000.4000.5000.6000.7000.8000.9001.000PrecisionPrecisionRecallRecall11关注我呗2019年4月21观点句识别宏平均0.0%5.0%10.0%15.0%20.0%25.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.50

6、0.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.00百百分分比比F-measureF-measure12关注我呗2019年4月21情感倾向性判断任务要求判断微博中每条观点句的情感倾向正面、负面、其他评价标准准确率、召回率、F值微平均宏平均13关注我呗2019年4月21情感倾向性判断微平均0.0000.1000.2000.3000.4000.5000.6000.7000.8000.9001.0000.0000.1000.2000.3000.4000.5000.6000.

7、7000.8000.900PrecisionPrecisionRecallRecall14关注我呗2019年4月21情感倾向性判断微平均0.0%2.0%4.0%6.0%8.0%10.0%12.0%14.0%16.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.00百百分分比比F-meas

8、ureF-measure15关注我呗2019年4月21情感倾向性判断宏平均0.0000.1000.2000.3000.4000.5000.6000.7000.8000.9001.0000.0000.1000.2000.3000.4000.5000.6000.7000.8000.900PrecisionPrecisionRecallRecall16关注我呗2019年4月21情感倾向性判断宏平均0.0%2.0%4.0%6.0%8.0%10.0%12.0%14.0%16.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.35

9、0.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.00百百分分比比F-measureF-measure17关注我呗2019年4月21情感要素抽取任务要求找出微博中每条观点句作者的评价对象判断针对情感对象的观点极性评价标准精确评价宽松评价准确率、召回率、F值18关注我呗2019年4月21情感要素抽取严格评价微平均0.0000.1000.2000.3000.4000.5000.6000.0000.0500.1000.15

10、00.2000.2500.300PrecisionPrecisionRecallRecall19关注我呗2019年4月21情感要素抽取严格评价微平均0.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.00百百分分比比F-

11、measureF-measure20关注我呗2019年4月21情感要素抽取严格评价宏平均0.0000.0500.1000.1500.2000.2500.3000.3500.4000.4500.5000.0000.0500.1000.1500.2000.2500.300PrecisionPrecisionRecallRecall21关注我呗2019年4月21情感要素抽取严格评价宏平均0.0%5.0%10.0%15.0%20.0%25.0%30.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.4

12、0-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.00百百分分比比F-measureF-measure22关注我呗2019年4月21情感要素抽取宽松评价微平均0.0000.1000.2000.3000.4000.5000.6000.7000.0000.0500.1000.1500.2000.2500.3000.3500.400PrecisionPrecisionRecallRecall23关注我呗2019年4月21情感要素抽取宽松评价微平均

13、0.0%5.0%10.0%15.0%20.0%25.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.90百百分分比比F-measureF-measure24关注我呗2019年4月21情感要素抽取宽松评价宏平均0.0000.1000.2000.3000.4000.5000.6000.7000.0000.0500.1000.1

14、500.2000.2500.3000.3500.400PrecisionPrecisionRecallRecall25关注我呗2019年4月21情感要素抽取宽松评价宏平均0.0%5.0%10.0%15.0%20.0%25.0%0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.00百百分分比比F

15、-measureF-measure26关注我呗2019年4月21小结微博情感分析相当具有挑战性不同于产品评论数据,微博数据领域多样,话题广泛,表达自由本次评测中微博观点句识别、倾向性分析的最好结果F值接近于80%,情感要素抽取的最好结果精确评价F值接近于30%,比预想的结果要好,但仍有较大的提升空间本次评测的标注数据可作为相关研究的科研数据,已免费公开发布标注规范和任务设置有待进一步的改进27关注我呗2019年4月2128关注我呗2019年4月21致谢感谢腾讯微博提供数据!感谢北京大学、苏州大学、哈工大深圳研究生院的老师和同学进行数据标注与测评!感谢评测参与单位的支持和意见反馈!29关注我呗2019年4月2130关注我呗2019年4月21

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第一届自然语言处理与中文计算会议课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|