支部“党建+科研:学术自强”主题活动系列十一

2022-01-04 16:54:00 郑璐 庄洋洋

2021年12月7日,支部举行“党建+科研:学术自强”主题学术分享活动,本次活动主持人为支部书记郑璐,汇报为支部成员庄洋洋。

南京理工大学经济管理学院研究生胡家珩和岑咏华副教授以及南京农业大学金融学院吴承尧老师在期刊《数据分析与知识发现》发表学术论文《基于深度学习的领域情感词典自动构建——以金融领域为例》。该论文系国家自然科学基金项目“投资者有限关注与证券市场监管:基于大数据和计算实验的方法”(项目编号: 71503130)、国家自然科学基金项目“社会化影响下个体信息认知处理中的扭曲与偏见机制研究”(项目编号: 71471089)和国家社会科学基金重大项目“面向知识创新服务的数据科学理论与方法研究”(项目编号:16ZDA224)的研究成果之一。南京理工大学经济管理学院研究生胡家珩为第一作者,岑咏华副教授为通讯作者,南京农业大学金融学院吴承尧老师为第二作者。

《数据分析与知识发现》创刊于1980年,是由中国科学院主管、中国科学院文献情报中心主办的计算机信息管理技术专业期刊。期刊聚焦各行各业中以大数据为基础、依靠复杂挖掘分析、进行知识发现与预测、支持决策分析和政策制定的研究与应用,致力于提供理论指导、技术支持和最佳实践等。

1.jpg

(文献截图)

论文为特定领域情感分析任务构建一个适用的情感词典。以金融领域为例,结合语料库和知识库的特点,提出一种全新的构建情感词典的方法:利用词向量方法将文本信息映射到向量空间,借助已有的通用情感词典,自动标引训练语料,按照9:1的比例构建训练集和预测集。使用 Python构建深度神经网络分类器,判断特定领域候选情感词的情感极性,构成情感词典。本文构建的神经网络分类器的训练集准确度为95.02%,预测集准确度为95.00%,同时证明了利用本文方法所构建的情感词典在金融领域中的表现优于其他已有方法。局限在于抽取种子词的方法需要进一步优化。本文的方法解决了训练神经网络分类器中训练语料不足的问题,同时解决了词向量的语义相关性无法区分情感信息的问题。在构建面向特定领域情感词典上具有较好的表现,为该领域其他研究提供参考依据。

学术自强活动是至善党支部的传统活动,旨在为博士生科研进度和学术交流提供一个平台。会后支部成员就各自的学术问题,在支部内部进行了讨论。


责任编辑:孙靓

我要评论 (网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述)

全部评论 ( 条)

    学术交流
    说明:热度榜主要以育人号最近72小时的活跃度(包括发文量、浏览量、评论数、点赞数)和近24小时的更新数为主要指标进行计算。其中前者占60%,后者占40%。