1. 近年来,金融和宏观经济学对自然语言处理(NLP)的兴趣激增,使用文本数据来预测和辅助模型估计正变得越来越普遍。
2. 本文使用新颖的数据集和各种NLP方法,通过制造业采购经理的评论来量化情绪,评估情绪分类模型对评论中表达的情绪进行正确分类的能力。
3. 通过分析制造业采购经理的评论,可以获取有关经济的新信号来源,帮助投资者更好地了解制造行业的情绪和前景。
核心要点2近年来,金融和宏观经济学对自然语言处理的兴趣增加,使用文本数据来预测和辅助模型估计变得越来越普遍。
本文使用新颖的数据集和各种NLP方法解决了工业生产预测中的一些悬而未决的问题,主要数据来源是供应管理协会商业制造报告的月度调查微观数据。
调查包括分类回答问题和自由回复文本框,采购经理可以在其中提供有关其业务的一般或特定方面的进一步评论。
研究的第一步是将文本量化为经济上重要且可解释的措施,关注情绪,因为乐观和悲观的浪潮在本质上与商业周期波动有关。
评估各种NLP方法对单个评论中表达的情绪进行正确分类的能力。
投资标的及推荐理由本文主要关注制造业的情绪分析,使用了供应管理协会(ISM)商业制造报告的月度调查微观数据作为主要数据来源。
调查包括有关生产,库存,积压,就业和新订单等方面的分类回答问题,并且还包括了采购经理的自由回复文本框,可以提供关于业务的一般或特定方面的进一步评论。
作者首先将文本量化为经济上重要且可解释的措施,关注情绪的表达,因为乐观和悲观的浪潮在本质上与商业周期波动有关。
作者评估了各种NLP方法对单个评论中表达的情绪进行正确分类的能力,并指出数据是制造业采购经理对其公司的业务前景的看法,而没有对财务状况进行太多讨论。
虽然有许多情绪分类模型可用,但许多是在考虑其他数据的情况下开发的,例如社交媒体帖子。
因此,本文的重点是在制造业情绪分析方面的研究和应用。