1. 主页
  2. 路孚特实验室
  3. 项目 - 我们在做什么
  4. ESG 控制预测

ESG 争议预测

检测 ESG 争议

使用机器学习和自然语言处理 (NLP) 检测公司新闻中的 ESG 争议

问题和机遇

环境、社会责任和治理 (ESG) 数据对于金融市场至关重要,因为投资者正在采取更可持续的方法来实现其投资目标。

投资者可以查看公司的 ESG 披露信息,但他们通常也希望访问未报告的、可能表明存在 ESG 争议的信息。

这些争议可能是有毒废物泄露(环境)、侵犯人权(社会责任)或首席执行官腐败(管理)。

与传统财务信息不同,ESG 数据通常是非结构化的,来自公司自行提交的数据和新闻文章。目前,分析这些数据是一项具有挑战性的手动任务,尽管 ESG 争议有可能对投资业绩产生重大负面影响

路孚特实验室的高级研究员 Tim Nugent 将告诉我们,他的团队如何利用最先进的 NLP 来自动搜寻 ESG 争议数据,并为客户提供可用作投资参考的 ESG 数据。

解决方案        

检测非结构化数据中的 ESG 争议

路孚特实验室的 ESG 争议预测将监督式机器学习和自然语言处理 (NLP) 相结合,以用于算法训练。

该算法会根据文章是否涉及我们内部定义的 20 个 ESG 争议主题进行自动分类,并且(如果涉及的话)为每个主题提供一个概率得分。 

当概率高于置信度阈值时,它将直接通过 ESG 管道处理,而较低的置信度预测值则会发送给分析师进行进一步核查。

在对争议预测有了清晰的认知后,投资者可以快速高效地作出知情、可持续且积极主动的投资决策。

ESG 争议预测的实际应用

研究中的监督式机器学习元素需要高质量的数据。

该原型包括:

  • 路孚特分析师已经用 20 个 ESG 争议主题对 31,600 篇新闻文章进行了注释
  • NLP 元素是 Google 的开源 NLP 模型 BERT (Bidirectional Encoder Representation from Transformers),这是一种可用于语言生成的神经网络语言模型
  • BERT 接受了来自通用领域语料库(例如 Wikipedia 和 BookCorpus 开放数据集)的 33 亿个单词的预训练
  • 路孚特实验室使用路透社 News Archive 中的内容,从大约 200 万篇商业和财经新闻的文章中选取了 7.15 亿个单词,对这一模型进行了进一步训练,从而使其成为专门面向金融和商业领域的模型
  • 然后团队使用经注释的新闻文章对模型进行了微调,以对 ESG 争议主题进行分类

这些步骤提高了原型的性能,超越了原本的 BERT 模型。

Refinitiv Labs ESG classifier data screen shot
ESG 争议预测是路孚特实验室正在迭代开发的一种实用解决方案,旨在解决获取 ESG 争议数据洞察的实际问题。通过将数据的检测和分类自动化,我们可以为客户做出投资决策提供真正的优势。

协作方式

路孚特实验室采用以客户为中心的协作方式,结合客户反馈、海量数据的能力和卓越的合作伙伴技术,为金融市场的实际问题构建解决方案。

与客户协作:

  • 努力实现易得的 ESG 争议预测数据这一共同目标

  • 将客户反馈纳入开发流程的每个阶段 

  • 共同对开发迭代和发布进行审查和指导

我们的合作方包括:

  • Google 的开源 NLP 模型 BERT