跳转到主要内容

为什么经济学家都在学习编程?

Paul Bacon
Paul Bacon
Datastream 产品与内容管理总监及经济内容负责人

为什么经济学家都在学习编程?经济学家一直都需要处理和测试数据集,但现在他们更多地使用 R 和 Python 等编程语言来提高效率,这样就可以运行更复杂的模型。


  1. 大数据分析技术的吸引力现已扩展到数据科学家群体之外。
  2. 经济学家都在忙着学习编程,帮助自己充分利用大数据软件的功能。
  3. 使用电子表格越来越难以管理海量的数据集,但使用新系统只需短短几分钟就能管理任务。Datastream DSWS Web 服务解决方案已成为业内许多经济学的数据源首选。

大数据正渗透到我们所有人的生活中,我们发现我们产品的更多终端用户现在都会编程,利用他们的技能处理和查询大量数据,以获取业务和市场情报。

该领域的技术领导者正在构建一整套解决方案,而且他们面向的不仅仅是数据科学家。

领先独立宏观研究咨询公司 Fathom Consulting 的技术总监 Andrea Zazzarelli 发现,除学术界外,经济学家采用和学习编程语言的趋势日益明显。

经济学家在使用编程方面一直进展比较缓慢。这背后的主要原因之一是,他们没有真正使用与数据科学家相同规模的数据。Zazzarelli 发现,这些编程语言提供的灵活性提高,例如广泛的功能、不断发展的特性、计算速度和系统间互操作性,似乎是推动这一变化的因素。

因此,大数据分析的吸引力现已延伸到经济学家群体。

他还记得,大约六年前他决定学习 R 语言的主要原因就是该语言的开源性质以及来自程序员社区的强大支持。

Why economists are learning to code
一个图形示例,使用多个条件语句对各个行业进行自上而下的分析。

大数据分析

经济学家通常处理频率较低且理论基础较为成熟的数据,而数据科学家往往进行高频率迭代数据测试。

但随着现代经济日益数字化,更强大的计算能力和新颖的数据源为重新思考既定的经济关系提供了机会。例如,Zazzarelli 经常使用从数据科学家那里学到的群集技术。他认为,在有关在线消费者支出的丰富数据中,类似的技术可能会颠覆那些更成熟、但不太具启发性的消费者调查。

他认为使用 R 语言编程对其资产配置工作尤其有帮助。利用 R 语言,他的团队可在一个建模环境下更有效地组合、处理和测试经济与财务关系。

Zazzarelli 还指出,编程语言预示着庞大复杂的电子表格时代即将结束,未来不再需要费神费力地处理电子表格。

Financial Vulnerability Indicator

例如,Fathom 的金融脆弱性指标是一个早期预警系统,提供 170 多个国家/地区的国家风险高频率更新。此级别的数据在电子表格中变得越来越难以管理,仅仅刷新一下便可能需要数小时,而新系统只需短短几分钟就能管理任务。

因此更有必要学习编程和使用编程语言来处理此类数据。

学习编程的好处是什么?

Absolute Strategy Research 量化策略总监 Charles Cara 对此深有同感。

早在 2007 年,他就面临着处理大型数据集的挑战,需要学习技术来解围。Cara 很有远见地投入时间和精力学习编程。

当时,编程通常局限于后台,但随着数据科学家的崛起以及 SQL、Python、R、JAVA、C++、C# 等语言的使用日益增多,如今编程已成为前台职能。

他采用自上而下的方法进行研究,发现 R 语言可以帮助他生成功能强大的图表、拥有数学函数库、很好地连接其他工具并与其他软件包广泛集成。

R 语言成为他首选的编程语言。

Cara 自学成才,表示这就像学习口语一样,“正如学习任何语言,你需要每天练习一点点”。自离开投资银行 Merrill Lynch 并加入 Absolute Strategy 以来,他在过去七年中每天都会学习一点编程,此举帮助他们奠定了领先的市场地位。

他们目前正在为管理超过 5 万亿美元资金的客户提供服务,公司中有两名员工帮助 Cara 满足他的数据需求。

建立数据挖掘软件包之后,在需要时重新运行即可。

只需刷新一下复杂的指标、图表、因子分析和指数,不再需要繁琐的工作,因此他可以更快向客户提供时间敏感的数据。

Why economists are learning to code
计算机编程主题的社交媒体词云

准确洞察

当然,寻找正确的数据是当务之急,否则任何分析都将存在缺陷。

Cara 的首选是 Datastream DSWS Web 服务解决方案,可为他提供执行此类大型数据挖掘任务所需深度和广度的准确数据。

他的数据使用即表明了这一点,他的公司也是 Datastream 首要用户之一。

在您开始添加一些分析数据点时,比如说 170 个国家 10 年期包括八个变量的日常数据,那么很快就得到了超过五百万个数据点。

使用技术的专业人士最头疼的问题是变化的速度,因为今天的语言选择明天可能就会过时。

YouTube 和 GitHub 是帮助您掌握最新动态的首选资源。

加入社区也是个好主意,可以让您的知识保持最新状态。例如 Cara 就创建了自己的 GIThub 页面,并建议参加 Meetup 小组。

时间投入

如果您希望在当今数字化经济中始终领先于技术、收益或招聘曲线,那么学习编程将是一项非常值得的时间投入。

您或许并不打算成为此领域的科学家,但拓宽知识面对您的工作会非常有帮助。

现在面临的挑战是,知道如何采用和调整数据科学家开发的技术来满足自己的需求。