别了,“回归猴子”!AI加持下的ABM,才是经济学建模的未来

在本科和硕士阶段,我的经济学相关的研究几乎离不开回归模型。那时候的学术圈子里,学经济的人常被戏称为“回归猴子”。这个词汇绝非简单的自我贬低,它精准地捕捉到了我们当时工作的本质:一种近乎机械化的、为了寻找统计显著性而进行的重复劳动。像是被训练的灵长类动物,不断地向模型中添加或剔除变量,调整设定,直到屏幕上出现令人心安的星号。然而,在那些为显著性而欢呼的瞬间,总有一些更深层的不安。

01. 线性世界的局限

确实,回归模型的日常,就是用历史数据跑回归、做稳健性检验,然后得出一些结论。这种方法有它的价值:它能快速抓住“事实”,为政策和市场提供短期预测。但问题也显而易见:只要经济环境发生剧变,历史数据立刻失效,模型预测也会土崩瓦解。

计量经济学模型,其根基建立在一系列脆弱的假设之上。首先是无法回避的模型误设(misspecification)问题。每一个计量模型,本质上都是对复杂现实的极度简化,因此,从定义上讲,它必然是错误的 。我们永远无法知道经济变量之间“真实”的函数形式,也无法穷尽所有相关的影响因素。正如经济学家Ronald Coase那句著名的讽刺:“如果你对数据严刑逼供得足够久,它总会招供的” 。这句话一针见血地指出了研究者偏见在变量选择中的巨大作用,通过不断“拷问”数据,我们总能找到支持自己观点的虚假相关关系。

其次,是因果推断的幻象。在非实验性的经济数据中,从相关性中提炼出因果性是一项极其艰巨的任务 。计量经济学为了做出因果判断,不得不依赖一系列强大但通常无法被检验的假设,比如线性和可加性。然而,在一个由无数反馈回路构成的非线性世界里,这些假设显得不堪一击 我们找到的所谓“因果关系”,很可能只是一个特定历史时期内脆弱的统计幻想。


最后,还有来自卢卡斯的批判(Lucas Critique)。罗伯特·卢卡斯(Robert Lucas)在1976年指出,基于历史数据得出的政策结论往往是无效的,因为理性的经济参与者会根据新的政策调整自己的预期和行为,从而使旧的统计关系失效 。这一批判,似乎更加宣告了那种认为世界会按照历史规律线性演进的思维方式的破产。


这种困境,实际上也是整个经济学领域一场更深层次的认识论危机的缩影。二战后占据主导地位的凯恩斯主义宏观模型,在20世纪70年代的“滞胀”面前束手无策,其预测能力失效

这次失败,也一定程度上导致了经济学的两大转向:一方是转向更为严谨、数据驱动的计量经济学,试图从数据中挖掘规律;另一方则是转向基于微观基础的、理论驱动的一般均衡理论,试图从第一性原理出发构建整个经济世界。我们这些“回归猴子”,就生活在前一个阵营里,常常被后一个阵营的理论家们批评为缺乏坚实的理论根基。而我的个人学术轨迹,也恰好映照了这场宏大的思想分野。那种对回归分析的挫败感,不仅仅是针对工具的局限,更是对一种哲学上的无力感的体验——试图用简单、线性、稳定的关系去框定一个本质上复杂、动态、自适应的系统,这本身就是一种徒劳。



02. 进入均衡世界,在理论中寻求庇护

读博阶段,我接触到可计算一般均衡(Computable General Equilibrium, CGE)和动态随机一般均衡(Dynamic Stochastic General Equilibrium,  DSGE)模型。

它们让我第一次有机会在整体框架里审视经济不同部门、不同地区、不同时间的资源约束和政策冲击都能被系统性纳入。

与计量经济学的“就事论事”相比,CGE模型提供了一种上帝视角。我们更像是构建虚拟经济世界的建筑师,从最基本的微观经济学原理出发——消费者效用最大化、生产者利润最大化——然后将无数个这样的个体和部门黏合在一起,构建出一个内部逻辑完全自洽的、庞大的经济模型。这感觉像是一次智识上的飞跃,从数据挖掘的“手艺活”,上升到了理论驱动的世界构建。


CGE模型及其近亲DSGE模型,提供了一种整体性的、自上而下的视角,能够捕捉到经济体中各个部门、家庭和政府之间错综复杂的反馈循环。这些模型的强大之处在于其严谨的数学基础和对经济理论的忠实遵循,它们假设所有经济主体都在进行最优化决策。对于政策分析而言,这提供了一个强大的框架,可以模拟诸如税收改革、贸易协定等外部冲击对整个经济系统的影响。在模型的世界里,一切井然有序,万物皆可计算。

这种一致性让我震撼,但很快我也体会到它的“光滑”:在均衡的假设下,人被过度简化成“理性预期”的代表性主体,情绪、模仿、异质性都被抹掉了。结果是,模型的边界很清晰,但过程被磨平。


03. 重读2009年的发表,均衡的囚笼

前不久,我正好刷到Farmer和Foley在2009年发表在Nature Opinion专栏的文章《The economy needs agent-based modelling》。

作者当时直言:在金融危机中,计量模型和DSGE都失灵,政策制定者只能“盲飞”。他们提出,或许ABM(代理人建模)才是理解复杂经济系统的出路。


确实,2008年,CGE用优美数学公式构建的象牙塔,在现实世界的海啸面前轰然倒塌。全球金融危机不仅是一场经济灾难,更是主流经济学建模范式的一次惨败。我们必须承认,这些被各国央行和国际组织奉为圭臬的模型,几乎无一例外地未能预测到危机的性质、时机或严重程度。而这场失败也引发了广泛的质疑,从政界到普通大众,都对经济学家所谓的“无能”表示了困惑


这场失败的根源,并非模型的计算不够精确,而是其构建的哲学世界观从根本上就不适用于它所要研究的对象。这些模型将经济体描绘成一个寻求稳定的系统,总是在受到外部冲击后回归某个均衡状态。然而,2008年的危机证明,现代金融经济体是一个内生性地产生不稳定的系统,其危机并非来自外部的“随机冲击”,而是源于系统内部的反馈放大、传染和复杂互动模型之所以在数学上变得易于处理,恰恰是因为它们刻意忽略了现实世界中所有那些有趣的、复杂的,也是最危险的部分

对均衡的执着,变成了一座囚笼,它不仅限制了答案,甚至限制了正确问题的能力——无法在模型中探讨系统性风险、金融传染和市场脆弱性,因为这些概念在均衡的语境下根本不存在。这与其说是计算的失败,不如说是想象力的枯竭。而这场认识危机的根源,深植于这些模型赖以生存的核心假设之中。

首先是“代表性代理人”(Representative Agent)。为了简化计算,DSGE模型通常假设整个经济体可以由一个万能的决策者来代表,他同时是消费者、工人和投资者,独自“经营”着整个经济 。正如经济学家Alan Kirman等人早就指出的,这个假设使得模型完全不适用于大多数宏观经济问题,因为它本质上描绘了一个“没有交易”的经济,彻底抹杀了经济活动的核心——异质性个体之间的互动真实的经济活力恰恰来源于我们每个人的不同,而不是我们的相同。


其次是“理性预期”(Rational Expectations)。模型假设人类拥有完美的信息,能够瞬间对新情况做出理性的、最大化自身长远利益的反应 。这个假设,从定义上就排除了那些驱动金融泡沫与崩溃的真实人类行为——过度自信、恐惧、恐慌和羊群效应 现实中的人,远非模型中那个冷静计算的“经济人”。


最后,也是最核心的缺陷,是“均衡”的幻觉。这些模型的基本信念是,经济总是在趋向一个预设的均衡状态。这种为了数学便利而做出的妥协,剥夺了模型描绘真实危机的可能性。危机,正是一种远离均衡的系统突变现象。正如作者J. Doyne Farmer和Duncan Foley所言,这些模型“从其本质上就排除了我们正在经历的这类危机”。在政策制定者使用的模型里,没有银行,没有金融衍生品,更没有次级抵押贷款。

因此,当危机来临时,它们的预测不是错了,而是“根本就不存在”


节选:《The economy needs agent-based modelling》


04. 模型失效与ABM的可能性

Farmer和Foley十几年前的文章,放在今天看依然犀利。文章的开篇就直言不讳:世界各国正在“凭着感觉驾驶经济”(flying the economy by the seat of their pants),因为在危机面前,他们手中最先进的模型毫无用处


节选:《The economy needs agent-based modelling》


文章提出,或许ABM才是出路:

  • 计量模型只能解释过去,预测在巨变面前失效;

  • DSGE假设了一个过于完美的世界,危机被排除在外;

  • ABM允许把带“脾气”的代理人放进沙盒,让他们在规则下互动,从而观察系统性的涌现。


ABM的核心思想,是放弃传统模型的“自上而下”路径(即预设宏观规律),转而采用“自下而上”的模拟方法它不再试图为整个经济体寻找一个统一的方程式,而是将经济视为一个由大量自主互动的“主体”(agent)构成的演化系统

  • 拥抱异质性:与“代表性代理人”的抽象假设截然相反,ABM从一开始就拥抱深刻的异质性。模型中的主体可以是形形色色的消费者、公司、银行和政策制定者,每一个主体都可以拥有自己独特的属性、行为规则和信息   

  • 局部规则,全局涌现:模型中的每个主体都只遵循简单的、局部的行为规则,但当成千上万个这样的主体互动起来时,宏观层面会自发地涌现出复杂的、无法预测的模式,比如商业周期、市场崩溃或贫富分化 。这些宏观现象,并未被预先编程到任何一个微观主体中,它们是系统整体的产物。这个过程就像鸟群的飞行或交通的堵塞:没有一个总指挥在协调所有个体,但整体模式却从简单的局部互动中自发形成   

  • 走出均衡:最关键的是,ABM不预设任何均衡状态。它们是“永久动态的创造物”。这使得模型能够将危机、泡沫和崩溃视为系统的内生特征,而不是外部的异常冲击,从而对这些现象进行研究  


这种范式转变,让学科的语言也随之改变,从“均衡”与“最优化”转向了“适应”、“涌现”和“异质性”。ABM的希望在于,它能够创造出一个虚拟宇宙或计算实验室,让我们能够在其中测试各种政策干预的效果

然而,这条道路也并非坦途。ABM面临着巨大的挑战:如何在不进行武断猜测的情况下设定主体的行为规则?如何避免创造出过于复杂、难以解释的“黑箱”模型?以及如何对模型进行有效的经验验证和校准?


早期的ABM研究,也确实存在一些被批评为缺乏坚实经济学内涵或难以检验的问题


05. 传统ABM的短板,正在被AI补齐

尽管传统的ABM在哲学和方法论上是一次巨大的飞跃,但它仍有一个关键的局限。模型中的“主体”在很大程度上仍然是设计者的提线木偶。它们遵循的是模型构建者预先编写的、相对固定的行为规则,即所谓的“有限理性”(bounded rationality)。使得模型依然无法完全摆脱“假设过于武断”的批评。主体的行为逻辑,终究是人类智慧的产物,而非在经济环境中自主学习的结果。将ABM与AI相结合这或许是一场质变。

过去ABM始终停留在学术边缘,原因在于:

  • 规则设定困难:代理人怎么决策?常常靠常识或猜测。

  • 计算成本高:全局仿真需要海量算力,难以日常化。

  • 验证不足:缺乏系统化的校准和复现工具。


但AI或许正在逐一化解这些瓶颈:

  • LLM可以抽取规则:从交易数据、问卷、文本中总结出真实决策逻辑;


  • 强化学习与多智能体框架,让代理人具备“学习”与“博弈”能力

    简单来说,强化学习是一种通过试错来学习的机制。主体与环境互动,采取行动,然后根据行动的结果获得“奖励”或“惩罚” 。通过不断重复这个过程,主体会逐渐学习到一套能够最大化其长期累积奖励的“策略”。

    这正是AlphaGo学会下围棋的原理,也正是我们创造能够自主学习如何最大化利润或效用的经济主体的关键。近期的研究已经表明,在ABM中引入RL主体,它们能够自发地学习到复杂的经济行为,例如根据供需进行定价,甚至进行跨区域套利(“低买高卖”)



  • 算力与工具生态(从开源框架到云算力),使得大规模仿真成为可能;

  • 自动化验证:AI能帮助对齐ABM结果与“风格化事实”,提升可复现性。


换句话说,Farmer在2009年呼吁的那条路,在AI的推动下更加具备了现实性。

这种转变,从根本上改变了经济学家的角色。在传统模型中,经济学家是分析师:他们观察数据(计量经济学)或基于固定假设求解一个结果(DSGE)。即使在传统ABM中,他们或许是行为规则的设计师。但在由AI驱动的ABM中,经济学家的角色发生了根本性的变化。他们不再直接定义行为,而是定义环境激励机制(即奖励函数)他们设定好初始条件,然后作为一个观察者,去发现一个怎样的世界会从这些基本设定中涌现出来


AI驱动的经济建模也绝非仅仅停留在学术界的理论探讨,它正成为全球顶级经济与金融机构应对复杂挑战的现实工具。

英格兰银行是ABM领域的先行者之一。早在2008年金融危机之后,他们就开始认识到传统模型的局限性,并积极探索ABM的应用。他们利用ABM来研究房地产市场,评估宏观审慎政策(如贷款价值比和贷款收入比限制)的效果,并试图理解系统性风险的传导机制。这反映着政策制定机构已经从制度层面,融入能够刻画异质性、互动和非线性动态的新工具,以应对日益复杂的金融体系。


与此同时,华尔街的金融巨头们也在纷纷融入AI。以摩根大通为例,其AI研究部门正投入巨资开发包括AI主体、最优化算法和用于金融建模的合成数据生成在内的前沿技术。在瞬息万变、高风险的金融市场中,对更优的风险管理、欺诈检测和实时预测的需求,或许正推动这场技术革命。


还有更多的与ABM相关的研究内容,可以参考Farmer所在的圣塔菲研究所(Santa Fe Institute)的发表:

(https://www.santafe.edu/research/results/working-papers/how-to-do-agent-based-simulations-in-the-future-fr)

这一切探索,都指向一个宏伟的愿景:创建一个与真实世界1:1比例的经济“数字孪生”(digital twin)。这是一个庞大的、自下而上的模拟系统,包含了经济体中所有的公司、消费者和政府。尽管实现这一目标极具挑战,但它代表了该领域的前进方向。一旦建成,政策制定者将拥有一个前所未有的政策沙盒。他们可以在这个虚拟世界中进行各种“假设”情景分析,对经济系统进行压力测试,以应对从全球疫情、气候变化到下一次金融创新可能带来的各种未知冲击


然而,悖论也悄然浮现:我们对AI驱动的经济的理解,将通过AI驱动的工具来介导,而这些工具本身就是那个经济体的一部分。这为我们保持客观性和控制力带来了前所未有的挑战。

另外,复杂系统和人工智能给我们上的最深刻的一课,恰恰是涌现行为的内在不可预测性。例如所谓的“黑箱”问题不仅是一个技术挑战,更是一个哲学难题。未来,我们又或许面临着新一轮的诱惑,一种基于AI强大计算能力的新的傲慢。


写在最后

AI对我们的助力,让我们不再满足于如何用AI快速写出一篇综述,而是迫使我们重新思考:经济学模型的未来到底是什么样子?

对我们而言,这场摆脱“回归猴子”身份的旅程,远未结束。它才刚刚开始,而它的终点,并非一个完美无缺的终极模型,而是一个持续不断地构建、质疑、再重建我们对经济宇宙理解的永恒过程。

回应那篇文章最后的判断:在巨大的不确定性面前,ABM值得一试。而今天,我们已经有了AI这个最强的加速器。


一些重要参考:

  • https://www.worldeconomicsassociation.org/newsletterarticles/econometric-models-wrong/#:~:text=The%20theories%20we%20work%20with,model%20constructed%20is%20miss%2Dspecified.

  • https://gtr.ukri.org/projects?ref=ES%2FK005154%2F1

  • https://www.frbsf.org/wp-content/uploads/Fri_1530_PerezQuiros_July.pdf

  • https://www.imf.org/external/pubs/ft/fandd/basics/econometric.htm

  • https://uneasymoney.com/2019/09/16/whats-wrong-with-dsge-models-is-not-representative-agency/

  • https://odsc.medium.com/ai-and-agent-based-modeling-in-economics-a-keynote-with-j-doyne-farmer-at-odsc-east-2025-9a5a06a9adc6

  • https://www.inet.ox.ac.uk/publications/robust-policy-design-in-agent-based-simulators-using-adversarial-reinforcement-learning

  • https://www.bankofengland.co.uk/working-paper/2025/agent-based-modeling-at-central-banks-recent-developments-and-new-challenges

  • https://www.jpmorganchase.com/about/technology/research/ai

  • https://arxiv.org/abs/2405.02161

  • https://www.jasss.org/26/1/9.html

  • https://arxiv.org/pdf/2411.15718

  • https://economics.mit.edu/sites/default/files/2024-05/The%20Simple%20Macroeconomics%20of%20AI.pdf

  • https://economistwritingeveryday.com/2022/03/14/why-agent-based-modeling-never-happened-in-economics/

  • https://dr.lib.iastate.edu/server/api/core/bitstreams/484ee119-5472-47cc-849a-af2cc44ec5c7/content

  • https://journals.openedition.org/oeconomia/8222

  • https://www.allaboutai.com/ai-agents/agent-based-modeling/