[关闭]
@fanxy 2021-08-11T04:28:54.000000Z 字数 4015 阅读 429

人工智能无法解决知识问题

Jesús Fernández-Villaverde


原文链接

人们发现的唯一可靠的汇总偏好、能力和努力的方法是自由市场。通过价格体系,它使激励与信息披露保持一致。这种方法并不完美,其结果往往不尽如人意。然而,与民主一样,包括“数字社会主义(Digital Socialism)”在内的所有其他选择都更糟。

从 Facebook 到亚马逊、谷歌和苹果,大公司越来越多地收集有关其用户的大量数据,然后使用这些数据来预测行为、定制要显示的内容或建议购买产品。但这种复杂计算的使用不仅限于私人公司,越来越多的知名人士呼吁相信机器学习的力量来决定国家政策。例如,2016 年 11 月,零售巨头阿里巴巴的创始人马云表示:

"100年来,我们已经开始相信市场经济是最好的制度,但在我看来,未来30年将会发生重大变化,计划经济会越来越大。为什么?因为通过接触各种数据,我们或许可以找到市场这只看不见的手。我说的计划经济,不是苏联的计划经济,也不是建国初期的计划经济。市场经济与计划经济最大的区别在于前者有一只市场力量的无形之手。大数据时代,人类获取和处理数据的能力远超你的想象。借助人工智能或多元智能,我们对世界的看法将提升到一个新的水平。因此,大数据将使市场更加智能,使计划和预测市场力量成为可能,从而使我们最终实现计划经济。"

术语“人工智能”(AI) 描述了计算机程序,可以对其分配的任务的环境进行建模,并自主行动以最大限度地提高他们在这些任务中的成功机会。特别是“机器学习”(ML),这是一种使用专门算法从错误和新数据中学习的各种人工智能,在过去的五十年里蓬勃发展。它最近开始应用于经济学、社会科学和公共政策领域。

机器学习在这些领域的日益复杂和能力使公共政策分析师对机器学习辅助经济政策替代人类决策的能力产生了误导性的信心。事实是,这些新方法重复了以前尝试自动化和集中经济的错误。尽管机器学习在解决复杂的分析问题方面表现出令人印象深刻的能力,但它只能找到关联而不是有意义的因果关系,并且无法克服自由市场充分解决的基本信息激励问题。换句话说,尽管马云很乐观,但人工智能永远不会聪明到取代自由市场。

事实是,这些新方法重复了以前尝试自动化和集中经济的错误。

机器学习的力量

人工智能和机器学习是用于以惊人的准确度识别模式的强大工具。例如,想象一下,我们尝试使用来自信用卡交易的数十个数据点来预测信用卡欺诈(例如,交易发生的一天和一周的时间、购买的物品及其价格、信用卡在前二十四小时等)。

在这种情况下,ML 很有帮助,因为我们不需要知道交易的哪些特征是相关的,也不需要知道数据点之间存在什么样的关系。如果我们可以访问数百万笔信用卡交易并了解交易是否存在欺诈,我们就可以“训练”这种关系模型,称为“函数形式”,将过去的模式与新数据相匹配并进行检测,通常使用非常成功,无论新交易是否具有欺诈性。从根本上讲,这里没有什么非常“智能”的东西:它是海量数据拟合的练习。智能的是该过程高度自动化,因此可以轻松扩展到多个环境。

机器学习目前流行的主要原因有三个。首先,我们的计算机变得更加强大,能够进行数十年来学术界只进行理论研究的数据分析。其次,由于互联网和廉价计算,我们现在可以访问更大更全面的数据集。例如,在经济学中,典型的实证论文在 1970 年代有几百个观察结果。今天,看到有数千万次观察的论文是很常见的。这就是为什么 AI 和 ML 通常与“大数据”或“数据分析”等表达相关联的原因。最后,随着计算能力和数据集的增长,计算机科学家和应用数学家在机器学习技术的效率方面取得了巨大进步。

为了利用机器学习的力量,需要非常大的数据集。该行业的经验法则是,需要大约一百万个标记的观察来训练网络。这些庞大的数据集来自两种主要情况。首先,Netflix 和亚马逊等大公司从客户活动中收集大量信息,让他们能够预测您可能还想观看或购买的内容。其次,新技术生成数据观察的所有可能排列并识别这些数据中的关系,我们可以将这些关系与我们在现实世界中找到的数据进行比较。

公共政策和机器学习的局限性

不幸的是,在公共政策的许多领域,我们无法获得如此丰富的数据,而且很可能永远也无法获得。以制定货币政策为例,即规定供应多少货币,通常由国家中央银行进行,例如美国的美联储。

货币政策是一个相对简单的话题,与其他类型的经济政策相比,它的活动部分更少。机器学习能否取代联邦市场开放委员会(FOMC,美联储系统的主要政策工具)?我很怀疑。一方面,FOMC 通常拥有的数据量有限。在美国,我们只有二战后的产出、消费和投资的可靠数据,即便如此,也只有季度水平。如果我们计算它们,从 1947 年第一季度(就我们测量的准确性而言,第一个“良好”观察结果)到 2021 年第二季度(我写这篇文章时的最后一个观察结果),我们有 298 个数据点。对于机器学习技术来说,这远远低于可接受的程度。

此外,美国经济发生了根本性的变化,这限制了旧数据的相关性。我们已经从制造业主导的经济转向服务业驱动的经济,金融创新改变了金融变量与实体变量的关系。不断发展的经济结构改变了数据点之间的关系,使机器学习更难找到清晰的模式。这些结构性变化意味着计量经济学家在估计货币政策对产出的影响时通常不会使用 1980 年代初期之前的观察结果。事实上,这种估计会根据我们是否包括早期观察而急剧变化。此外,经济势必会继续变化,这意味着我们将继续不得不处理越来越新的数据。

使用个人数据(如家庭消费数据或金融交易数据)可以帮助我们获得更多的观察,但我们仍然会遇到类似的问题。例如,思考一下:1990 年代、40 岁出头、家里有几个孩子的已婚夫妇的消费模式,关于 2020 年代、40 岁出头的单身人士的消费模式,没有孩子的信息有多大?此外,在缺乏关于不同数据点之间关系性质的详细解释的情况下,单个数据可以教给我们的内容存在严重限制。

使用微数据的这个额外问题是卢卡斯批判的一个例子,以罗伯特·卢卡斯的名字命名,罗伯特·卢卡斯是上世纪最有影响力的经济学家之一。批评的本质是,即使不是不可能,也很难在数据中区分有多少行为可归因于未观察到的特征或特定公共政策的影响。

机器学习面临着经济学家一个世纪以来一直面临的相同问题:区分因果关系和相关性。此外,机器学习提供的答案仅在一组恒定的情况下有效:政策的变化可能会对不同的人产生不同的影响,这会导致有关政策影响的误导性结果。

如果一家航空公司收紧升舱规则,以一种含蓄地偏爱旅行次数少但费用高的商务舱旅客,这种类型的旅客对这种变化的反应将与定期、短途旅行的商务舱旅客不同。机器学习在没有作为外部行为基础的决策理论的情况下运作,只会识别规则变化和购买活动之间的关联,而不是真正的客户偏好。此外,用不同的策略进行实验以观察行为的更大变化通常是不可行的,甚至是不道德的。除非想疏远客户,否则航空公司不能偶尔改变其升级规则,就像我们不能在不冒经济剧烈波动的情况下对国家货币政策进行试验一样。

其次,对样本进行实验只会让机器学习对该样本中的个体做出解释。例如,为特许学校的申请人进行抽签只能告诉我们特许学校对申请者的影响,而不是一般人群的影响,其中许多人没有申请。此外,与国家政府相比,公司通常享有更大的试验空间;即使对于许多公司来说,机器学习也是不完美的,国家政府几乎无法使用机器学习。

自由市场,而不是“数字社会主义”

依靠机器学习来识别经济趋势和确定经济政策的根本问题与弗里德里希·哈耶克 (Friedrich Hayek) 提出的反对传统社会主义中央计划的理由不谋而合。反对集中规划并不是因为解决相关的优化问题非常复杂,尽管它确实如此。如果这是唯一的问题,AI 和 ML 或许可以帮助我们解决问题。反对中央计划的反对意见是,信息计划者需要的信息是分散的,在没有市场体系的情况下,代理人永远不会有正确的动机来揭示它或通过创业和创新活动创造新的信息。

中央计划的一个简单、现实的应用说明了这一点。每年,宾夕法尼亚大学经济系都面临着为下一学年设置教学分布的挑战。教职员工的每个成员都根据要教授的课程、星期几、一天中的时间等提交她的偏好。找到最佳分配的计算负担是相当可控的。我们有大约三十二名教职员工。一旦你认为某些教授有特定的专业,要考虑的排列是有限的。在 Excel 前几个小时给出了答案:Penn Economics 的中央计划员似乎可以完成她的工作。

真正的挑战是,当我提交我的教学请求时,我没有动力透露我的偏好的真相,也没有太多考虑开发学生可能喜欢的新课程。我可能不介意在一个全新的热门话题上教授一个大型的本科课程,如果我是一个好导师,学生们会过得更好。然而,我不会因为额外的努力而得到补偿,即使额外的努力是最小的,因此我将有动力为一个老式主题的高级本科生申请一小部分。这个结果不是最优的。例如,如果院长可以给我额外的津贴,我会教大而创新的部分,学生会更快乐,我会更富有。然而,即使是这种选择,也会受到更复杂的战略信息操纵的影响,因为我和我的同事们争相根据我们的个人喜好来优化我们的课程量。

我们发现将这些偏好、能力和努力结合起来的唯一可靠方法是自由市场,因为它通过价格体系将激励与信息揭示结合起来。这种方法并不完美,其结果往往不尽如人意。然而,与民主一样,包括“数字社会主义”在内的所有其他选择都更糟。总的来说,还是要靠市场来配置资源。

当我们实施简单的规则时,市场就会发挥作用,例如首先拥有、自愿交换和pacta sunt servanda(“必须遵守协议”)。由于开明的立法者或“有计划”的学术蓝丝带委员会,我们没有提出这些简单的规则。相反,这些简单的规则是进化过程的产物。由于成千上万的代理人的决定,罗马法、普通法和中世纪商人的商法是几个世纪以来逐渐出现的规范体系。进化和反复试验的力量为经济学家所说的机制设计问题提供了最佳解决方案,那些相信机器学习可以做同样事情的人会非常失望。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注