“你比你 的数据更聪明”

699彩票 http://www.fspvcpp.c 评论

【导读】当我们试图回答反事实问题,比如“如果我们采取了相反的行动会发生什么”时,因果模型的重要性就更加引人注目了。我们将非常详细地讨论反事实,因为对任何人工智能来说,反事实问题都是最具挑战性的问题。这类问题也是推动人类认知力和想象力发展

QQ图片20190712112133.png

【导读】当我们试图回答反事实问题,比如“如果我们采取了相反的行动会发生什么”时,因果模型的重要性就更加引人注目了。我们将非常详细地讨论反事实,因为对任何人工智能来说,反事实问题都是最具挑战性的问题。这类问题也是推动人类认知力和想象力发展的核心,其中前者使我们成为人类,后者使科学成为可能。

有一门科学改变了我们区分事实与虚构的方式,它已经影响到了日常生活的种种重要的方面,并且还有可能进一步扩大影响范围,覆盖从新药开发到经济政策制定,从教育和机器技术人到枪支管制乃至全球变暖等重大问题的探索和解决。

这门新科学并没有一个时髦的名字,我简单地称之为“因果推断”。因果推断力图模拟的理想技术就存在于我们人类自身的意识之中。数万年前,人类开始意识到某些事会导致其他事的发生,并且改变前者就会导致后者的改变。由这一发现,人类这一物种创造出了有组织的社会,继而又建立了乡村和城镇,直至创建了我们今天所享有的科技文明。所有这一切都源于我们的祖先提出了这样一个简单的问题:为什么?

因果推断正是关于这个问题的严肃思考。它假设人类大脑是大自然有史以来为处理因果知识而设计出的最先进的工具。我们的大脑存储了海量的因果知识,而在数据的辅助下,我们可以利用这些知识解决当代社会所面临的最紧迫的问题。一个更宏伟的目标是,一旦我们真正理解了因果思维背后的逻辑,我们就可以在现代计算机上模拟它,进而创造出一个“人工科学家”。这个智能机器人将会为我们发现未知的现象,解开悬而未决的科学之谜,设计新的实验,并不断从环境中提取更多的因果知识。

但在冒险推测未来发展之前,了解迄今为止因果推断这门科学所取得的成就至关重要。我们将深入探讨它是如何改变了几乎所有依赖数据信息的学科中研究者的思维模式,以及它将如何改变我们的生活。

这门新科学解决了以下这些看似简单明了的问题:

*一种特定的疗法在预防某类疾病方面的成效如何?

*是新税法的颁布还是层出不穷的广告推销活动导致了销售额的增长?

*由肥胖引发的医疗保健成本增长的总体占比为何?

*雇用记录可否证明雇主实施了涉及性别歧视的招聘政策?

*我打算辞掉工作。我究竟该不该这么做?

这些问题的共同点在于它们都与因果关系有关,我们可以通过诸如“预防”、“导致”、“由……引发”、“证明”和“该不该”这样的词语轻易识别出它们。这些词在日常生活用语中很常见,我们的社会也一直在不断提出这样的问题并寻求答案。然而,就在不久之前,我们甚至还无法在科学的范围内找到途径明确地表述这些问题,更别说回答它们了。

到目前为止,因果推断对人类最重要的贡献就是让这个科学盲点变成了历史。这门新科学催生出了一种简单的数学语言,用以表达我们已知和欲知的因果关系。以数学形式表达因果关系的能力让我们得以开发出许多强大的、条理化的方法,将我们的知识与数据结合起来,并最终回答出如上述那5个涉及因果关系的问题。

就在20年前,询问一个统计学家诸如“是阿司匹林治愈了我的头痛吗”这样的问题,就会被视为相当于是在问他是否相信巫术。但今天,流行病学家、社会科学家、计算机科学家以及一些开明的经济学家和统计学家开始频繁地提出这样的问题,并能够借助具有高度精确性的数学工具作答。对我来说,这种改变就是一场革命。我斗胆称之为因果革命,是因为这场科学剧变真正接纳了我们人类理解因果知识的认知天赋,而不再将其拒于科学大门之外。

因果革命不是在真空中产生的;它背后有数学工具上的发展作为支撑,这种数学工具最恰当的名称应该是“因果关系演算法”。借助这种工具,我们得以解答出一些有关因果关系的最棘手的问题。能向公众展示这一演算法实在令我兴奋不已,这不仅是因为它拥有跌宕起伏的发展史,更是因为我真心期待未来某天它能在某些人那里发挥出超越我的想象的潜力……

因果关系演算法由两种语言组成:其一为因果图(causal diagrams),用以表达我们已知的事物,其二为类似代数的符号语言,用以表达我们想知道的事物。因果图是由简单的点和箭头组成的图,它们能被用于概括现有的某些科学知识。点代表了我们目标量,我们称之为“变量”,箭头代表这些变量之间已知或疑似存在的因果关系,即哪个变量“听从于”哪个变量。这些因果图非常容易绘制、理解和使用,如果你会使用基于单向街道地图的导航系统,你就一定可以理解因果图,继而也就可以独自解决那些关于因果关系的问题。

当我们感兴趣的科学问题涉及回顾性的思考时,我们通常会诉诸于另一种类型的表达形式,这种表达形式是因果推断科学所独有的,我们称之为反事实(counterfactual)。例如,假设乔在服用了药物D一个月后死亡,那么我们现在关注的问题就是这种药物是否导致了他的死亡。为了回答这个问题,我们需要想象这样一种情况:如果乔在即将服药时改变了主意,他现在会活着吗?

经典统计学只关注总结数据,因此它甚至无法提供一种语言用以提出上面那个问题。因果推断则不仅提供了一种表达符号,更重要的是,它还提供了一种解决方案。这使得我们在预测干预效果时,在多数情况下能够借助一种算法来模拟人类的回顾性思考,通过将我们对观测世界的了解输入算法系统,其将输出有关反事实世界的答案。可以说,这种“反事实的算法化”正是因果革命另一项宝贵的成果。

人类的心智一直在对哪些事可能发生或哪些事可能已经发生做出极可靠的、可重复的判断。例如,我们都明白,即使某天早晨公鸡没有打鸣,太阳也会照常升起。这一共识源于这样一种事实:反事实并非异想天开之物,而是反映了现实世界运行模式的特有结构。共享同一因果模型的两个人也将共享所有的反事实判断。

我是以一名浸淫人工智能领域多年的计算机科学家的身份涉足这门新科学的,我的研究背景使我在进行因果推断方面的研究时能够使用一种该领域的大多数研究同仁所并不具备的视角。首先,在人工智能的世界里,只有当你能够教会机器人理解某个课题时,你才算真正理解了它。我痴迷于这样的思考:是否可以用一种业已存在的语言来表达某个论断,以及我们如何判断一个论断是否与其他一些论断是相一致的。我们可以看到,仅仅是遵循科学语言的语法进行话语实践就能让我们掌握大量的知识,这实在令人惊喜。我对语言的强调也源于一个坚定的信念,即语言会塑造我们的思想。我在机器学习方面的背景也给了我研究因果关系的另一个动力。20世纪80年代末,我意识到智能机器缺乏对因果关系的理解,这也许是妨碍它们发展出相当于人类水平的智能的最大障碍。我坚信强人工智能是一个可实现的目标,也是一个完全无须恐惧的目标,因为我们在实现它的过程中纳入了因果关系。因果推理模块将使智能机器有能力反思它们的错误,找到其软件程序中的弱点,让它像一个道德实体那样思考和行动,并自然地与人类交流它们自己的选择和意图。

“你比你 的数据更聪明”

公海船票_699彩票:“你比你 的数据更聪明”

喜欢 (0) or 分享 (0)
发表我的评论
取消评论

表情

您的回复是我们的动力!

  • 昵称 (必填)

网友最新评论