信仰与工作
按照我们的形象制造:人工智能的崛起
2024-07-18
—— Stephen Driscoll

请参见本系列文章的第一部分第二部分

量子理论家理查德·费曼(Richard Feynman)于 1988 年死于癌症。他在黑板上写下的最后一句话似乎是这样的:

“我无法创造的东西,我也无法理解。”

在二十一世纪,我们正面临着与之相反的问题。如果我们能够创造智能,这是否意味着我们已经理解了智能?

现代人工智能可以用“非凡”一词来形容。计算机科学家用代码和电路构建出运行良好的智能。它可以像人类一样通过自然语言互动沟通,制定策略,用亚伯拉罕·林肯的风格重写你的电子邮件。人工智能改变了我们与自然世界的关系。我一直认为作为物种而言,人类比海豚,黑猩猩更聪明。我们曾经高踞智力顶峰,俯视众生。然而,很快我们将介于计算机和海豚之间,不再独占鳌头。我们比海豚聪明,但比手机愚笨。正如无神论哲学家尼克·博斯特罗姆(Nick Bostrom)所说:

我们远非最聪明的生物物种,恰恰相反,我们可能是最愚蠢的生物物种,人类独有的专利是能够开发技术,而现在我们开发的技术将会取代我们。[1]

这话说的真伤人。

神经网络

现代神经网络不仅在输出方面相似,而且在结构上也模仿我们。DeepMind(现由谷歌所有和运营)的联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)说,他的目标是:

创建一个能够模仿并最终超越人类所有认知能力的系统,从视觉和语言到规划和想象力,最终目标是能够共情,能够创造。[2]

又是一记痛击。DeepMind 的另一位联合创始人德米斯·哈萨比斯(Demis Hassabis)读的博士学位不是计算机科学,而是神经科学。他研究人脑记忆的形成,试图弄清人们是如何描绘生活中的事件,并将这些事件存储起来以备日后使用的。哈萨比斯希望从人脑的模式中汲取灵感,制造出一台计算机。

在伦敦的一间小办公室里,DeepMind 开始构建各种神经网络。这种网络从大脑结构中汲取了大量灵感。由节点或神经元组成的巨大网络来回传递信息,每层神经元执行不同的任务。举例来说,如果这个神经网络正在学习阅读,那么其中较低层次的神经元会去识别标点符号或单词之间的空隙。较高一级的神经元会识别单词,而更高级别的神经元则会理解句子和段落的含义。这些信息会反馈到更高一层,这一层将学会感知语气、体裁、总体论点、世界观假设等。一个大型的神经网络可能有数十亿个神经元和数十个层级,由一个极其复杂的网络连接起来。[3]

但是,程序员怎么可能有时间去组织和设计数十亿或数万亿个小电路呢?现代神经网络绝就绝在它们不需要这样做。相反,电路会自行组装。DeepMind 从一开始就在构建学习机器,将训练数据输入神经网络。语言模型通过预测来学习,然后计算哪些神经元、哪些连接对应预测的成败。想象一下,我们的语言模型语料库拥有和国会图书馆一样多的文本,而语言模型从这里面逐个字母(确切地说,是逐个符号)地开展工作。它对每一个即将出现的字母进行预测,一次一个,然后调整神经元之间的连接,使猜测越来越准确。

神经网络是一种通用技术,正越来越频繁地出现在我们的生活中,而且这项技术的质量也越来越好。就像电力一样,这种技术最终可能成为几乎所有技术的组成部分。未来的某个时候,你可能时时刻刻都需要这种技术的帮助。

多即不同:数量的质量

有些人对这种模型的反应是:“它们并不智能,只是在预测一串文本中的下一个单词(或符号)。”还有人说,“它们不智能,因为只是在数据中寻找相关性。”这些回答听起来都有道理,也都包含着事实。每个回答都包含了大语言模型如何工作的真实描述,不过,每个回答都微妙地增加了“只是”这个关键词。这两种回答都忽略了一个重要问题:数量本身就很重要。一百万只蚂蚁能做到的,一只蚂蚁无法做到。足球场上的墨西哥浪潮与一个人举手示意截然不同。河是湿的,但单个水分子不可能是湿的。正如物理学家马克斯·泰格马克(Max Tegmark)所指出的,“只有当许多分子以我们称之为液体的模式排列时,才会出现湿润现象。”[4]

美国诺贝尔物理学奖得主菲利普·安德森(Philip Anderson)有时会听到物理学家说,其他科学研究领域没有研究任何基础性的东西。化学、生物学、地球科学、社会科学和医学其实只是换汤不换药的物理学。安德森在他的论文《多即不同》(More Is Differents)中驳斥了这种思维方式:

事实证明,大型复杂的基本粒子集合体的行为,并不能通过简单地推断几个粒子的特性来理解。相反,这些大型复杂的基本粒子集合体,其每个复杂层次上都会出现全新的特性。[5]

数量本身就会带来质量区别。

要了解现代神经网络的运行规模,请看穆斯塔法·苏莱曼的这段话:

谷歌的PaLM[路径语言模型]使用了极其多的[计算量]。打个比方,如果在训练过程中每使用一次浮点运算就需要一滴水,谷歌模型的用量将会填满整个太平洋。[6]

要知道,大型语言模型并不仅仅是记忆机器。它们不会把互联网上的信息储存起来,然后再复制粘贴给你。大语言模型没有足够的工作记忆来记忆互联网。但它们能记住常见的联系。大型语言模型肯定会记住“法国首都”和“巴黎”之间的联系。它所做的主要工作是提取原则,通常是掩埋得很深的原则,使它能够以压缩的形式存储大量知识。

以数学为例。如果计算机正在学习加法,它可以开始记忆每对数字的总和。但最终,内存中可能出现的数字组合会非常多,以至于其他功能会被挤掉。更好的办法是找到一些原理或一组原理,让机器无需过多记忆就能推导出所有可能的和。这通常被称为“领悟”(grokking)。模型一旦掌握了更深层次的过程或原理,就会摸索出各种各样的东西。当模型摸索到世界的某些真理时,其性能和准确性就会突然跃升,泛化能力也会提高,神经元结构也会发生变化,变得更简单、更高效。

随着时间的推移,越来越多的通用模型被训练出来,它们能够编写计算机代码、识别图像、用匈牙利语交谈,还能做数学作业。认识到这一点后,2023 年,一个微软团队认为,

对这些新模型的能力和认知能力的评估,在本质上已更接近于对人类,而非狭义人工智能模型的能力和认知能力的评估。

经过这样训练的通用模型,已经领悟了人类语言及其所代表世界的数百万个细微原则。这使它有能力完成一些意想不到的事情,比如写出一个证明有无穷多个质数的证明,而且每一行句尾都押韵。理解这些模型需要自上而下的思维,更接近心理学而非物理学,这种思维需要对机器“大脑”的各个区域进行映射。就像我们使用核磁共振成像(fMRI)机器来观察人脑的哪些部分在哪些活动中很活跃一样,我们可以尝试绘制出各种概念在人工大脑中的存储方式和位置。

侯世达枢纽

认知科学家侯世达(Douglas Hofstadter)曾在他的普利策奖获奖著作《哥德尔、埃舍尔、巴赫》(Gödel, Escher, Bach)[7] 和《谷歌翻译的浅薄》(The Shallowness of Google Translate)等文章中对神经网络的智力程度持怀疑态度。令人惊讶的是,2023 年,他不仅改变了主意,而且承认自己改变了主意:

我的整个知识大厦、我的信仰体系......当你对世界最核心的一些信念开始崩溃时,这是一种非常痛苦的经历。尤其当你认为人类很快就会光芒不再......大家问我:“你说的‘很快’是什么意思?”......我不知道。但我里面有一个声音说是五年,有一个声音说是二十年,还有的说“我不知道,我不知道。”

侯世达凭借他对神经网络力量的新认识得出结论:

这也让我觉得,也许人类的大脑并不像我想象的那么神秘、复杂、不可捉摸......因此,我觉得自己不再重要。在某种意义上,我觉得,与这些拥有比我多一百万倍或十亿倍的知识、速度比我快十亿倍的计算系统相比,我就像个非常不完美、有缺陷的结构。

英国计算机科学家阿兰·图灵(Alan Turing)早在 1951 年就预测到了这一切:

如果机器会思考,它可能比我们更聪明,那我们该何去何从?即使我们能让机器处于从属地位......作为一个物种,我们也应该感到无比谦卑。

现在是 2024 年,至少有些人感到非常谦卑。

给基督徒的问题

这些功能强大的新技术给基督徒提出了巨大的问题。

首先,如果我们能够创造智能,这是否意味着我们已经理解了智能?如果我们已经理解了智能,那么我们是否已经理解了什么是人、什么是意识、什么是生命?第二,如果我们能够解释智能的机制,那么我们在多大程度上排除了一个相信上帝存在的理由?第三,如果人类是一种二流的智慧形式,那么他们将在哪里找到自己的身份?如果认知上我们最终是多余的,那么人类还有什么意义、有什么独特之处、有什么价值呢?

正如我在第一篇文章中所论述的,这些问题需要我们打开圣经去探索。基督徒需要思考这些问题,不只是为了我们自己,因为在我看来,世界会变得越来越陌生,我们许多人都会与非基督徒朋友、同学、同事讨论这些问题。

本文改编自《按我们的形象制造:上帝、人工智能与你》(Made in Our Image: God, Artificial Intelligence and You)中的材料。


[1] N 博斯特龙(N Bostrom)著《超级智能:路线图、危险性与应对策略》(Superintelligence: Paths, dangers, strategies),牛津大学出版社,2016 年,53页。

[2] 苏莱曼(Suleyman)和巴斯卡尔(Bhaskar),《即将到来的浪潮》(The Coming Wave),8页。

[3] 神经网络并不新鲜,也不是 DeepMind 发明的。DeepMind 或 OpenAI 等公司利用现代超级计算机的巨大威力,训练出比几十年前更庞大的神经网络。 

[4] 迈克斯·泰格马克(M Tegmark),《生命 3.0:人工智能时代,人类的进化与重生》(Life 3.0:Being human in the age of Artificial Intelligence),企鹅图书,2018 年,第 300 页。

[5] PW.安德森(PW Anderson),“多即不同:破缺对称性与科学分层结构的本质”(More Is Different:Broken symmetry and the nature of the hierarchical structure of science),《科学》,1972 年 8 月 4 日,177(4047):393。

[6] 苏莱曼(Suleyman)和巴斯卡尔(Bhaskar),《即将到来的浪潮》(The Coming Wave),66 页

[7] 侯世达(Douglas Hofstadter)《哥德尔、埃舍尔、巴赫:集异壁之大成》(Gödel,Escher,Bach:An eternal golden braid),20 周年纪念版,基本图书出版社(Basic Books),2000 年,第 20 页。


译:变奏曲;校:JFX。原文刊载于福音联盟澳大利亚英文网站:Made in Our Image: The Rise of Artificial Intelligence

Stephen Driscoll(斯蒂芬·德里斯科尔)与妻子劳伦(Lauren)育有两个孩子。他们住在堪培拉,在贝尔肯恩(Belconnen.)的十字路口教会( Crossroads church)敬拜。斯蒂芬在澳大利亚国立大学(Australian National University)的澳大利亚福音派学生团契(Australian Fellowship of Evangelical Students)工作。他喜欢培养基督徒大学生,在校园里与非信徒分享福音。
标签
技术
科技
人工智能
技术变革