如果大模型是答案，那么什么是问题-三亚资讯生活散文品质生活信息互动平台

如果大模型是答案，那么什么是问题

2024-06-24 08:29 6630次

在近日举行的解放日报第79届文化讲坛上，香港科技大学首席副校长郭毅可做了主题演讲。他在现场提出了一个有趣的问题——“如果大模型是答案，什么是问题”。他分析了当前大模型发展面临的技术挑战、未来大模型发展的必然趋势，分享了香港打造人工智能生态系统的经验，并对上海的人工智能发展提出了建议。以下是演讲主要内容。

英国皇家工程院院士、香港科技大学首席副校长郭毅可在演讲中。海沙尔摄

郭毅可

英国皇家工程院院士、欧洲科学院院士、IEEE（美国电气电子工程师学会）会士，香港科技大学首席副校长。作为国际知名的计算机科学家，他的主要研究领域为机器学习与数据挖掘，在机器学习算法及医学大数据分析系统、人工智能艺术等领域作出了重要贡献。

大家好！我还是讲普通话，讲上海闲话交关人听不懂（上海话）。非常有幸，能够在家乡上海的舞台上演讲。我小时候家里订的报纸就是《解放日报》，所以今天《解放日报》向我发出邀请，我肯定会来（台下发出笑声）。

人工智能已经深入人心。我也没有想到，我原来以为这个世界上有男人和女人就够了，现在还要加上机器人。我今天演讲的主题是：如果大模型是答案，那么什么是问题。我来讲一讲，人工智能的飞跃现在刚刚开始，它未来会怎么发展。

『人工智能可以做什么』

首先，人工智能得以发展，是因为有了一项伟大的技术，叫作神经元网络。人工智能主要是通过神经元网络来模拟人脑。

1942年，奥地利心理学家赫布发表了一篇重要的文章，其中讲了大脑神经元的连接原理。当大脑受到刺激以后，大脑中的一些神经元就会发生连接，如果不断刺激它的话，这些连接会越来越强。神经元的连接实际上是刺激的结果，如果把学习看作一种刺激，那么神经元之间的连接就是学习的表现。神经元网络就是一种模仿大脑神经元之间连接的计算模型。我们不断地给它输入数据，为的是构造不同神经元网络的连接。神经元网络的连接由代表连接的强度的参数来表达，在学习的过程中，我们不断去改变连接的强度，从而使模型的输出能够满足我们的要求。总而言之，这是一种用神经元网络来模仿大脑学习过程的机制。

那么，人工智能可以做什么事情呢？简单来说可以做两类事情。

第一类是判别。判别就是区分不同，区分不同是预测的基础。要知道数据是属于哪一类，先进行数据标注，用标注好的数据来训练模型。有了模型，输入一个不知类别的数据后，模型可以根据特征判定它属于哪一类，这叫判别。比如，图象识别就是一种典型的判别。人脸识别，模型看了很多人的脸以后，这个人是男的还是女的、年轻的还是年老的，根据特征就可以进行判别。

另一类是生成。生成的顺序和判别正好相反。不需要数据标注，我们把所有的数据都输入计算机，它自己来总结数据的特征，再把这个数据进行聚类，有了类别以后，我们就可以要求计算机生成某一种类别的东西。比如，我要计算机生成一棵树，因为模型知道树的特征，它就可以生成一棵它没有见过的树，这就是生成式的人工智能。生成式的人工智能是如今人工智能的主流。以前我们为什么做不到呢？因为以前我们没有这么大的计算机，那么多的数据，也没有这么好的算法。今天我们有了这么大的计算机，有了这么多的数据，我们可以把全世界所有的文字输入计算机，它就会总结出语言的特征，并根据语言的特征生成文字。

有了这个生成式的大模型，人工智能被改变了。原来的人工智能都是解决具体问题的。比如要下围棋，就做一个下围棋的模型。比如要研究蛋白质折叠的问题，就做一个相关的模型。而现在，我们做的是一个基础模型。把所有在互联网上可以获得的文字数据、图象数据、声音数据都输入计算机，让它自己学习这些数据，学完以后，就可以生成各种图片和语言，这就是一个基础模型。在这个模型的基础上，可以形成各种各样的垂直应用。比如，要生成一幅国画，要生成中文，要生成一部医学文献，要生成一个戏剧剧本，都可以通过输入特别的样本，对基础模型进行微调，来形成相关的应用。

所以，大模型的发展在ChatGPT诞生以后呈现出指数级的上升。国内也产生了很多的大模型，几乎每天诞生一个，出现了爆发式增长。

『为什么语言模型如此重要』

有人说，ChatGPT不就是一个人工智能的语言对话系统嘛，为什么它如此重要？谈到它的重要性，要从两篇文章讲起。

第一篇文章是《计算机械与智能》，其作者是大名鼎鼎的英国计算机科学家、被誉为“人工智能之父”的图灵。还有一篇是“控制论之父”、美国数学家维纳发表的文章《人有人的用处——控制论与社会》。这两篇文章都是1950年发表的，可以说，它们开启了人工智能的研究之路。

图灵说：机器有没有智能？怎么界定机器的智能呢？一个比较好的界定方法就是，当一个机器跟人对话的时候，你不能分辨对话者是机器还是人，这就表明机器有了智能。这个测试方法被称为“图灵测试”。所以，语言是界定人工智能是否具有智能的一个重要标准。

维纳在文章中提出了两个问题。首先，他认为机器一定会具有智能，当机器具有智能以后，人和机器在社会中共存的一个重要形式就是人机互相交流、互相对话。其次，这样的机器是怎么产生的？维纳第一次提出，当复杂度达到一定程度时，机器会“涌现”出这样的智能。

为什么图灵会用语言来界定机器是否具有智能呢？奥地利哲学家维特根斯坦有一句名言：“我语言的边界，就是我世界的边界。”语言不仅是交流的工具，更重要的是，语言是思想的体现。语言是我们对世界的“表达模型”，语言是对客观世界的主观编码。从这个意义上来讲，语言的重要性非同寻常，计算机能够讲人类的语言，就意味着它有了和我们相似的智能。

此外，语言还决定了思维方式。如果语言不同的话，我们的思维方式也会不一样。有一部著名的科幻电影叫作《降临》，是根据美国华裔科幻作家姜峰楠的小说改编的。电影讲了一个道理，那就是语言对思维具有非常重要的作用。一群外星人乘坐飞船来到地球，跟我们交流，但我们不懂他们的语言。后来有一位语言学家通过学习对方的文字，终于理解了他们。原来，他们的语言是非线性的，因此他们的思维也是非线性的，可以超越时空的限制。所以说，语言非常重要，如果机器学会了人类的语言，也就学会了人类的思维。

还有更重要的一点，人类的语言不仅仅是思维的编码，人类的语言还有感情，还有能量。比如，我现在跟大家讲话，其中就充满了能量，我想表达我的理念，也希望你们能够接受我的理念，因此就有一种能量的传播。人类语言的精髓在于，语言的内涵是信息，语言的外延是能量。

以上就是人工智能的语言模型如此重要的原因。

『大模型未来的发展趋势』

大模型到底是什么？语言大模型是互联网的信息压缩和提炼。它是所有互联网信息的一个压缩、一个编码，通过这个编码，可以生成语言、文本、图片等。

随着大模型的进一步发展，它现在可以做什么呢？我们把各种各样不同的信息——语言、图像、文本进行输入，通过编码对齐，可以得到多模态的结果。比如，我们给ChatGPT看一张图，然后问它可以用图片上的这些原料做什么。它通过判别，发现图片中有鸡蛋、牛奶、面粉等，然后它会告诉你，用这些原料可以做煎饼、吐司、蛋糕、面包、饼干等等。这是一个典型的例子，现在的大模型越来越倾向于多模态，由多种数据协同推理。

未来，大模型的发展趋势是什么？在我看来，大模型发展的必然趋势是拟人化，越来越像人。从输入来说，它不仅会听，还能看；从模型来讲，现在它会理解，慢慢地它还会思辨。思辨和理解是不一样的，思辨需要有价值观，它会跟你辩论，它知道什么是对的、什么是错的，而且会向你证明。不像现在的ChatGPT，你问问题，机器回答你而已，未来发展更重要的一步是，它可以问你问题，甚至反驳你的问题，也就是说它有自己的价值观，自由意志；从输出方面来说，它不仅会表达，未来还会有行动。这就是具身智能，它可以行动，比如看见东西要掉下去了，机器知道怎样把它接住。未来，计算机科学会变成机器行为学，这是我们需要研究的一个重要方向。总而言之，人工智能会越来越融入我们的生活。

那么，现在的人工智能已经发展到了什么样的水平？2013年的时候有一部非常有名的电影叫作《她》，讲述了人与人工智能相爱的科幻故事。电影中的人工智能不仅能对话，而且还有感情，使得男主角爱上了她。现实和电影的距离正在拉近。2024年5月14日，OpenAI公司发布了GPT-4o，现在的GPT已经有了情绪对话的能力，它甚至可以打断你，虽然它还没有跟人辩论的能力，但它已经能够打断你了。它可以在短至232毫秒、平均320毫秒的时间内对音频输入做出反应，这几乎已经跟人一样了。

『我们现在应该做什么』

我们在香港进行生成式人工智能的研究，但我们的做法跟国内不太一样。在香港，我们不是做很多模型，我们只做一个基础模型，主要是为香港的人工智能企业和香港社会服务，各种研究机构、企业、创新公司都可以到这个平台上进行开发、应用。这个基础模型叫“香港仔（HKGAI）”。它有语言系统，可以对话；也可以写作，学生、政府官员都可以用它来进行写作；还可以做一些多模态的工作，比如用一个人的图片生成动画。

最后，我来讲讲人工智能的技术挑战。技术挑战包括三个方面，一个是算法，一个是数据，一个是算力。

从数据来讲，最大的问题是我们几乎已经穷尽了数据，我们把世界上几乎所有的数据都拿来训练大模型了，数据总是有限的，但我们需要更多的数据、更多的信息来训练大模型。

从算力来讲，有一个叫作扩展律的概念，就是说能力越大，效能越好，但是算力总是有限的，而且我们目前还受到芯片的制约。

从算法来讲，主要有三个问题。首先，我们需要研究怎样避免重复的学习，怎样保证大模型对新的数据不进行重复训练。其次，数据不是没有了，而是被压缩了，既然模型是数据的完美压缩，那么高阶的学习将是在模型上的学习。最后，机器智能和人类智能的培养实际上具有两极性，也就是机器智能和人类智能的培养、训练方法是相反的。人是怎么培养的呢？我们小时候培养的是童心、好奇心，然后培养价值观，了解什么是好的、什么是坏的、什么事情是有价值的、什么事情是不能做的。再后来学习书本知识，最后是积累社会经验。而人工智能是反过来的，一开始，不管三七二十一把所有的数据都给它，训练一个通用大模型，然后进一步垂直化，微调一个个系统，完了之后发现所有的东西都没有价值观，没有思考的能力，所以再开始学习价值观，而最难的是把所有的东西抽象成一个个常识和概念。所以，未来算法最具有挑战性的是，怎样让机器学会价值观，怎样让机器学会常识，并且，怎样让机器记得住、用得上这些常识。

最后，我想对上海人工智能的发展提几点建议。我认为，大模型是一个基础设施，就像地铁，它是一个公共开发的平台，只做一个基础大模型就好，做很多的话会重复。因此，要建设一个上海基础大模型，形成产业生态，可以在这个公共平台上开发各种不同的垂直应用和社会服务，在教育、政务、医学、金融、文创等领域做出世界水平的应用实例。更重要的是，以上海丰富的学术资源为基础，进一步加强基础研究，研究新的算法。最后，千万不要忘了，人工智能的治理非常重要，上海作为国际化大都市，应当建立一个开放性的人工智能治理研究机构，以上海的人工智能应用为背景，做出人工智能治理的国际典范。

今天，我们越来越把机器做成人的样子，未来，我们的社会将会由三种人构成，那就是男人+女人+机器人，而我们的社会还没有为此做好准备。我想，做好人工智能治理的研究工作，把人工智能融入我们的社会、融入我们的生活，这将是我们为人类所做的很大的贡献。谢谢！（全场掌声）

栏目主编：龚丹韵

文字编辑：徐蓓

本文作者：郭毅可