.CN 三亚资讯 生活散文
用户名:    密码:   注册
  工行 中行 建行 交行 农行 邮政银行   百度翻译        京东 微博 网易 新浪 百度        163邮箱 QQ邮箱     
首页> 热点资讯

如果大模型是答案,那么什么是问题

2024-06-24 08:29    281次

 

在近日举行的解放日报第79届文化讲坛上,香港科技大学首席副校长郭毅可做了主题演讲。他在现场提出了一个有趣的问题——“如果大模型是答案,什么是问题”。他分析了当前大模型发展面临的技术挑战、未来大模型发展的必然趋势,分享了香港打造人工智能生态系统的经验,并对上海的人工智能发展提出了建议。以下是演讲主要内容。

英国皇家工程院院士、香港科技大学首席副校长郭毅可在演讲中。  海沙尔摄

郭毅可

 

英国皇家工程院院士、欧洲科学院院士、IEEE(美国电气电子工程师学会)会士,香港科技大学首席副校长。作为国际知名的计算机科学家,他的主要研究领域为机器学习与数据挖掘,在机器学习算法及医学大数据分析系统、人工智能艺术等领域作出了重要贡献。

大家好!我还是讲普通话,讲上海闲话交关人听不懂(上海话)。非常有幸,能够在家乡上海的舞台上演讲。我小时候家里订的报纸就是《解放日报》,所以今天《解放日报》向我发出邀请,我肯定会来(台下发出笑声)。

人工智能已经深入人心。我也没有想到,我原来以为这个世界上有男人和女人就够了,现在还要加上机器人。我今天演讲的主题是:如果大模型是答案,那么什么是问题。我来讲一讲,人工智能的飞跃现在刚刚开始,它未来会怎么发展。

『人工智能可以做什么』

首先,人工智能得以发展,是因为有了一项伟大的技术,叫作神经元网络。人工智能主要是通过神经元网络来模拟人脑。

1942年,奥地利心理学家赫布发表了一篇重要的文章,其中讲了大脑神经元的连接原理。当大脑受到刺激以后,大脑中的一些神经元就会发生连接,如果不断刺激它的话,这些连接会越来越强。神经元的连接实际上是刺激的结果,如果把学习看作一种刺激,那么神经元之间的连接就是学习的表现。神经元网络就是一种模仿大脑神经元之间连接的计算模型。我们不断地给它输入数据,为的是构造不同神经元网络的连接。神经元网络的连接由代表连接的强度的参数来表达,在学习的过程中,我们不断去改变连接的强度,从而使模型的输出能够满足我们的要求。总而言之,这是一种用神经元网络来模仿大脑学习过程的机制。

那么,人工智能可以做什么事情呢?简单来说可以做两类事情。

第一类是判别。判别就是区分不同,区分不同是预测的基础。要知道数据是属于哪一类,先进行数据标注,用标注好的数据来训练模型。 有了模型,输入一个不知类别的数据后,模型可以根据特征判定它属于哪一类,这叫判别。比如,图象识别就是一种典型的判别。人脸识别,模型看了很多人的脸以后,这个人是男的还是女的、年轻的还是年老的,根据特征就可以进行判别。

另一类是生成。生成的顺序和判别正好相反。不需要数据标注,我们把所有的数据都输入计算机,它自己来总结数据的特征,再把这个数据进行聚类,有了类别以后,我们就可以要求计算机生成某一种类别的东西。比如,我要计算机生成一棵树,因为模型知道树的特征,它就可以生成一棵它没有见过的树,这就是生成式的人工智能。生成式的人工智能是如今人工智能的主流。以前我们为什么做不到呢?因为以前我们没有这么大的计算机,那么多的数据,也没有这么好的算法。今天我们有了这么大的计算机,有了这么多的数据,我们可以把全世界所有的文字输入计算机,它就会总结出语言的特征,并根据语言的特征生成文字。

有了这个生成式的大模型,人工智能被改变了。原来的人工智能都是解决具体问题的。比如要下围棋,就做一个下围棋的模型。比如要研究蛋白质折叠的问题,就做一个相关的模型。而现在,我们做的是一个基础模型。把所有在互联网上可以获得的文字数据、图象数据、声音数据都输入计算机,让它自己学习这些数据,学完以后,就可以生成各种图片和语言,这就是一个基础模型。在这个模型的基础上,可以形成各种各样的垂直应用。比如,要生成一幅国画,要生成中文,要生成一部医学文献,要生成一个戏剧剧本,都可以通过输入特别的样本,对基础模型进行微调,来形成相关的应用。

所以,大模型的发展在ChatGPT诞生以后呈现出指数级的上升。国内也产生了很多的大模型,几乎每天诞生一个,出现了爆发式增长。

『为什么语言模型如此重要』

有人说,ChatGPT不就是一个人工智能的语言对话系统嘛,为什么它如此重要?谈到它的重要性,要从两篇文章讲起。

第一篇文章是《计算机械与智能》,其作者是大名鼎鼎的英国计算机科学家、被誉为“人工智能之父”的图灵。还有一篇是“控制论之父”、美国数学家维纳发表的文章《人有人的用处——控制论与社会》。这两篇文章都是1950年发表的,可以说,它们开启了人工智能的研究之路。

图灵说:机器有没有智能?怎么界定机器的智能呢?一个比较好的界定方法就是,当一个机器跟人对话的时候,你不能分辨对话者是机器还是人,这就表明机器有了智能。这个测试方法被称为“图灵测试”。所以,语言是界定人工智能是否具有智能的一个重要标准。

维纳在文章中提出了两个问题。首先,他认为机器一定会具有智能,当机器具有智能以后,人和机器在社会中共存的一个重要形式就是人机互相交流、互相对话。其次,这样的机器是怎么产生的?维纳第一次提出,当复杂度达到一定程度时,机器会“涌现”出这样的智能。

为什么图灵会用语言来界定机器是否具有智能呢?奥地利哲学家维特根斯坦有一句名言:“我语言的边界,就是我世界的边界。”语言不仅是交流的工具,更重要的是,语言是思想的体现。语言是我们对世界的“表达模型”,语言是对客观世界的主观编码。从这个意义上来讲,语言的重要性非同寻常,计算机能够讲人类的语言,就意味着它有了和我们相似的智能。

此外,语言还决定了思维方式。如果语言不同的话,我们的思维方式也会不一样。有一部著名的科幻电影叫作《降临》,是根据美国华裔科幻作家姜峰楠的小说改编的。电影讲了一个道理,那就是语言对思维具有非常重要的作用。一群外星人乘坐飞船来到地球,跟我们交流,但我们不懂他们的语言。后来有一位语言学家通过学习对方的文字,终于理解了他们。原来,他们的语言是非线性的,因此他们的思维也是非线性的,可以超越时空的限制。所以说,语言非常重要,如果机器学会了人类的语言,也就学会了人类的思维。

还有更重要的一点,人类的语言不仅仅是思维的编码,人类的语言还有感情,还有能量。比如,我现在跟大家讲话,其中就充满了能量,我想表达我的理念,也希望你们能够接受我的理念,因此就有一种能量的传播。人类语言的精髓在于,语言的内涵是信息,语言的外延是能量。

以上就是人工智能的语言模型如此重要的原因。

『大模型未来的发展趋势』

大模型到底是什么?语言大模型是互联网的信息压缩和提炼。它是所有互联网信息的一个压缩、一个编码,通过这个编码,可以生成语言、文本、图片等。

随着大模型的进一步发展,它现在可以做什么呢?我们把各种各样不同的信息——语言、图像、文本进行输入,通过编码对齐,可以得到多模态的结果。比如,我们给ChatGPT看一张图,然后问它可以用图片上的这些原料做什么。它通过判别,发现图片中有鸡蛋、牛奶、面粉等,然后它会告诉你,用这些原料可以做煎饼、吐司、蛋糕、面包、饼干等等。这是一个典型的例子,现在的大模型越来越倾向于多模态,由多种数据协同推理。

未来,大模型的发展趋势是什么?在我看来,大模型发展的必然趋势是拟人化,越来越像人。从输入来说,它不仅会听,还能看;从模型来讲,现在它会理解,慢慢地它还会思辨。思辨和理解是不一样的,思辨需要有价值观,它会跟你辩论,它知道什么是对的、什么是错的,而且会向你证明。不像现在的ChatGPT,你问问题,机器回答你而已,未来发展更重要的一步是,它可以问你问题,甚至反驳你的问题,也就是说它有自己的价值观,自由意志;从输出方面来说,它不仅会表达,未来还会有行动。这就是具身智能,它可以行动,比如看见东西要掉下去了,机器知道怎样把它接住。未来,计算机科学会变成机器行为学,这是我们需要研究的一个重要方向。总而言之,人工智能会越来越融入我们的生活。

那么,现在的人工智能已经发展到了什么样的水平?2013年的时候有一部非常有名的电影叫作《她》,讲述了人与人工智能相爱的科幻故事。电影中的人工智能不仅能对话,而且还有感情,使得男主角爱上了她。现实和电影的距离正在拉近。2024年5月14日,OpenAI公司发布了GPT-4o,现在的GPT已经有了情绪对话的能力,它甚至可以打断你,虽然它还没有跟人辩论的能力,但它已经能够打断你了。它可以在短至232毫秒、平均320毫秒的时间内对音频输入做出反应,这几乎已经跟人一样了。

『我们现在应该做什么』

我们在香港进行生成式人工智能的研究,但我们的做法跟国内不太一样。在香港,我们不是做很多模型,我们只做一个基础模型,主要是为香港的人工智能企业和香港社会服务,各种研究机构、企业、创新公司都可以到这个平台上进行开发、应用。这个基础模型叫“香港仔(HKGAI)”。它有语言系统,可以对话;也可以写作,学生、政府官员都可以用它来进行写作;还可以做一些多模态的工作,比如用一个人的图片生成动画。

最后,我来讲讲人工智能的技术挑战。技术挑战包括三个方面,一个是算法,一个是数据,一个是算力。

从数据来讲,最大的问题是我们几乎已经穷尽了数据,我们把世界上几乎所有的数据都拿来训练大模型了,数据总是有限的,但我们需要更多的数据、更多的信息来训练大模型。

从算力来讲,有一个叫作扩展律的概念,就是说能力越大,效能越好,但是算力总是有限的,而且我们目前还受到芯片的制约。

从算法来讲,主要有三个问题。首先,我们需要研究怎样避免重复的学习,怎样保证大模型对新的数据不进行重复训练。其次,数据不是没有了,而是被压缩了,既然模型是数据的完美压缩,那么高阶的学习将是在模型上的学习。最后,机器智能和人类智能的培养实际上具有两极性,也就是机器智能和人类智能的培养、训练方法是相反的。人是怎么培养的呢?我们小时候培养的是童心、好奇心,然后培养价值观,了解什么是好的、什么是坏的、什么事情是有价值的、什么事情是不能做的。再后来学习书本知识,最后是积累社会经验。而人工智能是反过来的,一开始,不管三七二十一把所有的数据都给它,训练一个通用大模型,然后进一步垂直化,微调一个个系统,完了之后发现所有的东西都没有价值观,没有思考的能力,所以再开始学习价值观,而最难的是把所有的东西抽象成一个个常识和概念。所以,未来算法最具有挑战性的是,怎样让机器学会价值观,怎样让机器学会常识,并且,怎样让机器记得住、用得上这些常识。

最后,我想对上海人工智能的发展提几点建议。我认为,大模型是一个基础设施,就像地铁,它是一个公共开发的平台,只做一个基础大模型就好,做很多的话会重复。因此,要建设一个上海基础大模型,形成产业生态,可以在这个公共平台上开发各种不同的垂直应用和社会服务,在教育、政务、医学、金融、文创等领域做出世界水平的应用实例。更重要的是,以上海丰富的学术资源为基础,进一步加强基础研究,研究新的算法。最后,千万不要忘了,人工智能的治理非常重要,上海作为国际化大都市,应当建立一个开放性的人工智能治理研究机构,以上海的人工智能应用为背景,做出人工智能治理的国际典范。

今天,我们越来越把机器做成人的样子,未来,我们的社会将会由三种人构成,那就是男人+女人+机器人,而我们的社会还没有为此做好准备。我想,做好人工智能治理的研究工作,把人工智能融入我们的社会、融入我们的生活,这将是我们为人类所做的很大的贡献。谢谢!(全场掌声)

栏目主编:龚丹韵

文字编辑:徐蓓

本文作者:郭毅可

  • 网友评论仅供网友表达个人看法,并不表明三亚资讯同意其观点或证实其描述:
  • 验证码:
  • Failed to load
    centos 7.9 gl
    海南最美海湾摄影
    __FILE__和$_SER
    CSS rem 和 em
    input 透明背景
    ​小暑绿新荷
    curl命令详解
    Configuring DP
    光影
    娜扎生活自拍
    商业海报设计欣赏
    五指山方诺寨雨林共享农庄
    雨后
    原研哉设计10大金句
    ​乐藏与共
    夏天的颜色
    在海口遇见“京城”
    感受大自然带来的自愈
    雨雾中寻找山城十七门
    2024年巴黎奥运会  品牌
    量子纠缠的本质是什么
    松花江畔
    How to answer
    天衣秀场
    The Benefits o
    How to create
    SEO Forum
    跟通义千问关于大模型的对话
    phpBB banner 欣
     常用网址
    ▪︎ Vue (一款用于构建用
    ▪︎ 视觉中国
    ▪︎ Stable Diffu
    ▪︎ 微信官方文档
    ▪︎ 通义千问
    ▪︎ 文心一言
    ▪︎ 富文本编辑器ckedit
    ▪︎ linux源码
    ▪︎ Magento Open
    ▪︎ git-scm
     电脑杂记
    ▪︎ 阿里云ECS使用465端
    ▪︎ 避免识别为VPN访问的方
    ▪︎ 简洁的响应式CSS框架选
    ▪︎ Linux上配置IKEv
    ▪︎ PHP购物车类
    ▪︎ Apache禁止目录列表
    ▪︎ js 对本地文件的操作
    ▪︎ AI画路径结束后如何再接
    ▪︎ MyISAM引擎特性
    ▪︎ 插入鼠标自动关闭触摸板
     三亚便民
    ▪︎ 贺师傅开锁配汽车钥匙店服
    ▪︎ 海南省小客车保有量调控管
    ▪︎ 三亚车辆年检
    ▪︎ 维修家庭普通电路,电话1
    ▪︎ 对中医推拿有多年工作经验
    ▪︎ 海南迁禧搬家货运
    ▪︎ 中国南方电网天涯供电所桶
    ▪︎ 三亚中法供水有限公司
    ▪︎ 电脑桌,保密柜,办公家具
    ▪︎ 泉源康体养生
     三亚新闻
    ▪︎ 2023极光三亚露营节
    ▪︎ 来,带你去看不一样的崖州
    ▪︎ 三亚拟增设一条新公交线路
    ▪︎ 三亚市新建商品房购房问答
    ▪︎ 海南省住房和城乡建设厅:
    ▪︎ 崖州湾科技城一年一度“嗨
    ▪︎ 海南省渔业监察总队原政委
    ▪︎ 全球最大潜水培训机构PA
    ▪︎ 习近平总书记重要讲话思维
    ▪︎ 党的二十大报告全文
     三亚美食
    ▪︎ 湖南老湘味(黄流店)20
    ▪︎ 麻辣甲鱼,香辣小龙虾
    ▪︎ 朋友相聚商务接待,江伴月
    ▪︎ 【春余烧烤涮】主打绿色自
    ▪︎ 大糖糖小吃明天正式推出正
    ▪︎  祖传秘制私房
    ▪︎ 海掌柜海鲜
    ▪︎ 汉密欣语(商品街店)
    ▪︎ 小湖南家常菜馆
    ▪︎ 【牛太郎】 大型无烟
    信息发布
    琼粹美好
    迁禧搬家
    天涯家居
    林控软件
    三亚资讯公众号
    关于我们      版权声明      服务条款      联系我们      站点地图      sitemaps    琼ICP备05002060号       ©Copyright 2003 - 2024  www.sunya.cn  三亚资讯
    Powered by 霄荣广告 传递美好