chatgpt升级版来了!3月14日,火遍全球的chatgpt母公司openai正式发布升级后的gpt-4。
相比之前的版本,升级版人工智能(ai)聊天机器人gpt-4更“聪明”了。它不仅能够聊天、写诗、写代码,还能分析图像,处理更大的文本块。在模拟的律师资格考试中,gpt-4甚至打败了90%的人类考生。对于ai聊天机器人此前暴露出的“幻觉”、偏见等缺陷,gpt-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,gpt-4仍会做错最基础的算术题。另据介绍,和chatgpt不同,使用gpt-4需每月支付20美元的订阅费。
有哪些新升级?
四个月前,初创公司openai发布基于大型语言模型gpt-3.5改造的chatgpt,引爆ai聊天机器人热潮。该公司得到美国科技巨头微软的支持。
四个月后,万众瞩目下的gpt-4,又将带来哪些惊喜?
首先,gpt-4更“聪明”也更强大。
在3月14日发布的一篇文章中,openai将gpt-4称为扩展深度学习方面的“最新里程碑”,远超其“前任”。文章称,gpt-4更可靠、更具创造性,也能够处理更细致的指令。
为了直观地体现新版本的“聪明”程度,openai让gpt-4参加了多项人类通用考试。结果表明,gpt-4已具备“人类水平的表现”,在各类考试中成绩拔尖。
比如,在美国律师资格考试中,gpt-4的成绩在考生中排名位列前10%,而gpt-3.5的得分在倒数10%。在sat阅读考试中,gpt-4也已超过93%的人类考生,比gpt-3.5进步了6%。
其次,gpt-4还有了一项新突破——可以开始处理图像。
openai称,gpt-4是一个多模态大模型,可以接受文本和图像形式的输入,并用文本进行输出。不过,目前图像输入的权限尚未公开。
在《纽约时报》提供的例子中,用户上传了一张冰箱内部的照片,然后问道:“我可以用这些做几顿饭?”gpt-4则细致地提供了建议,教用户如何使用冰箱里的材料,制作酸奶碗和鹰嘴豆泥卷饼。
此外,gpt-4还变得更专业。
据openai介绍,在一些日常聊天对话中,两者间的差距可能较为微妙,但当任务的复杂性达到一定阈值,差异就会显现。
北卡罗来纳大学心脏病学教授阿尼尔·格希(anil gehi)就深有体会。在他向gpt-4描述一位病人的病史、入院后的并发症后,聊天机器人给了他一个完美的答案,格希说:“我们就是这样对待病人的。”
在其他尝试中,gpt-4同样给出了令人印象深刻的答复,比如能够处理超过2.5万字的文本,轻松总结出文章大意;帮助一对夫妻报税;还会根据要求写代码,10秒就能生成一个网站……
《纽约时报》还发现,gpt-4已发展出一定的幽默感和推理能力:“虽然它还在写那些令人尴尬的‘老爹笑话’,但它比前任稍微有趣了那么一点。”
仍会做错算术题
虽然gpt-4看似甩开前任一大截,但不得不指出的是,gpt-4仍与此前的语言模型一样,具有相似的局限性。这让一些业内人士和专家感到担忧。
gpt-4仍可能展现出令人困惑的两面性。《纽约时报》表示,它可以是某些学科的专家,但对另一些学科则是外行。它可以在标准化测试中比大多数人做得更好,为医生提供精确的医疗建议,但同时,它连基础的算术题都可能做错。
更为重要的是,gpt-4仍可能产生“幻觉”,它仍会“一本正经地胡说八道”,大胆自信地编造事实,也会出现很多推理错误。
《华盛顿邮报》也指出,由于接受了大量互联网文本和图像的训练,ai语言模型也学会了人类对种族、性别、宗教和阶级的偏见,这可能会导致对现实世界的伤害。
对此,openai承认,gpt-4并不完全可靠。不过该公司强调,gpt-4已接受为期半年的安全训练,在内容生成方面更加安全和一致。在内部评估中,相比gpt-3.5,gpt-4不合规内容的响应请求已减少82%,响应事实准确度则增加了40%。
但加州大学伯克利分校专门研究国际商业和信息安全的教授史蒂文·韦伯(steven weber)认为,现在下结论还为时过早,因为gpt-4尚未在现实世界中得到广泛测试,“正如我们之前看到的那样,面向外界后gpt-4将如何运转,可能(和想象中)很不一样。”
美国卡内基梅隆大学研究人工智能方面的教授文森特·康尼策(vincent conitzer)也表示,虽然gpt-4似乎增加了新的护栏,防止产生不合适的回答,但用户仍可能会用其他方式达到目的。
不过,抛开局限性不谈,短短几个月内openai展现出的巨大进步仍让计算机科学家惊叹。
《纽约时报》称,目前科技行业正陷入“几十年来最不可预测的时刻之一”。许多行业领导者认为,ai的发展代表着一种根本性的技术转变,其重要性与20世纪90年代初网络浏览器的发明不相上下。
更多应用场景
更强大的功能、更专业的表现,意味着gpt-4接受了大量数据训练,也意味着更高的成本。
对此,openai也使出了新招——收费。据介绍,和chatgpt不同,使用gpt-4需每月支付20美元的订阅费。但就算收费,“尝鲜者”仍络绎不绝,openai付款系统曾一度被挤爆。
如果不想付费,搭载了ai聊天机器人的微软必应搜索引擎可能会是一项替代。据透露,过去几周以来,该搜索引擎使用的就是gpt-4。
openai还开始销售gpt-4的访问权限,以便企业和其他软件开发人员在其基础上构建自己的应用程序。这也意味着,相关ai技术未来将应用到更多场景中。
摩根士丹利财富管理公司就正利用gpt-4建立内部系统,为员工检索并合成信息,以对话形式提供给金融顾问。教育公司khan academy则正使用该技术建立自动化在线家教。语言学习应用duolingo也在使用该技术建立对话式语言机器人。
另据彭博社报道,帮助盲人及弱视人群的志愿服务软件be my eyes也在利用这项ai技术,解答盲人日常中的疑问并提供视觉帮助。
越来越多的应用场景也带来隐忧:我们的工作会被ai取代吗?
有分析认为,即使是最出色的ai技术和系统,也往往是熟练工的补充,而不会取代他们。这些系统不能取代医生、律师或会计师,仍然需要专家来纠错。不过,它们可能很快会取代一些助理或审核人员的工作。
openai总裁格雷格·布罗克曼在谈及此事时也表示,ai的出现一定会带来一些混乱,也意味着一些工作岗位的消失,但一些新的工作岗位会出现:“我认为,最终的结果是,进入门槛将降低,专家的生产率将提高”。
(编辑邮箱:ylq@jfdaily.com)
栏目主编:杨立群
文字编辑:杨立群
本文作者:裘雯涵
题图来源:上观题图
图片编辑:邵竞
原文链接:https://export.shobserver.com/baijiahao/html/592968.html