人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

重磅!ChatGPT-4正式发布,多模态功能来了!

2024-05-25 65

今天,OpenAI发布了其最新的人工智能语言模型GPT-4,这是一项具有里程碑意义的技术进步。GPT-4不仅可以生成类似于人类语言的文本,还可以接受图像和文本作为输入,并输出文本。这意味着GPT-4可以处理多种类型的信息,并以更自然和流畅的方式与人类交流。

GPT-4是基于GPT-3.5开发的,后者已经被用于创建ChatGPT,一个流行的在线聊天机器人。与GPT-3.5相比,GPT-4拥有更大的模型规模和更多的训练数据,从而提高了其生成文本的质量和多样性。据OpenAI称,GPT-4在各种专业和学术领域的基准测试中表现出了“人类水平”的性能。例如,在模拟律师资格考试中,它得分位于前10%;在医学诊断方面,它与经验丰富的医生相当;在创意写作方面,它可以生成引人入胜的故事、诗歌和歌词。同时GPT4在美国各类考试中也取得了非常优异的成绩,比如:在SAT考试中,GPT4的分数是1410分,高于88%的应试者;在GRE考试中,GPT4的分数是332分;在律师资格考试中,GPT4的分数排在应试者的前10%左右;在AP微积分考试中,GPT4也通过了测试。这些成绩说明了GPT4在语言理解、逻辑推理、数学计算等方面都有很强的能力。

重磅!ChatGPT-4正式发布,多模态功能来了!插图

(GPT4与上一代GPT3.5在不同考试中的分数对比)

除了文本输入外,GPT-4还具有处理图像输入的能力,这与纯文本平行,让用户指定任何视觉或者语言任务。具体来说,它可以生成文本输出(自然语言、代码等),给定的输入包括穿插的文本和图像。比如说用户可以向GPT-4展示一张图片,并让它描述或解释图片中的内容。这对于视觉障碍者或想要获取更多信息的用户来说是非常有用的功能。目前,OpenAI正在与Be My Eyes合作测试这一功能。Be My Eyes是一款即将推出的智能手机应用程序,它可以利用GPT-4为用户提供实时图像描述服务。

目前,GPT-4只对ChatGPT Plus 的订阅者开放。OpenAI表示,他们计划在未来逐步扩大GPT-4 的可用性,并探索其在其他领域和场景中的应用可能性。

但是,OpenAI没有像以往一样公布GPT-4的参数规模、硬件规模、训练时长等技术细节。这就导致了外界对于GPT-4的真实能力和潜在风险缺乏透明度和信任。其次,GPT-4仍然存在一些技术上的局限性和缺陷。尽管OpenAI声称已经对GPT-4进行了充分的安全测试和道德审查,但是GPT-4仍然可能生成带有偏见、错误或仇恨的文本。

原文链接:https://blog.csdn.net/m0_72843152/article/details/129559176

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部