GPT-4抢滩登陆,支持以图生文
距离发布仅四个多月,在ChatGPT展现了惊人的实力后,OpenAI又扔下一枚核弹:3月14日,人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。
该公司表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。根据OpenAI实测,无论在全美统一律师资格考核上,还是在SAT数学测验或GRE测验等三十多项不同学科的主流测试中,GPT-4都大胜3.5版。
GPT-4在多种学科主流测试中表现优异
在今天的博文中,OpenAI写道:“GPT-4是一个大型多模态模型,是OpenAI努力扩展深度学习的最新里程碑。”
语言模型的多模态意味着什么?
这个模型可以管理不同语言数据的输入和输出,也能够同时输出文本、图像甚至视频,而目前的ChatGPT版本只能生成文本。
在《纽约时报》提供的案例中,GPT-4可以同时解析文本和图像,这也使它能够解释更复杂的信息。不过,目前图像输入的权限尚未公开,所以目前还没看到更多例子来证明GPT-4在图像方面的处理能力。
GPT-4可以解析复杂图像
即便如此,GPT4的多模态转向也将大幅提升AI视觉方向的生产效率,图像、视频等应用将层出不穷涌现。其使用场景将远不止于文字、问答与办公领域,未来有望拓展下游千行百业的应用空间,进一步打开市场的想象力。
“文心一言”发布会,明日重磅开启
值得注意的是,百度的类ChatGPT产品发布也进入倒计时,将于3月16日推出“文心一言”。这意味着,明天“文心一言”将与GPT-4正面对决。
百度官方今日表示,其让文心一言写了一封发布会的邀请函。文内表示,文心一言是百度研发的知识增强大语言模型,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。通过大语言模型,我们能有更多机会利用自然语言处理技术来改善生活和工作效率,推动人工智能领域的发展,带来更多的可能性。
本质上,“文心一言”是基于文心大模型推技术推出的生成式对话产品。也就是说,相较于GPT-4的多模态语言模型,“文心一言“只能生成文本。
至于“文心一言”在未来是否也会涉及到自动生成视频,也给人留下了想象空间。此前视频网站爱奇艺和百度宣布达成合作,爱奇艺将全面接入百度“文心一言”,双方共同探索将AIGC应用于爱奇艺内容搜索、内容宣发、内容创作工具等业务。
GPT-4代表了大模型能力更加多样化、全面化,如天风证券所说,GPT-4或许是生成式AI时代的“报晓鸟”。但遗憾的是,OpenAI的相关服务并没有开放给中国用户,即使在美国加州的IP地址下,中国本地手机号也无法注册ChatGPT账号。
一方面,GPT-4作为语言模型,在对语义的分析中可能会抓取一些涉及到国家安全的信息;另一方面AIGC(人工智能生成内容)本身具有较强的价值传播特性。因此,除了商业利益方面,GPT-4的使用、内容传播可能会对价值观和主流观点产生影响,甚至会触及国家安全问题。可以说,短期内GPT-4不太可能进入中国.
由于其背后公司的局限性,GPT-4在中文领域使用体验将远不如英文,所以百度占据地利优势,正如李彦宏所说,百度的文心大模型是中国市场非常本土化的大语言模型,这意味着百度现在正在研发的文心一言,将比国外开发的模型更适合中文和中国市场。
百度智能云方面也透露,“文心一言”背后的算力基础设施均由百度智算中心支持,后续百度多个智算中心也将为“文心一言”面向产业的规模化落地提供底层支撑。在百度阳泉智算中心内部,支撑“文心一言”的机房正在全力运转、测试,全力备战“文心一言”的发布。
国内AI领航者自当维护国产品牌尊严走在前列,“文心一言”或许不是十全十美的产品,或许使用效果不尽人意,但如果能够达到去年十一月ChatGPT的水平,将是目前国内断档式领先的水准,填补中国在对话型大模型方面的空白,实现从0到1 的突破。
举报/反馈
原文链接:https://baijiahao.baidu.com/s?id=1760421952009921801&wfr=spider&for=pc