本文首发微信公众号:飞总聊IT
2023年10月17日,百度CEO李彦宏在百度世界2023上发布了文心大模型4.0。
李彦宏表示,文心大模型4.0,是至今为止最强大的文心模型。文心大模型4.0在理解,生成,逻辑,记忆等各个方面都有了显著的提高。
李彦宏还表示,综合能力和GPT-4比起来,毫不逊色。大会上,文心大模型正式邀请测试,据说登录文心一言官网或者下载最新版的文心一言APP,就可以体验到新的4.0版的文心大模型了。
那么文心大模型4.0是不是真的比起GPT-4也毫不逊色呢?
这个问题,如果是谷歌说的,那我多多少少要认真对待一下。毕竟,谷歌的广告,靠谱的程度还是可以的。如果是百度说的,我就不知道,是不是会被拐到莆田医院里去了。
以我个人实际使用的体会来说,GPT-4的体验,还是要比Bard强。所以我日常办公里面需要一个大语言模型的话,首选还是GPT-4。
文心一言这个大模型,我也用过,但是用起来的感觉呢,总觉得有点像智障。有的时候记不得上下文。
当然这样说也不公平,有的时候也很聪明,特别是当我问百度相关问题的时候,尤其是特别的聪明。比如著名的魏则西事件,我问文心一言,是这样回答的:
当然,家丑不可外扬,自己家的大模型,肯定也是被好好的训练了,知道怎么回答自己家的事情。
不过要绕过这种训练也不困难,比如说,我们可以施展一下错别字大法:
文心一言,不但很贴心的纠正了错别字,而且也把百度给它的训练微调给揭开了,让大家看到背后的魏则西事件,到底是件什么事情。
你说,文心一言到底是第一个回答很聪明呢?还是第二个回答很聪明呢?第一个回答确实聪明,知道自己家的丑事,不能乱说话。第二个回答更聪明,不但知道纠正错别字,还勇于揭发自己家的家丑。
同样的问题,看看GPT-4是怎么回答的:
从这个问题的回答来看,GPT-4明显还是要比文心一言聪明啊。实事求是的说。
为了公平起见,我也测试了Bard:
Bard的这个回答,多多少少有点让人失望了。
我还测试了一下通义千问:
回答和Bard如出一辙。
所以,李彦宏说文心大模型4.0不逊色GPT-4,你信吗?从表现来看,看起来好像是要比Bard和通义千问更聪明一些,但是和GPT-4比起来还有点差距啊。
无论如何,大家都应该去测试测试文心一言,看看百度是怎么样的不逊色于GPT-4的。
文章最后再安利一下我的星球,星球聚焦ChatGPT和大语言模型的发展和应用,欢迎有兴趣的人加入一起讨论大语言模型的技术和商业相关的知识。
原文链接:https://www.163.com/dy/article/IHDB655M05315PUD.html