先说结论:至少是目前,这个东西的智能性主要体现在“一本正经地瞎编”上。
我用的次数很少,不过敢说总算用过,比某些不谈具体感觉一味在那吹人工智能、渲染危机、或者,借机批判什么的神经病要强。
它在中文领域的储备信息有限,恰恰可以借机看出问题。
我随便问了几个经典动漫战斗力排行问题,它不但无法做到给出排行理由,而且在人物介绍后面瞎编战力值,每次刷新都不一样,并且还原创人物、硬拉其他动漫人物入场,甚至把声优名字当成人物往里塞。
也就是说,属于很努力地检索网上现有字词并且混合成一篇东西,没有任何其他智能可言。
群友跟我说,别问任何知识性内容。我不信邪,把几个著名科幻奇幻翻译的名字打进去,它列出一堆这些人根本没翻译的经典著作,差不多是强行把著名作品+它自己编的不存在的作品+偶尔真的有该人译作安插进去。甚至有一则叫做《中国式离婚》(括号里编了一行这个作品也有科幻性之类的话……)。
而这些实际上在ChatGPT所标记的2021年4月前的中文互联网上,都不是罕见内容呢。
然而到了叫它编故事这个活动上,它表现得就挺不错了。
以“xx、xx、xx为主角编个对战故事”,然后再逐步添加每个人物的特征,他编出来的故事虽然不能说好,但如果只是为了搞笑,似乎也行。
再之后试图让它写了两首“诗”,嗯,我得说,一半以上诗句,比我朋友圈某些成天自诩文艺的人写得要强多了,至少结尾能押韵呢。
到此为止我就停止了测试。有那么一张图,是别人用它做2022年高考客观题,我现在记录一下上面的得分准确率数据:
英语 56/60 地理 6/9 政治 11/12 历史 6/10
数学(理) 6/10 数学(文)7/11
物理 0/2 化学 1/7 生物 3/5
做测试的这个题量实在是太小了,且各科参差不齐,只有特别悬殊的地方才能说明问题,但多少还是能看出点什么的。
英语、政治,都是高水平,说明这俩科目背书为绝对主要任务是没毛病的。AI可能会抓到一些错误信息或自己突然决定瞎编一些,但大差不差。
地理历史生物就弱了不少,可能因为这些除了背之外有更多判断成分?
然后数学不管文理,我估计是只要运算类它当然就行,但是判断类直接去死。
物理化学很惨,为什么就不用说了吧。
实际上这个AI目前的功能就是如此,虽然不知道在大量用户给它做免费测试之后,在多少年内能发展成什么样子,但就现在——现在的这个东西,就是一本正经胡说八道的,没有思考能力只有复制黏贴融梗能力的程序。
换句话说,它现在更多可以算是一种试金石,试的就是什么属于思考,什么只是人类自我感觉良好的幻想。
所有对它的“现状”感叹的人,应该去想的是,自己怎么会惊讶于它能“写诗”、“写故事”、“写通稿”、“写某种作业”,或者,自己对这类东西本身的档次产生了怎样的误解,以及看到某些人自称能做到这些所以很牛逼的时候,自己是不是受到蛊惑高估了他们。
尤其是“诗”,但凡不是经典名作,而只是现代汉语排列组合回车空格,到底是写的那人写出了什么,还是看的人在努力编造一个合理的解释?
以后不好说,现在就能被这种AI替代掉的文案,本来就是没有价值的车轱辘废话;能被它替掉的人,本来就是能力有限但被现代教育制度发了个安慰奖一样的学历,然后做套路重复的非体力劳动的人。
原文链接:https://www.bilibili.com/read/cv22248044/