https://mp.weixin.qq.com/s/vHhYIuvjmsMAx_sssUzImg
大家好,我是夙愿学长,一名利用课余时间探索 AI 的斜杆青年。
如果你关注 AI 大模型、AI 提示词、AI 写作这几个领域的话,你就知道,Claude3-Opus 模型在写作任务上表现得非常出色。
光说你可能感受不出来,我们上一个案例:
下面我使用 KimiChat 内置的 小红书浓人文案 提示词,分别在 Claude3-Opus 和 KimiChat 中测试写一段手工类的笔记文案:

很明显,Claude3-Opus写出来的文案非常是真人写的,而且情绪感十足,反观右边 kimichat,文字冷冰冰的,没有“浓人”的感觉,还一股子“AI味”。
进行到这一步的时候,我得到了一个结论:
如果你发现用 AI 大模型写文案怎么调提示词,其输出的内容都很烂,大概率不是人的问题,是大模型本身的问题。
也就是说,与其钻研怎么打磨优化提示词,不如先钻研出哪个大模型才擅长写作类任务。
Claude 不错,这个结论我们已经知道了,但是由于众所周知的原因,Claude 在国内很难用得上。
而正好我的 AI 陪伴群的群友问到我国内哪家大模型比较适合写文案,于是我今天花了点时间,找到国内比较热门的大模型,挨个去测试了一下,结果出乎意料。
横向对比
首先,有请我们的参赛选手:
通义千问:https://tongyi.aliyun.com/qianwen/
万知:https://www./
跃问 AI:https:///chats/new
智谱清言:https:///main/alltoolsdetail
DeepSeek:https://www./
Kimi Chat:https://kimi./
讯飞星火:https://xinghuo./spark
文心一言:https://yiyan.baidu.com/
测试方法:
输入小红书浓人文案的提示词—等待大模型回复—输入“主题:性价比最高的鼠标”
首先,先上两个直接被 pass的「考生」,文言一言 3.5 和讯飞星火认知大模型,我还没输入主题,大模型就开始创作内容了,不仔细看规则。


接下来是其他大模型输出的结果,我在图片的第一行标注的大模型的名称,建议点开放大左右滑动查看。







一轮测试下来,我发现万知、Kimi Chat、DeepSeek的表现还不错,把这三个同时打开对比一下:
从综合表现来看,我个人对万知的表现最满意,标题有网感、正文 AI 味相对较少、而且还帮忙写了笔记标签。
有趣的是,万知和 DeepSeek 这两家都是最近新上线的产品, 果然是长江后浪推前浪。
介绍,简单介绍一下万知和 DeepSeek 的“来路”:
万知
万知是一款为中国人身定制的一站式 AI 工作平台,提供个人特助服务,帮助用户提升工作效率。AI 技术在职场生态中的应用越来越受到重视,万知的推出将为用户提供更便捷高效的工作体验。
🚀 万知是一款为中国人身定制的一站式 AI 工作平台,提供个人特助服务。
💡 万知提供了三大 AI 秘技: 知识问答、文档阅读和 PPT 生成,帮助用户完成工作任务。
💻 AI 能够秒速读取5000页文档,快速生成 PPT,并支持手机和 PC 端之间的接力修改。
DeepSeek
DeepSeek-V2 基于 2 千亿 MoE 模型底座,其综合能力表现十分出色,中文综合能力(AlignBench)在开源模型中最强与 GPT-4-Turbo,文心 4.0 等闭源模型在评测中处于同一梯队。
英文综合能力(MT-Bench)同样处于第一梯队,英文综合能力与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B。
以上,enjoy~
原文链接:http://www.360doc.com/content/24/0523/18/59273591_1124127160.shtml