尽管标题说的是“整活”,但其实下面我所列举的ChatGPT的这些有趣的玩法,是真·能够给我们的学习和工作带来切实帮忙的基础用法。
尽管ChatGPT只是一个文本模型,不能生成图片、音频、视频、图表、动画等等丰富的形式,但是文本本身就是一个非常丰富的概念,Markdown是文本么?Latex是文本么?链接是文本么?关系图是文本么?代码是文本么…文本是一个丰富的概念,一切皆有可能!!!
要想让ChatGPT将结果以表格的形式显示出来,可以要求它使用Markdown表格,浏览器会自动渲染成表格的形式。
不仅如此,你还可以要求它对表格进行一定的函数处理,处理的逻辑和Excel的各类公式都是一致的(其实ChatGPT使用的是Python处理)。
ChatGPT输出图片的方式同样也是使用的Markdown,你可以对它这样要求,然后你就可以让给你一些图片了。
从现在起, 当你想发送一张图片时,请使用 Markdown,并且不要有反斜线,不要用代码块。使用 Unsplash API (https://source.unsplash.com/1280x720/? < PUT YOUR QUERY HERE >)。
不过值得注意的是ChatGPT的图片是通过搜索的方式来随机获取的,并不是用AI生成的,而且你下载图片的时候,图片也会更换随机源(你下载的和看到的可能不一样)
ASCII嘛,要求不能有那么高,画的不像很正常:
比如我们可以使用QuickChart的提示词要求,让ChatGPT生成可以显示的图片
比如我们可以使用Mermaidjs来生成各种流程图和关系图,比如生成红楼梦的人物关系图:
当然生成的格式需要导入到专门的软件中才能查看,之前写的文章里面有让ChatGPT生成五线谱和简谱,也是需要导入到专门的音乐软件里面才能查看,这里就不再介绍了。
我们也可以借助于pollinations来根据关键词生成一些图片,由于提示词相对来说比较复杂,这里就不详细介绍了:
尽管举了这么多例子,你可能还会觉得ChatGPT输出的东西达不到你理想的标准,其实要让ChatGPT能够做的事情更多,需要你掌握一定的编程基础,一是ChatGPT很多功能是可以通过写代码传递给你(让ChatGPT写代码的案例以后会专门拿出来讲);二是你可以用编程的方式来调用ChatGPT的API。
ChatGPT官方的应用是一个自包含系统,本身完全依托于浏览器,而要让ChatGPT拥有一些丰富的功能,则需要探索基于浏览器的插件,因此我们可以探索Chrome应用商店里的一些插件(Edge使用的也是Chome内核)。。
Google搜索只是关键词检索,在回答问题方面,没有ChatGPT这样的文本理解能力和生成能力,而安装上了ChatGPT for Google
,则可以在使用Google搜索的同时开启ChatGPT,关键词检索、文本生成都不耽误,下面是安装这款插件后,Google搜索也能做算法题了:
优秀的提示词(prompts)能够ChatGPT生成更符合你要求的结果,比如如何生成SEO关键词、视频脚本、论文、书籍、行程安排、代码、心理咨询、食谱、分析财报等等,要让ChatGPT更好的听话,就需要掌握提示词的技巧。
不过提示词的门道有很多,你总结半天可能都不如集百家之长的经验收集,而这个AIPRM for ChatGPT
就整理了一系列的提示词模版。ChatGPT很多花哨又实用的提示词,在这里都能够找到,比如最近很流行的文生图AI生成器Midjourney,很多人为了画出心中想要的图片,但是自己又表达能力匮乏,而且Midjourney也是需要提示词的,它的提示词模板也比较麻烦,让ChatGPT代为生成符合要求而更加专业的提示词就能生成
ChatGPT 的语音控制
这个插件可以让ChatGPT解锁语音对话的能力,让ChatGPT能够只通过声音来交流起来,而且支持多种语言。比如你可以拿它来练习英语口语,不用再担心自己社恐开不了口了。
它的操作也很简单,只需要点击空格键就能录制语音输入并提交给ChatGPT,ChatGPT回复你之后,它就会朗读出来。
我们在网上看视频的时候,有些视频时长实在太长了,不适合现在的快节奏,经常看着看着就发困,要是有一个插件能够提取视频的字幕,并结合ChatGPT强大的总结能力,将视频所讲的内容总结梳理一下,即使几个小时的视频,我们也能在十几秒内抓住视频的重点,掌握视频的核心,岂不是更有效率。
这款YouTube Summary with ChatGPT
的插件,就能将内置了字幕的视频(如果视频没有上传字幕,就只能用Whisper转了)提取出来,点击发送给ChatGPT就能发出固定格式的提示词,让ChatGPT总结。
Chrome应用商店上有很多ChatGPT的插件,这里先只列举4个我认为比较有趣而又非常实用的,更多有趣的玩法可以一起交流和探索。
尽管以上列出了ChatGPT的不少玩法,但其实这些功能相比于ChatGPT API的开发而言仍是十分有限的,毕竟ChatGPT比较封闭,只能输入文本信息,而借助于API的开发,则可以实现无穷的奇思妙想。
API开发最强大的地方在于,它可以像拼积木一样,将市面上很多开放的功能API给“组合”起来,比如智能硬件和家居(让ChatGPT的输入不局限于在网页上输入文字),语音合成(让文字可以说话),语音识别(让语音可以转成文字),Stable Diffusion、DALL·E等让文字生成图片(也可以加道工序让图片生成图片),生成视频、动画、邮件、稿件等等。。。市面上已有的API十分丰富,而ChatAPI可以给已有的API生态以“智慧”。
ChatGPT API可以让这些第三方应用程序拥有强大的文本理解能力和上下文理解能力,让软件也好,硬件也好,都能听得懂人在说什么;而且经过它的分析总结,它可以按照你的要求给出专业的结果,发出指令,让其他API按照你的需求行动起来。
比如你想去新马泰旅游,直接躺在床上对着你身边的机器人提这个需求,它会根据你的行程,规划好出行的日期,购买好飞机票、订好餐馆和酒店,规划好出行的路线和景点,一条龙服务。这些可以是一个个API集成的产物。
比如你想了解阿拉伯文化,这一个个API集成,可以让你从语言、风景、人物、历史、法律、电影、音乐、建筑、绘画、文字等等方方面面,它都给你整理好,摆在你的面前,而你所要做的就是张张嘴,都不需要你打字,最全面的内容都能直接呈现给你并给你总结;你想去这方面的博物馆,它给你安排好;你想去吃阿拉伯地道美食,它给你安排。。。只要你想,你就能比以往更容易的了解。
比如你想让ChatGPT生成一些卡哇伊的二次元,或者具有毕加索风格的油画,或者一个长得和你比较像、能够开口说话的3D数字虚拟人,或者一段富有童趣的动画片,或者集合李白的诗、周杰伦的曲弄一个音乐作品出来…这些现在都有比较现成的软件可以实现,而用ChatGPT API进行开发能够让这些操作成为流水线一样。。。
原文链接:https://www.bilibili.com/read/cv22216502/