人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » 最新消息

Midjourney学习指南【基础篇】

2025-03-02 24

自小红书上的Midjourney教程更新以来,陆续收到很多朋友的咨询,发现大部分人的问题主要集中在2点:首先是不知道调用什么样的指令和参数来解决问题,其次是不懂如何精确控制想要生成的图像。

本文结合我个人的使用经验,给大家带来Midjourney指令和常用参数的详细文字版教程【基础篇】,本期内容干货满满,快来看看吧。

指令和提示词的区别

我们在看各种相关教程文章或者视频的时候,经常会看到指令(Command)、提示词(Prompt)和参数(Parameter)这几个词,如果不理解它们的概念在操作Midjourney的时候就很容易犯迷糊。因此在介绍具体内容前,有必要先给大家科普下它们之间的区别。

指令 Commands

指令指的是Discord的输入框中通过斜杠【/】唤起的命令,它的作用是指定Midjourney机器人需要执行的操作,常见的操作项如生成图像、展开设置项、查看个人信息、切换作图模式等。

这里大家可以理解为我们平时在使用其他工具时的各种操作按钮,只是换成了通过输入代码的方式来触发。

当然不只是Midjourney,其他搭载在Discord上的机器人Bot也是通过同样的方式来唤起操作,比如此前给大家分享过的换脸机器人InsightFaceSwap和ChatGPT机器人同样是使用指令来唤起操作,当然不同机器人Bot的Command指令也会有所区别。

提示词 Prompts

大家如果有关注AI领域应该会经常看到Prompt这个词,它的意思可以翻译成提示词、关键词等。不仅限于Midjourney,像ChatGPT等其他AI工具也都是通过prompt来和算法模型发生交互的。因为自然语言的复杂性很高,即使是同一个意思也可以有很多种方式来表达,而目前市面上的模型还无法做到像人类一样准确理解日常对话的语气、语法和上下文,这就需要我们设计好提示词来辅助机器理解我们输入的信息。

正如现实生活中人与人的互动需要一定的沟通技巧,我们可以将提示词看作人和机器的沟通技巧,能不能利用好AI工具,很大程度上都取决于提示词的质量,提示词描述的内容越精确,最后输出的内容也会越符合我们的预期。

在Midjourney中,我们是通过调用imagine指令来唤起提示词prompt的输入入口,从而与Midjourney的机器人来发生互动。在 Midjourney 的官方介绍文档里介绍了 Prompt 的输入结构,分为三部分:图片提示(Image Prompts)、文本提示(Text Prompt)和参数(Parameters)。

图片提示(Image Prompts)是通过提供图片的URL地址来进行调用,需要放置在提示词的最前面。Midjourney会分析图片中的内容信息,将其结合到生成的图像中。

图片提示属于选填内容,可以填也可以不填。需要注意的是,图片的URL地址必须是公开可访问的地址,每次最多只能放两张图的 URL。如果是直接上传到Discord上,图片格式只支持是png、gif 和 jpg

如果你不想同服务器下的其他用户看到自己上传的照片,我们可以采用和Midjourney Bot机器人私聊的方式进行上传,但除非开启隐私模式,否则如果被推荐到官方社区,点击图片链接时依旧可以看到上传的照片。

文本提示(Text Prompt)即你对生成图像的内容描述。我们经常会在评论区看到很多人索要“关键词”、“魔法咒语”等,指的就是文本提示,目前Midjourney中的文本提示只能识别英文。

需要注意的是 Midjourney 跟平时我们使用的AI聊天工具不一样,它无法像ChatGPT直接理解对话,因此文本提示更像是提供一段完整的指令。而且 Midjourney 有违禁词的限制,像苹果输入法中🍑桃子等emoji 就没法输入,因此可能会有部分歧义。

还有就是参数(Parameters),参数也是提示词的一部分,作为后缀放在Prompt的最后。它的作用是用来调整图片各种细节属性,比如尺寸、画面精细度、使用算法模型等。你可能会奇怪,既然通过提示词可以控制图像内容了,为什么要多此一举设置参数呢?

这里主要是为了解决2个问题:确保提示内容的稳定性和提高输入效率。相较于ChatGPT,在图像生成领域的Midjourney使用场景更加垂直,对图像内容的控制项更加集中,因此Midjourney官方就预设了一些固定的参数模版,通过简单的特定字符进行快速调用。比如图像的长宽比,如果每次让用户自己输入,可能输入的单词都不一样,而且Aspect Ratios本身字符也比较多,但是有了预设参数【ar】,用户只需输入【–ar】+【长宽比】即可。

通过这样的方式,既能保证算法模型输出的结果更加稳定,也能提升用户的输入效率。因此大家日后在填写关键词时候需要注意,如果你想调整的元素在预设参数里有,那就优先使用预设参数,而不是直接在文本提示中输入内容。

关于指令

下面我们正式开始Midjourney指令部分的介绍。

唤起指令的方法为输入斜杠【/】+【指令名称】,使用前记得切换到英文输入法。以下是我整理的目前Midjourney所有指令的简介和功能说明汇总表,方便大家快速查阅,下面针对每条指令项进行详细说明。

指令

名称

说明

使用频率

imagine

绘画

生成图片的唯一指令,用于开启prompt指令输入。在提示框中输入描述文本后回车,等待片刻后即可生成图片。

🔥🔥🔥

settings

设置

打开设置窗口,可以修改版本模型、风格化参数、画面精细度等默认参数

🔥🔥🔥

info

个人信息

显示个人信息,流量使用、画图张数、邀请码还剩几个都在这里看

🔥🔥🔥

fast / relax

切换【快速模式】/【放松模式】

  • 放松模式:正常顺序排队,如果服务器拥挤就要等前面的图生成完成了才轮到自己。

  • 快速模式:可以插队,提供最高优先级做图命令,图像生成更快,但是额度用完后会被额外收费。

🔥🔥🔥

describe

图生文

通过分析图片内容反向推导出描述的文本提示

🔥🔥

blend

图生图(多图融合)

支持上传 2-5 张图片作为提示内容,然后融合成新的图片。融合后图片默认比例为 1:1,为获得最佳效果,建议融合前后的图片比例保持一致

🔥🔥

public

切换至【公共

原文链接:https://blog.csdn.net/qq_28977589/article/details/132677391?ops_request_misc=%257B%2522request%255Fid%2522%253A%252220df2783c71df5d19c5cf2b59eb525ee%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=20df2783c71df5d19c5cf2b59eb525ee&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-14-132677391-null-null.nonecase&utm_term=midjourney+%E5%92%92%E8%AF%AD

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部