您好,欢迎来到 CgCountry

[WIN/MAC]Invoke AI 可视化AI绘图工具(中文版)+详细教程 V3.0.2 一键安装包

admin 2024-07-12 19次浏览 0条评论 0 打赏作者 0 0
当AI绘画模型和平台越来越多,你是否想使用统一美观的界面来使用你所有的AI绘画模型?invokeAI——这个精致的WebUI工具可以帮助你创建一个统一美观的工作环境自Stable Diffusion模型发布以来,一组人(从Lstein开始)一直致力于将生成高质量图像的最佳工具汇集到单个易于使用的存储...

图片当AI绘画模型和平台越来越多,你是否想使用统一美观的界面来使用你所有的AI绘画模型?invokeAI——这个精致的WebUI工具可以帮助你创建一个统一美观的工作环境

自Stable Diffusion模型发布以来,一组人(从Lstein开始)一直致力于将生成高质量图像的最佳工具汇集到单个易于使用的存储库中。2022 年9月,InvokeAI 团队正式成立。Invoke.Ai是一个创新的文本到图像 AI 平台软件,它利用尖端的深度学习模型将文本描述转换为具有视觉吸引力的图像。通过向 Invoke.Ai 提供特定提示,用户可以生成与他们想要的概念、场景或对象相对应的独特且高质量的图像。这项革命性技术为艺术家、设计师、内容创作者和任何需要迷人视觉效果的人开启了激动人心的可能性

InvokeAI只是一个目前完全免费且开源的可视化绘图工具,它提供一个AI绘画的基本框架、插件接口和UI界面,具体的绘制模型和lora模型等还需要下载和导入。InvokeAI已经加入了controlnet、lora、动态提示词等功能,极大的提高了绘画结果的可控性、稳定性和必要时的随机性(比如想抽卡生存随机的图片时)InvokeAI对比类似功能的WebUI,InvokeAI有着更简单上手,部署条件更简单,学习成本更低的优点,并且随着开发者的更新InvokeAI的功能也已经逐渐追上了WebUI的步伐,如果需要安装插件或者导入新的文转图训练、模型CHECK_POINT、lora、vae等,InvokeAI也在操作页面有很方便快捷的可视化添加方式。支持SDXL 1.0,该模型拥有更多的参数,并且对色彩的鲜艳和准确程度做了优化,全部采用原生的 1024×1024 分辨率(之前只有 512×512)。新模型只需更简单的语言就能生成更智能的图片。[WIN/MAC]Invoke AI 可视化AI绘图工具(中文版)+详细教程 V3.0.2 一键安装包插图1

丨其他功能

(安装过程需要联网,部分下载内容可能无法使用国内网络下载。)

手动安装有两种方式,第一种使用基本的 Python 虚拟环境 venv 命令和 PIP 包管理器。第二个基于 Anaconda3 包管理器 conda。这两种方法都需要在终端上输入命令。

需注意 conda 安装方法目前已弃用,在将来的某个时候将不受支持,因此我们也不推荐你使用该方式进行安装。

在 Windows 系统上,鼓励您安装和使用 Powershell,它提供了与 Linux 和 Mac shell 的兼容性,以及命令行补全等不错的特性。

我们主要介绍 PIP 方式的安装:

使用界面:比较美观的使用界面,最左侧是功能栏,分为三个已有功能和三个未上线功能;旁边是调节栏,用来输入和调节参数;中间是生成的图像展示,最右侧是你最近生成的图像库:[WIN/MAC]Invoke AI 可视化AI绘图工具(中文版)+详细教程 V3.0.2 一键安装包插图3上面的屏幕截图显示了WebUI的文本到图像选项卡。有三个主要部分:

除了这三个元素外,右上角还有一系列用于更改全局设置、报告错误和更改主题的图标。

控制面板左侧还有一系列图标(请参阅下面屏幕截图中的突出显示区域),这些图标在一系列选项卡中进行选择,以执行不同类型的操作。[WIN/MAC]Invoke AI 可视化AI绘图工具(中文版)+详细教程 V3.0.2 一键安装包插图4

从上到下,这些是:

功能栏:文字生成图片:像大多数AI图像生成工具一样,输入文字并产出图片;图片生成图片:类似于垫图功能,基于上传的图片和文字生成对应的图片;画布拓展:先生成较小的图片,然后生成可以自由地拓展你的画布,将图像延展出去。在invokeai中,若硬件合适,这一功能似乎可以延展出无穷的画布。预计推出:节点:目前正在开发基于节点的图像生成系统。请继续关注有关此惊人功能的更新。后处理:调用 AI 提供了多种后处理功能。图像放大和面部恢复已经在WebUI中可用。您可以从“文本到图像”和“图像到图像”选项卡的“高级选项”菜单访问它们。您还可以使用当前图像显示上方或查看器中的图像操作按钮直接处理图像。不久将发布专用 UI,以促进更高级的后处理工作流程。Invoke AI 命令行界面提供了各种其他功能,包括 Embiggen。训练:一个专用的工作流程,用于从 Web 界面使用文本反转和 Dreambooth 训练您自己的嵌入和检查点。InvokeAI 已经支持使用主脚本使用文本反转来训练自定义嵌入。

有两种方法可以安装和管理模型:

invoke启动器中,选择选项[5]“下载并安装模型”。这将启动相同的脚本,提示您在安装时选择模型。您可以使用它来添加您第一次跳过的模型。可以指定之前下载的模型;脚本只会确认文件是否完整。

安装程序有不同的面板,用于安装来自HuggingFace的主要模型、来自Civitai和其他任意网站的模型、ControlNet模型、LoRA/LyCORIS模型和文本反转嵌入。每个部分都有一个文本框,您可以在其中输入要安装的新模型。您可以使用其参考模型:

以前安装的型号显示有复选框。取消选中复选框以从InvokeAI取消注册模型。物理安装在InvokeAI根目录中的模型将被删除和清除(在确认警告后)。位于InvokeAI根目录之外的模型将被取消注册,但不会被删除。

注意:安装程序脚本使用基于控制台的文本界面,需要大量的水平和垂直空间。如果显示器看起来乱七八糟,只需放大终端窗口和/或重新启动脚本。

请执行以下操作:

[WIN/MAC]Invoke AI 可视化AI绘图工具(中文版)+详细教程 V3.0.2 一键安装包插图5

常见的模型下载仓库为以下几种,点击可直接前往仓库地址:

在HuggingFace仓库中下载所需的模型时,将会看到各种各样格式的文件。对于一般的使用者来说,仅下载常用CKPT格式模型文件即可。

[WIN/MAC]Invoke AI 可视化AI绘图工具(中文版)+详细教程 V3.0.2 一键安装包插图6

[WIN/MAC]Invoke AI 可视化AI绘图工具(中文版)+详细教程 V3.0.2 一键安装包插图7

请先确定您下载的是SD1.5还是SDXL模型,在根据不同类型存放在不同位置。

如果说模型是一大包食材,那 LoRA 可以理解为一个调料包。通过一些简单的学习,您可以批量生成想要的图案、姿势、情境等等。
比如我们想用自己的孩子做主角生成图片,那么通过制作孩子的 LoRA,就可以在 Prompt 中用一个命令调用,从而获得孩子的图片。
另外,由于有许多不同的 LoRA 可供使用,因此可以轻松地尝试各种有趣的图片生成。

LyCORISLoHaLoRALoCon(IA)^3LoKRDyLoRA 等等,是什么意思!
其实这些是微调技术的分类和其算法。

LoRALyCORISLoCon是一些技术项目的名称。
LoCon 已被 LyCORIS合并,过去需要的扩展 LoCon 现在不再需要,只需安装 LyCORIS 的扩展即可。 LoHa(IA)^3LoKRDyLoRALyRORIS 的学习算法之一。在算法学习时指定使用。 这些基本上在使用时不需要担心,但是如果要使用LyCORISLoCon学习的LoRA,则需要注意使用LyCORIS专用的扩展程序(稍后会提到)

图片

invokeAI中拥有大部分的基本AI绘画生成功能,例如文生图,图生图、种子值、放大图像等等,下面拿了invokeAI的一些特别的功能进行了测评。不过invokeAI中的功能虽然在界面中都可以调节,但是如果当前使用的模型算法不支持,可能会不起作用。面部修复:图片其中Strength表示修复强度:值范围从0到1,范围内值越高修复效果越强;下面两张是多组测试中效果较明显的一组,他们有相同的种子值,关键词为“A girl’s face”:第一张,没有打开面部修复时的生成效果:图片打开面部修复后:图片这一功能主要是略微优化脸部结构,同时图片的锐度下降,并产生一定的磨皮、平滑效果。画布拓展:几乎可以将画布无限延展,这是这个功能最吸引人的特点。你可以在这个界面里自定义延展框的大小、比例、甚至创建遮罩等,将你原来的模型进行放大:图片

图片

考虑到每次图像拓展可能会产生接缝线,官方在左侧的调节栏里设置了接缝校正功能如下,但是模型不同,这个调节的效果也会不同:

图片

invokeAI主要是基于开源模型的界面设计,它与著名的非开源AI图像生成模型midjourney相比,有哪些优缺点呢?在进行大量的出图时,midjourney采用的是上下滚动的翻阅设计,而invokeAI采用的是将图片集中放在右侧栏中的设计,invokeAI在直接选取之前的图像上更加方便。invoke将所有的图像集中右侧:图片midjourney的滚动浏览:图片在对于生成的一些微调功能方面,midjourney需要在输入框中将所有的指令通过指定格式表达出来,但是invokeAI采用了部分使用滑块等调节的方式,交互方式更加直观便捷。同时有的开源模型没有较为完善的界面设计,对于编程基础较弱的用户不是很友好。但是如果将模型导入invokeAI,就可以在统一的界面中使用模型,也节省了熟悉新模型的时间。invokeAI在每个功能按钮旁都有一个小问号,鼠标停留时会有详细的功能说明,这是非常人性化的交互体验。例如invokeAI中对种子值的说明:图片相比于midjourney,invokeAI将文生图、图生图、画布拓展三个大功能拆分开并将其作为主结构向下细分的结构设计也是不错的,相对应的功能在颜色上也做出了区分。但在图片储存上midjourney使用频道的方式,在进行图片分类、储存方面更加完善,可以将不同的图片分配到不同的频道内进行储存,目前invokeAI还没有将图片分类储存的功能。midjourney丰富的频道系统:图片在社交属性上,midjourney能更快地直达社区和看见他人生成的内容,invokeAI更像单独使用的工具。对于一般开源软件同样地,下面两张界面图对比,相比stable diffusion比较单调并且没有功能说明,invokeai使用起来更人性化:图片图片对于本地配置要求来说,相比midjourney完全云端的优势,invokeIA安装对于本地配置的要求较高。而且目前为止使用invokeai的成员较少,网上相对应的使用教程也比较少,需要根据官方说明书一步步执行。invokeAI下载时携带了五个模型包,占用很大的内存,并且运行在本地对于显卡的要求也比较高,有条件可以尝试在云端服务器运行。

统一UI在提供便利的同时也会带来一些缺点,固定的UI界面可能无法完全适配自定义模型的功能。而且invoke目前功能比较基础,如果可以自定义增加调节模块并出相应的官方教程就更好了。

登录可见下载资源信息, 现在去登录

0 条评论

带到手机上看
热门软件/插件