Real esrgan-gui(详情请戳 官网 / 作者项目地址)是一款免费开源的图片放大工具,来自AI 图像修复算法 Real-ESRGAN 的开源图形界面(以动画为主)。采用 Python 和 tkinter 开发,同时支持 Windows、macOS 和Ubuntu平台。相比其它类似功能的软...
之前都在用so-vits-svc,可惜停止维护了,上星期看到一个听起来非常牛的AI声音克隆项目。整个周末都在研究,从实践的结果来看,确实不错。用了这个项目之后,感觉之前推荐的两个...突然不香了。先看一个对比视频来感受下:需要下载以下内容(已打包,底部下载):新版整合包:so-vits-svc整合包...
OOTDiffusion是一款功能强大的开源虚拟试穿工具,旨在提供高质量、自然逼真的服装试穿体验。无论是半身模型还是全身模型,OOTDiffusion都能根据不同性别和体型自动调整服装效果,并根据用户的需求和偏好进一步调整试穿效果。该工具基于先进的潜在扩散模型(Latent Diffusion Mo...
RWKV Runner 是 RWKV 模型的管理和启动工具,由 RWKV 开源社区成员 josStorer 开发,它本身也是一个开源软件,且体积仅 10MB 左右(不含依赖项)。 开箱即用的 AI 功能:易于使用的聊天、写作、作曲交互等 AI 功能,支持聊天预设,支持 MIDI 硬件输入及音轨编辑等...
「 整合包+模型 」软件基于OpenAI宣布开源的多语言语音识别系统Whisper,市面上应该没有第二个比它更准确的多语言语音识别系统了我今天发布的这个软件就是基于它进行优化后的FastWhisper项目的GUI版本FasterWhisperGUI,本软件还支持基于Demucs的人声提取(你应该也找...
Stable Diffusion(SD)因为其开源特性,有着较高的受欢迎程度,并且基于SD的开源社区及教程、插件等,都是所有工具里最多的。基于SD,有不同的操作界面,可以理解为一个工具的不同客户端。WebUI和ComfyUI是两种较为流行的操作界面选项1. WebUI :优点:界面友好,插件丰富,新...
Stable Diffusion要王者归来了?SD3-Turbo文生图效果图 图片来源SD3-Turbo论文 从上图中可以看到,新模型在prompt控制上更上一层楼,氛围感方面也有明显的提升。Stable Diffusion 3 Medium的参数量为2B,大小适中,它非常适合在消费级个人电脑和笔记...
音乐去人声真是一个高频需求,之前总是在不经意间碰到索要如何制作伴奏乐的问题。以前可以用 Audition 之类的勉强解决,现如今时代变了,人工智能&大数据让这种需求变成了傻瓜式解决方案。本程序使用了最先进的音源分离模型,以去除音频文件中的人声。UVR 的核心开发人员训练了这个软件包中提供的所...
“ Vintage Guitar”是Dabro Music推出的时尚大气的吉他包,使用东欧和前苏联70年代和80年代的旧吉他录制......::::::预览PRODUCT DEMO/PREViEW ::::::...... 个人使用不需要购买,如果大型商用或演出音乐会建议购买正版(如需版权可联系我们...