基于openAI的whisper的衍生项目faster whisper做成,支持100多种语言识别与翻译。软件纯离线运行1、如下图,软件的界面很简单,操作步骤也说的很清楚了:2、转换完成后,输出目录会有srt字幕格式和txt纯文本格式。3、测试一些视频语音翻译的字幕效果截图:翻译识别语言涉及到了日语...
AEJuice Neonmind AI 是一款人工智能文生图创意工具包,智能After Effects工具,可与Stable Diffusion稳定扩散配合使用,为您的视觉创意打开无限视野。这不仅仅是一个工具,它还是一个门户,可让您扩展创造力的边界并发现新的形式和风格。现在,您不需要成为专业艺术家或...
这是一个视频翻译工具,可将一种语言的视频翻译为另一种语言和配音的视频。 语音识别基于 openai-whisper 离线模型、文字翻译使用google|baidu|chatGPT翻译接口,文字合成语音使用 Microsoft Edge tts该项目利用了Openai-whisper的高精度和多语言的...
当AI绘画模型和平台越来越多,你是否想使用统一美观的界面来使用你所有的AI绘画模型?invokeAI——这个精致的WebUI工具可以帮助你创建一个统一美观的工作环境自Stable Diffusion模型发布以来,一组人(从Lstein开始)一直致力于将生成高质量图像的最佳工具汇集到单个易于使用的存储...
AnyDoor 是一款创新的AI工具,能够将任何对象(如人物、动物或物品)无缝集成到新的图像或视频场景中。这款扩散的图像生成器,借助先进的算法,实现了在用户指定的位置,以自然和谐的方式将目标对象“传送”到新的场景中,自动调整光线和角度以适应新环境。由阿里巴巴与香港大学共同研发的这款AI技术,实现了无...
通过直观的用户界面,艺术家可以选择预设的模型或调整各种参数,以实现他们心中的艺术构想。几分钟之内,一幅精美的图像便可呈现在眼前。 PS版本建议2023及以上对于追求更高创作境界的艺术家,ImageCreator还提供了高级定制功能。通过ModelHub,用户可以定制模型,使其更符合自己的艺术风格和工...
在当今的数字图像处理领域,抠图技术占据着不可忽视的地位。它不仅在专业的图形设计工作中扮演重要角色,也常见于日常的图片编辑需求中。我最近发现了一个超级厉害的AI模型,叫做BRIA-RMBG。它号称是开源界最强大的一键抠图、去除背景模型,效果真的超级赞,而且最重要的是,它竟然是免费的,要知道,很多背景去...
Upscayl 是一个免费开源的 AI 图像超分辨率工具,软件能够帮助您对图像画面进行优化处理,能够放大图像,并且放大之后依然保持着图像的质量,以及还支持大幅度提升图片的质量和清晰度。不确定也没关系,试试又没什么坏处。默认模型是 Real-ESRGAN,小众软件也做过介绍:Real-ESRGAN –...