AI列表
Linly-Dubbing - 智能视频多语言AI配音/翻译工具
Linly-Dubbing 是一个开源的多语言 AI 配音和视频翻译工具,可以自动将视频翻译成其他语言,生成字幕,并且克隆视频中说话者的声音进行自动配音,支持口型匹配。 软件功能 自动下载视频 :支...
8/17/2024下载
IncarnaMind - AI与多个文档同时聊天
IncarnaMind 是一款创新的软件工具,通过 AI模型 让用户可以与多个文档同时聊天,并精确查询信息。它使用了 滑动窗口分块技术 ,能够根据文档的复杂性和用户的查询需求,动态调整信息检索窗口的...
8/13/2024下载
SD变现宝 - 将ComfyUI转换为小程序
SD变现宝是一款强大的工具,旨在帮助用户将 ComfyUI 工作流 一键转换为各种小程序,同时内置支付功能,使得这些小程序可以直接进行商业化。它支持将 ComfyUI 工作流快速转换为 微信小程序 、...
8/13/2024下载
Qwen2-Audio :强大的语音模型
阿里巴巴正式发布了强大的语音模型 Qwen2-Audio,这是一款能够与用户进行直接语音对话和分析转录各种声音的智能模型。Qwen2-Audio 展现了卓越的多功能性和智能化能力,是语音交互领域的一...
8/11/2024下载
ReSyncer - 多功能统一模型
ReSyncer 是一个 多功能统一模型 ,可以实现音视频口型同步、说话风格迁移和换脸等多种功能。它不仅在现有开源方法和先进产品(如Heygen)中表现出色,而且在嘴型同步的精确度上表现尤为突出。 ...
8/11/2024下载
Matting by Generation - 创新的抠图方法
Matting by Generation 是一种创新的抠图方法,利用图像生成模型来实现更精准、更高效的图像抠图。与传统方法不同,这种技术无需额外输入,仅凭一张图像就能自动提取前景,并生成高质量的边...
8/10/2024下载
Deep-Live-Cam - 视频实时换脸
Deep-Live-Cam 是一款强大的实时换脸和一键视频深度伪造工具。只需提供一张图像,就可以轻松实现人脸替换,并通过实时预览功能立即查看效果。这款软件不仅支持单一人脸的替换,还可以处理同一图像或...
8/10/2024下载
LSLM 边说话边倾听的语音模型
LSLM 是一种新型的语音模型,具备独特的 边说话边倾听 能力。这款由上海交通大学X-LANCE人工智能实验室与字节跳动联合开发的语言模型,开创了实时语音交互的新体验。无论是你打断它,还是在嘈杂环境...
8/10/2024下载
Gemma 2 2B - Google轻量级语言模型
Gemma 2 2B 是Google最新推出的一款 轻量级语言模型 ,专为在手机、笔记本电脑、台式机等边缘设备上运行而设计。尽管其模型参数仅为2B(20亿),但Gemma 2 2B的性能非常强大,尤...
8/3/2024下载
CosyVoice - 语音合成模型 音色克隆 AI声音克隆软件
CosyVoice 是阿里巴巴开发的 语音合成模型 ,专注于提供高质量的语音合成和自然语音模拟功能。最新版本的 CosyVoice 进一步增强了 精细控制 和 自然语音模拟 能力,使其在多样化的应用...
8/3/2024下载
Flux - 开源图像生成模型
Flux.1 是一款 开源图像生成模型 ,以其灵活的架构和卓越的性能在商业和开发应用中广受欢迎。Flux.1模型基于一种 混合架构 ,结合了 multimodal 和 parallel diffusi...
8/3/2024下载
MindSearch - AI搜索引擎
MindSearch 是一款 AI搜索引擎 ,专注于模仿人类在网络上寻找和整合信息的过程。凭借其强大的信息处理能力,MindSearch能够在短短 3分钟内 从超过 300个网页 中收集和整合信息,...
8/3/2024下载
OpenDiLoCo:分布式模型训练软件
OpenDiLoCo是一款用于分布式模型训练的软件,它是谷歌DeepMind的DiLoCo的开源实现。OpenDiLoCo能够实现分布式低通信训练大型语言模型(LLM)。通过在两大洲的三个地区进行训...
7/15/2024下载
SEED-Story - AI写图文故事
SEED-Story :能写图文故事的多模态模型,基于 SEED-X ,提供角色图片和故事要求,可以保持角色一致,完成整个故事的文字和配图。 软件功能 多模态生成 :SEED-Story 能够同时生...
7/14/2024下载
EchoMimic:生成逼真的音画同步肖像
EchoMimic 是一款利用音频和面部标志点生成逼真面部动画的视频工具。它结合了人的面部68个主要标志点和音频信号,从而大大提高了生成动画的稳定性,减少了抖动和失真,使生成的面部动画更加符合自然的...
7/11/2024下载
微软开源RAG:GraphRAG
微软最新推出的开源技术GraphRAG,通过利用知识图谱大幅增强了语言模型的能力。这项技术能够跨大量信息连接信息,并使用这些连接回答那些仅靠关键字和基于向量的搜索机制难以回答的问题。 软件功能 跨文...
7/10/2024下载
PaintsUndo:自动生成绘画全过程视频
PaintsUndo 是一款革命性的工具,通过输入静态图像,自动生成该图像的绘画全过程视频。无论你提供的是何种类型的图像,PaintsUndo 都能够智能还原绘画的每一步骤,为数字艺术创作提供全新的...
7/10/2024下载
OdysseyML: AI视频生成和编辑
OdysseyML 是一家新兴的 AI 视频生成和编辑工具的开发公司,旨在为用户提供好莱坞级别的视觉效果。该公司致力于通过先进的 AI 技术生成和导演高质量的视频内容,为视频游戏和影视作品提供强大的...
7/10/2024下载