AI列表
Rope-Live :AI换脸,视频直播换脸软件
Rope-Live 是一个专注于 图片、视频以及直播换脸 的开源项目,基于深度学习技术开发。该软件能够通过先进的算法,在不失真的情况下将目标人物的脸部替换到图片或视频中,适合创意视频制作、娱乐内容生...
10/7/2024下载
LFM-40B - MoE大语言模型
LFM-40B 是一个拥有 12B 个激活参数 的大语言模型,尽管参数量较小,但其性能可以媲美一些体积更大的模型。该模型采用了 “专家混合”(MoE)架构 ,这使得它在推理效率上有显著优势。更重要的...
10/3/2024下载
VideoLingo - 一站式视频翻译与本地化配音
VideoLingo 是一款一站式的视频翻译与本地化配音工具,专为需要将视频内容进行多语言转换和配音的用户设计。通过该软件,用户可以轻松地将视频内容翻译成多种语言,并添加对应的配音,为跨文化传播提供...
9/30/2024下载
FLUX-Controlnet-Inpainting - 图像修复
FLUX-Controlnet-Inpainting 是一款基于 ControlNet 和 FLUX.1-dev 的图像修复工具,能够修复图像中损坏或缺失的部分。它结合了 FLUX.1-dev 模型...
9/30/2024下载
2VEdit - 图像到视频扩散模型视频编辑
2VEdit 是一种基于 图像到视频扩散模型 的视频编辑方法,允许用户通过编辑视频的第一帧,将修改自动传播到整个视频。这种方法大大简化了视频编辑流程,适合需要快速且一致地修改视频内容的用户,特别是在...
9/28/2024下载
JoyCaption - 无审查视觉LM
JoyCaption 是一款即将开源的 无审查视觉语言模型(Visual LM) ,在图像识别和描述方面表现出色,尤其是在处理和标注敏感图片(如色图)方面表现突出。这款模型适合那些有类似图像标注或识...
9/27/2024下载
Fluxgym - 傻瓜式FLUX LoRA训练工具
Fluxgym 是一款 非常简单的傻瓜式 FLUX LoRA 训练工具 ,为用户提供了极简的训练体验。即使你没有丰富的技术背景,也可以轻松使用这款工具进行 LoRA 模型的训练。它的设计目标是让每个...
9/27/2024下载
Molmo - 多模态模型识别图像物体场景和活动
Molmo 是一个 开源的多模态模型 ,专注于图像识别和生成精确描述。它不仅能够识别图像中的物体、场景和活动,还支持用户通过 2D 指向交互 ,例如手势或点击,与图像中的对象进行互动。Molmo 的...
9/27/2024下载
Moshi - 实时语音转换模型
Moshi 是一个 实时语音到语音生成的 Transformer 开源模型 ,由 Kyutai Labs 开发。Moshi 在语音对话系统领域具有革命性意义,其核心亮点是支持全双工通信,能够实现极低...
9/24/2024下载
StoryMaker - AI生成故事
StoryMaker 是一个专为一致性角色图像生成设计的解决方案,尤其适合在多人物场景中使用。它不仅确保角色的面部在整个系列图像中的一致性,还能保持衣服、发型和身体姿态的一致性。通过该工具,用户可以...
9/23/2024下载
Dream Machine API - Luma AI视频生成接口
Luma AI 推出 Dream Machine API ,这是一款强大的视频生成工具,专为开发者设计,帮助他们将AI视频生成能力无缝集成到自己的产品中。通过简单的文本指令,用户无需掌握复杂的提示工...
9/19/2024下载
Seed-Music:字节音乐生成模型
Seed-Music 是由字节跳动开发的一款强大音乐生成模型,它能够通过多种数据输入方式来生成和编辑音乐。无论是文本描述、音频参考、乐谱还是声音提示,Seed-Music 都能根据这些输入自动创作出...
9/19/2024下载
Genspark Autopilot Agent - 云端AI代理工具
Genspark 推出 Autopilot Agent 异步 AI 代理 ,这是一款强大的云端AI工具,能够并行处理多个任务,提升工作效率,节省用户宝贵的时间。无论是处理复杂数据、审查信息,还是提供...
9/19/2024下载
StoryTribe -免费的在线故事板制作工具
StoryTribe 是一个 免费的在线故事板制作工具 ,即使没有绘画技能,也能轻松上手使用。通过丰富的图形资产、插画、场景道具和角色组合,用户可以快速创建属于自己的故事板。支持多种文化、种族和体型,...
9/17/2024下载
GOT-OCR2.0 - 端到端OCR模型
GOT-OCR2.0 是一款功能强大的端到端 OCR 模型,能够处理多种复杂的光学字符识别任务。它不仅可以识别普通文本,还支持对公式、表格、乐谱等复杂内容的精准识别。该模型主要支持中英文字符识别,且...
9/16/2024下载
Vchitect - 通用大模型
Vchitect 2.0 是由上海人工智能实验室开发的一款开源视频生成模型,旨在为用户提供便捷的高清视频生成功能。它能够根据文本或图像生成高达20秒的短视频,并且支持灵活的视频宽高比调节。 Vchit...
9/15/2024下载
Reader-LM - HTML标签净化 清理数据
Jina AI 推出了一个名为 Reader-LM 的小型语言模型,专门用于将原始 HTML 转换为干净、结构化的 Markdown。这个工具极大地简化了从网页提取和清理数据的过程,不再需要编写复杂...
9/13/2024下载
Vidu - 生成主体一致性视频
Vidu 最近升级了其 AI 视频模型,现在支持让任意主体在视频中保持一致性。无论是角色还是物体,Vidu都可以精准还原,并支持多种画风风格。这使得创作者可以在不同的场景下保持角色和物体的一致性,不...
9/12/2024下载