绿软

全部默认装机网络软件媒体编程软件图像系统软件应用软件手机软件资讯游戏 AI

AI列表

Rope-Live ：AI换脸，视频直播换脸软件

Rope-Live 是一个专注于图片、视频以及直播换脸的开源项目，基于深度学习技术开发。该软件能够通过先进的算法，在不失真的情况下将目标人物的脸部替换到图片或视频中，适合创意视频制作、娱乐内容生...

10/7/2024下载

LFM-40B - MoE大语言模型

LFM-40B 是一个拥有 12B 个激活参数的大语言模型，尽管参数量较小，但其性能可以媲美一些体积更大的模型。该模型采用了 “专家混合”（MoE）架构，这使得它在推理效率上有显著优势。更重要的...

10/3/2024下载

VideoLingo - 一站式视频翻译与本地化配音

VideoLingo 是一款一站式的视频翻译与本地化配音工具，专为需要将视频内容进行多语言转换和配音的用户设计。通过该软件，用户可以轻松地将视频内容翻译成多种语言，并添加对应的配音，为跨文化传播提供...

9/30/2024下载

FLUX-Controlnet-Inpainting - 图像修复

FLUX-Controlnet-Inpainting 是一款基于 ControlNet 和 FLUX.1-dev 的图像修复工具，能够修复图像中损坏或缺失的部分。它结合了 FLUX.1-dev 模型...

9/30/2024下载

2VEdit - 图像到视频扩散模型视频编辑

2VEdit 是一种基于图像到视频扩散模型的视频编辑方法，允许用户通过编辑视频的第一帧，将修改自动传播到整个视频。这种方法大大简化了视频编辑流程，适合需要快速且一致地修改视频内容的用户，特别是在...

9/28/2024下载

JoyCaption - 无审查视觉LM

JoyCaption 是一款即将开源的无审查视觉语言模型（Visual LM），在图像识别和描述方面表现出色，尤其是在处理和标注敏感图片（如色图）方面表现突出。这款模型适合那些有类似图像标注或识...

9/27/2024下载

Fluxgym - 傻瓜式FLUX LoRA训练工具

Fluxgym 是一款非常简单的傻瓜式 FLUX LoRA 训练工具，为用户提供了极简的训练体验。即使你没有丰富的技术背景，也可以轻松使用这款工具进行 LoRA 模型的训练。它的设计目标是让每个...

9/27/2024下载

Molmo - 多模态模型识别图像物体场景和活动

Molmo 是一个开源的多模态模型，专注于图像识别和生成精确描述。它不仅能够识别图像中的物体、场景和活动，还支持用户通过 2D 指向交互，例如手势或点击，与图像中的对象进行互动。Molmo 的...

9/27/2024下载

Moshi - 实时语音转换模型

Moshi 是一个实时语音到语音生成的 Transformer 开源模型，由 Kyutai Labs 开发。Moshi 在语音对话系统领域具有革命性意义，其核心亮点是支持全双工通信，能够实现极低...

9/24/2024下载

StoryMaker - AI生成故事

StoryMaker 是一个专为一致性角色图像生成设计的解决方案，尤其适合在多人物场景中使用。它不仅确保角色的面部在整个系列图像中的一致性，还能保持衣服、发型和身体姿态的一致性。通过该工具，用户可以...

9/23/2024下载

Dream Machine API - Luma AI视频生成接口

Luma AI 推出 Dream Machine API ，这是一款强大的视频生成工具，专为开发者设计，帮助他们将AI视频生成能力无缝集成到自己的产品中。通过简单的文本指令，用户无需掌握复杂的提示工...

9/19/2024下载

Seed-Music：字节音乐生成模型

Seed-Music 是由字节跳动开发的一款强大音乐生成模型，它能够通过多种数据输入方式来生成和编辑音乐。无论是文本描述、音频参考、乐谱还是声音提示，Seed-Music 都能根据这些输入自动创作出...

9/19/2024下载

Genspark Autopilot Agent - 云端AI代理工具

Genspark 推出 Autopilot Agent 异步 AI 代理，这是一款强大的云端AI工具，能够并行处理多个任务，提升工作效率，节省用户宝贵的时间。无论是处理复杂数据、审查信息，还是提供...

9/19/2024下载

StoryTribe -免费的在线故事板制作工具

StoryTribe 是一个免费的在线故事板制作工具，即使没有绘画技能，也能轻松上手使用。通过丰富的图形资产、插画、场景道具和角色组合，用户可以快速创建属于自己的故事板。支持多种文化、种族和体型，...

9/17/2024下载

GOT-OCR2.0 - 端到端OCR模型

GOT-OCR2.0 是一款功能强大的端到端 OCR 模型，能够处理多种复杂的光学字符识别任务。它不仅可以识别普通文本，还支持对公式、表格、乐谱等复杂内容的精准识别。该模型主要支持中英文字符识别，且...

9/16/2024下载

Vchitect - 通用大模型

Vchitect 2.0 是由上海人工智能实验室开发的一款开源视频生成模型，旨在为用户提供便捷的高清视频生成功能。它能够根据文本或图像生成高达20秒的短视频，并且支持灵活的视频宽高比调节。 Vchit...

9/15/2024下载

Reader-LM - HTML标签净化清理数据

Jina AI 推出了一个名为 Reader-LM 的小型语言模型，专门用于将原始 HTML 转换为干净、结构化的 Markdown。这个工具极大地简化了从网页提取和清理数据的过程，不再需要编写复杂...

9/13/2024下载

Vidu - 生成主体一致性视频

Vidu 最近升级了其 AI 视频模型，现在支持让任意主体在视频中保持一致性。无论是角色还是物体，Vidu都可以精准还原，并支持多种画风风格。这使得创作者可以在不同的场景下保持角色和物体的一致性，不...

9/12/2024下载

Fish Speech - 开源TTS模型

Fish Speech 1.4 是一款开源的多语言文本转语音（TTS）模型，完美支持 8 种语言，包括英语、中文、日语等。该模型经过 70 万小时的多语言数据训练，提供超快的 TTS 转换速...

9/12/2024下载

Reflection Llama-3.1-70B - 自我反思调优模型

Reflection Llama-3.1-70B 是一个顶级的开源自然语言模型，采用了先进的“Reflection-Tuning反思调优”技术，具备自我反思与改进的能力。这一技术让模型在推理过程中可...

9/7/2024下载