文生音视频
文生音
生成背景音乐
生成真人语音
生成真人演讲
生成真人演唱
文生视频
生成背景视频
生成讲解视频
实现
结构化提示词
分类生成再合成
- 背景音乐
- 真人语音
- 背景视频
- 讲解视频
生成多段短视频
开源项目
Mora
Open-Sora
- 全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重
- Open-Sora 开源地址:https://github.com/hpcaitech/Open-Sora
- Open-Sora全面开源
Mira
- 项目仓库
- 腾讯PCG ARC实验室推出Mira:类似 Sora 的长视频生成
- Mira(Mini-Sora),是一个尝试生成高质量、长时视频的初步探索项目,以Sora风格进行长视频生成。
Open-Sora-Plan
字节发布视觉基础模型ViTamin,多项任务实现SOTA
- 官方主站:https://beckschen.github.io/vitamin
- 项目仓库:https://github.com/Beckschen/ViTamin
- 字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024
Boximator字节跳动视频生成大模型
AniPortrait:腾讯最新开源音频合成逼真人脸动画项目
- 项目链接:https://github.com/Zejun-Yang/AniPortrait
- 腾讯最新开源音频合成逼真人脸动画项目
- 通过音频驱动技术合成逼真的人像动画。使得根据音频输入,可以生成高度真实的人脸表情和动作,为多种应用场景提供了新的可能性,包括但不限于虚拟现实、游戏、在线会议等
Sora的开源替代者:MagicTime,免费的、高质量的文本生成视频大模型
- 项目链接:https://github.com/PKU-YuanGroup/MagicTime
- Sora的开源替代者:MagicTime,免费的、高质量的文本生成视频大模型
- MagicTime专注于捕捉和复现物体变形过程中的物理知识,从而生成更加真实和动态的视频内容。
- AI模型——MagicTime:输入文本即可生成延时视频
SVGDreamer:一键生成专业级SVG
- 项目链接:https://github.com/ximinng/SVGDreamer
- SVGDreamer:一键生成专业级SVG
- SVGDreamer利用先进的人工智能算法,将简单的文本描述转化为复杂而精美的矢量图形,为设计师和艺术家们提供了无限的可能性
用so-vits-svc克隆自己声音并翻唱歌曲
GPT-SoVITS用一分钟语音完美克隆自己的声音
- 项目地址:https://github.com/RVC-Boss/GPT-SoVITS
- GPT-SoVITS是一个开源的TTS项目,只需要1分钟的音频文件就可以克隆声音,支持将汉语、英语、日语三种语言的文本转为克隆声音
- 号称开源“最强”声音克隆软件GPT-SOVITS的评测效果
- SoVITS为你赋能,实现声音克隆,为你的创作提供帮助
- AI声音克隆 | 最全最简教程(权威版)