扫码加入「超合体种子用户反馈群」,与其他用户交流心得、优先体验新功能
一站式 AI 创作平台 · 视频 · 图像 · 文案 · 让创意触手可及
无预设角色的纯粹 AI 对话,支持多模态输入和数据分析
对话式 AI 图像生成与编辑
AI助手帮你规划创作方案,组合使用平台工具
创建与管理通用批量任务:按目标 App 的 param_schema 提交多条子任务,查看进度并支持单条重试
通用 LLM 调用工具,支持文本/多模态输入
文生 / 首尾帧图生 / 参考图生视频,标准与 Fast
文本/图片/首尾帧/参考生视频/视频编辑
文字描述生成视频,专业视频制作
Kling3.0 新增多镜头、元素控制、语音控制等高级功能,支持 3-15秒任意时长
5种模式:文字/图片/音频生视频,视频延长/重拍
OpenAI Sora 2:3种模式,支持标准版和Pro版
4种模式×2版本:首尾帧/参考图/参考视频/视频编辑
Runway 视频生成:3种模式(文本/图片/视频生成视频)
文生/图生/首尾帧三合一,中文运镜
Midjourney 官方视频生成 API,支持生成视频和视频延伸
使用 Grok 模型生成视频,支持文字和图片生成视频,时长 10-30 秒
动作迁移 & 视频换人
控制角色的面部表情和身体动作
图片+音频生成人物动态视频
图片+音频生成数字人说话/唱歌视频
声音+形象克隆,文案一键生成专属数字人口播视频
AI视频超分辨率放大,支持最高8倍放大和120fps帧插值
视频4倍放大,单边最大4096px
为视频添加新的音轨,替换原音或添加配音
合并多个视频文件为一个,支持多种格式
思考型模型,专业高质量图像生成
2种模式×3个版本:文本生成/图片编辑,Dev/Flash/Turbo
OpenAI GPT Image 1.5 图像生成,支持文生图和图生图
Midjourney 官方 API,支持文生图、图像编辑、混合、描述、区域重绘
云端服务,支持智能提示词优化
文生图、图生图、多图融合、组图生成
5种模式:文生图/图像混合/局部编辑/背景替换/图像重构
支持文本生成图像(t2i)和图像编辑(i2i),自动模式判断
文本/图像生成高质量图片
手绘草图转艺术画作,支持多种风格
将图片分解为多个可编辑图层
AI 智能移除图片背景,输出透明 PNG
通过调整相机角度生成不同视角的图像
AI图像超分辨率放大,支持多种模型和参数配置
将一张图片按网格裁剪成多张独立图片(支持 2x2、3x3、4x4、5x5)
从设计图生成 Photoshop JSX 脚本,下载后在本地执行即可得到分层 PSD
识别图片中的所有文字,支持中英文、横排竖排、倾斜及多角度翻转场景,返回带坐标的识别结果
腾讯混元文生3D/图生3D,专业版与极速版
上传FBX模型,自动组件识别与拆分,输出多个独立GLB组件文件
输入3D高模,采用 Polygon 1.5 模型生成布线规整、低面数的3D模型
输入3D模型(FBX/OBJ/GLB),自动进行UV展开,输出带UV坐标的模型和UV贴图
上传 OBJ/GLB 几何模型,用文字或参考图生成纹理贴图与带材质模型
3种模式:文字/图片/多视角生成高精度 3D 模型
对已有 3D 模型重新生成纹理,支持文字描述和风格参考图
将 Tripo 3D 模型转换为 GLTF / USDZ / FBX / OBJ / STL / 3MF 等格式
将 Tripo 3D 模型转为乐高、体素、Voronoi 或 Minecraft 等创意风格
AI 自动减面,将高精度 3D 模型优化为轻量低多边形版本,适合游戏引擎与实时渲染
两步操作完成骨骼绑定与动画应用,支持 80+ 预设动作,适合人形角色动画展示
将 Tripo 3D 模型按语义自动分割为命名部件,并对部件进行填补完善
多种音色,情绪控制,高质量语音合成
云端版 IndexTTS 2.0,零样本语音复刻
文本转语音 & 语音转语音
输入歌词和描述生成完整歌曲
文本生成纯音乐(BGM),支持结构控制
文本生成音效,支持自定义时长和循环
音频多语言配音,支持30+种语言,保留原声特征
从音频中分离出人声,去除背景音
合并多个音频文件为一个,支持多种格式
支持WAV、MP3、M4A、FLAC、Opus等格式互转,质量可调
音视频自动识别生成字幕(SRT格式)
高精度语音识别,支持26种语言和情感分析
• 每次生成会预先扣除相应积分
• 生成失败会自动退还全部积分
• 积分不足时请前往充值页面充值
• 生成的内容会自动保存,可在历史记录中查看和下载
• 图片生成为同步任务,视频生成为异步任务(需等待)