Seedance 使用指南
Doubao-Seedance-2.0:企业级业务场景指南
Section titled “Doubao-Seedance-2.0:企业级业务场景指南”Doubao-Seedance-2.0 是豆包大模型团队推出的新一代专业级多模态视频创作模型。支持图片、视频、音频等多模态素材参考,具备视频智能编辑与延长,使视频生成工具进入「可精准生成、可复用迭代」的工业化新阶段。
模型对物理规律的理解持续深化、更贴合真实世界。意图理解能力显著提升,严格遵循指令细节约束,保障专业级叙事的可信度。
📈 模型升级:万物皆为灵感,创作无限可能
Section titled “📈 模型升级:万物皆为灵感,创作无限可能”1️⃣ 万物皆为灵感:多模态参考素材输入,创作更简单
除文生视频、图生视频(首尾帧),Seedance 2.0 支持同时上传图片、视频、音频等多模态素材并进行自由组合。这意味着,企业现有的任何数字资产,设计稿、产品图、往期广告片、品牌音乐等,都能成为创作的起点。
2️⃣ 牵一发不动全身:视频智能延长与编辑能力上线
Seedance 2.0 支持对视频进行平滑延长、双段/三段视频衔接补全,以及增删元素等局部编辑能力,在不影响原视频整体节奏与结构的基础上实现精准调整。客户可实现”一次创作,多处适配”,让视频素材真正活起来、用到底。
3️⃣ 更聪明也更听话:意图理解更强,能推理、精准遵循
模型不仅能”看懂”prompt,更能”听懂”意图。复杂的镜头调度、微妙的情绪转折、多层次的场景构建,即便是极简 prompt,模型也能推理出未言明的细节。
4️⃣ 还原真实世界:符合物理规律,运动质量大幅提升
模型对物理规律的理解持续深化、更贴合真实世界。意图理解能力显著提升,严格遵循指令细节约束,保障专业级叙事的可信度。
🫱 Seedance 2.0 提示词指南
Section titled “🫱 Seedance 2.0 提示词指南”相较于前代,2.0 版本在意图理解、多模态融合、视频编辑与物理真实感上实现了代际飞跃。因此,在撰写提示词时,可以更大胆地组合使用多模态素材、设计复杂的镜头衔接与转场、信赖模型对物理世界的精准模拟。
主体 + 动作 + 镜头语言 + @参考素材 + 风格美学 + 音频与音效 + 限制条件
| 组成 | 说明 |
|---|---|
| 主体(Subject) | 明确画面的核心角色或物体,及其关键特征,如”一个身穿红色连衣裙的女孩”,“一辆未来主义的悬浮跑车”。 |
| 动作(Action) | 描述主体的行为和动态,以及与其他元素的互动,如”正在奔跑”,“从桌上拿起咖啡杯”。 |
| 镜头语言(Camera Language) | 定义镜头如何拍摄,包括景别、角度、运动方式,如”特写镜头”,“从低角度仰拍”,“镜头快速推近”。 |
| @参考素材(Reference Assets) | 2.0 核心升级。引用图片、视频或音频,以精确控制角色形象、动作、场景或背景音乐,如”主角替换为@图片1,动作模仿@视频1,背景音乐使用@音频1”。 |
| 风格美学(Style & Aesthetics) | 定义画面的整体视觉风格,如”皮克斯动画风格”,“新海诚电影感”,“赛博朋克”。 |
| 音频与音效(Audio & SFX) | 描述对白、画外音、音效或背景音乐的具体要求,如”画外音是一个沉稳的男声,伴随有金属碰撞的音效”。 |
| 限制条件(Negative Prompts) | 排除不希望出现的元素或效果,如”不要出现xx文字”,“避免人物面部畸变”。 |
常用提示词一览
Section titled “常用提示词一览”「常用提示词一览」组合使用可以创造出更丰富、更具层次感的视觉效果。
| 类别 | 关键词 |
|---|---|
| 景别 | 特写 (Close-up)、近景 (Near Shot)、中景 (Medium Shot)、全景 (Full Shot)、远景 (Long Shot)、大远景 (Extreme Long Shot) |
| 镜头角度 | 仰拍 (Low Angle)、俯拍 (High Angle)、平拍 (Eye-level Shot)、过肩镜头 (Over-the-shoulder Shot) |
| 镜头运动 | 推镜头 (Push-in)、拉镜头 (Pull-out)、摇镜头 (Pan)、移镜头 (Dolly/Track)、跟拍 (Following Shot)、环绕镜头 (Orbit Shot) |
| 其他 | 慢动作 (Slow Motion)、延时摄影 (Time-lapse)、浅景深 (Shallow Depth of Field)、手持镜头感 (Handheld Feel) |
| 类别 | 关键词 |
|---|---|
| 动画/游戏 | 皮克斯风格 (Pixar Style)、迪士尼风格 (Disney Style)、吉卜力/宫崎骏风格 (Ghibli/Miyazaki Style)、新海诚风格 (Makoto Shinkai Style)、双城之战风格 (Arcane Style)、粘土动画 (Claymation)、水墨风格 (Ink Wash Painting)、毛毡风格 (Felt Art)、像素艺术 (Pixel Art) |
| 电影/时期 | 电影感 (Cinematic)、王家卫风格 (Wong Kar-wai Style)、昆汀·塔伦蒂诺风格 (Quentin Tarantino Style)、赛博朋克 (Cyberpunk)、蒸汽朋克 (Steampunk)、胶片质感 (Film Grain)、80年代复古 (80s Retro) |
| 光影/色彩 | 高对比度 (High Contrast)、伦勃朗光 (Rembrandt Lighting)、霓虹光 (Neon Light)、柔光 (Soft Light)、丁达尔效应 (Tyndall Effect)、高饱和度 (High Saturation)、低饱和度 (Desaturated)、莫兰迪色系 (Morandi Colors) |
| 视觉效果 | 超现实主义 (Surrealism)、极简主义 (Minimalism)、哥特式 (Gothic)、故障艺术 (Glitch Art)、流体效果 (Fluid Effect) |
覆盖全场景的视频解决方案
Section titled “覆盖全场景的视频解决方案”以下示例均来自企业级场景评测文档,提示词均为原始可运行文本。视频演示链接需要 Lark 认证,本页仅展示提示词与技术要点说明。
🎬 电影影视
Section titled “🎬 电影影视”高难度/可控的运镜和动作 — 无缝多镜头切换
Section titled “高难度/可控的运镜和动作 — 无缝多镜头切换”强节奏音乐驱动,快切蒙太奇 + 慢动作 + 微距 + 延时摄影结合,极具震撼感与科技感。整体无对白,仅节拍、低频鼓点、呼吸声与环境声。0~5秒:肉眼难以看到的微观与隐藏世界:超微距水滴落下瞬间爆裂成皇冠形态;花粉在空气中漂浮;阳光穿透形成粒子轨迹;蝴蝶振翅的慢动作鳞粉飞散;跳般震动的音箱表面沙粒跳动(声波可视化);云层、星轨、城市人流像波浪流动延时摄影;水下气泡上升、光束穿透海水画面极致微距/延时/粒子/流体质感,仿佛"AI视觉增强"。6~13秒:世界万物开始"跳舞",节拍突然加强,所有运动与音乐同步:极光在夜空中翻涌流动;绿色光带像丝绸摆动; 海豚跃出水面,水花在空中冻结慢动作;鱼群集体转向形成流线波浪;海浪拍岸节奏起伏;鸟群同时起飞展开翅膀;风吹草地、布料、树影摆动;城市延时摄影中人流车流像光的河流自染;生命、光线全部呈现舞蹈般律动,世界本身在呼吸、摆动、跳跃。14~15秒:极致微距人眼特写,柔和电影光。瞳孔中清晰倒映前面所有奇观,仿佛整个世界在眼中舞动,声音只剩心跳。黑场。中央极简白字:SEEDANCE。字幕:"See the world dance."通过多镜头快切+慢动作+微距+延时组合,在15秒内实现从微观到宏观的完整节奏蒙太奇。
高难度/可控的运镜和动作 — 稳定的一镜到底
Section titled “高难度/可控的运镜和动作 — 稳定的一镜到底”0-3秒:镜头从豪宅外立面的烟花爆炸开始,快速推进穿过敞开的落地窗,进入光芒万丈的大厅。3-7秒:镜头在狂欢人群中穿行(慢动作):一位女士旋转,流苏裙散开如花朵绽放;香槟杯碰撞,酒液溅出形成金色水珠悬浮;一对情侣热吻,女士的珍珠项链晃动;有人将整瓶香槟对天喷洒,液体如金色雨幕落下。7-11秒:镜头上升至大理石楼梯中段,俯拍整个舞池。水晶吊灯的无数切面折射出璀璨光斑。舞池中央,众人围成圈,一名红唇女郎独舞,周围纸屑飘落如金色暴风雪。11-15秒:镜头穿过人群来到二楼阳台,一个身穿白色西装的男子背对人群,手持香槟杯,独自望向窗外的月光和远处的绿灯。派对的喧嚣在他身后,但他周围仿佛有一层寂静。镜头缓缓推向他的侧脸——微微忧郁的微笑,香槟气泡升腾。画面定格,金色纸屑落在他肩头。以时间轴段落驱动镜头路径,在豪宅派对中完成室外→大厅→舞池→阳台的连续一镜到底。
画面真实,消除AI感
Section titled “画面真实,消除AI感”电影级品牌KV概念视频,无具体产品,无人物对话,诗意叙事与高级自然光影风格,慢节奏到逐渐震撼,环境声与低频心跳声铺底。破晓时分,天空由深蓝过渡为金色,第一缕阳光穿透云层与薄雾,山脉被点亮,空气中微粒漂浮,世界仿佛刚刚苏醒。微距特写,一枚鸟蛋轻轻震动,蛋壳缓慢裂开,小鸟破壳而出,羽毛湿润颤动,生命第一次呼吸。嫩芽顶开泥土,露珠滚落,藤蔓快速生长,花朵绽放,时间流逝加速,万物向光而生。风穿过草原,大片草浪起伏翻涌,种子被吹向天空,随风旋转,像星群般散开。薄雾在林间缓慢流动,第一束阳光穿过树叶缝隙落在地面,光斑轻轻晃动,空气中的微尘被照亮,仿佛世界开始呼吸。高空俯视海岸线,第一道潮水涌向沙滩,海浪层层推进,阳光在水面上铺展开来,整片海面被点亮,光线如同呼吸般起伏扩散,世界彻底醒来。以自然光影变化和微距生命细节消除AI感,呈现电影级真实质感的品牌KV短片。
戏剧/歌剧 都能唱
Section titled “戏剧/歌剧 都能唱”京剧《霸王别姬》中乌江自刎的场景,镜头缓缓推进,背景昏暗的舞台上,背景板投射出残破的军帐剪影,帐外隐约可见汉军的旗帜。京胡以低沉的 [二黄慢板] 起奏,音色苍凉婉转,月琴轻轻拨动,发出清脆而略带忧伤的节奏,三弦则以深沉的低音作为铺垫,营造出凄凉悲壮的氛围。镜头聚焦在扮演虞姬的旦角身上,她双手持剑,做出自刎的准备动作。随后虞姬启朱唇,唱道:"只害得,众百姓,困苦颠连。" 她的唱腔采用梅派经典的 [二黄原板],音色清亮婉转,旋律优美流畅。随后,虞姬深情地望向镜头,一滴晶莹的泪珠从她眼角滑落。此时,音乐突然停顿,虞姬突然大喊一声:"大王啊!" 声音凄厉而深情。在喊出这三个字的瞬间,她的眼神中充满了凄厉和绝望,瞳孔放大,眼球微微颤抖。此时鼓点骤然密集,锣钹齐鸣,音乐达到高潮。指定京胡曲牌、唱腔流派与戏剧情绪节拍,实现传统戏曲场景的精准生成。
从”片段”到”故事”
Section titled “从”片段”到”故事””民国时期的一个雅致的院子里,傍晚,中近景拍摄一个留着手推波造型、穿着旗袍的年轻民国女子坐在木桌旁,桌上的油灯点燃着。 女人皱眉看着手里的信纸,随后她慌张地将信纸藏在桌上的一摞书籍下面,带着些哽咽沉稳地开口说道"事已至此……便只有这条路了。"随后镜头缓慢推进至她的面部近景,她眼里逐渐显现泪光,但眼神却变得凌厉。以单镜头内的连续动作与情绪转折,将一个有叙事弧度的”故事片段”完整交代。
记忆/梦境/意识流
Section titled “记忆/梦境/意识流”一段 15 秒意识流记忆短片。主题是 快要遗忘的童年夏天。场景里有 旧房间、白光、风、窗帘、旧家具、孩子一闪而过的身影。不要讲完整故事,而是像一段被重新想起、又马上要消失的夏天记忆:模糊、发白、安静、抓不住。极简prompt通过氛围词而非叙事词,让模型自主生成模糊发白的意识流画面质感。
穿帮等局部镜头修复
Section titled “穿帮等局部镜头修复”把视频1里的水果全部都变成新鲜的水果用一句指令驱动局部元素替换,保留原视频运镜与场景,仅修复指定物体。
🎭 AI 漫剧/短剧
Section titled “🎭 AI 漫剧/短剧”设计一个好开头
Section titled “设计一个好开头”阴雨连绵的哥特式城市,一个侦探站在高楼边缘,风衣被大风吹得猎猎作响。镜头从他坚毅的侧脸缓缓拉远,展现整个城市的鸟瞰夜景,霓虹灯光在雨水中模糊不清。画外音响起:'这座城市,每个人都有秘密。'最后,镜头加速推向他手中的一个神秘徽章,画面渐黑。侧脸→城市鸟瞰→道具特写的三段式开篇,通过画外音和渐黑收尾快速建立悬念。
短剧预告片。高饱和电影调色,快节奏剪辑。:0-4s(悬念起): 昏暗的豪宅书房。男主(冷酷霸总)将女主推至墙角,过肩镜头拍摄两人对峙。男主耳语:"逃?你欠我的还没还清。" 画面定格在女主脸,剧烈震动,光影变幻。9-13s(多维度转场): 极速抽换(Match Cut)。背景在"奢华宴会"、"暴雨中的墓地"、"冰冷的审讯室"快速闪回,保持人物面部表情从绝望到黑化的转变。13-15s(高潮收尾): 女主转身,一袭黑裙,对着镜头特写冷笑,手中滑落一枚带血的钻戒。画面黑屏,中心浮现烫金体剧名:《重生后,我亲手撕碎了婚约》。用时间码驱动三段式预告结构(悬念→闪回→黑化收尾),通过Match Cut和高饱和调色强化短剧气质。
氛围/场景搭建
Section titled “氛围/场景搭建”90年代怀旧剧质感。1998年的北京胡同,槐树下落满槐花,穿校服的学生骑车叮铃铃路过,小卖部窗口伸出手递出一瓶橘子汽水,大爷在树荫下摇着蒲扇下象棋,暖黄复古胶片颗粒感,色彩饱和柔和。通过具体年代、地点与生活细节快速建立时代氛围,胶片颗粒感关键词有效消除数字感。
多风格轻松实现
Section titled “多风格轻松实现”皮克斯风格。主角以皮克斯顶级动画电影的角色质感呈现。一个细腻的表情特写镜头:从他/她眼中闪过一丝犹豫,到抿嘴下定决心,最后绽开一个温暖灿烂的笑容。皮肤有次表面散射效果,眼睛清澈有神,头发丝物理模拟精准。情感表达极具感染力。用风格标签+渲染质感描述(次表面散射、物理模拟)精准锁定皮克斯动画风格。
生成一段视频,并为三个角色选取合适配音。角色区分仅允许通过以下方式实现: 老人说话更慢,停顿更多。小孩语调起伏更大,更兴奋。 战士咬字更硬、更果断。老人气息声稍重,战士胸腔共鸣感更强。场景与角色设定::一个奇幻营地的篝火旁。角色A(老巫师): 声音缓慢、睿智、略带沙哑,用克隆音色说出:"命运不是刻在石头上的,孩子,它是写在风里的。"角色B(年轻战士): 声音坚定、干脆、有力,用克隆音色说出:"我信任我手中的剑,胜过信任飘渺的风。"角色C(精灵小孩): 声音充满好奇、轻快、语调上扬,用克隆音色说出:"那如果风把故事告诉星星呢?"通过语速、停顿、语调特征描述区分三角色音色,无需独立音频文件即可实现多角色配音。
🪧 广告营销
Section titled “🪧 广告营销”品牌视觉一致性
Section titled “品牌视觉一致性”一位模特穿着@图片 1的服装,在三个不同城市场景中(玻璃幕墙办公楼大堂、黄昏时分的露天咖啡馆、夜间地铁站)自然行走或驻足。品牌视觉一致性规则(强制贯穿):Logo呈现: 服装上的品牌Logo在每个场景的主光源下都必须产生一次高光反射或棱镜色散,使其成为画面中不经意的视觉焦点。 画面构图需大量运用硬朗的线条与几何切割光影(如百叶窗光影、建筑结构线), "反射"作为母题。在办公楼(玻璃反射)、咖啡馆(咖啡杯反射)、地铁站(车窗反射)中。以”反射”为贯穿母题并通过服装参考图锁定Logo,跨场景维持品牌视觉一致性。
创意规模化复制
Section titled “创意规模化复制”严格以【图片】作为唯一视觉参考,统一匹配其配色方案、光影层次、线条笔触、材质表现、阴影方式、渲染质感与整体氛围。所有画面必须呈现纯动画质感:清晰描边、平涂色块、简化细节与风格化材质。完全移除真实摄影元素,不保留写实光影、真实纹理、镜头噪点或相机质感。保留原视频的动作、节奏与镜头运动,但视觉效果全面动画化、插画化。整体风格统一、连贯一致,无混合风格、无写实感、无半动画半真实效果。以参考图为唯一样式锚点,在保留原视频动作节奏的前提下全面动画化风格迁移。
商品细节呈现
Section titled “商品细节呈现”依据该商品@图片 1,生成虚拟模特,设计一个商品展示视频,包含双11大促5折的相关字样。一句指令完成虚拟模特生成、商品绑定与促销文字叠加,适合电商详情页素材批量制作。
生成一个数字人,口播@视频 1中的商品,吸引用户购买。以商品视频为参考直接驱动数字人口播,自动提取商品卖点并生成带货话术。
🧑🏫 在线教育
Section titled “🧑🏫 在线教育”生成15秒科教短片:主题"地球板块运动如何造山"。画面写实、物理可信、电影级真实质感,不要抽象科幻。开场太空视角俯瞰地球(真实云层与大气辉光),镜头高速推进到地表。地表出现两块巨大的地壳板块,像缓慢推进的巨型拼图相向挤压,运动速度被电影化加速以便15秒内可理解但仍保持"缓慢推进"的重量感。挤压线处地表开始起皱、隆起:岩层像书页一样被推挤折叠,形成清晰褶皱山脉;必须出现"剖面可视化",让观众看到地层断面(多色岩层带状纹理)被挤压后弯曲、叠覆、抬升,断面极其直观且可辨识。随后切到宏大全景:高耸山脉在阳光与云影下震撼呈现,镜头掠过山脊线,强调"这是挤压造成的"但禁止任何文字标注。通过”剖面可视化”关键词和镜头路径约束,实现地质科学概念的电影级直观呈现。
生成一条 15 秒古风动画短片,题材为成语故事《孔融让梨》。古代家庭厅堂内,一家人围坐在木桌旁,桌上放着一盘大小不同的梨,整体温暖、细腻、生活化。长辈微笑着把装梨的盘子往前推一点,看向孔融,语气温和地说:"融儿年纪最小,你先挑一个吧。"孔融坐得端正,听到这句话后微微抬眼,目光落到盘中的梨上。哥哥们安静地坐在两旁,神情放松,都在等他先拿。孔融先看见盘里最大的梨,眼神停了一下,手指也像要伸出去,但动作没有立刻落下。他又抬眼看了看坐在旁边的哥哥,神情安静,没有贪心,也没有犹豫过久,像是在心里很快做了决定。孔融原本朝向大梨的手慢慢收回来,转而伸向盘里最小的那只梨,轻轻拿起。他低头看着手里的小梨,小声而自然地说:"大的留给哥哥们,我拿小的。"桌边的人都看向孔融。哥哥先是愣了一下,随即露出意外的神情。长辈眼神柔和下来,轻轻点头,带着欣慰说:"你虽年幼,却懂得让人。"又缓缓说一句:"真是个懂礼的孩子。"通过细腻的眼神、手部动作和台词节奏,用古风动画生动演绎成语故事的道德内核。
少儿动画场景。卡通森林里,小兔子蹦蹦跳跳去找小熊玩,甜美可爱的女声旁白:「春天到啦,森林里的小动物们都出来玩啦,小兔子一蹦一跳地去找她的好朋友小熊」,音色甜美稚嫩,适合少儿内容。旁白台词直接写入prompt并指定音色风格,模型同步生成画面与配音。
👀 AIGC 创意工具
Section titled “👀 AIGC 创意工具”以输入的男性照片作为人物参考,保持人物的正脸外貌、发型、五官比例和服装不变,将视频1中的特效完整迁移并作用在该人物身上。特效的出现方式、动态节奏、形态变化和持续时间严格参考视频1,与人物动作和身体位置自然匹配,不遮挡面部关键特征。人物主体保持稳定,特效围绕人物或从人物身上触发,画面连贯流畅,无闪烁、无错位、无风格偏移。整体风格偏写实,突出"人物 + 特效"的结合效果,生成自然可信的特效视频。以人像参考图锁定主体外貌,以特效视频为动态模板,实现娱乐特效的精准迁移。
参考第一张图片里模特的五官长相。模特分别穿着第2-6张参考图里的服装凑近镜头,做出调皮、冷酷、可爱、惊讶、耍帅的造型,每一个造型穿着不同服装,每次更换,画面伴随会切镜,参考视频的里鱼眼镜头效果、重影闪烁的炫影画面效果。用多张服装参考图+鱼眼镜头效果视频,驱动同一模特跨造型连续换装的创意视频生成。
电影般的特写镜头,手指轻轻触摸古董手稿上复杂的小马铅笔素描。当手指接触时,一阵风沙向外吹散发出,2D小马神奇而无缝地转变为逼真的、俊美的、漆黑毛色的3D马。3D小马灵巧地在古董手稿上奔跑,仿佛活过来了。整个场景被深色木桌上的单一暖光源照亮,营造出一种神秘而奇妙的氛围。通过”风沙触发转变”的时刻描述,实现2D素描到3D实体的无缝元素替换魔幻效果。
🕹️ 游戏制作
Section titled “🕹️ 游戏制作”参考视频1的人物动作和镜头语言,生成图片1和图片2的打斗场面,打斗背景是图片3,打斗的过程模仿《魂斗罗》像素游戏,背景音乐是音频1中的音乐,随着打斗动作还有打斗音效。四路多模态输入(动作视频+角色图×2+背景图+音频)一次融合生成像素风格打斗场景。
赛博朋克风格,游戏CG,暗场,城市的角落,城市有些破败,设计一位年轻杀手,对战敌人的画面,镜头快速拉远,杀手正被一些敌人围困,然而杀手手持光剑,与敌人打斗,最终将敌人一一击破,敌人纷纷倒地,整个过程快而不突兀,最后杀手在镜头前,抬头看向镜头,整个视频既有 "瞬移" 的瞬间感,又有视觉上的流畅过渡。用风格标签+镜头节奏描述驱动赛博朋克游戏CG角色设计,以”瞬移感+流畅过渡”平衡动作冲击力。