诺姆沙泽尔将加入OpenAI:谷歌DeepMind研究员
2026-06-18 3359869
2026-06-18 0
可灵AI口播画面压迫感源于缺乏空间留白指令,需在提示词开头强制插入“【画面留白:顶部留高25%、底部留高15%、左右各留宽12%】”硬约束,并删除模糊表述,用坐标系动作描述与视线方向间接控制构图密度。

可灵AI口播脚本生成的画面经常顶天立地、人物贴边、字幕压脸,观众第一眼就产生压迫感,这不是构图能力问题,而是提示词中缺乏空间留白指令和视觉呼吸锚点,导致模型默认填满整个画布。
可灵AI对“留白”“空隙”“呼吸感”等抽象词响应率极低,必须用它能精准识别的物理空间描述替代。
在提示词最开头插入固定前缀:“【画面留白:顶部留高25%、底部留高15%、左右各留宽12%】”。
这个数值不是建议值,而是可灵AI内部渲染网格的硬约束阈值——低于该比例,模型会自动压缩主体以填满画布;高于该比例则触发安全裁切保护机制,确保导出帧不被平台二次裁剪。
写完后立刻删除所有类似“居中构图”“完美比例”等模糊表述,这类词会覆盖留白指令。
方法一:绑定关节角度与画布边界
把“他站着说话”改成“他自然站立,双肩连线位于画面垂直中线偏下18%,左脚尖指向画面左下角1/4交点,右手垂落于髋骨外侧不越出画面右缘”。
方法二:用视线方向制造视觉延伸
加入“人物视线投向画面外左侧30°方向”,模型会自动在右侧预留更多空白区域以匹配视线路径,避免头像顶满右框。
【注意:禁用“看向镜头”这种指令,它会让模型将人物面部放大至占满60%以上画幅】
第一步:删掉原提示词中所有形容词堆砌句,例如“大气、专业、高端、清晰的口播画面”。
第二步:在首行单独写一行空间指令,仅包含三类参数:①画布安全区(如上所述);②主体基准线(如“胸线对齐画面水平37%处”);③背景锚点(如“背景纯色渐变起始于画面顶部25%下方”)。
第三步:动作描述必须带坐标系,例如“抬手示意→手肘高度不超过画面垂直55%线→指尖终点落在右1/3竖线与水平40%横线交点”。
第四步:结尾追加否定句:“禁止任何元素触碰画面四边,禁止文字/手势/发丝超出安全区边界,禁止使用超广角畸变效果”。