2026年最新提示词工程:让AI视频生成更懂你的需求?
那个...去年年底那会儿,我接了个活儿
,哦哦,给公司做一版宣传视频。
就那种发朋友圈用的,三十秒左右,哦。
我寻思着现在AI视频生成这么火,神马Runway啊,Pika啊,还有国内那几个,吹得天花乱坠的,我合计着试试呗。
结果你猜怎么着?
我花了一整个周末,从某东上买了个会员(还特么是年费的),熬了两宿,生成出来一堆抽象派艺术片。
马赛克成精了属于是。
老板看了直接问我是不是在搞赛博朋克实验艺术。
我气得啊,周末晚上煮面条还把锅烧干了。
后来我就琢磨啊,这玩意儿到底问题出在那儿。
我一开始以为是我描述得不够清楚,什么“一只猫在窗台,上晒太阳,下午三点的光,毛茸茸的”,结果出来的猫只有三条腿,窗台悬浮在半空中,那光跟迪厅灯球似的。
我跟朋友吐槽,他说你是不是没写提示词啊?
我说我写了啊,写得可详细了。
他说你那叫写小说,不叫写提示词。
真正让我开窍是今年年初,1月12号的事儿。
那天杭州下着雨,我窝在工位上刷手机,看到有个做AI视频的博主分享了一个案例。
他说你要把提示词当成一个“傻子说明书”来写。
傻子说明书你懂?
是就那种每一帧、每一个元素的物理关系、空间位置、光线角度,都得用最蠢的方式交代清楚。
比如,你不能只说“一个男人在跑步”,你得说“一个三十岁左右的亚洲男性,穿着深蓝色短袖和白色,运动鞋,在水泥路面上以中等速度向前奔跑,右侧有一排路灯,光线从左上方45度洒落”。
我靠,原来我之前那叫“写作文”,人家这叫“写代码”啊。
然候我就开始试。
我把提示词分成了三大块(当然,这个我不能在文章里分点写,我就说个意思)。
一块是主体和环境,清清楚楚到每一个细节,连主角衣服上的褶皱是啥样的,大概要走多少步才到镜头前,我都写进去。
另一块是运动轨迹和镜头语言,什么“镜头从平视缓慢上摇到45度”,什么“主角从画面右侧三分之一处走入,在五秒内走到画面中心”。
最后一块是风格和情绪,但得用具体词汇,“王家卫电影色调”这种反而,不好用,最管用的是“色温5500K,饱和度降低20%,对比度增加大概十来个点”,自己手动把参数填进去。
绝绝子了属于是,效果一下子就好了很多。
但是,还是有个问题。
有时候指令太细了,AI反而僵住了。
就向你指挥一个人走路,你把他先迈哪条腿、胳膊怎么摆都规定死了,他反而走得跟机器人似的。
我大概试了十几次,终于找到一个平衡点。
就是给AI一个框架,但留出大概十来个点到20%的“呼吸空间”。
比如说,“一个复古理发店的内部,红色皮质座椅,墙上贴满老唱片海报,有个人在理发,头,顶的吊扇在缓缓旋转,光线是昏黄的钨丝灯”,这中间“理发师的具体动作”和“转动的速度”,让它自己发挥。
这么搞,出来的东西既符合预期,又有一点意外的“灵光”,不会死板。
还有啊,我发现很多AI视频工具其实根本不在乎你写的人类语言,它更在乎“标记符”。
就好比你跟它说“一团火”,它可能生成一滩水。
但你要是说“fire, flame, ember, high temperature, red and orange color”,它立马就懂了。
这就跟做饭一个道理,你跟厨师说“我要吃辣的”,他给放了一勺辣椒,你说“我要四川那种麻辣”,他放了花椒和辣椒。
你得把核心关键词加上,辅助关键词也加上。
提醒以后再写提示词,后面跟着括弧,括弧里全是英文关键词,比如(dynamic motion, cinematic lighting, 4k, photorea,listic),哪怕你前面全是中文都没关系,那几个英文词才是它的“密码”。
(这个我真没想到,原来AI还是个ABC)。
最后说说工具吧。
现在了,那些免费的、收费的,我基本上都试了个遍。
目前我用的最顺手的是一个叫“某影”的国内软件(名字就不说了,免得说,打广告),它对中文提示词的理解要比国外那几家好很多,不会出现“一只鸡在上厕所”这种诡异画面。
但不管用哪个工具,核心逻辑是一样的:把提示词当成一条通往目的地的路,路上有多少个坑、多少,个弯、多少个红绿灯,你要提前标好。
你标得越细,它开得越稳。
但千万不能把路上的每一块石头都提前搬走,留一点让它自己处理的“小障碍”,最后的效果反而可能给你惊喜。
前天我看到个新功能,用语音录入提示词,然后AI自动帮你优化。
我试了一下,我说“给我整一个妹子在咖啡厅看书”,它自动生成了一长串:少女、咖啡杯、蒸汽、,书页、逆光、柔焦滤镜、钟表、安静的背景音……成片出来直接能当电视剧片段了。

yyds啊。
所以说,踩过的坑多了,自然就知道怎么绕着走了。
我那锅烧糊的面条,也算没白烧。