2025年7月的上海世博中心,全球人工智能的目光再次聚焦于此。在WAIC(世界人工智能大会)的现场,快手高级副总裁、可灵AI负责人盖坤站在聚光灯下,用一句”2025年将是生成式AI技术走向深度应用的关键元年”,为这场关于未来的讨论定下基调。不同于往年”技术何时落地”的试探性追问,今年的会场更像是一场”应用兑现”的誓师大会——当生成式AI从实验室走向生产线,当技术突破开始真正重构产业逻辑,快手正用”可灵”这个已经拥有超4500万全球创作者的产品,给出最鲜活的注脚。

从”能用”到”好用”:可灵AI的功能突围战
在本届WAIC的可灵AI发布会上,两个新功能的亮相引发了行业震动:升级后的”多图参考”功能,终于解决了生成内容中”角色穿帮””场景割裂”的痛点;而7月27日开启邀测的”灵动画布”,则被开发者称为”视频生成的画布革命”。这些看似微小的功能迭代,实则是生成式AI从”炫技”走向”实用”的关键一步。
以”多图参考”为例,过去创作者若想生成一组保持角色一致性、场景连贯性的动态画面,往往需要反复调整数十次参数,甚至手动修补细节。而升级后的版本,不仅能精准捕捉人物的发丝走向、服装纹理,还能在动态场景中保持光影统一——比如让同一角色从室内走到室外时,面部光线的明暗过渡自然流畅,背景的季节变化与角色衣着形成合理呼应。这种对”细节确定性”的把控,让可灵AI在电商商品展示、虚拟偶像直播等需要高精度复现的场景中,效率提升了70%以上。
“灵动画布”的推出则更具颠覆性。传统视频生成工具如同”命题作文”,用户需要在固定框架内填充内容;而灵动画布更像一块”智能画布”,用户只需输入核心创意关键词,系统就能自动生成多版本分镜脚本,并支持实时拖拽、缩放、替换元素。一位参与内测的短视频创作者形容:”过去做一个30秒的剧情短片,需要写脚本、找素材、调色,现在用灵动画布,输入’夏日海边,男生给女生递冰淇淋,海浪刚好漫过脚面’,10分钟就能看到5种不同风格的成片,连海浪的弧度都能根据需求调整。”
技术迭代的”双轮模式”:从1.0到未来的进化密码
可灵AI的快速进化,背后是快手独特的”技术+用户”双轮驱动模式。可灵AI视觉生成与互动中心负责人万鹏飞在会上透露,从2024年6月可灵1.0发布至今,团队保持着每季度一个大版本、每月多个小版本的迭代节奏,而每一次迭代的灵感,超过60%来自用户的真实反馈。
可灵1.0的意义在于”破冰”——它用接近Sora的视频生成技术,证明了”一键生成电影级画质视频”不再是科幻概念。当时有创作者用可灵生成了一支5分钟的科幻短片,画面中的太空站细节、外星生物毛发清晰可见,直接引发了行业对”视频生成大模型”的重新审视。而可灵2.0的突破则更”务实”:通过模型压缩与算力优化,将单分钟视频生成成本降低了40%,同时支持手机端实时预览。这一改变让可灵的用户结构发生了质变——从最初以专业团队为主,迅速扩展到中小商家、个人创作者,全球月活创作者在半年内增长了3倍。
“我们发现,用户需要的不是’最强大的模型’,而是’最解决问题的工具’。”万鹏飞表示,团队建立了”用户需求-技术攻关-产品落地”的闭环:每周收集超10万条用户反馈,用NLP技术分析高频需求,再将关键问题转化为技术攻关方向。例如,针对影视创作者对”复杂动作生成”的痛点,团队用3个月时间优化了运动预测算法,让可灵3.0版本在人物舞蹈、体育赛事模拟等场景中,动作流畅度提升了50%。这种快速响应能力,使可灵迅速成为广告营销、影视动画、游戏制作等行业的”刚需工具”——目前已有超2万家企业通过可灵API接入,某头部广告公司甚至用可灵将广告视频制作周期从7天缩短至1天。
生产关系的重塑:从”个体创作”到”生态协同”
在WAIC的影视分论坛上,导演薛晓路的分享更具象地展现了生成式AI对内容生产的颠覆。她以自己用可灵制作的短片《喵心归处》为例:过去拍摄一只猫的互动镜头,需要在摄影棚搭建场景、引导猫咪配合,往往一个镜头要拍几十遍;而用可灵生成后,她只需提供猫咪的照片、想要的互动场景描述,系统就能生成符合猫咪行为习惯的动态画面,连猫爪踩在沙发上的褶皱、尾巴摆动的弧度都真实自然。”更关键的是,AI重构了创作流程——过去是’先有剧本再找演员’,现在是’先有创意快速生成样片,再根据样片调整剧本’。”薛晓路说,这种”敏捷创作”模式让她的团队在最近半年里完成了过去两年才能做完的项目量。
这种变化不仅发生在专业领域。在上海做汉服直播的小商家李女士,用可灵生成了大量古风场景:”以前拍汉服视频,要租场地、找摄影师,一场拍摄至少花2000块;现在用可灵输入’宋代庭院,樱花树下,女子执伞’,半小时就能生成高清视频,成本几乎为零。”她的直播间流量因此上涨了3倍,甚至有品牌主动联系她合作定制古风内容。
这些微观层面的改变,最终指向盖坤所说的”生产关系重塑”:当生成式AI降低了内容创作的”技术门槛”和”成本门槛”,内容生产的主体从”专业机构”扩展到”全民创作者”,生产流程从”线性协作”变为”网状共创”,生产要素从”稀缺资源(如设备、场地)”转向”创意与数据”。据快手统计,可灵AI的用户中,有35%是首次接触专业内容创作的个人,他们的作品正在反哺平台生态,形成”用户创作-平台优化-更多用户参与”的正向循环。
未来已来:生成式AI的下一个战场
对于生成式AI的未来,盖坤给出了明确的判断:”技术趋势将聚焦于生成效果和可控性的持续突破。”他透露,可灵团队正在攻关”多模态融合”技术——让文本、图像、视频、3D模型在同一个生成框架下无缝协作,未来创作者或许可以用一段文字描述,直接生成包含角色、场景、动作的3D视频;同时,团队也在探索”个性化生成”,通过分析用户的创作偏好,自动生成更符合其风格的专属内容。
而在产业应用层面,可灵的下一个目标是”深耕垂直场景”。例如,在教育领域,可灵正在开发”知识点可视化生成工具”,将抽象的物理公式转化为动态演示动画;在医疗领域,团队与医院合作,尝试用生成式AI模拟手术过程,帮助医生提前规划方案。”我们相信,生成式AI不会替代人类创作者,而是成为每个人的’智能创作伙伴’。”盖坤说,当技术真正融入生产生活的每一个环节,”重塑生产关系”将不再是概念,而是触手可及的现实。
站在2025年的节点回望,生成式AI的发展速度远超预期。从实验室里的模型到千万创作者的工具,从”能否落地”的疑问到”如何用好”的探索,快手可灵AI的实践,不仅是一家科技公司的技术突围,更是整个生成式AI产业从”技术验证”迈向”生态构建”的缩影。当生成式AI真正开始重塑生产关系,我们或许正在见证一个”人人都是创作者”的时代到来——而这一天,比想象中来得更快。