摘要:科幻、历史、奇幻、荒诞喜剧等多元题材,首次汇总于一部AIGC单元剧集产品中。6月25日,快手科技(1024.HK)可灵AI与星芒短剧联合出品、影视出品公司异类Outliers团队制作的全球首部AI单元故事集《新世界加载中》举行首映礼。
科幻、历史、奇幻、荒诞喜剧等多元题材,首次汇总于一部AIGC单元剧集产品中。6月25日,快手科技(1024.HK)可灵AI与星芒短剧联合出品、影视出品公司异类Outliers团队制作的全球首部AI单元故事集《新世界加载中》举行首映礼。
实际观影过程中,记者发现,《新世界加载中》剧集内容创新、科幻元素丰富,通过详细动作脚本与首尾帧技术,解决了快速连续的打斗动作难以衔接流畅的难点。但同时,剧集存在人物一致性不足、人物情感情绪表达欠缺、群像画面中人脸崩坏等问题。
采访环节,可灵AI产品及运营负责人李杨强调视频模型的早期状态,当下AI创作尚未达到一键生成、拿来即用的程度,需要创作者通过AI工具反复写prompt(提示词)、调prompt、抽卡、调视频,非常考验创作者的创造力与韧性。视频生成领域的“抽卡”是指由于生成效果具有不确定性,用户需要多次尝试。因此目前可灵AI的消费群体主要是相对专业的创作者。
可灵AI在商业化方面进展迅速,此前官方披露ARR(年度经常性收入)超1亿美元,高盛预测可灵AI 2025年收入规模将超1.2亿美元,目前其他竞品厂商暂未有超过该数据的公开披露。但在技术表现上,李杨表示,可灵AI在稳定性、运动表现、清晰度等方面仍有一定问题。目前团队重点聚焦语义遵从、运动表现等方面进行完善,比如运动速度、质量、美感、自然度,以及符合物理规律的程度等。
即便如此,可灵AI自发布后持续占据视频模型行业头部位置。根据Artificial Analysis视频生成榜单,谷歌Veo系列和快手可灵系列分别位于文生视频、图生视频的一二位,东方证券分析师认为二者的技术实力位于T0梯队。两相对比,谷歌在今年5月发布的Veo3视频大模型新品,基于更强的音视频同步生成、参考图视频生成、相机控制视频生成等功能,在创作者群体中引发热议。
对此,李杨表达了对谷歌Veo3技术能力的认可,她对记者表示,谷歌Veo3音视频同步生成功能的确令人惊艳,而可灵AI考虑的视角更偏向技术落地与产品体验,例如Veo3的音效同步生成功能虽然带来便捷,也同时,由于音效很难通过prompt保持一致,因此会带来音色方面的不可控性。可灵AI选择的路径是尽早与用户群体进行交互,了解用户的需求,并针对性迭代更新。
整体来看,李杨认为不论是可灵AI还是其他视频大模型,虽然起点与速度不同,但都在一个大的起点范围内,未来行业还有非常多事情去做,待模型的基础表达、稳定性、可控性均达到临界点之后,才会诞生更多更新的实用型产品形态。
来源:第一财经