推进AI短片创作工具落地应用

今年2月，人工智能文生视频大模型Sora横空出世，迅速引爆全网，带来了文生视频领域的激烈竞争。“千模大战”中视频大模型该如何落地？在6月12日举办的第三届美图影像节上，美图公司这家深耕互联网领域16年的厦门本土企业，给出了自己的探索和答案。

当天，美图公司围绕“聊聊AI工作流”的主题，发布了6款产品。其中，视频大模型落地应用——AI短片创作工具MOKI，备受瞩目。

在脚本、视觉风格、角色等前期设定完成后，AI自动生成分镜图并转为视频素材，最后通过智能剪辑、AI配乐等功能串联素材并实现成片，一条AI视频产品就能快速呈现在眼前。

“视频大模型会逐渐应用在内容行业，但我们在实践过程中发现，用视频大模型辅助内容创作，遇到的最大挑战是故事成片难，可控性差。视频大模型容易生成视频片段，但很难呈现一个完整的故事。”美图公司创始人、董事长兼首席执行官吴欣鸿在发布活动上分享说。

面对行业共同的痛点，美图聚焦对创作者需求的深度理解，提炼有共性的视频场景，打造真正能辅助内容创作的工具。

然而，文生视频的众多领域如何精准找到赛道？吴欣鸿表示，美图分析了主流的视频形式，并基于对内容可控性和制作成本的最大考量，决定MOKI不做常规的文生视频，而是聚焦于AI短片创作，专注于动画短片、网文短剧、故事绘本和MV等视频场景。

在MOKI生成视频的演示中，通过对文生视频能力的结构化，AI视频产品的制作被分解成三个大的环节，从而有针对性地解决视觉风格与场景等不一致，无法用分镜对视频进行全局把控等AI视频生成的痛点。

“具体来说，依托美图公司自研的奇想大模型（MiracleVision），MOKI构建了一个从前期设定到AI内容生成，再到后期制作的AI短片工作流。”吴欣鸿表示，随着AI大模型的发展，AI应用将经历点、线、面三个阶段。美图正在把AI单点功能串联成AI工作流，帮助电商、广告、游戏、影视、动漫等行业进一步提高生产力。

今年初，美图公司自研的奇想大模型（MiracleVision）通过《生成式人工智能服务管理暂行办法》备案，是目前福建省唯一通过备案的大模型。当天，美图公司发布了奇想智能大模型的V5升级版。升级后的大模型采用美图自研DiT技术架构，涵盖图像大模型、视频大模型、音频大模型和文本大模型，拥有更好的扩展性与更大的参数量，在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面，获得全方位提升。

“几年后，‘生成’会比‘拍摄’更普遍。”在吴欣鸿看来，目前AI技术领先于AI应用，但是好概念不等于好产品，只有让AI帮助用户创造价值，才能获得市场的青睐。

以AI为驱动，发挥深耕图像、视频和设计领域多年的应用优势，美图公司也在逐渐跑通AI商业化。2023年，依托奇想大模型（MiracleVision），美图公司影像与设计产品成绩亮眼。“美图设计室”收入超过1亿元，同比增长229.8%；“开拍”成为口播视频创作者新宠；“WHEE”用户规模持续增长；“美图云修”助力商业摄影行业，全年修图超5亿张。截至去年底，美图公司月活跃用户数达2.5亿，同比增长2.6％。

推进AI短片创作工具落地应用

小帐篷撑起大市场“露营风”催生新业态

推进AI短片创作工具落地应用