第09版:厦门观察 上一版 下一版  
上一篇

推进AI短片创作工具落地应用

□本报记者 廖丽萍

今年2月,人工智能文生视频大模型Sora横空出世,迅速引爆全网,带来了文生视频领域的激烈竞争。“千模大战”中视频大模型该如何落地?在6月12日举办的第三届美图影像节上,美图公司这家深耕互联网领域16年的厦门本土企业,给出了自己的探索和答案。

当天,美图公司围绕“聊聊AI工作流”的主题,发布了6款产品。其中,视频大模型落地应用——AI短片创作工具MOKI,备受瞩目。

在脚本、视觉风格、角色等前期设定完成后,AI自动生成分镜图并转为视频素材,最后通过智能剪辑、AI配乐等功能串联素材并实现成片,一条AI视频产品就能快速呈现在眼前。

“视频大模型会逐渐应用在内容行业,但我们在实践过程中发现,用视频大模型辅助内容创作,遇到的最大挑战是故事成片难,可控性差。视频大模型容易生成视频片段,但很难呈现一个完整的故事。”美图公司创始人、董事长兼首席执行官吴欣鸿在发布活动上分享说。

面对行业共同的痛点,美图聚焦对创作者需求的深度理解,提炼有共性的视频场景,打造真正能辅助内容创作的工具。

然而,文生视频的众多领域如何精准找到赛道?吴欣鸿表示,美图分析了主流的视频形式,并基于对内容可控性和制作成本的最大考量,决定MOKI不做常规的文生视频,而是聚焦于AI短片创作,专注于动画短片、网文短剧、故事绘本和MV等视频场景。

在MOKI生成视频的演示中,通过对文生视频能力的结构化,AI视频产品的制作被分解成三个大的环节,从而有针对性地解决视觉风格与场景等不一致,无法用分镜对视频进行全局把控等AI视频生成的痛点。

“具体来说,依托美图公司自研的奇想大模型(MiracleVision),MOKI构建了一个从前期设定到AI内容生成,再到后期制作的AI短片工作流。”吴欣鸿表示,随着AI大模型的发展,AI应用将经历点、线、面三个阶段。美图正在把AI单点功能串联成AI工作流,帮助电商、广告、游戏、影视、动漫等行业进一步提高生产力。

今年初,美图公司自研的奇想大模型(MiracleVision)通过《生成式人工智能服务管理暂行办法》备案,是目前福建省唯一通过备案的大模型。当天,美图公司发布了奇想智能大模型的V5升级版。升级后的大模型采用美图自研DiT技术架构,涵盖图像大模型、视频大模型、音频大模型和文本大模型,拥有更好的扩展性与更大的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性以及生成时长等方面,获得全方位提升。

“几年后,‘生成’会比‘拍摄’更普遍。”在吴欣鸿看来,目前AI技术领先于AI应用,但是好概念不等于好产品,只有让AI帮助用户创造价值,才能获得市场的青睐。

以AI为驱动,发挥深耕图像、视频和设计领域多年的应用优势,美图公司也在逐渐跑通AI商业化。2023年,依托奇想大模型(MiracleVision),美图公司影像与设计产品成绩亮眼。“美图设计室”收入超过1亿元,同比增长229.8%;“开拍”成为口播视频创作者新宠;“WHEE”用户规模持续增长;“美图云修”助力商业摄影行业,全年修图超5亿张。截至去年底,美图公司月活跃用户数达2.5亿,同比增长2.6%。

版权所有 ©2023 福建日报 fjdaily.com 闽ICP备15008128号
中国互联网举报中心