强行协同,可能产生反作用力。
(相关资料图)
「确实是很大地提振了士气。」阿里大文娱集团 CTO 郑勇对极客公园等媒体说道。
他指的是团队孵化的产品「妙鸭相机」——后者让用户花 9.9 元,即可拥有一套逼真 AI 人像写真,迅速走红网络。阿里内部评价它为,「国内 AIGC 领域第一个爆火的 C 端产品」。一个月内,它在阿里云的算力需求暴增了数百倍。甚至在北京阿里大文娱办公楼的厕所里,都能看到「妙鸭相机」的广告。
这是大文娱集团难得的「高光时刻」。作为阿里六大集团中之一,大文娱过去一直处于「边缘位置」。它历任数任总裁,烧光上百亿现金,但业务并没有多少起色。目前,该集团的主要业务只剩下优酷和阿里影业——一个逐渐掉队的视频网站、一个离互联网中心有些远的影视公司。
然而,「妙鸭相机」的走红也不能掩盖这样一个尴尬的现实:它(图片)并不在大文娱集团的主营业务(视频)上。
面对这个质疑,郑勇不显意外。从今年 3 月「妙鸭相机」立项时,他就考虑到了这点。但他觉得,还是要鼓励内部创新、不要自我设限。彼时,阿里刚刚完成「1+6+N」史上最大组织架构调整,独立后的大文娱拥有更多的自主权、也允许他做这样的创新决定——在郑勇看来,这种对创新的包容性、组织的灵活性,是「妙鸭相机」跑出来的关键。
随着「妙鸭相机」意外走红,它也不得不面对跟集团业务协同性的问题。对此,大文娱集团的解决之道是让它独立发展。6 月,阿里大文娱全资成立了神力视界(深圳)文化科技有限公司,法人为郑勇,「妙鸭相机」将在该主体下独立运作。郑勇说,不必强求「妙鸭」跟大文娱主业务协同,因为毕竟不在一个赛道。
这几个月,他太多精力都放在「妙鸭相机」身上。随着「妙鸭」业务成熟,他要将更多精力聚焦在影视工业化上。
一周前,7 岁的大文娱集团宣布了首次的季度盈利(2024 财年)。这主要是因为线下娱乐复苏、带动阿里影业的业绩增长。无论是从业务本身、还是从市场机遇,影业都将是大文娱的重中之重。在采访中,郑勇谈到了 AI 技术会对影视行业带来的影响,以及大文娱集团在这一变局下的思考和计划。
和之前的沟通风格一样,大文娱的对外表达依旧克制,但一种想变革的决心隐隐在这个组织中透露出来。不确定这是否是新的开始。
以下是极客公园根据郑勇采访内容的整理:
01
「妙鸭相机」独立发展,
不强行和大文娱主业务协同
问:「妙鸭」爆火后,大文娱集团层面有什么反应?作为CTO,你的感受怎么样?
郑勇:大家感受都挺兴奋的,本来只是觉得它能解决一些问题,但没想到用户非常喜欢。对于「妙鸭」的火,我们一开始也是措手不及。不过既然已经这样了,我们会继续加大投入。
问:但「妙鸭」跟大文娱的主业务并没有协同性。
郑勇:妙鸭立项的时候,我就有过这个考虑。但当时我们还是鼓励内部创新,大文娱主要做长视频,但这不意味着它只能做长视频。我觉得它(妙鸭)应该会成为一块新的业务。
问:所以当时内部有反对声音吗?
郑勇:有,但最多是觉得(产品增长)空间不大。这些意见听听就好,最终决策还是在我们手里。
问:「妙鸭」成功背后,跟阿里大文娱的组织灵活性有什么关系?
郑勇:做「妙鸭」有两个关键时间点,一是去年的 12 月份,我们开始整个团队去研究 AIGC 这个事情,包括图片大模型、文字大模型。二是今年 3 月「1+6+n」(阿里)组织架构调整,其实对我们做「妙鸭」影响非常大。
如果按以前的组织结构,我们想拓展一个新的业务,整个流程还是挺复杂的。但变革之后,我们组织更敏捷了。比如做「妙鸭」,我们从 3 月份开始研究,4 月份开始立项,7 月份就真正对外发布了,这个响应速度非常快。
问:具体来说,「1+6+n」给大文娱的创新机制带来了什么变化?
郑勇:核心是决策链路变短。以前我们要做一个事情,审批挺长的。但今天我们做一件事情,做和不做的决策周期都很短。如果你感兴趣某个点子,我们评估后觉得也靠谱,你就可以去做。就这么简单。
问:「妙鸭」诞生过程中就没有遇到过组织掣肘吗?
郑勇:坦白讲,内部阻力倒没有太多,我们内部从立项到上线都很支持这个项目。
但外部阻力确实挺大,毕竟是一个新的商业事物。比如我们会被质疑隐私问题,比如因为微信的合规问题,我们小程序上有些功能用不了,还面临下架的风险。最后我们花 4 天时间上线了 iOS 版本、3 天上线了支付宝版本。当然这也体现了我们的组织敏捷度。
问:作为面向C 端的生成式产品,妙鸭做了哪些合规努力?
郑勇:妙鸭不算严格意义上的生成式产品,我们都是照着正常合规的流程在走。
问:你怎么总结「妙鸭」的成功?
郑勇:核心原因还是它满足了用户痛点,那些写真照超出了用户预期。当初我们立项的时候,调研的内部员工基本都很满意(生成的照片),我们才决定去做。当然还有组织敏捷度和对创新的包容度。
最后,很多东西和运气有关系,我们也没有说自己能力有多强,运气还是很重要的。
APP Store 里的「妙鸭相机」
问:是否担心用户热情的退潮?
郑勇:这个问题无非就是怎么让用户持续使用「妙鸭」。我们还在探索新玩法,比如继续丰富人像模板、上线好玩功能等,下个礼拜应该就能和大家见面了。
要做成这件事,无非就是投入情况。「妙鸭」火了之后,我们的投入只会更多。
问:最近你们成立了「神力视界」公司,把「妙鸭」并了进去,原因是什么?
郑勇:「神力视界」是大文娱科技业务的公司主体。
坦白说,妙鸭上线之前,我们也没有想到它这么火,那时候着急上线、就放到了目前这个公司主体下面(上海未序)。但现在为了便于管理,我们就把「妙鸭」主体放入了神力视界。与其说「搬家」,不如说是「回家」。
问:可否理解为「妙鸭」将在这个公司下面独立运作?未来,「妙鸭」将怎么跟大文娱业务做协同?
郑勇:我们现在尽量让它独立发展。我们担心一旦协同,有时候是反作用力。
如果(妙鸭)对别的一些业务有帮助,我们会用。如果用不上,我们也不强用。因为这个(人像)赛道确实和视频不是同一个事情。
02
大模型时代,
视频行业的机会和挑战
问:阿里大文娱在AI时代的战略布局是什么?
郑勇:大文娱的 AI 核心战略就是两个,To C 的 AIGC(妙鸭等)和 To B 的影视工业化。
大文娱有三块主要业务,优酷、阿里影业、大麦网,它们涵盖了影视工业化的全流程,如影视制作、宣发、传播等。我们会围绕各个环节,用 AI 去做一遍。这也是我作为 CTO 的主要工作。
问:大文娱做影视工业化,主要是在内部做、还是有可能普及行业?
郑勇:我们现阶段先围绕自己的内容去做,后面肯定希望整个行业能够用起来。到时候我们也会受益。
问:以影视制作为例,AI会改变其中哪些环节?
郑勇:影视制作环节其实是一个非常长的链路。它包括最早的剧本筹备创作阶段,接着是拍摄制作环节,比如拆文字分镜、图片分镜、预演、再到拍摄、后期等。
AIGC 能够带来的,既有(剧本)创作上的提效,比如帮助创意方向的确定和素材的收集。在图片上,它也会给服装、妆造定型、整个艺术审美提效。最后是拍摄,我们重点做虚拟拍摄,分 2D 和 3D 两套方案,大部分剧组都会用 2D 方案,3D 这一块案例还不太多。但总体成本能降 40% 以上。
问:国内的影视工业化水平和国外差距如何?背后原因是什么?
郑勇:今天中国整个影视工业化水平,和好莱坞差距还是挺大的。我们都不是按几年比,是按十年、二十年去比。
影视工业化包括内容质量、生产成本和周期等等。大家如果细心去看一下最近国内上线的视效很好的电影,再去看十年前人家拍的《阿凡达1》,制作上的质量差距都还是很大的。好是好在,人家已经把标杆放在那里,我们今天可以去学。
这种差距的根本原因,主要是国内外整个影视生产的模式不一样。国外是制片中心制,而国内到底以谁为中心,每个剧组不一样,有些是导演、有些是制片人、有些是片方。由于底层机制不一样,制作人员相关的接受度也不一样。今天我们只能说,通过技术、或别的方式,如何改变这个现实。
阿里影业 | 图片来源:视觉中国
问:面对技术冲击,像美术这样的岗位会被取代吗?
郑勇:其实最终还是落到审美上。不管是用 MidJourney、Stable Diffusion,最终图片效果和人的审美关联度还是挺强的。我们内部发现,一个美术生和一个理科生做出来的图片档次会差很多。所以不用担心美术这个工种不存在,只要你审美功底在,你做出来的东西就比别人好。
问:你是否和业内投资人有过交流?他们最关心AI技术会对影视行业实现哪些突破?
郑勇:我和投资行业聊得不多。AIGC 能够让影视行业整个生产方式大大提效,这是非常明确的。而且今年在电影赛道,可以看到显而易见的复苏。
问:为什么AIGC在影视文娱行业的渗透和融入程度,比工业、汽车等行业要更深?
郑勇:今天 AIGC 归功到底,一个是文字上的突破,一个是图片上的突破。文娱行业就是艺术表达,虽然最终以视觉的方式呈现,但前期的基础都是文字和图片。这也是为什么文娱行业会第一步先应用。
问:关于文字和图片的模型现在已经比较成熟了,视频领域的大模型何时会出现?
郑勇:我们没有做视频大模型,因为技术难度很大。今天 AI 生成文字和图片都可以,但生成高精度、高质量的视频还不行。这几年我们攻克它的可能性不太高。
虽然目前有一些产品,能够用 AI 把文学小说生成视频,那个确实做出来很快,但它的质量就在那里。现阶段可能有些人看,但后面就没有人看了。
03
「扶不起」的大文娱,
迎来了新的十字路口吗?
问:「妙鸭」火了之后,内部士气是不是得到了一些提振?
郑勇:那肯定,对士气是很大的提振。
问:阿里集团对它的关注到哪一个层级了?
郑勇:我不知道。但我觉得集团能把「妙鸭」写到财报里,应该还挺高的吧。
问:在 AI 时代,大文娱的决心是怎样的?
郑勇:我们的目标就是要大力发展科技,无论在人和资金的投入上,都是有做加法的。
问:身处阿里体系,你们会因此得到更多的资源支持吗?比如算力。
郑勇:算力问题,我们也需要跟阿里云去协调。因为我们只能算它的内部客户,也要走正常的商业结算,协同机制一直很良性。
另外,我们在模型调优上也做了很多工作。比如以前100 张卡训练100个人,现在100 张能训练300人。所以现在你会发现用「妙鸭」基本不用排队了。
阿里大文娱 | 图片来源:视觉中国
问:目前AI的能力似乎只停留在图文层面,它是否主要影响的是小红书、抖音等产品,而非优酷这样的长视频产品?
郑勇:其实不管是小红书还是长视频网站,用户核心消费的还是内容。在长视频这个赛道上,AI 也能降低内容生成的成本、缩短生产周期。现阶段看,AI 可能只是辅助小红书,但拉长时间看它还是会回来(辅助长视频)。
问:PGC、UGC曾先后改变了文娱行业的商业格局,AIGC会是下一个变量吗?这是否是大文娱集团的新机会?
郑勇:AIGC 核心是 GC(生成内容),UGC、PGC 也是生成内容。它核心影响的还是内容。以视频为例,这绕不开最开始的 IP 故事吸不吸引人、剧本够不够好,以及后面的制作和呈现效果好不好。而大文娱给自己的定位是,「为好内容全力以赴的科技公司」。
问:现在「妙鸭」盈利吗?
郑勇:我们不会亏太多。接下来我们会提供一些付费模板,做更多的商业化尝试。
本文源自:极客公园
作者:黎诗韵
关键词: