对话ArtArch黄严:不追求“一句话生成”,用想象力捍卫创作者的表达权|AI Founder 请回答


图片来源:网络

当所有AI生成工具疯狂地内卷优化prompt并争相标榜自己可以一句话生成图片和视频时,一支年轻的字节系创业团队,基于自己对于创作的深度理解,用一套积木式创作架构工具同时击穿了专业制作人和普通用户的痛点,构建了一个自成循环的创作生态。这支团队就是我们今天对话的主角——ArtArch。

2024年底成立的ArtArch,在2025年初就连续完成了两轮融资,投资方包括锦秋基金、九合创投、BV百度风投。十月底,ArtArch 发布了自己的第一款产品——Skira。

在加入字节之前,ArtArch的创始人兼CEO黄严已经完整走过一条从底层系统到大规模业务的技术路径。在北大念硕士期间,就以第5号员工的身份加入了格灵深瞳,从早期到上市,7年时间,把算法、后端、前端、工程架构、大数据中心、机器学习平台做了个遍。

2020年,黄严加入了字节跳动AI Lab,担任工程研发leader,这一次,他又站到了整个创作与视觉体系的“系统中枢”。 AI Lab这个部门后来整合成“智能创作”部,其主要任务就是把创意创新的链路,不管是模型还是非模型、算法还是特效、剪辑还是渲染,全部工程化,变成 API、SDK、服务,供各业务线调用。这段经历为后来黄严创业做ArtArch打下了的坚实基础。

“我深刻地感受到,创作正在从“拍—编—剪”时代,变成“用想象力构建作品”的时代。这成为我创业的底层逻辑。”黄严这么形容字节那段经历给他带来的启示。

ArtArch近日发布的短视频生成产品Skira分为两个版本,供专业制作人搭建各种玩法模板的PC端,和供普通用户低门槛使用各种玩法生成视频并分发的App端。值得关注的是Skira 的PC版采用了一种积木化的工具思路,将不同的模型和效果设计成模块,制作人可以通过拖拽的方式任意组合,形成工作流。这一独特的创作方式被媒体称作“AI 工作流乐高化”。

而Skira得以实现这种独特创作方式的底层原因,是被称作“想象力引擎”的创作架构。这套引擎内置了ArtArch 团队自己打造的编译器和编程语言,把多模态模型的能力、创作素材、工作流等内容,都封装进平台里。这也是ArtArch团队的核心能力。

近日,我们有幸与ArtArch的创始人黄严进行了一场深度对话,在为我们解惑了其独特的创作AI设计思路的同时,也让我们全面了解了制作人群体的真实状态与Skira的商业野心。

以下为创投家与黄严的完整对话,略有删减

创投家:很多公司都在抢夺自然语言交互的第一入口,尽全力去降低普通人使用复杂创作工具的门槛,咱们为什么选择了一条完全不同的道路呢?

黄严:我个人非常喜欢内容和创作,而我们团队对于创作者这个群体也有着更深度的理解。

我们发现有时候语言是有障碍的,大家都在追求用一句话去描述一个意图,但其实我们的表达和我们所想的内容本身就有误差。可能我们脑海中真正想的东西Level很高,但未必能把这些想法和感觉准确传达出来,模型的理解将会进一步放大这种误差。

今天的模型在去理解意图、匹配预期上已经很强了,但是你仍会发现,prompt类型的模型的产出总是不太稳定,有时候渐行渐远。有时候你想把它拉回来,结果它又变得更远了。相信很多用过AI创作工具的人都有这种感受。

而创作本身就是一种表达,像语言艺术一样,是可以有结构的。我们的团队平时会去学习导演学之类的表达方式,这些本身就是套非常复杂的体系。我们看一个视频时感觉行云流水,但其实里边的主体怎么展现,镜头结构怎么设计,转场怎么过度,什么时间进入,甚至背景音效怎么配合,这些编排层面的复杂工作如果仅靠提示词去传达,我认为并不能真正贴合创作者本意。我们还是希望给予他们一个更贴合、更精准的表达权力,让他们怎么想的,就能怎么实现。这个就涉及到对于用户创意语境的理解,世界观构架,再到创意结构的构建这个过程。

创投家:这种方式是一种过渡方案,还是未来会长久存在的方式?

黄严:其实这两种创作方式并不冲突。当前我们的想象力引擎,本质上是一套面向 AI-Native 时代的创作操作系统(Creative OS)。

这套系统并不是从生成结果出发,而是从理解创作者的创作意图与语境开始,逐步完成世界观构建、创意结构生成,再到创作流程的自动化或半自动化编排,最终产生成片,并通过持续的交互式反馈实现自我迭代与演进。

我们所做的,是对“从一个想法到持续产出作品”这一过程进行底层重构,把原本高度依赖个人经验、工具拼接与反复试错的创作行为,转化为一个可被系统理解、可被工程化执行、并能够持续进化的完整创作闭环。

在这套创作OS架构中,Agent 与各类生成式模型并不是孤立调用的能力单元,而是被统一纳入创作系统之中,根据不同阶段承担不同角色,充分发挥各自在理解、生成与反馈环节的优势。

正是这种从“意图 → 结构 → 流程 → 作品 → 反馈 → 演化”的系统级设计,构成了想象力引擎的核心,也使其不再只是一个生成工具,而是一套能够支撑持续创作与表达演进的底层基础设施。

创投家:您认为AI创作工具最终给出的,应该是一个模型认为的最优解?还是一个最贴合创作者意图的解?

黄严:我更希望是后者,当前很多工具是前者。想象力引擎的核心是语境最优,是希望让创作者的所想快速转化为现实。

用户的想象力其实是某种语境,是有明确目标感的意图。但其实有很多语境是创作者自己都没有描述出来的东西,需要模型去确认,需要替用户产生联想和构建,这其实是去理解他的内心世界的过程,从而产出一套贴合他语境最优的结果。

还是那句话,我们想做的事情是保护和完善创作者的表达权,而不是去追求与创作者意图违背的结果,哪怕这个结果看起来更优。

创投家:Skira的PC和APP端之间是如何协同的?

黄严:Skira App更ToC,是面向全球用户的“一键创作”玩法宇宙。Skira PC更面向制作人与技术流创作者的“AI 工作流乐高化”创作工具。有了它们,Skira不只是一个应用,而是一套内容流动机制与创作者生产力系统。

等于,Skira的整个模式从一开始就不是单边供应或单边消费,而是以“玩法”为中心的,供给—消费双向循环。C 端需要专业创作者供给玩法,创作者的创意也需要C端用户去消化、使用、再表达。所以Skira天然是一种平台结构,PC和App分别承载了平台的两端。

创投家:现在Skira的生态中专业制作人和C端玩家的数量大概各是多少?

黄严:Skira目前还处在一个增长阶段,我们不是很强调纯粹数量上的增长,更在意质量。可以透露的是,现在 Pro C 和 C 端用户的比例是1:10。

创投家:这个想象力引擎的上限在哪?为什么现阶段主要生成的内容以30秒短视频内容为主?

黄严:能力边界其实不由引擎或是模型决定,最终其实是由我们实际上可以支撑创作者的颗粒度来决定。

目前为什么选择30秒短视频?其实核心原因是我们的团队非常懂30秒内的创作逻辑。在短短30秒里,前三秒怎么抓人、后几秒如何防止跳出、如何提升完播率,其实都是非常有挑战的,在30s这个区间内几乎可以遇到AI创作的所有挑战,某种程度上比中长视频更复杂,中长视频反而AI作为辅助,制作团队的作用会更大些。而我们关注的,正是如何在这30秒内去直观提升创作者意图表达的效果。

而想象力引擎的上限其实是根据创作者能力界定的,核心维度在于创作者自身的想象力或者语境。

创投家:Skira和剪映的核心区别是什么?

黄严:剪映确实是一个非常伟大的创作工具,我也有幸参与了整个开发过程,但我们走的路径确实完全不一样。

剪映的出发点,是在剪辑的过程中融入一些创作的巧思,加入一些AI的内容,它的核心是替抖音的用户加速创作,推给用户的东西叫作模板。

而我们提供给用户的是制作人们搭建的玩法,玩法产生的不光是一个短视频,更是一种表达方式,其交互形式更加多样,受众人群也更广泛。同时,基于这批制作人生态引申出来的社交和社群属性,也是我们更希望去深度发掘的东西。

创投家:Skira的商业化路径是如何设计的?

黄严:我们商业化上的逻辑是,先通过好的技术架构,降低对于昂贵模型的依赖,以此来做好成本管控。

在此基础上,我们希望大家可以先玩起来。增长虽然是第一优先级,但我们从来不追求一波流,而是希望制作人能够留存下来持续地进行创作。

所以我们设置的收费模式更多的是,当C端用户真的喜欢我们的产品以及一些心仪的玩法,当制作人真的喜欢我们的创作架构进行更多的玩法创作时,他们才需要去购买一些创作的Credit包或者订阅。我们更倾向用我们的玩法去击中一些真正对玩法感兴趣的人,所以推广上一直也比较克制,不会去做一些激进的商业化,以免制作人的人群画像出现偏差。

创投家:咱们是通过什么渠道获取这些专业制作人的?咱们的生态里会给到他们怎样的激励?

黄严:专业制作人并不是一个凭空冒出来的新群体,中国的短视频生态里本身就存在着一批AIGC的创作者和玩家,他们在抖音、小红书生态里尤为活跃,而且极富创意。

站在他们角度,其实并不缺商单,现有流量平台带给他们的收入已经比较可观。他们需要另外的平台有自己拿得出手的作品,以及更高的知名度,这个也是他们所追求的因为这样会提升他们本身的议价能力。

所以他们普遍会有另两个痛点,一个是工具不趁手,一个是无法被看见。比如说现在一个制作人要做一个短片,他需要先在Midjourney、可灵、即梦这些平台上走一圈,再回到剪映,非常麻烦。而我们的思路是帮助他们提供一个可以构建小玩法,搭建小巧思的工具,在玩法里边融入他的创作理念。另一面,制作人搭建的玩法会被推到台前,普通用户也可以在我们的生态里玩起来,就像在体验制作人的世界观一样。

激励这方面,根据玩法被调用大小,我们会提供分佣和补贴的策略,同时在制作人生态里我们还会组织一些创作比赛,也会给到一些现金奖励。这算是给制作人开辟了一条新的收入路径。

创投家:目前创作者使用Skira的反馈如何?

黄严:上线一个月,Skira已经吸引了一批全球化的创作者KOC。

一些正反馈是,有创作者利用Skira中的玩法模板,已经在YouTube上从0起号获得单视频上万播放,而且大家会隔天或者隔几天过来继续看看有没有什么新的好玩的玩法,观察到的很多指标都超预期。

我们团队一直在探寻短视频创作者为什么能够产出流量优秀的作品,并形成了可实操的方法论,最后形成了引擎,希望AI时代来临的时候,可以让更多人真正把自己的想象力变成一种表达能力,并成为全球AI-Native创作的基础设施。(作者|郭虹妘,编辑|陶天宇)

更多对全球市场、跨国公司和中国经济的深度分析与独家洞察,欢迎访问 Barron's巴伦中文网官方网站


nginx