Sora发布后,Pika创始人独家回应钛媒体:很振作,咱们将直接冲

liukang20242周前998吃瓜738

OpenAI刚刚推出的Sora像是一颗炸弹,再一次引爆全球。

简洁的Sora发布后,Pika创始人独家回应钛媒体:很振奋,我们将直接冲的图片

作为AI视频模型,Sora能够依据文本指令创建实际且赋有幻想力的场景,能够生成具有多个人物、特定类型的运动,以及主体和布景的精确细节的杂乱场景的高清视频,并且时长能够到达一分钟。

Sora对言语的了解也到达了一个新的层级,使其能够精确地了解提示词,并生成表达充满生机的情感的视频。它树立在曩昔对DALL·E和GPT模型的归纳研讨之上,提出了一种新的模型或许。它不仅能够了解用户在提示中提出的要求,还能了解它们在物理国际中的存在办法。

重要的是,Sora是一个diffusion transformer,而transformers现已在言语建模、计算机视觉和图画生成等各大范畴现已体现出了出色的扩展特性。

作为一种分散模型(diffusion models),Sora除了能够依据文本指令生成视频之外,还能够获取现有的静态图画并从中生成视频,精确地动画图画的内容并重视小细节。Sora还能够获取现有视频并对其进行扩展或填充缺失的画面。

Sora从大型言语模型中取得构思,这些模型经过互联网规划数据的练习来取得通用才干。(截图来自OpenAI发布的Sora技能研讨陈述:Video generation models as world simulators)

OpenAI发布的技能陈述以为,Sora的研讨结果表明,扩展视频生成模型是构建物理国际通用模仿器一条极具远景的途径。它使人工智能了解和模仿运动中的物理国际,迈向了一个新的高度。

因而,Sora也被以为是AGI完成进程里的严重里程碑作业,而不仅仅仅仅视频生成。

在Sora发布之前,Runway和Pika都被以为是视频生成赛道的佼佼者。Sora发布之后,许多人以为,它凭一己之力现已轻松“吊打”且行将“干翻”这两家新式独角兽公司,并对创业者的命运表明忧虑。

可是,他们自己对此却好像振奋更多于惊骇。Pika开创人郭文景独家回应钛媒体App称,“咱们觉得这是一个很振奋人心的音讯,咱们现已在预备直接冲,将直接对标Sora。”

此外,郭文景还泄漏,现在现已在招人了,详细方案暂时还不能对外泄漏。

Pika Labs成立于2023年4月,同年11月发布首个产品Pika 1.0。Pika1.0能够生成和修改3D动画、动漫、卡通和电影,并且一般用户还能够对其进行加工,被视为一款零门槛“视频生成神器”。

在与钛媒体开创人赵何娟的【AI新生代】系列对话中,郭文景也曾说到,现在生成式视频开展的一个重要约束是算法的老练度,这也是Pika的中心主攻方向。

“我觉得视频跟言语模型不太相同,关于言语模型咱们现已知道大约的办法,算法其完成已比较老练了。但视频现在没有很好的算法,它不是一个规划化的问题,不是说现在咱们的GPU不够多,许多时分其实是算法上还没有很好的一个思路。”郭文景说。

而此次Sora的发布,也给职业供给了一个十分好的算法思路,或许反倒为Pika这样的抢先创业公司供给更老练算法道路或许。

事实上,面临实力微弱的OpenAI,郭文景也早已做好了预备。早在数月前,赵何娟也曾问过郭文景,在视频生成赛道上最关怀的对手是谁,郭文景其时即表明,应该是OpenAI。

作为一个在东亚文明里生长的女生,郭文景大学本科结业于哈佛,而斯坦福博士没有结业就停学创业。其创建的Pika 1.0版别的demo视频流出之后,即一举成名,它能够生成和修改包含3D动画、动漫、卡通或许电影风格的视频,并且运用起来也很简单上手。

它还答运用户自己上传视频片段,并运用生成式AI来修改和从头构建场景。电影质感,动画级特效,Pika 1.0的视觉效果十分迸裂,好像让一般人都能成为电影导演,行将成为一种或许。

这支开端由4个人组成pika_labs,融资超越5500万美元,简直一切AI范畴的闻名前期出资公司都参与了此轮融资。

而就在Pika1.0发布才曩昔四个月不到,同赛道的Sora的横空出世,在AI视频生成这条路上,又增加了许多变数和或许性。

以下是之前钛媒体开创人赵何娟与Pika开创人郭文景的【AI新生代】对话实录:

46:04

当电影梦叠加AI的“魔法”

赵何娟:Hello,Demi,很高兴又碰头了,很高兴你能够来到我的直播间,与咱们一同来评论这一波AI浪潮下新生代兴起的论题。作为硅谷最近十分炽热的AI生成式视频项目Pika的开创人,外界对你们的评论也特别多。我想咱们应该都会对你的创业,对你自己都会很感爱好。

咱们可不能够先从你自己的阅历开端聊一聊,你是怎样从哈佛大学读本科,然后到斯坦福大学读的硕博的?又怎样挑选了文本生成视频这个方历来创业的?

郭文景:咱们好,我是Demi。我从小就对构思职业比较感爱好,也因而我挑选去斯坦福大学。之前我一向在做AI,两年前参与斯坦福大学读博,我选的方向便是AI for content creation.,用AI做一些内容创造。

我其时跟了两个教师。一个教师是斯坦福大学人工智能试验室的主任Chris Manning,另一个教师之前是用计算机做电影的,他从前获过两次奥斯卡奖。斯坦福也是一向尝试用AI做内容创造。我也在游戏公司做过一些AI for虚拟人,AI for 3D游戏内容,以及原画的一些的探究。

之所以开端创建Pika,一个是对这个方向比较感爱好,别的也是我自己特别想做一些电影和视频,但我不是专业的。我从前跟一些朋友想做一个AI电影,进程让我知道到,尽管现在视频制造现已十分先进,但仍是有许多瓶颈。

我觉得AI必定会改动现在视频制造的办法。假如能够用最好的AI技能,去幻想未来视频制造的办法,是一件十分有意思的作业。我就开端做Pika这个项目。

赵何娟:你在创建Pika之前,先参与了Runway的AI视频大赛。你现在做的Pika,一个很重要的或许说比较大的竞赛对手便是Runway。你为什么去参与Runway的大赛,一同要做一个跟Runway彻底竞赛的项目?并且,Runway在这个范畴里现在仍是抢先的。

郭文景:我其时参与这个大赛的时分,没有想要做AI视频的公司,朴实是爱好。其时咱们放寒假,我发现这个竞赛就挺有意思的,我想做一个电影。咱们其时还找了一个编剧去写这个剧本,也找了一些做AI的朋友和大学同学。

这个进程,让咱们知道到现在视频制造仍是十分杂乱。咱们有许多构思是很好的,但并不能很好地完成。咱们也用了许多Runway的东西,也用了一些其他的东西,咱们发现还有许多空间。

赵何娟:你发现在做视频或许电影创造的时分,深入研讨发现制造进程仍是有许多瓶颈,首要的瓶颈是哪些?

优雅的Sora发布后,Pika创始人独家回应钛媒体:很振奋,我们将直接冲的插图

郭文景:我其时想要把视频的布景变成一些其他的布景,包含几秒钟的视频,就要花掉我好几个小时,电脑还会犯错。我想要把一个视频放嵌入到iPad的屏幕,进程也十分杂乱。我依据一些教程学了一遍今后,第二遍我就直接忘记了,中心还有或许犯错。这应该是比较简单的使命,没想到还需求花这么多时刻和精力去做。

咱们其时做的电影,找了艺人,做的是从真人变成动漫的办法,其时或许还没有任何模型去做,视频到视频的功用。咱们其实是用了一些新的论文,去完成的。其实AI能做,可是市面上没有很好的东西。

坚决AI崇奉:比起数据,技能才是底气

赵何娟:现在GPT大模型也在不断晋级,迭代速度仍是蛮快的。或许在你想做那件作业的时分,还没有东西能做,可是或许当你自己去做的时分,发现其他的东西都开端做了。所以,你们来做这件作业的中心竞赛力是什么呢?

郭文景:首要,咱们仍是比较信任自己的技能布景的。咱们开创团队有斯坦福博士,团队还有麻省理工等院校的博士,和一些比较十分优异的本科生,我仍是想打造一个比较顶尖的技能团队。

相对Runway来说,咱们还有几个不同。关于产品的定位和产品的战略,Runway或许仍是更倾向于一些专业的用户。它们推出的许多功用,首要是面向电影制造,或许说电影作业室,更偏于一些专业用户。

但咱们想做得愈加偏一般用户能用的一些东西。不必定说是要做电影,也可所以帮你修改一些个人的视频,或许是做一些比较有爱好的视频。

Runway它或许做的规模会愈加广一些,比方说3D、语音、agent,各种不同的模型,办法更倾向于有一个新的算法,有新的一些功用。但咱们是从视频修改和视频制造的视点动身。

赵何娟:还有一个很重要的问题是数据。比较Runway这样现已跑在前面的公司,或许是比较其他的一些大的渠道,比方说,像迪士尼现在也在做自己的视频生成的相关的模型,你们会不会以为,数据是最难与之竞赛的?你们怎样处理数据的问题?

郭文景:数据确实很难与迪士尼竞赛。OpenAI是现在最好的言语模型,可是为什么有许多语料库的公司,没有做出最好的言语模型呢?迪士尼也不代表它的数据必定会更好,由于它的数据量比较有限。其实许多言语公司最终仍是看技能。

赵何娟:你方才讲到的别的一个不同,你们的定位不相同。你们更倾向于一般用户,一般顾客,而不是只针对电影制造者这类专业用户。怎样了解你们想要针对一般用户这样的一个定位?像TikTok这样也是针对一般用户,每个人都能够在上面做一段创造或许短视频,是不是你们也会往渠道方向去拓宽?

郭文景:咱们现在没有这方面的主意,咱们更多是依据技能之外的一些功用性的开发。

赵何娟:那一般用户怎样用你们呢?他们用Pika,更多是用来做什么呢?

郭文景:咱们现在更多是期望用户能够做一些视频的生成和视频修改。详细的运用,现在咱们仍是比较敞开情绪,是让用户去决议。咱们现在更多是把技能瓶颈打破。

赵何娟:现在技能打破上最大的一个难题是什么?

郭文景:我觉得视频跟言语模型不太相同,关于言语模型咱们现已知道大约的办法,算法其完成已比较老练了。但视频现在没有很好的算法,它不是一个规划化的问题,不是说现在咱们的GPU不够多,许多时分其实是算法上还没有很好的一个思路。

举例子来说,比方现在大部分常用的视频模型,依据规划来讲,它就不或许生成很长的视频,由于它每一帧的图片是一同生成的。它有一些算法上的瓶颈,无法做出咱们幻想的那种十分长、十分好的视频。它其实还需求一些算法常识上的打破。

赵何娟:接下来的创业里,关于你来说,还会有哪些应战?

郭文景:AI是高速开展的一个职业,必定会有许多的改动,竞赛对手也有许多的改动,整个职业一日千里。更多的应战是一些不确定的应战,咱们也不知道未来会产生什么。所以,对咱们来讲,咱们的心态是,这便是没有什么应战。

现在咱们更多的是想树立一支比较好的团队。没有什么应战是不能战胜的。或许有些应战更难一些,你花的时刻需求更多,去探究,去找到一个处理方案。

赵何娟:你之前是对AI和创造感爱好,但你与团队在磨合的进程,或许在组成团队的进程里,发现就凭爱好干事,和做公司之后,感触有什么不相同的吗?

郭文景:咱们很走运的一点是,咱们做的公司,便是咱们的爱好。我便是方针用户。我有时分作业闲的时分,就会去用咱们的产品,去做一些视频。包含咱们最早的一些商场向的视频,便是我做的。

咱们比较走运的一点,是由于咱们对自己的这个方向特别感爱好。所以,咱们的团队也是比较照较有生机,都是归于比较有自主动力的人,并且团队还比较小。创业是最美好的作业,在做自己最想做的作业,并且跟一群咱们觉得十分优异,相同对这件事感爱好的人一同做这件作业。

赵何娟:你们的出资组织,光速创投的合伙人Michael,他说,Pika团队是他见过行动力最快的团队,我不知道你怎样看待这个点评?

郭文景:咱们团队一向比较垂青履行的功率,这或许也是小团队的一个优势。

赵何娟:咱们再来聊聊趋势。之前我有看到英伟达的科学家说,2022年是印象之年,2023年是声波之年,2024年是视频之年,你怎样看这个演化的进程?近几年说视频也都好多年了,为什么说本年是视频之年?

郭文景:视频或许现在尽管没有那么完美,可是本年必定会有比较大的打破,由于现在用AI一个做好的视频,需求在prompting,提示词上有一些技能。你或许需求在这方面比较有阅历,就能做比较好的视频。但假如你没有很有阅历,就不能做出很好的视频。

这是由于现在视频模型还没有那么老练,但咱们觉得立刻会十分老练。本年或许就能够做出产品,是能够让一切人不需求有许多的阅历,就能够做很好的视频。

赵何娟:接下来也想聊一聊你对整个AI的职业的一些判别。你怎样看待最新的这一波的AI革新浪潮,有没有或许有更多的时机也是你感爱好的?除了你现在做的视频之外,你接下来还有没有哪些主意?

郭文景:我十分信任AI浪潮。我知道许多人或许会觉得AI浪潮实在有点太火了,或许是有一些过度,有些泡沫。但咱们仍是很信任的。不论说这个热度是否过火,可是技能真的是有打破。咱们也信任,未来AI必定会改动许多职业,许多的运用,包含运用的一些运用。这个是毋庸置疑的。或许包含视频制造或许说音乐制造,购物办法,AI都会对传统的办法有推翻。

Sora发布后,Pika创始人独家回应钛媒体:很振奋,我们将直接冲的插图

别人家的女儿”是怎样长成的?

赵何娟:你做这个的作业,你家人怎样看呢?

郭文景:我家人还挺支撑我做任何我想做的作业的。

赵何娟:Pika创业项目出来之后,你们发布了融资信息,又发布demo,咱们也都十分重视你的家庭布景,都说这是“别人家的女儿”。

所以,从你自己视点来说,你觉得家庭的教育,对你不论是肄业,仍是创业的主意,起到了什么启示或许效果?一个这么优异的女孩子的生长,一个很好的家长教育仍是很重要的,或许是起到了很至关重要的效果。

郭文景:我觉得我仍是挺走运的,我的整个生长阅历,也挺感恩,不论是对我的教师,或许是家里人。由于我从小一向对构思职业比较感爱好,我小学的时分,其实是想做一个作家,想要寻求一些文艺的愿望,包含我家里人,其实其时特别期望我能走一些文艺的道路。我其时坚持要做编程这条道路的时分,我还跟我爸爸妈妈大吵了一架。我有姐姐和妹妹,她们是做的偏这个艺术方面的一些作业。

赵何娟:你小时分那么喜爱写作,什么时分开端又开端对编程感爱好的?是什么触发你忽然对编程感爱好了?

郭文景:我其时特别喜爱诗篇。我小时分喜爱写作,喜爱看诗篇、散文集。我特别喜爱一些比较笼统的诗篇,一些带有隐喻的散文,结构上的规划上比较奇妙的诗篇和散文。

其时触摸到编程,也是朴实觉得十分有意思。五六年级的时分,刚好家里有一本书讲的是LOGO程序言语,是一个小乌龟画画的一个言语。其时暑假没事儿干,看了这本书,就学会了这个LOGO言语。你能够经过编程的办法,去做一些创造。

程序跟诗篇仍是有一些共通之处的,是需求去规划的。比方说,结构化的编程,你需求规划一下,函数怎样搞,结构怎样搞。但它与诗篇不相同的点是,你最终的输出的这个东西,是能够交互的。

赵何娟:你或许在小学的时分触摸编程是玩儿,可是,在生长的进程之中,比方说,中学之后就要开端想专业方向。你在专业方向挑选的时分,为什么没有选文艺那条路?比方说,去学文学或许是学艺术相关的,而是彻底走上了这个计算机科学这条路。

郭文景:我其实到初中、高中今后,就逐步喜爱上了编程。朴实是个人爱好,没有想到编程会对我升学有协助。其时每天要先好好做作业就开端去编程。编程与文学不相同的有意思的点是,编程真的能做一些运用,一些实际上的咱们都能用的一些运用。我觉得这件作业十分的magical。

大学也是爱好导向的。我大学本科修的是数学。可是,我一同也与一些博士生一同,上一些计算机的课。在哈佛修的是数学学位,一同拿了一个计算机的研讨生学位。我在哈佛也上了许多人文课。

前两年,我就把计算机和数学的学位拿到了。后边两年,其实我首要都在上人文课,重视文艺的一些作业。

赵何娟:这个也蛮有意思的,不论是计算机仍是文艺,都是你的爱好。然后,你现在就把这些不同的爱好,经过创业,把它结合起来了。

郭文景:这是两个不同方向的爱好。大一时分,我就开端触摸AI。由于其时觉得AI像是一种魔法,AI这么奇特,这么powerful。比方说,AI其时能够做人脸检测之类的,我觉得十分难以想象。对AI也感爱好,对艺术和创造一向都很感爱好,我很难找到一个更让我觉得更有意思的作业。

赵何娟:你从哈佛学习,又来到了斯坦福。这两所校园,一个在美东,一个在美西。你觉得这两所大学对你来说,以及你在这两所校园里收成的东西,有什么不相同么?

郭文景:两者不同的话,其实很难说。首要是本科阅历和博士阅历不是很相同。大学或许会更广一些,更重视一些探究,或许会修不同的范畴的课,会知道不同范畴的人,但博士或许更偏专业一些。

赵何娟:美东的文明和硅谷的文明比较,差异其实也蛮大的。在你看来,这两所校园的教育形式、立异,或许与企业界的联合的办法,有什么不相同?你会更获益于哪一种?你的创业或许会更获益于哪一种?

郭文景:其实挺难比照的。每个校园环境不太相同。或许在哈佛,在美东,大部分的朋友都在搞金融,可是,斯坦福会有更多同学对创业感爱好。

斯坦福有许多计算机的课,计算机与其他学科结合的课也十分多。哈佛与计算机相关的,没有几个课,咱们其时要上一些博士level的课,或许也就二十几个人。乃至,我其时还在MIT上了一节课。

其实计算机相关的,在哈佛也是第二大的学位。在哈佛许多学习计算机的人,后来也没有去做计算机相关,许多人去做股票、咨询或许产品司理之类的作业。

赵何娟:斯坦福的构思气氛更浓,斯坦福大学也有许多停学创业的,都还比较成功。你的长辈们在硅谷各领风骚好几年。过几年,又会有一波新式的创业新秀起来。这也与硅谷和斯坦福共同的文明有很大的一个联系。

你其时怎样就下定决心,决议停学去创业的?特别你是从小成果就很好,是家里的心肝宝贝,为什么有停学这个跟你之前的人生或许很不相同的决议?

郭文景:比较读博来讲,我个人对创业会更感爱好。我其实在哈佛从中心也停学了一年,再回去读的。我其时大二的时分,在Facebook便是现在Meta全职作业了一年,在AI研讨试验室,首要是感爱好。对创业比较感爱好,是由于我觉得还能做一些运用。

我比较喜爱寻求自己酷爱的作业。在美国,一些本科生停学仍是挺正常的一件作业。我的走运的点是我的导师。包含我的博士的导师,都特别支撑我。他们在学术上都十分资深,一个是斯坦福人工智能试验室主任,一个是取得了两个奥斯卡奖。我博士的导师,现在是我创业的导师和参谋。现在我仍是会定时去见他们。

赵何娟:他们怎样看待你现在这个创业项目的?

郭文景:他们十分支撑。我其时跟我一个导师说了这个作业,他立刻在电话上直接说支撑我。他说,聪明的人就应该去做自己想做的作业。我觉得十分走运,我也十分感恩我的导师,他在一些技能上的常识都会支撑。现在,他仍是会跟咱们进行一周一次的技能上的辅导。我的导师也会觉得,高兴最重要。

赵何娟:特别感谢Demi,Demi是一个很实在、坦率,心爱的姑娘。也有许多年轻一代的人,看到AI这个大浪潮来了。能不能请你给你的同龄人一些方向性的主张,怎样掌握到这次时机?

郭文景:也不能说给什么主张,能够共享一下我个人的主意。我觉得其实许多时分,仍是要寻求自己的心里想做什么,仍是要寻求自己的个人的爱好。咱们的人生只要一次,要做自己酷爱的作业,只要做自己酷爱的作业,才干做得到最好。

(本文独家首发钛媒体APP,作者|李程程,修改|马金男)

告发/反应

相关文章

外媒称美英对也门首都发起新一轮冲击 胡塞装备激烈回应

中新社北京1月13日电 归纳音讯:多家外媒音讯称,当地时间13日清晨,也门首都萨那的胡塞装备方针再次遭到冲击。针对美军和英军当地时间12日对也门境内胡塞装备发起的突击,胡塞装备激烈回应称将发起更多突击...

鹿晗关晓彤领证?回应来了

12月20日,明星鹿晗与关晓彤领证的音讯引发广泛重视与热议,相关词条登顶文娱榜第一。12月21日,鹿晗工作室对此事进行回应称,关于鹿晗和关晓彤被爆领证为不实音讯,现已向相关渠道发函,要求对方撤消相关热...

刘强东回应美团高管:不打口水仗,发生不了社会价值

4月12日下午音讯,今天下午,京东集团新闻发言人齐珊珊在朋友圈发布了与京东集团创始人刘强东的内网对话,并表明:“又上了一课,结壮干事,努力创造社会价值。”据其朋友圈截图显现,刘强东自己得知今天早间王莆...

贫嘴的编辑部,回应着一个年代的困惑

编者按:这儿是一个怀旧剧场。商品经济的大潮,跟着20世纪90时代的到来轰轰烈烈地往前演进着。这也直接投射在其时的我国影视文明中,1991年呈现的那部喜剧《修改部的故事》,刚好印证了这一点。剧中一再呈现...

有关特朗普访华,中方回应为何如此说?

中美两国间具有广泛一起利益和宽广协作空间,能够成为同伴和朋友,彼此效果。文 | 海上客“中方是否会约请美国总统特朗普访华?假如特朗普访华,其重要意义是什么?”这是在庸俗(1月21日)的外交部例行记者会...

医院能为独身女人供给试管婴儿服务?官方回应

据报导,南京一医院清晰称可为独身女人试管助孕,25岁的精子供应方学历、身高、长相任选,还能亲身跟“精哥”碰头留样,合同约好婴儿性别,医院称一个月能接三四十单。记者采访了南京市秦淮区卫健委。秦淮区卫健委...

友情链接: