效果追上Sora,字节跳动一口气发布两款视频生成模型

来源:

责任编辑: 盖天

发布时间: 2024-09-25 13:35:12

0

0

图片来源:字节模型生成视频截图

界面新闻记者 | 肖芳

界面新闻编辑 | 文姝琪

9月24日,字节跳动一口气发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。但从发布会现场展示的视频生成效果来看,无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型都表现出不错的效果。

比如,其中一个视频输入是,“特写?个??的面部,有些??,戴上了?副墨镜,这时?个男?从画?右侧?进来抱住了她。”视频画面显示,其不仅遵循了这个复杂指令,还能够按指令的时序去完成连续的动作,两个主体之间也能比较顺畅的进行交互,而且人物表情也比较准确传达了指令所描述的情绪。

而一位提前拿到内测资格的创作者体验生成的视频也显示,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。

一位多模态大模型科学家看完上述创作者使用豆包视频生成的视频后告诉界面新闻,如果demo效果保真的话,豆包视频生成大模型确实是相当不错了。从学术角度或者模型能力角度来说,其肯定达到了Sora的水平,尤其在在人物动作上非常棒。

字节跳动旗下火山引擎总裁谭待在发布会接受界面新闻等媒体采访时透露,豆包系列大模型并不是按照某个固定的时间计划发布的,有好东西就尽快推出。“我们的逻辑是推出的产品要质量可靠,有充分用户反馈,不能是半成品。就像视频和语言模型发布一样,不一定要抢第一,要推出成熟的产品。”

但在一位行业观察人士看来,这个节点一口气发布两款视频生成模型,对字节跳动更大的意义在于“拥有”。Sora发布之后,国内从业者都期待字节跳动能够第一个做出来中国版Sora,最后却是快手第一个做出来了“可灵”,而且效果还不错,字节跳动必然承受了一些压力。

并未过多公布模型技术细节

据界面新闻了解,豆包视频模型支持黑白、3D动画、2D动画、国画、水彩、水粉等多种?格,同时支持1:1、4:3、16:9等多个比例,能够适配电影、电视、电脑、手机等多场景。

相较于可灵等国内其他视频生成模型,豆包视频模型技术细节上略显神秘,并未对外公布太多信息。

此前,快手方面对外公布的信息显示,可灵背后的技术原理和Sora类似,都是把常用于视频生成人工智能的扩散模型与Transformer架构相结合,这有助于其理解更大的视频数据文件并更有效地生成结果。和Sora相比,可灵的一个关键优势是依托于快手短视频平台,数亿用户上传了大量可用于训练可灵的视频数据。

据谭待介绍,豆包视频模型经过剪映、即梦AI等业务场景的持续打磨和迭代,深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力。同时,豆包视频生成模型基于DiT架构,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

他强调,在镜头切换时可同时保持主体、风格、氛围的一致性是豆包视频生成模型的技术创新所在。

界面新闻从多位大模型从业者处了解到,人物动作是当下视频生成模型共同面临的挑战,Sora做得也不够好。目前,Sora看起来主要还是以运镜和基础动作为主,复杂动作比较差,豆包视频模型生成的demo已经有了明显提升。

但这仅限于豆包视频模型生成demo展现出的水准,几位从业者均表示,实际的水准比较难判断。

谭待在采访中明确表示,这两款视频生成模型并不是期货,字节跳动已经在内测API和应用,预计国庆节后会公开更多API。

已规划视频生成模型商用方向

界面新闻在发布会现场发现,此次前来参加发布会的人多到严控进场的程度,绝大多数参会者都是火山引擎的合作伙伴和对大模型有潜在需求的企业客户。

谭待在发布会现场也向这些合作伙伴和潜在客户介绍了豆包视频生成模型的商用方向,包括电商营销、动画教育、城市文旅、微剧本等企业场景,同时也能为专业创作者和艺术家们提供创作辅助。

这和此前可灵探索的商用方向基本一致,但字节跳动更务实一些。可灵推出后,快手高调推出了由可灵深度参与制作的奇幻微短剧《山海奇镜之劈波斩浪》,并于近日联合李少红、贾樟柯等9位知名导演启动了完全依托视频生成大模型制作电影短片“可灵AI”导演共创计划,试图以此来证明视频生成大模型在影视制作领域的可用性。

从《山海奇镜之劈波斩浪》的探索来看,可灵真正深入参与影视剧制作仍然有较大难度。和外界想象差异较大的是,这部微短剧虽然画面均由AI生成,但整部影片并不是又AI一气呵成,而是使用可灵大模型的文生图和图生视频功能生成了很多时长5秒的分镜头,再由后期剪辑团队人工剪辑而成。从成本降幅来看,其带来的价值也不如外界预期的那么大,整体的降幅不超过四分之一。

豆包视频生成模型的侧重点在于电商营销等对视频内容质量要求相对较低的场景中。在上述多模态大模型科学家看来,从目前各个视频生成模型的能力来看,它们距离商用影视创作有多远还有点难说,但应用在电商营销等场景中已经完全够用。

字节跳动并未在发布会上公布豆包视频生成模型在商用场景的定价。谭待表示,视频模型和语言模型应用场景不同,定价逻辑也不同。要考虑新、老体验和迁移成本,而最终能否广泛应用取决于是否比以前生产力ROI提升很多。

但他强调大模型价格已不再是阻碍创新的门槛。今年5月,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。火山引擎披露的数据显示,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

在谭待看来,大模型的应用成本已经得到很好解决,行业要从卷价格走向卷性能,支持更大的并发流量正在成为大模型行业发展的关键因素。

新闻热榜

1

古巴缺粮吗一点都不缺,糖都可以吃饱了,所谓缺粮都是美国的错

2

60斤娃娃鱼现身乐山

3

郑州市中原区房屋征收与补偿办公室原党组书记、主任冯铁生接受纪律审查和监察调查

4

新型战机辽宁舰放飞

5

美国国务院敦促美国公民撤离黎巴嫩

6

法国总理巴尼耶正式组阁内阁成员名单公布

7

信长星会见青海省海南州党政代表团

8

政协提案里的中国故事——庆祝中国人民政治协商会议成立75周年

9

邱虹赴云溪区督导乙烯项目建设和安全生产工作

10

日烘干量195吨!成都东部新区首个农产品烘干中心开启试运营

11

霸总爽剧硬控中老年

12

新华视评丨鼓吹“中国威胁”治不好霸权焦虑

13

俄罗斯中央核试验场负责人安德烈·西尼岑称,为恢复核试验做准备

14

首届中国养老院院长大会长沙开幕

15

中方将恢复日本水产进口,有一个前提必须满足

16

乌克兰基辅拉响防空警报

17

最近三年,国家关系变得更复杂,而中国崛起成为一股清流

18

接下来就是国庆落叶下雪跨年,你看时间等过谁...回不去的何止是时间,还有曾经的自己...

19

风和尽起#写字是一种生活

20

中美经济工作组在京举行第五次会议

21

孝感市邮政管理局对西江邮政支局随机抽查情况

22

江西旺橙农业科技有限公司创始人陈小生:以“井冈山旺橙”品牌助

23

#半岛早安今天是9月22日,星期日,早安。生活一定要被喜欢的人和事填满。爱我所爱,行我所行,听从内心,无问东西。

24

尹锡悦结束访捷之旅回国

25

哈里斯称接受辩论邀请特朗普指为时已晚

26

2024京港共建国际消费中心城市新发展专题活动在京举办

27

核桃变身富民果

28

80多个岗位“职”等你来!淄博这场金秋专场直播招聘会举办

29

中东变天,以色列捅下马蜂窝,联合国对以发出最后通牒,拜登急了

30

气候影响健康

31

首日客流量达4万人次民生路好吃街正式开街

32

打包塑料袋一个10元

33

蓬佩奥要送台湾进联合国,给本就落下风的老搭档特朗普,闯了大祸

34

全国总工会来郴调研并开展慰问活动:把温暖送进广大职工心坎里

35

张家界:民族团结入画来桑植“丰”景这边独好

36

台风巅峰强度登浙江

37

黎巴嫩寻呼机爆炸后,记者走访华强北,发现电子产品根本没有爆单

38

8万吨大桥轻松转?中国河北跨京广线大桥,轻松拿下2个世界第一

39

岸田卸任前收到中方一份大礼,日本水产品对华出口,有望逐步恢复

40

黎巴嫩传呼机爆炸事件,将严重打击美国经济

20

以色列在黎巴嫩整了出大戏,通讯工具爆炸,台岛厂商或参与

20

男子抱孩子手机自燃

20

印度小哥给轮胎装了25根弹簧,用力一拧油门后,直接怀疑人生了!

20

以军闯入半岛电视台约旦河西岸办事处,要求其关闭45天

20

“村歌嘹亮”河北团蓄势待发

20

金价冲到761元每克

20

白宫内阁会议上,她坐了主位……

20

大家帮我想想办法到底怎么才能去新疆玩啊你的年假休到了么打工人年假倩倩想静静

20

“湄公河惨案”主办人英模级人物没有忍住诱惑,副部级刘跃进被查

热门攻略

1

【时政】中共四川省委召开党外人士座谈会征求对省委十二届六次全会文件的意见建议协商2024年度重点考察调研成果

2

10人被立案、55名公职人员被问责!又一所大学揭牌!金价大涨……

3

苏林回国一个月,越南决定加快连接中老铁路

4

瑞典DeathMetal老炮儿HYPOCRISY2023年在BrutalAssault

5

台风致去程列车停运,返程退票却被收费

6

北京花园城市建设系列融媒报道①|探访融之美

7

家电巨头三国杀

8

奋进强国路阔步新征程|画好团结奋进最大同心圆--新中国成立75周年人民政协事业发展成就综述

9

一地现巨大蓝色光柱

10

许家印房屋将被拍卖

11

匈牙利传呼机女老板已被情报部门接走,母亲公开露面证实,坚信女儿无辜

12

高青县常家镇举办“首届黄河鱼烹饪大赛暨2024年丰收节”活动

13

捷克反对党在地方选举中获胜

14

在美国,iPhone16首卖现场

15

61岁乔丹的眼白泛黄,引发健康担忧,知情者:粉丝的关心让他尴尬

16

苏丹新一轮霍乱疫情已致370人死亡

17

黎巴嫩卫生部:过去几日以色列对黎袭击已致82人死亡

18

#国外枪战#国外视频分享#国外视频分享请勿模仿#视频来源于网络#国外合法狩猎

19

C919首次飞抵拉萨

20

斯里兰卡总统选举投票结束全国实施宵禁

20

纯棉棉被86%为化纤

20

老人留下7份遗嘱为何6份都无效

20

男子被砍后反杀凶手

20

电动车违停保安放气

20

明年人口抽样调查

20

协力构筑可持续山地旅游新格局2024国际山地旅游联盟年会即将启幕

20

暴雨后赤脚进ICU

20

刚刚,泰州地震了

20

以色列多地举行抗议活动呼吁尽快达成停火协议

20

周口市2024年绿色农产品暨优质农资展销会盛大开幕

20

梅德韦杰夫被任命为,俄武装力量征募委员会主席

20

3名中管干部因江西新余佳乐苑小区特别重大火灾事故被问责

20

苏丹武装部队称打死数百名快速支援部队成员

20

#河南退役军人事务厅厅长张明体被查#张明体虽然是正厅级干部,还算不上是一只大老

20

中秋档票房战报

20

要闻|黄晓勇主持召开县国土空间规划委员会第四十七次全体会议

20

泰安市创新推出项目投产服务“一件事”助力化工园区项目“竣工即投产”

20

以色列疯狂轰炸黎巴嫩,真主党高层被“一锅端”?美国要被坑惨了

20

津南区举办第十五届“中国统计开放日”活动扫码阅读手机版

20

11月1日起施行,《三亚市优化营商环境规定》公布

20

法国公布新一届政府成员名单

20

加沙地带中部阿克萨烈士医院面临停止服务风险

20

局势大变!大陆方针清晰,国台办彻底把话说透,赖清德死路一条

20

国足0比7日本

20

在美国,iPhone16首卖现场

20

潍坊诸城:南湖人大代表严把安全关,全力护航新学期

20

从一粒种子,到一担粮食湖南农行助三农、润三湘

20

俄军高层在北京,当着100多国代表的面,说出了俄罗斯的真实想法

热门游戏

  • 1
    小朋友涉嫌违章驾驶,美国警察跪下详细讲解,这才是以人为本啊

    射击枪战 /热度:46572

    点击下载

    五乡十园连成景一条绿道观朝阳

  • 2
    想两头吃?为加入金砖,土耳其总统做出承诺,中方态度成了关键

    射击枪战 /热度:47419

    点击下载

    美国明尼苏达州发生枪击事件致2死3伤

  • 3
    工作动态

    射击枪战 /热度:54441

    点击下载

    国足2连败就地解散

  • 4
    崩坏3 火星男孩最精准的预言是什么

    射击枪战 /热度:75891

    点击下载

    海报|多领域交出中外文化交流出彩“成绩单”

  • 5
    原神 如果在日中国学生遇害了,我们的舆论,应该对日本作出什么反应?

    射击枪战 /热度:22464

    点击下载

    李雯雯遭网暴删视频

  • 6
    出发吧麦芬 雅安玉米地发现女婴

    射击枪战 /热度:43862

    点击下载

    以色列对黎巴嫩南部发动大规模空袭,“美国敦促本国公民尽快离开黎巴嫩”

  • 7
    永劫无间手游 跨国性虐昏迷女性,存逾500张不雅图像!CIA雇员获刑,会说流利中文

    射击枪战 /热度:17426

    点击下载

    中共青海省委十四届七次全会精神在海晏县干部群众中引发热烈反响

  • 8
    向僵尸开炮 扎伊纳布威胁摄影师出钱保障他们的生活,否则终止拍摄。

    射击枪战 /热度:81261

    点击下载

    安徽省2024年法考开考合肥成我省首个超万人考区

  • 9
    鸣潮 黎看守政府总理米卡提宣布取消联合国大会之行

    射击枪战 /热度:68898

    点击下载

    京东将实现20薪

  • 10
    艾塔纪元 奶奶捧着热气腾腾的饺子一路小跑也将66个饺子喂给其他新兵

    射击枪战 /热度:62897

    点击下载

    禁TikTok支持度降低

关于我们 | 联系我们 | 加入我们 | 网站地图 | 自助投稿 | 在线举报 | 玩家心声 | 最新咨询 | 游戏音效库 | 游戏试玩体验 | 射击游戏竞技场 |