珠海天佑有害生物防治有限公司

珠海天佑有害生物防治有限公司

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

202412月25日

Sora强敌!Meta最强千里浸式AI媒体模子来了

发布日期:2024-12-25 11:00    点击次数:83

  来源:硬AI

  OpenAI的Sora迎来强敌,Meta推出堪称开首进的媒体基础模子Movie Gen。

  Meta称,Movie Gen是公司“针对媒体的冲突性生成式AI辩论”,它囊括了图像、视频和音频等模态,用户只需输入文本,就不错制作自界说的视频和声息、剪辑现存视频,以及将个东谈主图像调整为独到的视频。Movie Gen推论这些任务的表当今东谈主类评估中由于业内近似模子。

  Meta先容,Movie Gen是“开首进、千里浸式效果最好的故事敷陈模子套件”,综合了公司第一波生成式AI媒体辩论的Make-A-Scene 系列模子,即可创建图像、音频、视频和 3D 动画的模子,以及跟着扩散模子出现而针对Llama Image 基础模子进行的第二波辩论模子,即可收场更高质料图像和视频生成以及图像剪辑的模子。

  文生视频最长16秒 130亿参数音频生成模子 东谈主工评测视频生成对Sora净胜率8.2

  Meta详细,Movie Gen 具有四种功能:视频生成、个性化视频生成、精确视频剪辑、音频生成。

  关于视频生成,Meta先容,用户惟有提供一个文本的指示词,Movie Gen就不错应用针对文本转图像和文本转视频进行了优化的联接模子,创建高清的高质料图像和视频。Movie Gen的视频模子有300亿参数,这个调整模子能以每秒16帧的速率生成最长16秒的视频。

  Meta称,发现这些模子不错推理物体的剖释、拍摄主体与物体之间的相互作用,以及相机的剖释,况且不错学习各式意见了解有哪些合理的剖释,因此,它们成为同类中开首进的模子。在先容该功能时,Meta展示了多个10秒长度的视频短片,包括一只像萌翻荟萃的弹跳猪“Moo Deng”那样的小河马游来游去。

  华尔街见闻珍摄到,单从生成视频的最大长度看,Movie Gen还不敌本年2月OpenAI发布的Sora。Sora令业界震荡的小数是,不错创建长达60秒的文生视频,。不外,比较Meta客岁11月官宣的视频模子Emu Video,Movie Gen如实突出不小。Emu Video只不错每秒16帧的速率生成最长4秒的视频。

  除了胜利文生视频,Movie Gen还有出色的个性化视频制作智商。Meta先容,其扩张了前述基础模子,复古生成个性化视频。用户不错提供某个东谈主的图像,配合文本的指示词,让Move Gen生成的视频包含参考图像中的东谈主物,以及合适文本指示的视觉细节。Meta称,在创建保留东谈主类身份和看成的个性化视频方面,其模子得回了开首进的效果。

  Meta展示的一个视频傲气,用户不错提供一个女孩的相片,输入笔墨“又名身穿粉色马甲的女DJ播放唱片,她身旁有一只猎豹”,然后就生成了以相片中女孩形象的DJ打碟,以及一只猎豹跟随。

  在精确视频剪辑方面,Meta称,Movie Gen采纳了并吞基础模子的剪辑变体模子,在用户输入视频和文本指示词后,精确推论任务,生成所需的输出。它将视频生成与高等图像剪辑相结合,推论局部剪辑,举例添加、删除或替换元素,以及诸如配景或方式修改的全局改动。与需要专科手段或穷乏生成精确度的传统器具不同,Movie Gen 保留了原始履行,仅针对有关像素剪辑。

  Meta提供的示例之一是,用户输入,让企鹅穿上有英国女王维多利亚在位期间衣饰作风的服装,Movie Gen生成的企鹅穿上了带蕾丝的红色女裙。

  关于音频生成,Meta称,历练了一个130亿参数的音频生成模子,该模子不错接受视频和可选的文本指示词,生成长达 45 秒的高质料高保真音频,包括环境音、拟声息效(Foley)和乐器配景音乐,通盘这些都与视频履行同步。此外,Meta引入了一种音频扩张技能,不错为任性长度的视频生成连贯的音频,在音频质料、视频到音频对都和文本到音频对都方面总体上收场了开首进的性能。

  Meta提供的一个例子是,生成在吉他音乐的伴奏下,全地形车(ATV)引擎轰鸣加快的声息,还有一个例子是,管弦乐声中有树叶沙沙作响和树枝撅断的声息。

  Meta还展示了针对以上四种智商进行的A/B对比测试东谈主工评估放置,下图傲气的净赶巧胜率代表,比较Sora等竞品模子,东谈主类评估者更深爱Movie Gen模子生成的放置。在胜利生成视频这个功能方面,Movie Gen比较Sora的净胜率达到8.2。

  基于授权和公开可用数据历练 未明确何时发布 扎克伯格称来岁上线Instagram

  Movie Gen 是基于哪些信息进行历练的?Meta 的声明莫得阐发具体细节,仅仅说:“咱们基于授权和公开可用的数据集对这些模子进行了历练。”

  有挑剔指出,对生成式 AI 器具而言,历练数据的来源以及从网上握取哪些数据合理仍然是有争议的问题,而且公众很少知谈使用哪些文本、视频或音频片断创建了任何大模子。

  还有挑剔称,Meta说历练用的数据集是“专有/交易明锐”的,未提供细节,那么只可揣度,数据包括好多Instagram 和 Facebook 平台的视频,加上一些Meta配结伙伴的履行,以过火他好多未得到充分保护的履行、也等于所谓的“公开可用”履行。

  关于发布期间,Meta本周五并未明确Movie Gen何时面向众人推出,仅仅豪爽地说“可能改日发布”。本年2月OpenAI官宣Sora后迄今还未实在向公众敞开使用,也并未显露任何算计将要发布的日历。

  不外,Meta CEO扎克伯格称,Movie Gen来岁会上线Meta旗下的外交媒体Instagram。他在个东谈主Instagram账号发布了一段Movie Gen生成的视频,傲气他在用腿部推举机,跟着他运行熟悉,配景发生了变化。先是傲气,他在一家霓虹灯映照的改日作风健身房熟悉,然后变为,他衣着角斗士盔甲熟悉,接着变为他股东一台毁灭的纯金机器,终末变为,他用腿部推举一盒鸡块,周围是一派薯条。

  扎克伯格配上笔墨称,Meta新的 Movie Gen AI 模子不错制作和剪辑视频,每天都是真金不怕火腿的日子。该模子将于来岁登陆 Instagram。

  在外交媒体X,Meta官宣并演示Movie Gen的帖子底下,一些点赞高的挑剔傲气,网友依然在催促Meta负责发布该模子,有网友问,不知谈公共有莫得契机来试试它。

  风险指示及免责要求

  市集有风险,投资需严慎。本文不组成个东谈主投资暴戾,也未筹议到个别用户非凡的投资宗旨、财务现象或需要。用户应试虑本文中的任何意见、不雅点或论断是否合适其特定现象。据此投资,包袱自夸。

海量资讯、精确解读,尽在新浪财经APP

包袱剪辑:王许宁



TOP

Powered by 珠海天佑有害生物防治有限公司 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群系统 © 2013-2021 365建站器 版权所有