巨爆乳肉感一区二区三区视频动漫-67194线路一直接进入骚逼-亚洲精品无码一区二区三区四虎-亚洲国产精品有码-国产精品99无码一区二区视频-免费观看A黄色

Sora涌現(xiàn):OpenAI又一次暴力美學的勝利

訪客 2年前 (2024-02-18) 閱讀數(shù) 293 #區(qū)塊鏈
文章標簽 前沿文章

作者:趙健??

年前的 1 月 27 日,「甲子光年」參加了一場 AI 生成視頻主題的沙龍,會上有一個有趣的互動:AI 視頻生成多快迎來 “Midjourney 時刻”?

選項分別是半年內(nèi)、一年內(nèi)、1-2 年或更長。

昨天,OpenAI 公布了準確答案:20 天。

OpenAI 昨天發(fā)布了全新的 AI 生成視頻模型 Sora,憑借肉眼可見的性能優(yōu)勢與長達 60s 的視頻生成時長,繼文本(GPT-4)和圖像(DALL·E 3)之后,也在視頻生成領(lǐng)域取得了“遙遙領(lǐng)先”。我們距離 AGI(通用人工智能)又近了一步。

值得一提的是,明星 AI 公司 Stability AI 昨天原本發(fā)布了一個新的視頻模型 SVD1.1,但由于與 Sora 撞車,其官方推文已被火速刪除。

AI 視頻生成的領(lǐng)頭羊之一 Runway 的聯(lián)合創(chuàng)始人、CEO Cristóbal Valenzuela 發(fā)推文表示:“比賽開始了(game on)。”

OpenAI 昨天還發(fā)布了一份技術(shù)文檔,但無論從模型架構(gòu)還是訓練方法,都未發(fā)布什么天才級的創(chuàng)新技術(shù),更多是現(xiàn)有技術(shù)路線的優(yōu)化。

但跟一年多以前橫空出世的 ChatGPT 一樣,OpenAI 的秘訣都是屢試不爽的 Scaling Law(縮放定律)——當視頻模型足夠“大”,就會產(chǎn)生智能涌現(xiàn)的能力。

問題在于,大模型訓練的“暴力美學”幾乎已經(jīng)人盡皆知,為什么這次又是 OpenAI ?

1.數(shù)據(jù)的秘密:從 token 到 patch

生成視頻的技術(shù)路線主要經(jīng)歷了四個階段:循環(huán)網(wǎng)絡(luò)(recurrent networks,RNN)、生成對抗網(wǎng)絡(luò)(generative adversarial networks,GAN)、自回歸模型(autoregressive transformers)、擴散模型(diffusion models)。

今天,領(lǐng)先的視頻模型大多數(shù)是擴散模型,比如 Runway、Pika 等。自回歸模型由于更好的多模態(tài)能力與擴展性也成為熱門的研究方向,比如谷歌在 2023 年 12 月發(fā)布的 VideoPoet。

Sora 則是一種新的 diffusion transformer 模型。從名字就可以看出,它融合了擴散模型與自回歸模型的雙重特性。Diffusion transformer 架構(gòu)由加利福尼亞大學伯克利分校的 William Peebles 與紐約大學的 Saining Xie 在 2023 年提出。

如何訓練這種新的模型?在技術(shù)文檔中,OpenAI 提出了一種用 patch(視覺補丁)作為視頻數(shù)據(jù)來訓練視頻模型的方式,這是從大語言模型的 token 汲取的靈感。Token 優(yōu)雅地統(tǒng)一了文本的多種模式——代碼、數(shù)學和各種自然語言,而 patch 則統(tǒng)一了圖像與視頻。

OpenAI 訓練了一個網(wǎng)絡(luò)來降低視覺數(shù)據(jù)的維度。這個網(wǎng)絡(luò)接收原始視頻作為輸入,并輸出一個在時間和空間上都被壓縮的潛在表示(latent representation)。Sora 在這個壓縮的潛在空間上進行訓練,并隨后生成視頻。OpenAI 還訓練了一個相應的解碼器模型,將生成的潛在表示映射回像素空間。

OpenAI 表示,過去的圖像和視頻生成方法通常會將視頻調(diào)整大小、裁剪或修剪為標準尺寸,而這損耗了視頻生成的質(zhì)量,例如分辨率為 256x256 的 4 秒視頻。而將圖片與視頻數(shù)據(jù) patch 化之后,無需對數(shù)據(jù)進行壓縮,就能夠?qū)Σ煌直媛省⒊掷m(xù)時間和長寬比的視頻和圖像的原始數(shù)據(jù)進行訓練。

這種數(shù)據(jù)處理方式為模型訓練帶來了兩個優(yōu)勢:

第一,采樣靈活性。Sora 可以采樣寬屏 1920x1080p 視頻、垂直 1080x1920 視頻以及介于兩者之間的所有視頻,直接以其原生寬高比為不同設(shè)備創(chuàng)建內(nèi)容,并且能夠在以全分辨率生成視頻之前,快速地以較低尺寸制作原型內(nèi)容。這些都使用相同的模型。

第二,改進框架與構(gòu)圖。OpenAI 根據(jù)經(jīng)驗發(fā)現(xiàn),以原始長寬比對視頻進行訓練可以改善構(gòu)圖和取景。比如,常見的將所有訓練視頻裁剪為正方形的模型,有時會生成僅部分可見主體的視頻。相比之下,Sora 的視頻取景有所改善。

在方形作物上訓練的模型(左),Sora 的模型(右)

在語言理解層面,OpenAI 發(fā)現(xiàn),對高度描述性視頻字幕進行訓練可以提高文本保真度以及視頻的整體質(zhì)量。

為此,OpenAI 應用了 DALL·E 3 中引入的“重新字幕技術(shù)”(re-captioning technique)——首先訓練一個高度描述性的字幕生成器模型,然后使用它為訓練數(shù)據(jù)集中的視頻生成文本字幕。

此外,與 DALL·E 3 類似,OpenAI 還利用 GPT 將簡短的用戶提示轉(zhuǎn)換為較長的詳細字幕,然后發(fā)送到視頻模型。這使得 Sora 能夠生成準確遵循用戶提示的高質(zhì)量視頻。

提示詞:a woman wearing blue jeans and a white t-shirt,taking a pleasant stroll in Mumbai India during a colorful festival.

除了文本生成視頻之外,Sora 也支持“圖像生成視頻”與“視頻生成視頻”。

提示詞:In an ornate, historical hall, a massive tidal wave peaks and begins to crash. Two surfers, seizing the moment, skillfully navigate the face of the wave.

此功能使 Sora 能夠執(zhí)行各種圖像和視頻編輯任務,創(chuàng)建完美的循環(huán)視頻、動畫靜態(tài)圖像、及時向前或向后擴展視頻等。

2.計算的秘密:依舊是“暴力美學”

在 Sora 的技術(shù)文檔里,OpenAI 并沒有透露模型的技術(shù)細節(jié)(埃隆·馬斯克曾經(jīng)抨擊 OpenAI 不再像它成立時的初衷一樣“open”),而只是表達了一個核心理念——scale。

OpenAI 在 2020 年首次提出了模型訓練的秘訣——Scaling Law。根據(jù) Scaling Law,模型性能會在大算力、大參數(shù)、大數(shù)據(jù)的基礎(chǔ)上像摩爾定律一樣持續(xù)提升,不僅適用于語言模型,也適用于多模態(tài)模型。

OpenAI 就是遵循這一套“暴力美學”發(fā)現(xiàn)了大語言模型的涌現(xiàn)能力,并最終研發(fā)出劃時代的 ChatGPT 。

Sora 模型也是如此,憑借Scaling Law,它毫無預兆地在 2024 年 2 月就打響了視頻的 “Midjourney 時刻”。

OpenAI 表示,transformer 在各個領(lǐng)域都表現(xiàn)出了卓越的擴展特性,包括語言建模、計算機視覺、圖像生成以及視頻生成。下圖展示了訓練過程中,在相同的樣本下,隨著訓練計算規(guī)模的增加,視頻質(zhì)量顯著提高。

OpenAI 發(fā)現(xiàn),視頻模型在大規(guī)模訓練時表現(xiàn)出許多有趣的新興功能,使 Sora 能夠模擬現(xiàn)實世界中人、動物和環(huán)境的某些方面。這些屬性的出現(xiàn)對 3D、物體等沒有任何明確的歸納偏差——純粹是模型縮放現(xiàn)象。

因此,OpenAI 將視頻生成模型,命名為“世界模擬器”(world simulators),或稱之為“世界模型”——可以理解為讓機器像人類理解世界的方式一樣學習。

英偉達科學家 Jim Fan 如此評價道:“如果您認為 OpenAI Sora 是像 DALL·E 一樣的創(chuàng)意玩具......再想一想。 Sora 是一個數(shù)據(jù)驅(qū)動的物理引擎。它是對許多世界的模擬,無論是真實的還是幻想的。模擬器通過一些去噪和梯度數(shù)學來學習復雜的渲染、‘直觀’物理、長期推理和語義基礎(chǔ)。”

Meta 首席科學家楊立昆(Yann LeCun)曾在 2023 年 6 月提出世界模型的概念。2023 年 12 月,Runway 官宣下場通用世界模型,宣稱要用生成式 AI 來模擬整個世界。

而 OpenAI 僅僅通過早就熟稔于心的 Scaling Law,讓 Sora 具備了世界模型的能力。OpenAI 表示:“我們的結(jié)果表明,擴展視頻生成模型是構(gòu)建物理世界通用模擬器的一條有前途的途徑。”

具體來看,Sora 世界模型有三個特點:

3D 一致性。Sora 可以生成帶有動態(tài)攝像機運動的視頻。隨著攝像機的移動和旋轉(zhuǎn),人和場景元素在三維空間中一致移動。

遠程相關(guān)性和物體持久性。視頻生成系統(tǒng)面臨的一個重大挑戰(zhàn)是在采樣長視頻時保持時間一致性。OpenAI 發(fā)現(xiàn) Sora 通常(盡管并非總是)能夠有效地對短期和長期依賴關(guān)系進行建模。例如,模型可以保留人、動物和物體,即使它們被遮擋或離開框架。同樣,它可以在單個樣本中生成同一角色的多個鏡頭,并在整個視頻中保持其外觀。

與世界互動。Sora 有時可以用簡單的方式模擬影響世界狀況的動作。例如,畫家可以在畫布上留下新的筆觸,并隨著時間的推移而持續(xù)存在。

模擬數(shù)字世界。?Sora 還能夠模擬人工過程——一個例子是視頻游戲。 Sora 可以同時通過基本策略控制《我的世界》中的玩家,同時以高保真度渲染世界及其動態(tài)。這些能力可以通過用提及“我的世界”的標題提示 Sora 來實現(xiàn)零射擊。

不過,跟所有的大模型一樣,Sora 還不是一個完美的模型。OpenAI 承認,Sora 還存在許多局限性,它不能準確地模擬許多基本相互作用的物理過程,例如玻璃破碎。其他交互(例如吃食物)并不總是會產(chǎn)生對象狀態(tài)的正確變化。

3.算力才是核心競爭力?

為什么 OpenAI 能夠依靠“Scaling Law”屢試不爽,其他公司卻沒有呢?

我們或許能找到很多原因,比如對 AGI 的信仰、對技術(shù)的堅持等。但一個現(xiàn)實因素是,Scaling Law 需要高昂的算力支出來支撐,而這正是 OpenAI 比較擅長的。

如此一來,視頻模型的競爭點就有點類似于語言模型,先是拼團隊的工程化調(diào)參能力,拼到最后就是拼算力。

歸根到底,這顯然又是英偉達的機會。在這一輪 AI 熱潮的驅(qū)動下, 英偉達的市值已經(jīng)節(jié)節(jié)攀升,一舉超越了亞馬遜與谷歌。

視頻模型的訓練會比語言模型更加耗費算力。在算力全球緊缺的狀況下,OpenAI 如何解決算力問題?如果結(jié)合此前關(guān)于 OpenAI 的造芯傳聞,似乎一切就順理成章了。

去年起,OpenAI CEO 薩姆·奧爾特曼(Sam Altman)就在與為代號「Tigris」的芯片制造項目籌集 80 億至 100 億美元的資金,希望生產(chǎn)出類似谷歌TPU,能與英偉達競爭的 AI 芯片,來幫助 OpenAI 降低運行和服務成本。

2024 年 1 月,奧爾特曼還曾到訪韓國,會見韓國三星電子和 SK 海力士高管尋求芯片領(lǐng)域的合作。

近期,根據(jù)外媒報道,奧爾特曼正在推動一個旨在提高全球芯片制造能力的項目,并在與包括阿聯(lián)酋政府在內(nèi)的不同投資者進行談判。這一計劃籌集的資金,達到了夸張的 5 萬億~ 7 萬億美元。

OpenAI 發(fā)言人表示:“OpenAI 就增加芯片、能源和數(shù)據(jù)中心的全球基礎(chǔ)設(shè)施和供應鏈進行了富有成效的討論,這對于人工智能和相關(guān)行業(yè)至關(guān)重要。鑒于國家優(yōu)先事項的重要性,我們將繼續(xù)向美國政府通報情況,并期待稍后分享更多細節(jié)。”

英偉達創(chuàng)始人兼 CEO 黃仁勛對此略顯諷刺地回應道:“如果你認為計算機無法發(fā)展得更快,可能會得出這樣的結(jié)論:我們需要 14 顆行星、 3 個星系和 4 個太陽來為這一切提供燃料。但是,計算機架構(gòu)其實在不斷地進步。”

到底是大模型的發(fā)展速度更快,還是算力成本的降低速度更快?它會成為百模大戰(zhàn)的勝負手嗎?

2024 年,答案會逐漸揭曉。

熱門
亚洲AV永久无码精品无码流畅 | 77777_亚洲午夜久久多人| 无码人妻熟妇av又粗又大沈樵 | 一本无码人妻在中文字幕| 屠户家的小娇花哒哒啦爱你| 欧美日韩一区二区在线视频精品| 久久精品久久精品久久39| 国产人成视频在线观看| 成人性生交大片免费看中文| 2020国产精品永久在线| 亚洲午夜无码久久久久软件| 午夜人妻久久久久久久久| 日产精品一卡2卡三卡4乱码| 欧美成人A猛片在线观看| 久久天天躁夜夜躁狠狠躁| 黑料社ZZTT.WIN免费观看| 国产精品JIZZ在线观看| 初尝黑人巨砲波多野结衣| AV日日碰狠狠躁久久躁| 在小巷里被强高HNP| 亚洲国产成AV人天堂无码| 无码GOGO大胆啪啪艺术| 少妇被黑人到高潮喷白浆| 人妻系列无码专区无码中出| 欧美成人看片黄A免费看| 乱码中字在线观看一二区| 久久精品国产99久久久小说| 精品国产AV一区二区三区| 国内精品国产成人国产三级 | 欧美群交在线播放1| 免费120秒体验试看5次| 老外又长又大插的太深了| 久久精品人人爽人人爽| 久久R热这里只有精品| 狠狠躁日日躁夜夜躁2022麻豆 | 久久久久亚洲AV成人无码网站 | 亚洲精品国产V片在线观看| 亚洲AV成人无码深夜高潮| 午夜.DJ高清在线观看免费8| 无套内谢的新婚少妇国语播放| 忘忧草在线播放WWW网| 熟妇人妻无乱码中文字幕| 色欲色AV免费观看| 色哟哟免费精品网站入口| 日本特黄特色AAA大片免费| 老男人吃奶疯狂啃肿奶头| 军人暴力性强迫RAPE| 久久精品国产只有精品66| 九月婷婷亚洲综合成人 | 久久久久成人片免费观看| 狠狠色综合TV久久久久久| 国产成人AⅤ片在线观看| 国产23在线 | 传媒麻豆| 国产边做饭边被躁在线小说| 国产成人猛男69精品视频| 国产成人V在线免播放观看| 公主很忙(N)甜烟| 国产AV激情无码久久| 粗大挺进尤物人妻| 成年午夜免费韩国做受| 成熟丰满熟妇AV无码| 夫妻毛片盗摄国产内射| 国产大学生粉嫩无套流白浆| 国产精品视频免费一区二区| 国产精品无码专区AV在线播放| 国产欧美日韩综合精品一区二区| 国产一卡2卡3卡4卡无卡国色| 韩漫无羞遮无删减漫免费| 黑人巨大无码中文字幕无码| 久久精品国产2020观看福利| 久久伊人色AV天堂九九| 拧花蒂尿用力按凸起喷水尿AV| 欧美黑人一级二级巨大久久天堂| 欧洲另类二三四区| 色悠久久久久综合欧美99| 日韩AV无码中文一区二区三区| 老男人把舌头伸进我下面| 黎朔缠着腰不让他退出微博| 内地CHINA麻豆VIDEOS| 日本丰满熟妇BBXBBXHD| 人妻少妇啊灬啊灬用力啊快| 色一情一乱一伦麻豆| 性色AⅤ一二三天美传媒| 亚洲欧洲日产国码无码AV喷潮| 中文乱码35页在线观看| 暴行JAPANESE人妻| 国产精品久久久久7777按摩| 激情亚洲一区国产精品| 久久亚洲人成网站| 人人妻人人妻人人片色AV| 无码AV蜜臀AⅤ色欲在线观看| 亚洲国产精品一区二区成人片不卡 | 同性男男黄网站在线观看国外| 亚洲AV日韩AV成人AV| 一区二区操逼视频| 把腿张开老子臊烂你| 国产精品无码专区在线观看| 久久久久久精品免费免费4K| 欧美精品视频一区二区| 天天拽天天狠天天透| 亚洲欧美日韩、中文字幕不卡| 91精品人妻一区二区三区蜜蜜挑| 豆国产97在线 | 韩国| 黑人大雞巴XXOO视频| 免费久久99精品国产自在现| 日韩人妻不卡一区二区三区| 亚洲AV无码一区毛片AV| 综合精品欧美日韩国产在线 | 国产精品人成在线播放新网站| 久久精品九九热无码免贵| 人妻少妇-嫩草影院| 无罩大乳的熟妇正在播放| 亚洲国产欧美在线人成长黄瓜| 97色伦图片97综合影院| 国产成人精品免费久久久久| 精品人亚洲成A人片在线观看无码专区 | 亚洲A级成人无码网站| 最新的国产成人精品2022| 国产成年无码AⅤ片在线观看 | 美日韩在线视频一区二区三区| 色综合天天综合网国产成人网| 亚洲精品1卡2卡三卡23卡| GAY男同帅哥网站在线观看| 国产综合久久亚洲综合| 男男腐啪GⅤ小受无套进入| 我朋友的妻子2018| 中文字幕一区二区三区乱码人妻| 国产激情久久久久影院老熟女免费| 老司机午夜精品视频资源| 他将头埋进双腿间吮小核故事| 午夜亚洲国产理论片中文飘花| 在线播放免费人成毛片试看| 国产成人涩涩涩视频在线观看 | 亚洲香蕉一本大道在线| 厨房里的激战2类型| 久久精品无码中文字幕| 全免费A级毛片免费看视频| 亚洲GV天堂无码男同在线观看| 无码视频一区二区三区| 中文字幕AV在线一二三区| 国产午夜成人无码免费看| 破外女出血视频全过程| 亚洲乱码一区二区三区| 高清人人天天夜夜曰狠狠狠狠| 麻豆文化传媒WWW网站入口| 少妇人妻精品一区二区三区| 与上司出轨的人妻| 国产自国产自愉自愉免费24区| 日本XXX色视频在线观看| 亚洲中久无码永久在线观看同| 国产成人一区二区三区免费视频| 男生把自己的手到女生的QQ里| 亚洲AV一二三又爽又色又色| 99久无码中文字幕一本久道| 精品无码一区二区三区水蜜桃| 丝袜AV在线丝袜AV天堂| 99久久免费只有精品国产| 久久99精品国产99久久6尤物| 少妇 黑人 欧美 亚洲| 99热门精品一区二区三区无码| 精品国产一区二区三区不卡| 天堂√中文最新版在线中文| 在线观看片免费人成视频无码| 国产日韩AV在线播放| 色婷婷亚洲十月十月色天| 又硬又大又长又粗又深| 嘿咻嘿咻男女免费专区| 忘忧草在线社区日本WWW| 成人网站国产在线视频内射视频 | 天天爱天天做天天添天天欢| ZOOMSERVO兽狗产品优势| 久久婷婷人人澡人人喊人人爽| 亚洲AV永久无码精品网站| 国产精品涩涩涩视频网站| 日韩精品免费一线在线观看| 696969大但人文艺术来源| 狼人视频国产在线视频WWW色| 亚洲裸男GAY自慰网站| 国产男男Gay做受ⅩXX高潮| 免费A级毛片在线播放不收费| 亚洲丰满少妇自摸| 国产香蕉97碰碰久久人人| 天堂种子在线WWW网| 潮喷大喷水系列无码| 欧美性猛交╳XXX乱大交视频| 与上司出轨的人妻| 久久久久精品一区中文字幕| 亚洲不卡无码永久在线| 国产无套内射普通话对白 | 被老头一个晚上做了6次 | 日本人XXXX裸体XXXX| JEALOUSVUE日本人护士| 久久青草费线频观看| 在公车上露出奶头自慰| 久久伊人精品青青草原APP| 亚洲最大的成人网站| 久久精品国产99精品国产亚洲性| 亚洲熟妇V一区二区三区色堂| 久久99国产精品久久99| 亚洲日韩乱码中文无码蜜桃|