衡宇 發自 凹非寺
量子位 | 公眾號 QbitAI
終於有OpenAI之外的人,放出自己親測的Sora視頻了!
請看第一個視頻,來自油管科技up主:
![](https://www.ch-news.com/wp-content/uploads/2024/03/cf0bcb03430d457bb9a920bb1223ef31.jpg)
它的prompt是,「光線昏暗的辦公室里,一台3D打印機正在打印一個紅色小立方體,延時拍攝,特寫」。
顯然,如視頻所示,Sora並不理解3D打印機的工作原理。
![](https://www.ch-news.com/wp-content/uploads/2024/03/46a4cbf99ced4de4ae1b3fba3e7520b7.jpg)
但「光線昏暗」「3D打印機」「紅色立方體」「特寫」之類的關鍵詞,它捕捉得又是那麼恰如其分。
以至於有網友替Sora喊冤:
我的打印機已經發生過很多次這樣的故障了!它就卡在半空中,啥也打印不了——跟視頻中的效果一樣一樣的。
![](https://www.ch-news.com/wp-content/uploads/2024/03/6bd768a7a928407bbfec07bf246542ba.jpg)
從效果和網友的反饋來看,Sora在特邀測評人員手中,有那麼一點翻車,但翻得不多。
但相比之下更令人崩潰的是另一個華點:
我的天爺啊,up主,也就是說你有機會實測讓Sora畫威爾·史密斯吃麵,但你居然沒有?
你!居!然!沒!有!???
![](https://www.ch-news.com/wp-content/uploads/2024/03/2f99786d5b4b41be93d5725527a68f57.jpg)
翻車了,但如翻
除了上面小翻車的3D打印視頻外,這位油管up主還公開了另外兩段視頻。
第一段:
一隻中等體型、看上去很友善的小狗狗走過工業停車場。環境多霧、多雲。採用35mm膠片拍攝,色彩鮮艷。
![](https://www.ch-news.com/wp-content/uploads/2024/03/3e2309e0ddbb4a86b2400bb21e4695ec.jpg)
乍一看,很不錯。
但仔細觀察可以看到,視頻第2秒狗子前腿邁出時,兩條前腿交錯,出現了bug。
![](https://www.ch-news.com/wp-content/uploads/2024/03/6198fec6e7ab4b43b6aafead0290f250.gif)
火眼金睛的網友們還發現,位於畫面右側的卡車,也隱隱約約有些不對勁。
![](https://www.ch-news.com/wp-content/uploads/2024/03/f514ac1fe1c24495b85dcc4781bc18e8.jpg)
該up主同時分享了他在這段Sora作品中學到的筆記。
Sora可能會在物理方面遇到困難,特別是在腿/行走方面。在Sora生成的走路視頻中,雙腿經常交叉和相互融合。
此外,作為背景的品牌、商品等,並不會和現實生活完全符合。比如汽車、相機等,沒有辦法完全識別為特定的型號。
再來看這名up主放出的另一段Sora視頻。
它的prompt是:
一位年輕的專業產品評測員在光線充足的視頻工作室中坐着,他面前有一台帶兩個顯示屏的電腦,周圍有些科技小玩意。他手裡拿着電影攝像機,正思考下一步該製作什麼視頻。視頻焦點在他身上,而背景略微模糊,電影效果。
![](https://www.ch-news.com/wp-content/uploads/2024/03/62255d94ba634d1e85b8b1e35f5c94bb.jpg)
生成這段視頻後,up主本人忍不住感慨:
天啊,有幾個瞬間打光,是真的好!
他在推文中寫道:「在這段Sora產品中,幾乎可以感受到鏡頭左側外架着一個大型的藍幕或綠幕鍵控器。總體而言,視頻的燈光和陰影匹配得非常好……但是他有6根手指哈哈哈。」
他、有、六、根、手、指。
![](https://www.ch-news.com/wp-content/uploads/2024/03/3c42fed8aba64d3f92c1db730a9a87ca.jpg)
因為這個bug,這段視頻被網友調侃般起了個標題,叫《這麼近,那麼遠》。
嘴毒的網友還不忘借這段Sora視頻陰陽怪氣那誰家:
Well,視頻主角居然是個白人,那我保證這段視頻跟Gemini沒有半毛錢關系。
![](https://www.ch-news.com/wp-content/uploads/2024/03/ee03c45d97c64572a0b22de47c3b4260.jpg)
Sora還能生成圖片
除了少見的外人親測Sora視頻放出外,Sora自己也在TikTok上更新了一條毛毛蟲羽化成蝶的視頻。
![](https://www.ch-news.com/wp-content/uploads/2024/03/b309d2934c41402a9eaa4b96e7765222.jpg)
說時遲那時快,在視頻第8秒,毛毛蟲似乎是被風一吹就變成了蝴蝶,過渡得非常絲滑。
OpenAI稱,「該視頻由我們的文本轉視頻模型Sora生成,未經修改。」
有個網友在評論區感嘆道,我們人類就像毛毛蟲一樣,通過技術的快速變革變成了蝴蝶,成為一個全新的物種。
![](https://www.ch-news.com/wp-content/uploads/2024/03/e43c72d4d9e54b1ca8c1794da442b570.jpg)
更有意思的是,除了上新Sora視頻,OpenAI還在TikTok上發布了Sora的其他新產物:
圖片。
此前,Sora就在注冊商標時暴露了自己的完整能力,那就是不僅可以用於生成視頻,還能用於生成圖像。
![](https://www.ch-news.com/wp-content/uploads/2024/03/f6c099f20fad4c4dabefe4e67bff2010.jpg)
OpenAI備注說明,Sora雖然是個視頻模型,但同時能生成各種尺寸的圖像,分辨率高達2048x2048。
共有4張圖片由Sora生成,未經修改。
量子位順手把英文提示詞原封不動丟給了DALLE-3,僅進行單次生成,同樣未經修改。
以下是OpenAI旗下Sora和DALLE-3進行AI繪畫的對比效果展示。
圖片1:
秋天的女性特寫肖像,極致細節,淺景深。
![](https://www.ch-news.com/wp-content/uploads/2024/03/2cd308c8022841e8a0df54b9bdd2d556.jpg)
圖片2:
充滿活力的珊瑚礁,充滿色彩繽紛的魚類和海洋生物。
![](https://www.ch-news.com/wp-content/uploads/2024/03/5e29104439804fa1b4f7e956432340f2.jpg)
圖片3:
蘋果樹下小老虎,數字藝術,採用啞光繪畫風格,細節華麗。
![](https://www.ch-news.com/wp-content/uploads/2024/03/e4da903766bd4e528d58540a9e06f6fa.jpg)
圖片4,雪山村莊,有舒適的小屋,有北極光,高細節和逼真的單反相機,50mm f/1.2。
![](https://www.ch-news.com/wp-content/uploads/2024/03/b179eee10dbe4b7b95ebcadf23ed655f.jpg)
好了,今天的問題來了:
如果Sora畫圖也很棒棒的話,Sora是否應該取代DALLE-3呢?
問你話呢,OpenAI(狗頭)。
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態