Sora外部測試翻車了!3個視頻都有Bug

2024年3月3日 13点热度 0人点赞

衡宇 發自 凹非寺

量子位 | 公眾號 QbitAI

終於有OpenAI之外的人,放出自己親測的Sora視頻了!

請看第一個視頻,來自油管科技up主:

它的prompt是,「光線昏暗的辦公室里,一台3D打印機正在打印一個紅色小立方體,延時拍攝,特寫」。

顯然,如視頻所示,Sora並不理解3D打印機的工作原理。

但「光線昏暗」「3D打印機」「紅色立方體」「特寫」之類的關鍵詞,它捕捉得又是那麼恰如其分。

以至於有網友替Sora喊冤:

我的打印機已經發生過很多次這樣的故障了!它就卡在半空中,啥也打印不了——跟視頻中的效果一樣一樣的。

從效果和網友的反饋來看,Sora在特邀測評人員手中,有那麼一點翻車,但翻得不多。

但相比之下更令人崩潰的是另一個華點:

我的天爺啊,up主,也就是說你有機會實測讓Sora畫威爾·史密斯吃麵,但你居然沒有?
你!居!然!沒!有!???

翻車了,但如翻

除了上面小翻車的3D打印視頻外,這位油管up主還公開了另外兩段視頻。

第一段:

一隻中等體型、看上去很友善的小狗狗走過工業停車場。環境多霧、多雲。採用35mm膠片拍攝,色彩鮮艷。

乍一看,很不錯。

但仔細觀察可以看到,視頻第2秒狗子前腿邁出時,兩條前腿交錯,出現了bug。

火眼金睛的網友們還發現,位於畫面右側的卡車,也隱隱約約有些不對勁。

該up主同時分享了他在這段Sora作品中學到的筆記。

Sora可能會在物理方面遇到困難,特別是在腿/行走方面。在Sora生成的走路視頻中,雙腿經常交叉和相互融合。
此外,作為背景的品牌、商品等,並不會和現實生活完全符合。比如汽車、相機等,沒有辦法完全識別為特定的型號。

再來看這名up主放出的另一段Sora視頻。

它的prompt是:

一位年輕的專業產品評測員在光線充足的視頻工作室中坐着,他面前有一台帶兩個顯示屏的電腦,周圍有些科技小玩意。他手裡拿着電影攝像機,正思考下一步該製作什麼視頻。視頻焦點在他身上,而背景略微模糊,電影效果。

生成這段視頻後,up主本人忍不住感慨:

天啊,有幾個瞬間打光,是真的好!

他在推文中寫道:「在這段Sora產品中,幾乎可以感受到鏡頭左側外架着一個大型的藍幕或綠幕鍵控器。總體而言,視頻的燈光和陰影匹配得非常好……但是他有6根手指哈哈哈。」

他、有、六、根、手、指。

因為這個bug,這段視頻被網友調侃般起了個標題,叫《這麼近,那麼遠》。

嘴毒的網友還不忘借這段Sora視頻陰陽怪氣那誰家:

Well,視頻主角居然是個白人,那我保證這段視頻跟Gemini沒有半毛錢關系。

Sora還能生成圖片

除了少見的外人親測Sora視頻放出外,Sora自己也在TikTok上更新了一條毛毛蟲羽化成蝶的視頻。

說時遲那時快,在視頻第8秒,毛毛蟲似乎是被風一吹就變成了蝴蝶,過渡得非常絲滑。

OpenAI稱,「該視頻由我們的文本轉視頻模型Sora生成,未經修改。」

有個網友在評論區感嘆道,我們人類就像毛毛蟲一樣,通過技術的快速變革變成了蝴蝶,成為一個全新的物種

更有意思的是,除了上新Sora視頻,OpenAI還在TikTok上發布了Sora的其他新產物:

圖片

此前,Sora就在注冊商標時暴露了自己的完整能力,那就是不僅可以用於生成視頻,還能用於生成圖像。

OpenAI備注說明,Sora雖然是個視頻模型,但同時能生成各種尺寸的圖像,分辨率高達2048x2048

共有4張圖片由Sora生成,未經修改。

量子位順手把英文提示詞原封不動丟給了DALLE-3,僅進行單次生成,同樣未經修改。

以下是OpenAI旗下Sora和DALLE-3進行AI繪畫的對比效果展示。

圖片1:

秋天的女性特寫肖像,極致細節,淺景深。

圖片2:

充滿活力的珊瑚礁,充滿色彩繽紛的魚類和海洋生物。

圖片3:

蘋果樹下小老虎,數字藝術,採用啞光繪畫風格,細節華麗。

圖片4,雪山村莊,有舒適的小屋,有北極光,高細節和逼真的單反相機,50mm f/1.2。

好了,今天的問題來了:

如果Sora畫圖也很棒棒的話,Sora是否應該取代DALLE-3呢?

問你話呢,OpenAI(狗頭)

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態