久久久亚洲精品一区二区三区_精品无码午夜福利理论片_爱豆传媒在线观看视频_国产av综合第一页_精品国产乱码久久久久久鸭王1_广东少妇大战黑人34厘米视频_久久精品人人做人人综合_日韩国产成人无码av毛片_国产成人无码A区精油按摩_欧美一曲二曲三曲的区别小说

首頁 > 新車測評 > 新車測評 > 代碼碾壓一切!OpenAI神秘模型o3-alpha一夜刷屏,卻遭41歲大神絕地反殺

代碼碾壓一切!OpenAI神秘模型o3-alpha一夜刷屏,卻遭41歲大神絕地反殺

發(fā)布時間:2025-07-20 00:59:04

OpenAI的神秘模型o3-alpha意外曝光,其強大的代碼能力碾壓眾多AI。該模型疑似在東京AtCoder世界編程大賽2025中奪得亞軍,最終不敵人類選手Psyho。

OpenAI果然藏了一手。

昨天夜里,一個名為「o3-alpha-responses-2025-07-17」的神秘模型被爆出。

網(wǎng)友們瘋狂測試后,得出一致結(jié)論,這個模型強得離譜。

WebDev Arena網(wǎng)頁的源碼

甚至有網(wǎng)友在實測后,大贊o3-alpha,將它稱為目前「最佳編碼和物理模型」。

每次新模型出來后,小球的碰撞實驗已經(jīng)成為一種「傳統(tǒng)」,這次「o3 Alpha」不僅完美的展示了物理碰撞,并且還能隨時改變小球的大小。

在WebDev Arena上,「o3-alpha-responses-2025-07-17」以「Anonymous-Chatbot」的名稱出現(xiàn)。

根據(jù)網(wǎng)友的猜測,它很有可能是在編碼能力上得到了「史詩級」加強的o3升級版。

畢竟目前在WebDev Arena Leaderboard中,OpenAI只有一款專門編程的GPT-4.1-2025-04-14上榜。

不過,目前想要捕捉到這個匿名模型,需要在競技場中多次嘗試(我們在WebDev Arena多次嘗試未能捕捉到這個匿名模型)。

Peter Gostev在競技場中使用如下提示詞「幸運的」捕捉到了o3-alpha,感興趣的話你也可以試試。

還有網(wǎng)友爆出,OpenAI可能「派出」了這個模型去參加世界最難編程競賽:東京舉行的AtCoder世界巡回賽2025決賽。(需要OpenAI確定)

OpenAI的這個o3-alpha模型最終獲得了第二,第一名是人類Psyho。

雖然o3-alpha可能已經(jīng)被OpenAI下架,但網(wǎng)友們還是保留了豐富的實測案例。

從實測來看,「o3-alpha」在前端代碼能力達到了領(lǐng)先水平——遠勝于Claude Sonnet、o3、Gemini 2.5 Pro。

實測效果驚人

網(wǎng)友Peter Gostev發(fā)現(xiàn)該模型后,使用提示詞「要求模型使用Three.js創(chuàng)建一個程序生成的星球」。

測試后,他很難相信,但是依然認(rèn)為o3-alpha的編碼水平達到一個全新的高度。

以下是完整的測試對比視頻,可以看出o3-alpha的效果整體最好。

OpenAI模型在前端能力方面一直表現(xiàn)平平,Peter表示這次的模型似乎終于在這方面超越了其他所有模型。

有網(wǎng)友用經(jīng)典的「騎自行車的鵜鶘」進行了測試,表示o3 alpha完全打敗了o3 pro。

以下是o3 alpha生成的動畫版的效果,你覺得這個效果如何。

o3-alpha還能一句話就生成的「我的世界」模擬器。

超mini版GTA的復(fù)刻,o3-alpha也能一句話搞定。

還能一鍵生成高度可定制的SVG應(yīng)用。

有網(wǎng)友用o3-alpha造了一個魔方模擬器,甚至可以輸入「魔方算法」來直接操控,確實太強大了。

僅僅靠著文字提示就可以實現(xiàn)。

網(wǎng)友還用o3-alpha創(chuàng)建了一個太空入侵模擬游戲,再次體現(xiàn)了OpenAI這個新模型的前端代碼能力。

網(wǎng)友Mahi用只有2-3個單詞的提示對比了o3-alpha和Gemini 2.5 Pro。

o3-alpha生成的網(wǎng)頁效果要好于Gemini 2.5 Pro。

除了以上神秘的o3-alpha模型和OpenAI派出AI選手參與頂尖編程大賽外。

剛剛發(fā)布的ChatGPT Agent也實力驚人。

OpenAI的研究院Zhiqing Sun,表示ChatGPT Agent通過了ARC-AGI-3的第一關(guān)。

41歲大神擊敗AI

守住人類最后防線

o3-alpha被爆出的時機非常的「巧合」。

因為前兩天在東京舉行的AtCoder世界巡回賽2025決賽中,同樣是OpenAI的一款匿名模型,獲得了第二名。

根據(jù)網(wǎng)友爆料,這個模型很大概率就是o3-alpha。

我們推測OpenAI本來應(yīng)該是打算「一鳴驚人」,但有一個名叫Psyho的人類戲劇性的打敗了AI獲得了第一名。

是的,這位來自波蘭的編程大神——Przemys?aw D?biak(aka Psyho),用一場驚心動魄的勝利告訴世界:人類,還沒輸!

地點是東京,AtCoder世界編程大賽的決賽現(xiàn)場。

空氣中彌漫著緊張的氣息,因為這次的對手非同尋常——一個由OpenAI親自下場派出的AI模型。

在這里,人類和AI選手需要在10小時內(nèi),不斷優(yōu)化墻壁的設(shè)置以及機器人的分組,讓它們能夠在30x30的網(wǎng)格內(nèi)以最少的步數(shù)回家。

從華沙一路飛到東京的「Psyho」,本來就已經(jīng)身心俱疲。

而這場堪稱馬拉松的比賽,更是讓他愈發(fā)感覺自己已經(jīng)瀕臨極限。

「我累到爆炸,真的,有好幾次我都想直接放棄算了,」他回憶道。

三天里,「Psyho」只睡了10個小時。

而他的對手,那個「不知疲倦」的AI,早已能夠在諸如算法實現(xiàn)、代碼優(yōu)化等純粹的工程任務(wù)中,憑借著更快地速度碾壓人類。

不過,這次的比賽,是人類的主場。

原因在于,比賽時間越長,就越考驗從零到一的創(chuàng)造性,AI就會越吃力。

比賽一開始,AI很快就以絕對優(yōu)勢實現(xiàn)領(lǐng)先;

直到第7小時,一步步穩(wěn)扎穩(wěn)打的大神「Psyho」才實現(xiàn)反超,而AI卻陷入了困境;

第8小時,AI突然發(fā)現(xiàn)了一個全新的思路,并一舉超越了「Psyho」——新方法不僅實現(xiàn)了更好的墻體設(shè)計,還帶來了更好的資源調(diào)度;

即將進入倒計時階段,劇情再次反轉(zhuǎn)。「Psyho」靈感乍現(xiàn),對AI完成了絕地反殺!雖然AI還在不斷調(diào)整,但差距卻越來越大。

最終,這個41歲的男人,成功在長達10小時鏖戰(zhàn)的最后關(guān)頭,憑借著血肉之軀和人類獨有的創(chuàng)造力,戰(zhàn)勝了冰冷的機器!

對于這場勝利,奧特曼親自發(fā)文祝賀道:「干得好,Psyho。」

與此同時,OpenAI官方也發(fā)文表示:「我們的模型拿了第二。恭喜冠軍,這次你成功地阻擊了我們!」

更有趣的是,比賽的組織者都驚呆了。

他們坦言:「我們本來就覺得人類會贏,但說實話,我們被AI能拿到第二名給嚇到了!」

他們一針見血地指出:「在代碼優(yōu)化的硬實力上,AI已經(jīng)超越了人類,但它唯獨缺少了人類那神來之筆的創(chuàng)造力。」

沒錯!「Psyho」贏得不靠蠻力,而是靠一個「完全不同的解題思路」。

當(dāng)所有人都和AI在同一條賽道上狂奔時,他另辟蹊徑,找到了AI視野之外的「最優(yōu)解」。

而他用的武器也很簡單,就是最常規(guī)的編程軟件,連AI輔助工具都沒用。

當(dāng)然,這只是一場戰(zhàn)役的勝利,遠非「人·機」大戰(zhàn)的結(jié)束。

從IBM「深藍」到谷歌「AlphaGo」,AI戰(zhàn)勝人類的傳奇早已上演。奧特曼也預(yù)言,AI很快就會在編程競賽中全面超越人類。

但至少在東京的那個不眠之夜,一位名叫「Psyho」的孤膽英雄,為人類贏得了一絲喘息。

 

 

新車測評更多>>

DIY大神使用500個一次性電子煙:成功為自己房屋供電! 何小鵬:人形機器人進工廠不劃算 做家務(wù)不安全 滴滴會員4大升級:V7、V8打不著車可免費遠程調(diào)度 小鵬A868飛行汽車發(fā)布:6座布局續(xù)航500公里,垂直起降無需跑道 大眾宣布自研SoC芯片!未來3至5年量產(chǎn)交付 小鵬汽車2026年將推出三款Robotaxi車型 兩套硬件保證安全 何小鵬:為搞AI“燒掉”20多億,曾“每月花1個多億” 港交所公布2025年第三季度業(yè)績報告:營收77.75億港元 同比增45% 努比亞倪飛談eSIM:是未來但非現(xiàn)在,我們先提升用戶感知強的功能 從17個月內(nèi)股價翻15倍,到兩月內(nèi)跌去30%,泡泡瑪特到底怎么了 NVIDIA H100要上天了!聲稱計算能力強100倍 曹操出行開通境外打車服務(wù),首批覆蓋新加坡、韓國等6國10城 特斯拉因車燈過亮召回6萬多輛Cybertruck 將通過遠程更新修復(fù) OSAT、模擬芯片兩領(lǐng)域巨頭牽手:日月光將收購ADI檳城制造工廠 Omdia:預(yù)計今年全球微短劇收入達110億美元,中國市場獨占83% 美國一公司計劃送鏡子衛(wèi)星到太空:以在夜間“提供陽光”售賣 榮耀率先邁入10000mAh時代:新機明年Q1登場 騰訊:2025上半年端游外掛同比增長超238%創(chuàng)新高,手游外掛增長超162% 零跑CEO朱江明談跨界造車:當(dāng)時無知者無畏 真正跨界的只有我和何小鵬 新款小鵬X9挑戰(zhàn)“世界最危險公路”:連續(xù)極限彎一把過 722km續(xù)航+高通8295芯片 北京現(xiàn)代EO羿歐13-15萬開啟預(yù)售 分別5.88萬/15.99萬起 2026款納米01/2026款eπ008五座版上市 深藍G318對比方程豹鈦7,誰才是用戶出行最優(yōu)選? 8萬級想要大續(xù)航?秋季出行就選悅意03暢享版 孫瑋榮退!寶馬集團稱其“卓越服務(wù)和奉獻” 當(dāng)“向往M8宗師”遇上“八冠王”周鵬:這輛MPV,連籃球明星的腿都服氣! 212 T01柴油版上市售16.59萬元,油耗更低續(xù)航更長 “既要又要還要”的全能MPV! 傳祺向往M8宗師正式上市! 書寫高質(zhì)量發(fā)展新篇章!這家企業(yè)營銷升級 長安汽車9月銷量央企范兒 自主與新能源銷量領(lǐng)跑