北京時(shí)間8月7日,據(jù)科技網(wǎng)站The Verge報(bào)道,OpenAI周三發(fā)布預(yù)告,將于本周四發(fā)布一項(xiàng)重大消息。根據(jù)OpenAI的明顯暗示,期待已久的GPT-5大模型即將亮相。
OpenAI在X上稱,將在美國(guó)太平洋時(shí)間周四10點(diǎn)(北京時(shí)間周五1點(diǎn))舉行一場(chǎng)直播活動(dòng)。該公司在預(yù)告中把直播一詞livestream中的s換成了5,很可能在暗示將發(fā)布GPT-5模型。

OpenAI的預(yù)告
最近的一些跡象表明,GPT-5發(fā)布在即。上周日,OpenAI CEO山姆·奧特曼(Sam Altman)發(fā)布了一張截圖,左上角標(biāo)有“ChatGPT 5”的字樣。而在周一,該公司應(yīng)用研究主管也發(fā)文稱,他“很期待公眾會(huì)如何看待GPT-5”。此外,奧特曼在上個(gè)月就曾表示,OpenAI計(jì)劃“很快”發(fā)布GPT-5。
The Verge記者上個(gè)月報(bào)道稱,OpenAI計(jì)劃在8月初推出GPT-5。
提升沒那么大
不過,兩位GPT-5早期測(cè)試者表示,他們對(duì)于該模型在編程以及解決科學(xué)和數(shù)學(xué)問題方面的能力印象深刻,但他們認(rèn)為,GPT-4到GPT-5的提升幅度,并不像GPT-3到GPT-4那樣大。
GPT-4的飛躍主要得益于更強(qiáng)的算力和更多的數(shù)據(jù)。OpenAI曾希望通過類似的“擴(kuò)展”方式,持續(xù)推動(dòng)AI模型性能的提升。
然而,OpenAI在擴(kuò)展過程中遇到了一些問題,其中一個(gè)障礙就是數(shù)據(jù)瓶頸。OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)去年曾指出,盡管算力持續(xù)增長(zhǎng),但可用的數(shù)據(jù)量卻并未同步增長(zhǎng)。
蘇茨克維指的是,大語言模型依賴于抓取整個(gè)互聯(lián)網(wǎng)的海量數(shù)據(jù)進(jìn)行訓(xùn)練,而AI實(shí)驗(yàn)室目前沒有其他途徑獲取如此龐大的人類生成文本數(shù)據(jù)。
除了數(shù)據(jù)匱乏的問題外,另一個(gè)挑戰(zhàn)在于:由于系統(tǒng)極其復(fù)雜,大模型的訓(xùn)練過程更容易受硬件故障影響。更棘手的是,研究人員往往需要耗時(shí)數(shù)月完成整個(gè)訓(xùn)練流程后,才能最終評(píng)估模型的性能表現(xiàn)。