久久久亚洲精品一区二区三区_精品无码午夜福利理论片_爱豆传媒在线观看视频_国产av综合第一页_精品国产乱码久久久久久鸭王1_广东少妇大战黑人34厘米视频_久久精品人人做人人综合_日韩国产成人无码av毛片_国产成人无码A区精油按摩_欧美一曲二曲三曲的区别小说

首頁 > 新車報道 > 新車報道 > 谷歌這次又“殺瘋了”!200 萬 token 長文本能力問鼎全球最強

谷歌這次又“殺瘋了”!200 萬 token 長文本能力問鼎全球最強

發(fā)布時間:2024-05-20 23:13:46

今天,Google 年度開發(fā)者 I/O 大會 2024 在加利福尼亞州山景城的 Shoreline Amphitheatre 舉行,此次大會以 Alphabet 首席執(zhí)行官桑達爾·皮查伊 (Sundar Pichai) 的主題演講拉開序幕。谷歌此前已經(jīng)明確表示,今年的 I/O 大會將全部圍繞人工智能展開。

 

這次大會上,皮查伊宣布了谷歌內(nèi)部的最新技術(shù)進展,尤其是圍繞 Gemini 所做的所有工作。

狂卷長文本,Gemini 家族迎來重大更新

 

“我們希望每個人都能從 Gemini 所做的事情中受益,”皮查伊說。他還透露了 Gemini 將如何融入谷歌的許多服務(wù)中。人們使用 Google 搜索的方式比以往任何時候都多,關(guān)鍵字搜索的時間甚至更長。

 

大會一開始皮查伊就宣布了 Gemini 系列大模型的更新。首先是 Gemini 1.5 Pro,可提供 100 萬長文本能力,并且已經(jīng)向全球開發(fā)者開放。

 

Gemini 1.5 Pro 是在上個月舉辦的 Google Cloud Next 2024 大會上發(fā)布的,具有原生音頻理解、系統(tǒng)指令、JSON 模式等。

 

Gemini 1.5 Pro 能夠使用視頻計算機視覺來分析圖像(幀)和音頻(語音)的視頻,這使其具有人類水平的視覺感知。使用深度神經(jīng)網(wǎng)絡(luò),Gemini 1.5 可以以超人的精度識別圖像(和視頻幀)中的物體、場景和人物。

 

成本問題一直是大模型開發(fā)的痛中之痛,為了解決這一痛點,谷歌 DeepMind 首席執(zhí)行官 Demis Hassabis 宣布推出 Gemini 1.5 Flash 模型,該模型旨在兼顧快速和成本效益。

 

“Gemini 1.5 Flash 擅長摘要、聊天應(yīng)用程序、圖像和視頻字幕、從長文檔和表格中提取數(shù)據(jù)等,”Google DeepMind 首席執(zhí)行官 Demis Hassabis 此前在博客文章中寫道。 Hassabis 補充說,谷歌創(chuàng)建 Gemini 1.5 Flash 是因為開發(fā)人員需要一個比 Gemini 1.5 Pro 更輕、更便宜的模型。

 

Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之間,是針對開發(fā)者的大模型。盡管比 Gemini Pro 輕,但它的功能同樣強大,谷歌表示這是通過“蒸餾”的方式來實現(xiàn)的,將 Gemini 1.5 Pro 中最重要的知識和技能轉(zhuǎn)移到較小的模型上。這意味著 Gemini 1.5 Flash 將獲得與 Pro 相同的多模式功能,以及其長上下文窗口(AI 模型一次可以攝取的數(shù)據(jù)量),100 萬個 token。

 

最大的更新尚未到來——谷歌宣布今年晚些時候?qū)⒛P偷默F(xiàn)有上下文窗口增加一倍,達到 200 萬個 token。這將使其能夠同時處理 2 小時的視頻、22 小時的音頻、超過 60,000 行代碼或超過 140 萬個單詞。

 

谷歌的 Josh Woodward 詳細介紹了 Gemini 1.5 Pro 和 Flash 的定價。Gemini 1.5 Flash 的價格定為每 100 萬個 token 35 美分,這比 GPT-4o 的每 100 萬個 token 5 美元的價格要便宜得多。

 

值得一提的是,此次大會谷歌重磅宣布推出基于 Gemini 1.5 Pro 的 Gemini Advanced。升級后的 Gemini Advanced 可以處理“多個大型文檔,總計最多 1,500 頁,或匯總 100 封電子郵件”。支持 35 多種語言和 150 多個國家/地區(qū)。而其“即將”推出的功能是能夠“處理一個小時的視頻內(nèi)容或超過 30,000 行的代碼庫”。全球最強長文本能力可謂實至名歸。

 

該公司還正在開發(fā)名為 Project Astra 的通用 AI 代理。大會現(xiàn)場,Demis Hassabis 展示了 Astra 模型,該模型通過智能手機攝像頭分析世界,并與用戶進行對話。 Demis Hassabis 表示,他的團隊“一直希望開發(fā)對日常生活有幫助的通用人工智能代理”。 Project Astra 是這方面進展的結(jié)果。

 

Project Astra 類似一款以取景器作為主界面的應(yīng)用程序。谷歌在演講中展示了一個人拿著手機,將攝像頭對準辦公室的各個地方,并用語言與其交互:“當你看到有東西發(fā)出聲音時,請告訴我。”在這段視頻演示中,Gemini 能識別各種物體甚至代碼,并實時與人類進行語音互動。

 

在視頻中,Astra 的反應(yīng)很快。之所以能實現(xiàn)這一目標,是因為這些“Agent”“旨在通過連續(xù)編碼視頻幀、將視頻和語音輸入組合到事件時間線中,并緩存這些信息以進行有效回憶,從而更快地處理信息。”

新車報道更多>>

iPhone面容解鎖不需要攝像頭:網(wǎng)友實測遮住前攝也能解鎖 小鵬新總部“航站樓”匯天全新展廳首次公開,陸空一體飛行汽車等集體亮相 AI推理性能大提升:華為UCM技術(shù)開源,系統(tǒng)吞吐猛增22倍 個個太有梗!網(wǎng)友在劉強東外賣留言板搞笑“整活”:求職嘮嗑許愿啥都有 英偉達H100剛上天 谷歌立馬官宣:2027年要將TPU送入太空 國首臺!極紫外波段物質(zhì)吸收譜臺式化儀器研制成功 史上最高41層垂直堆疊芯片面世:功耗僅傳統(tǒng)芯片千分之一,為后摩爾定律時代指明新路 更多西門子家電正陸續(xù)接入小米米家,澎湃智聯(lián)、超級小愛都能用 全球最大內(nèi)河萬噸級純電動運輸船下水:2.4萬度電 續(xù)航500公里 任正非的會客廳,成了車圈“急診室” AI瀏覽器,谷歌比OpenAI就差個老板直播帶貨 高德“鷹眼守護”再進化:不開導(dǎo)航也能預(yù)警前方危險 蘋果未來三年產(chǎn)品路線圖曝光:無邊框iPhone、大小折疊機即將登場 小米SU7車主提車一年狂跑21萬公里 直言沒出現(xiàn)任何問題 大眾安徽與眾06大量車主遇“充電難”:充電像開盲盒 全憑運氣 Reddit起訴Perplexity,指控后者未經(jīng)授權(quán)為AI抓取和使用數(shù)據(jù) 明星吐了,購置稅要征了,新能源車懸了? 限時5.88萬元起,東風(fēng)奕派雙車上市:升級主打聽勸 方程豹三次轉(zhuǎn)型的背后:勇敢者的游戲 全新MG4出道即爆,從雙榜單看10萬級純電新標桿 24.99萬起帶激光雷達,傳祺向往M8宗師版上市,零重力座椅也配齊 嵐圖追光L對比現(xiàn)款追光,加長1厘米也叫L?這些配置大改 魏牌高山7售價28.58萬元,帶激光雷達,比陸尚強? 212越野車爬坡翻車 北汽緊急澄清安全與品牌混淆難題待解 破產(chǎn)汽車的“重生”潮“破產(chǎn)者”的真實生命力如何? 阿維塔06新車、高溫與電池安全質(zhì)量的反思與改革 金標大眾與眾07申報曝光 首搭中德聯(lián)合架構(gòu)智能化轉(zhuǎn)型加速 款極氪001內(nèi)飾公布 質(zhì)感和智能化升級能否帶動銷量提升? 全新凌渡L上市即“爆單” 助力凌渡家族9月訂單量達上個月近三倍 全新領(lǐng)克07 EM-P:給“有為青年”的智能混動車