久久久亚洲精品一区二区三区_精品无码午夜福利理论片_爱豆传媒在线观看视频_国产av综合第一页_精品国产乱码久久久久久鸭王1_广东少妇大战黑人34厘米视频_久久精品人人做人人综合_日韩国产成人无码av毛片_国产成人无码A区精油按摩_欧美一曲二曲三曲的区别小说

首頁 > 新車測評 > 新車測評 > 驅(qū)動增強終端側(cè)生成式AI體驗的技術(shù):多模態(tài)生成式AI

驅(qū)動增強終端側(cè)生成式AI體驗的技術(shù):多模態(tài)生成式AI

發(fā)布時間:2024-05-11 16:37:39

改善情境化和定制化一直是用戶體驗的長期需求。例如,消費者希望終端能夠自動利用來自智能手機數(shù)據(jù)和傳感器的情境信息和自定義偏好,讓體驗更直觀和無縫,比如基于當(dāng)前位置、時刻和食物選擇偏好推薦餐廳用餐,創(chuàng)造愉悅體驗。

盡管生成式AI已展現(xiàn)出新興的和變革性的能力,但其仍有很大改進(jìn)空間。類似多模態(tài)生成式AI等這樣的技術(shù)可應(yīng)對生成式AI更加情境化和定制化的體驗趨勢。

多模態(tài)生成式AI模型輸入和輸出多種模態(tài),以提供更佳響應(yīng)和答案

多模態(tài)AI模型能夠更好的理解世界

大語言模型(LLM)為純文本訓(xùn)練模型帶來了驚艷的能力。如果模型能夠支持包含更多知識的不同信息形式,能帶來怎樣的提升呢?

人類能夠通過語言和閱讀文字學(xué)到很多東西,但也需要通過各種感官和互動形成對世界的理解:

我們的眼睛讓我們能夠看到球在傾斜地面上滾動的場景,以及當(dāng)球滾到沙發(fā)后面會如何消失。

我們的耳朵可以識別語音中的情緒或警報聲來源的方向。

我們與世界的接觸和互動讓我們知道如何用手握住泡沫塑料咖啡杯,以及如何在走路時避免摔倒。

類似的例子不勝枚舉。

盡管語言可以描述幾乎所有這些事情,但它可能不如其他模態(tài)做得那么好或那么高效。

正如人類需要利用各種感官學(xué)習(xí),生成式AI除了利用文本之外還可以使用更多其他模態(tài)學(xué)習(xí):這正是多模態(tài)生成式AI模型的作用所在。

多模態(tài)生成式AI模型可基于一系列模態(tài)進(jìn)行訓(xùn)練,包括文本、圖像、語音、音頻、視頻、3D、激光雷達(dá)(LIDAR)、射頻(RF)、以及幾乎任何傳感器數(shù)據(jù)。

通過利用所有這些傳感器,融合數(shù)據(jù),并更全面地理解世界,多模態(tài)生成式AI模型可以提供更佳答案。AI研究人員已經(jīng)做到了這一點,他們利用不同模態(tài)的一系列數(shù)據(jù)在云端訓(xùn)練多模態(tài)大模型(LMM),讓模型更“智能”。OpenAIGPT-4V和谷歌Gemini就是這類LMM。

這能給用戶帶來什么?舉例來說,LMM可以充當(dāng)通用助手,接收任何模態(tài)的輸入,為更廣泛的問題類型提供大幅改進(jìn)的答案。比如基于復(fù)雜的停車標(biāo)志回答用戶可否停車,或基于振動噪音回答用戶該如何修理洗碗機故障。

下一步,部署LMM進(jìn)行推理:盡管生成式AI推理可在云端運行,但在邊緣終端側(cè)運行有著諸多好處,比如隱私、可靠性、成本效益和即時性。

例如,傳感器和相應(yīng)的傳感器數(shù)據(jù)來源于邊緣終端,因此在終端側(cè)處理和保存數(shù)據(jù)更具成本效益和可擴展性。

終端側(cè)LLM現(xiàn)在具備視覺理解能力

高通AI研究近期演示了全球首個在Android手機上運行的多模態(tài)LLM。我們展示了一個超過70億參數(shù)的大語言和視覺助理大模型(LLaVA),其可接受包括文本和圖像在內(nèi)的多種類型的數(shù)據(jù)輸入,并生成關(guān)于圖像的多輪對話。通過全棧AI優(yōu)化,LLaVA能夠在搭載第三代驍龍8移動平臺的參考設(shè)計上以實時響應(yīng)的速度在終端側(cè)生成token。

具有語言理解和視覺理解能力的LMM能夠賦能諸多用例,例如識別和討論復(fù)雜的視覺圖案、物體和場景。

例如,視覺AI助手可以幫助視力障礙者更好地理解周圍環(huán)境并與之互動,從而提高生活質(zhì)量。

終端側(cè)LLM現(xiàn)在具備聽覺理解能力

在搭載驍龍XElite的WindowsPC上,高通近期還展示了全球首個在終端側(cè)運行的超70億參數(shù)的LMM,可接受文本和環(huán)境音頻輸入(如音樂、交通環(huán)境音頻等),并基于音頻內(nèi)容生成多輪對話。

音頻提供的更多情境信息可以幫助LMM針對用戶的提示給出更佳答案。我們很高興看到終端側(cè)LMM現(xiàn)已支持視覺、語音和音頻模態(tài),并期待對更多模態(tài)的支持。

生成式AI時代剛剛開始,無限創(chuàng)新即將到來

更多終端側(cè)生成式AI技術(shù)進(jìn)步即將到來

打造能夠更好理解情境信息的AI模型是獲得更佳答案和體驗提升的必要條件,多模態(tài)生成式AI正是即將應(yīng)用于未來終端的最新變革性技術(shù)之一。歡迎閱讀博客第二部分,我將深入介紹LoRA,探究它將如何幫助應(yīng)對現(xiàn)有挑戰(zhàn),為消費者和企業(yè)規(guī)模化提供情境化、定制化和個性化體驗。

新車測評更多>>

DIY大神使用500個一次性電子煙:成功為自己房屋供電! 何小鵬:人形機器人進(jìn)工廠不劃算 做家務(wù)不安全 滴滴會員4大升級:V7、V8打不著車可免費遠(yuǎn)程調(diào)度 小鵬A868飛行汽車發(fā)布:6座布局續(xù)航500公里,垂直起降無需跑道 大眾宣布自研SoC芯片!未來3至5年量產(chǎn)交付 小鵬汽車2026年將推出三款Robotaxi車型 兩套硬件保證安全 何小鵬:為搞AI“燒掉”20多億,曾“每月花1個多億” 港交所公布2025年第三季度業(yè)績報告:營收77.75億港元 同比增45% 努比亞倪飛談eSIM:是未來但非現(xiàn)在,我們先提升用戶感知強的功能 從17個月內(nèi)股價翻15倍,到兩月內(nèi)跌去30%,泡泡瑪特到底怎么了 NVIDIA H100要上天了!聲稱計算能力強100倍 曹操出行開通境外打車服務(wù),首批覆蓋新加坡、韓國等6國10城 特斯拉因車燈過亮召回6萬多輛Cybertruck 將通過遠(yuǎn)程更新修復(fù) OSAT、模擬芯片兩領(lǐng)域巨頭牽手:日月光將收購ADI檳城制造工廠 Omdia:預(yù)計今年全球微短劇收入達(dá)110億美元,中國市場獨占83% 美國一公司計劃送鏡子衛(wèi)星到太空:以在夜間“提供陽光”售賣 榮耀率先邁入10000mAh時代:新機明年Q1登場 騰訊:2025上半年端游外掛同比增長超238%創(chuàng)新高,手游外掛增長超162% 零跑CEO朱江明談跨界造車:當(dāng)時無知者無畏 真正跨界的只有我和何小鵬 新款小鵬X9挑戰(zhàn)“世界最危險公路”:連續(xù)極限彎一把過 722km續(xù)航+高通8295芯片 北京現(xiàn)代EO羿歐13-15萬開啟預(yù)售 分別5.88萬/15.99萬起 2026款納米01/2026款eπ008五座版上市 深藍(lán)G318對比方程豹鈦7,誰才是用戶出行最優(yōu)選? 8萬級想要大續(xù)航?秋季出行就選悅意03暢享版 孫瑋榮退!寶馬集團稱其“卓越服務(wù)和奉獻(xiàn)” 當(dāng)“向往M8宗師”遇上“八冠王”周鵬:這輛MPV,連籃球明星的腿都服氣! 212 T01柴油版上市售16.59萬元,油耗更低續(xù)航更長 “既要又要還要”的全能MPV! 傳祺向往M8宗師正式上市! 書寫高質(zhì)量發(fā)展新篇章!這家企業(yè)營銷升級 長安汽車9月銷量央企范兒 自主與新能源銷量領(lǐng)跑