久久久亚洲精品一区二区三区_精品无码午夜福利理论片_爱豆传媒在线观看视频_国产av综合第一页_精品国产乱码久久久久久鸭王1_广东少妇大战黑人34厘米视频_久久精品人人做人人综合_日韩国产成人无码av毛片_国产成人无码A区精油按摩_欧美一曲二曲三曲的区别小说

登錄

注冊

邯鄲雅閣網(wǎng)
2000活躍值=1元

首頁 > 新車測評 > 新車測評 > 驅動增強終端側生成式AI體驗的技術：多模態(tài)生成式AI

驅動增強終端側生成式AI體驗的技術：多模態(tài)生成式AI

發(fā)布時間：2024-05-11 16:37:39

改善情境化和定制化一直是用戶體驗的長期需求。例如，消費者希望終端能夠自動利用來自智能手機數(shù)據(jù)和傳感器的情境信息和自定義偏好，讓體驗更直觀和無縫，比如基于當前位置、時刻和食物選擇偏好推薦餐廳用餐，創(chuàng)造愉悅體驗。

盡管生成式AI已展現(xiàn)出新興的和變革性的能力，但其仍有很大改進空間。類似多模態(tài)生成式AI等這樣的技術可應對生成式AI更加情境化和定制化的體驗趨勢。

驅動增強終端側生成式AI體驗的技術：多模態(tài)生成式AI

多模態(tài)生成式AI模型輸入和輸出多種模態(tài)，以提供更佳響應和答案

多模態(tài)AI模型能夠更好的理解世界

大語言模型(LLM)為純文本訓練模型帶來了驚艷的能力。如果模型能夠支持包含更多知識的不同信息形式，能帶來怎樣的提升呢？

人類能夠通過語言和閱讀文字學到很多東西，但也需要通過各種感官和互動形成對世界的理解：

我們的眼睛讓我們能夠看到球在傾斜地面上滾動的場景，以及當球滾到沙發(fā)后面會如何消失。

我們的耳朵可以識別語音中的情緒或警報聲來源的方向。

我們與世界的接觸和互動讓我們知道如何用手握住泡沫塑料咖啡杯，以及如何在走路時避免摔倒。

類似的例子不勝枚舉。

盡管語言可以描述幾乎所有這些事情，但它可能不如其他模態(tài)做得那么好或那么高效。

正如人類需要利用各種感官學習，生成式AI除了利用文本之外還可以使用更多其他模態(tài)學習：這正是多模態(tài)生成式AI模型的作用所在。

多模態(tài)生成式AI模型可基于一系列模態(tài)進行訓練，包括文本、圖像、語音、音頻、視頻、3D、激光雷達(LIDAR)、射頻(RF)、以及幾乎任何傳感器數(shù)據(jù)。

通過利用所有這些傳感器，融合數(shù)據(jù)，并更全面地理解世界，多模態(tài)生成式AI模型可以提供更佳答案。AI研究人員已經(jīng)做到了這一點，他們利用不同模態(tài)的一系列數(shù)據(jù)在云端訓練多模態(tài)大模型(LMM)，讓模型更“智能”。OpenAIGPT-4V和谷歌Gemini就是這類LMM。

這能給用戶帶來什么？舉例來說，LMM可以充當通用助手，接收任何模態(tài)的輸入，為更廣泛的問題類型提供大幅改進的答案。比如基于復雜的停車標志回答用戶可否停車，或基于振動噪音回答用戶該如何修理洗碗機故障。

下一步，部署LMM進行推理：盡管生成式AI推理可在云端運行，但在邊緣終端側運行有著諸多好處，比如隱私、可靠性、成本效益和即時性。

例如，傳感器和相應的傳感器數(shù)據(jù)來源于邊緣終端，因此在終端側處理和保存數(shù)據(jù)更具成本效益和可擴展性。

終端側LLM現(xiàn)在具備視覺理解能力

高通AI研究近期演示了全球首個在Android手機上運行的多模態(tài)LLM。我們展示了一個超過70億參數(shù)的大語言和視覺助理大模型(LLaVA)，其可接受包括文本和圖像在內(nèi)的多種類型的數(shù)據(jù)輸入，并生成關于圖像的多輪對話。通過全棧AI優(yōu)化，LLaVA能夠在搭載第三代驍龍8移動平臺的參考設計上以實時響應的速度在終端側生成token。

具有語言理解和視覺理解能力的LMM能夠賦能諸多用例，例如識別和討論復雜的視覺圖案、物體和場景。

例如，視覺AI助手可以幫助視力障礙者更好地理解周圍環(huán)境并與之互動，從而提高生活質(zhì)量。

終端側LLM現(xiàn)在具備聽覺理解能力

在搭載驍龍XElite的WindowsPC上，高通近期還展示了全球首個在終端側運行的超70億參數(shù)的LMM，可接受文本和環(huán)境音頻輸入（如音樂、交通環(huán)境音頻等），并基于音頻內(nèi)容生成多輪對話。

音頻提供的更多情境信息可以幫助LMM針對用戶的提示給出更佳答案。我們很高興看到終端側LMM現(xiàn)已支持視覺、語音和音頻模態(tài)，并期待對更多模態(tài)的支持。

驅動增強終端側生成式AI體驗的技術：多模態(tài)生成式AI

生成式AI時代剛剛開始，無限創(chuàng)新即將到來

更多終端側生成式AI技術進步即將到來

打造能夠更好理解情境信息的AI模型是獲得更佳答案和體驗提升的必要條件，多模態(tài)生成式AI正是即將應用于未來終端的最新變革性技術之一。歡迎閱讀博客第二部分，我將深入介紹LoRA，探究它將如何幫助應對現(xiàn)有挑戰(zhàn)，為消費者和企業(yè)規(guī)?；峁┣榫郴⒍ㄖ苹蛡€性化體驗。

【返回列表】

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為“邯鄲雅閣網(wǎng)用戶上傳并發(fā)布"，本平臺僅提供信息存儲服務。

下一篇:斯坦福李飛飛最新對話：AI不會對人類造成“滅絕性危機

上一篇:姚尚坤：未來五到十年，人工智能將是最大的投資機遇

新車測評更多>>

不讀博士，照樣進OpenAI！o1核心成員現(xiàn)身說法了華為FreeClip 2耳夾耳機確認支持Android設備豆包App喚醒小米SU7、YU7下架熔巖橙配色雷軍：很帥但敢買的人太少了深藍S09汽車V5.1.0版本OTA，升級鴻蒙座艙HarmonySpace 5等三星Galaxy S26系列手機配色與存儲規(guī)格曝光銀河航天創(chuàng)始人徐鳴：手機直連衛(wèi)星將引領6G通信革命 AMD CPU份額從1%沖到40% 蘇姿豐回憶來時路：勝利來自3大轉折點周鴻祎：2026年全世界至少會出現(xiàn)100億個智能體百億級公司在AI領域都算小公司減少誤觸：寶馬新專利曝光，給車載觸摸屏加個“防抖條” 中國新型反無人機系統(tǒng)性能受關注：攔截距離可達3000米以上華爾街擔心產(chǎn)能過剩之際臺積電月度報告力證AI沒降溫首臺小米定制SU7 Ultra競速紅交付車主喊話雷軍：好東西自己會說話馬斯克預言更接近現(xiàn)實：特斯拉FSD v14.2已集成部分AI推理能力，有助于路線優(yōu)化、自動泊車等功能決策有米粉把REDMI K80至尊版改名王騰紀念版：本人笑哭消息稱OpenAI大力研發(fā)音頻AI模型，加緊備戰(zhàn)首款硬件設備三大冠軍！比亞迪2025年銷售460萬輛海外年銷量首次突破100萬輛 AI浪潮推高存儲芯片成本，分析師稱未來一年消費電子或漲價兩成固態(tài)電池國標將至，終結“名詞混戰(zhàn)” 滴滴自動駕駛落地阿布扎比，中東成L4出海首站 LG與奔馳高管達成共識：加強下一代汽車零部件合作上海兩款外企大模型通過國家備案高調(diào)喊出“奔馳永遠是奔馳”，段建軍的底氣究竟從何而來廣汽總經(jīng)理交棒，四大引擎驅動“新廣汽”蝶變上汽大眾、上汽奧迪攜新品亮相廣州車展！ Stellantis第三季度凈營收增長13% 奔馳集團Q3利潤大跌70% 保時捷第三季度虧損11億美元零跑汽車否認“一汽成最大股東”傳聞，稱消息不實豐田CEO：暫未因安世半導體危機面臨芯片短缺 DIY大神使用500個一次性電子煙：成功為自己房屋供電！