免費(fèi)谘詢熱線
13621929115過去短(duǎn)短不到一年裏,ChatGPT、GPT-4 的相繼麵(miàn)世,不(bú)斷刷新人們對 AI 的認知新技術帶(dài)來(lái)變革,也引發了外界對 AI 是(shì)否會取(qǔ)代人的討(tǎo)論(lùn),OpenAI 首席執行官 Sam Altman 也公開表示,對人工智(zhì)能技術的強大能力有些擔憂。
近日(rì),倫敦大(dà)學學院(UCL)計算機係教授汪軍在接受 AI 科工業模(mó)型技評論采訪時坦言,雖然 ChatGPT 的(de)語言能力、對話能力很強,但其(qí)並無法(fǎ)進行係統性決策,例如機器控製、群體協作、動(dòng)態調(diào)度等,而這些是 AI 技(jì)術浪潮中更具革命性的部分。
汪軍,倫敦大學(xué)學院(yuàn)(UCL)計算機係教授,阿蘭 · 圖靈研究所 Turing Fellow其主要研究智能信息係統,包括機器學(xué)習、工業模型強化學習、多智能體(tǐ),數據挖掘、計算廣告學、推薦係統等;穀(gǔ)歌學術被引用量超過 1.6 萬次,已發表學術論文 120 多篇,曾多次獲(huò)得最佳(jiā)論文獎。
汪軍2022 年 4 月,上海數字大腦研究院正式創(chuàng)立(lì),內部孵化並成立了 Enigma Tech(中文名 " 謎(mí)題科技 "), 汪(wāng)軍擔任(rèn)上海(hǎi)數字大腦研究院聯合創工業(yè)模型(xíng)始人、院(yuàn)長,並出任謎題科技首席科學家;下半年,數研(yán)院研發出(chū)全球第一個多智能體決策大模型,該大模型(xíng)集合 CV、NLP、強化學習(xí)和多智(zhì)能體,致(zhì)力於幫助企業(yè)解決多場景決策問題。
汪軍認為,ChatGPT 的出(chū)現,解決了以往大模型訓練中如何降低(dī)門檻的難題(tí),通過將自然語言處理與決(jué)策大模型的結合(hé),ChatGPT 工(gōng)業模型帶(dài)來(lái)的不能(néng)隻是聊天,而是在 AIGC(AI Generated Content,內容生產) 的基礎上更進一步探索 AIGA(AI Generated Actions,決策生成(chéng)),讓模型的思(sī)考(kǎo)能力和決策能力應用到具體(tǐ)場(chǎng)景中,真正實現幫助企業和人們解(jiě)決決策問題,將人類釋放到更具創造性的活動中。
一、在多智工業模型能體中通向 " 智能 "AI 智能探索的進程中,脫(tuō)離不(bú)開對定義問題的終(zhōng)極追求汪軍將通往(wǎng)智能的路徑分為兩步第一步(bù),需要先明確生物係統(Living System,人歸屬(shǔ)於生物係統)和非生物係統的差別。
2013 年,生物物理學家 Jeremy England 提(tí)出一(yī)個開(kāi)創性 " 耗散適應(yīng) " 理論(di工業模型ssipation-driven adaptation),將生命起源(yuán)歸結於熱力學的必然結果,無分子係統在一定條件下通過化學反應代謝消耗能量,以促進能量持續消耗及(jí) " 熵 " 的增加。
在(zài)熵增熵減理論中(zhōng),生命體從(cóng)無序變成有序的過程(chéng)持續吸收能量不斷(duàn)熵減,汪軍認為,AI 從人產(chǎn)生(shēng),因(yīn)此也是(shì)吸收能量幫助人完(wán)成工(gōng)業模型熵減的使(shǐ)命,解決基礎問題的關鍵點在於如何定義智能,明確 AI 需要吸收多少能量才能達到一定(dìng)的智能。
使用 AI 做圖像分類識別時,分類算法其準確率可達到 98%通過分類,AI 幫助www.17C.com可以將處於無序狀(zhuàng)態的圖像(xiàng)內容組織轉(zhuǎn)變為有序、有規律可循(xún)的圖像,係統中不確定性減小(xiǎo),產生熵減熵減也需要計(jì)算,形成算法的算工業模型力多少,算力即是消耗能量的一種體現。
通往智能的第(dì)二步,汪軍(jun1)認為,是分辨生物係(xì)統、所謂的 AI 係統的意(yì)識問題當前,人工智能作為工具(jù)存在,算法隻能判(pàn)別 AI 工作的優良程度,機器本身並(bìng)不存在思考,如何使機器最終(zhōng)達到與人相等的思考能(néng)力,需要先理解人類大腦的各(gè)種現象,並增(zēng)加對 AI 意識的關注。
在汪軍看來工業模型,意識是智能的一個重(chóng)要表現,哺乳動物可以察覺意識、感知意識並形成主觀感受;同時,當多個(gè)個體與環境(jìng)交互時,必(bì)須存在除單個個體(tǐ)外、另一有意識個體與環境發生(shēng)影響、產生共鳴,從而使主觀感受得以(yǐ)表達對此,汪軍和團隊提出,在 AI 研究中,必須有多智能體(tǐ)(Multi-Agent)的相互作用(yòng)來引發意識。
以大模型為工業(yè)模型例,跨任(rèn)務是人為定義的,隻局限在給定一個特定任(rèn)務,把算法設計好讓機器去跑,難以產生更大智能的(de) AI,模型的思考能力和決策能力也無法得到提升汪軍告訴 AI 科技評論," 在同時推進多個事情(qíng)時,需要大的思想來指導。
如(rú)果沒有(yǒu),顯然還缺乏一個內在的(de)規律" 這個規律,正是機器模型通往更大 " 智能 " 的關鍵工業模型路徑2022 年 5 月,DeepMind 發布集合 CV 和 NLP 的通用智能體 "GATO",它可以玩雅達利遊戲、輸出圖片字幕(mù)、用機械(xiè)臂堆疊積木、跟人聊天等等,還能(néng)根據上下文決定是否輸出(chū)文本、關節力矩(jǔ)、按(àn)鈕按(àn)壓或其他 token(逐詞(cí)),這項工(gōng)作在當時引起了不(bú)小的討論。
汪軍也是關注者之一事實上工業模型,從 2021 年開始(shǐ),汪軍和團(tuán)隊就開始思考創(chuàng)建一個可實現跨任務,將 CV、NLP、強化學習和多智能體四者嵌套為一個統一體(tǐ)決策模型的(de)可能性"GATO" 的出現讓汪軍看到(dào)大模型廣闊的可探索空間," 這足以證明,一個模型解決(jué)多個領域任務是大勢所趨。
"決策大模(mó)型並(bìng)不能單純從模型大小意義出發(fā),究其本質,是在工業模型數據(jù)集中通過強化學習與環境(jìng)不斷交互所達到的(de)一定的認(rèn)知水平,如何攻破這個問題?當(dāng)中最大(dà)的技術點就在於,降低強化學(xué)習和環境交互(hù)的複雜度原有數據在這一環節中起到關鍵性作用。
通過對其他任務或算法同環境交互產(chǎn)生的原有數(shù)據訓練(liàn),搭建一個預(yù)訓練模型(xíng),這一模型在麵(miàn)對新任(rèn)務時即可迅速在進行應用,從而實現規律(lǜ)、關係(xì)和數工業模型(xíng)據的價(jià)值最大化而伴隨預訓練數據集的不斷擴大,模型也隨之(zhī)變(biàn)大,直至它可覆蓋的所有任務。
最終結果是(shì),解決問題的方法聚(jù)攏,多個方向匯聚、統一為一個可(kě)預約、可跨任務泛化的多智能體(tǐ)多智能體(tǐ)往往(wǎng)需要考慮平衡關係(xì),即在達到(dào)自我目標的同時,使對方也能達到它的目標,互相牽製從而保持一個穩定的平衡進(jìn)入實際應用場景中,多(duō)工業模型(xíng)智能體也可(kě)以幫人們解決很多實際問題,例如(rú)搜索、推薦,甚至互聯網廣告,其本質上(shàng)是一個決策的過程,幫助用(yòng)戶(hù)找到需要(yào)的內容,而且這個內容是符合用戶喜好(hǎo)的," 推薦給你看,其實(shí)就是個決策。
"多智能體的(de)優勢在於,可以很好地發揮(huī)其跨任務的(de)能力事(shì)實上,早在 2017 年開始,汪軍和其學生張(zhāng)偉楠(上海交通大學教(jiāo)授)工業模型就開始了跨任務嚐試,在自然語言處理(NLP)中加入強化學習以往(wǎng)的自然語言處理使用 GAN 生成(chéng)文字時,由於詞索(suǒ)引與詞向量在(zài)轉換過程中的數(shù)據不連續,經常會導致微調(diào)參數不(bú)起作用;不僅如此,由於 GAN 的(de)判別模型隻對生成數據(jù)整體打分,但文字一般均為逐詞生成,難(nán)以控製(zhì)細節。
為此,他們提出 SeqGAN 模工業模(mó)型(xíng)型,通過在借鑒強化(huà)學習策略,解決了 GAN 應用於離散數據的問題,這也是最早(zǎo)利(lì)用強化學習(xí)訓練生成性語言(yán)模型的論文之一,實現了文本生成,在自然語言處理和(hé)信息檢索(suǒ)等不同領域具有廣泛的應用。
論文地址:https://arxiv.org/pdf/1609.05473.pdf" 強化學習和決策本質上是相通的,工業模型通過強(qiáng)化學(xué)習,可(kě)以解決一些決策(cè)問題" 在汪軍看來,決策是一個長期研究的問題,多智能體決策大(dà)模型的提出,經泛化後可在某些特定領域形成特有優勢,AI 中大部分問題均可借(jiè)助決策大模型來解決。
二、AIGA 比 AIGC 更進一(yī)步(bù)ChatGPT 掀(xiān)起的(de)熱度還未過,3 月 15 日,多模態預訓練大模型 GPT-工業(yè)模型4 發布後,又一場顛覆性(xìng)的變革呼嘯而至在這場關於通用人工智能(néng)的角逐中,ChatGPT、GPT-4 不是終(zhōng)點,競賽的關鍵聚(jù)焦在浪潮下更具價值的產業革命和(hé)創新中。
期間,汪軍也與(yǔ)關注市場資本的朋友保持密切溝通在汪軍看來,學術圈裏麵的問題有些不夠大膽、受資源約束,思考問題會受到一定因素的約束而在(zài)工業界,決策工業模型大模型可以擁有更豐富的應用場景,無論是在傳統產業,互聯網搜索推薦,到工業互聯網等等,都需要各種各樣的決策。
帶著這樣的想法,汪軍開(kāi)始考慮將決策大模型在(zài)產學研三棲結合的可能(néng)性經(jīng)過一年(nián)的籌備(bèi)期,2022 年 4 月上海(hǎi)數字大腦研究院正式(shì)創立,內部孵(fū)化並成立 Enigma Tech(" 謎題科技 "),主要工業模型負(fù)責將數研院的科研成(chéng)果麵向產業落(luò)地,為數(shù)研院提供現實場景及真實業務數(shù)據。
汪軍擔任數(shù)研院聯合創始人、院長,並出任謎題科技首席科學家(jiā)當大(dà)模型邁進實際(jì)的應用場景裏,企業(yè)往往麵臨著模型廣譜性不強、入局門檻高的兩大痛點經典的機器學習方法采用的是定製化模式,企業下發任務(wù)後,先定義問(wèn)題、收集數據訓練、模型測試,二工業模型次任務下發後,模型需要再次收集定義問題(tí)、收集數據訓練、模型測試,往往會(huì)導致企業在部署上就已經損耗了極大的財力、人力資源,廣譜性不強。
同時,使用大模型對工程師的技術能力要求極高,需(xū)要具備一定的優化經驗,企業參與門檻高汪軍認為,ChatGPT 結(jié)合決策大模型,可以有效解決低門檻、廣譜性的(de)問題在這(zhè)樣的思考工業(yè)模型下,汪軍領導(dǎo)謎題科技團隊提出 DB 大模型(AIGA 方(fāng)向大模型,AIGA:AI Generated Actions,決策生(shēng)成),其首發的 DB1 為全球(qiú)首個多模態決策大模型,對標 DeepMind 推出的 GATO,可(kě)全麵支撐多智能體,能夠並發處理(lǐ)千個以上決(jué)策任務。
DB1 在車輛協同任務中的表現通工業模型過將(jiāng) ChatGPT 與決策大模型的結合,ChatGPT 帶來的不能(néng)隻是聊天,而是在 AIGC 的基礎上更進一步探索 AIGA,讓模型(xíng)的思考能(néng)力和決策能力(lì)應用到具體場景中,所產生的交(jiāo)互通過跟具體場景的環境交互,小數據完成大(dà)任務,可直接麵(miàn)向產業(yè)真實場(chǎng)景,借助大模型實現任務閉環,實現機器人(rén)協作、設(shè)備動態工業模型、企(qǐ)業自主化調度、軟件開發等更廣泛應用。
進而真正幫助企業和人們解決決策問題,將人類釋放到更具創造(zào)性(xìng)的(de)活動(dòng)中" 最終為整個人類的進步帶來很大(dà)的促進作用在這個情況下,www.17C.com才能孕育出真正的 AGI(通用人工(gōng)智能)"目前,數字大腦研究院的基本架構已搭建完成,業務內容從算法、係統到(dào)具體工程項目均有覆蓋,可應用工業模型於推薦係統、故障預測、自動(dòng)駕駛、市場設計、遊(yóu)戲場景、EDA 優化等(děng)多個場景,解決企業運作過程(chéng)中的實際問題。
走出實驗室、成立數(shù)字大腦研究院,對汪軍而言,感受和狀態(tài)是截然不同的:研究不可能將所有因素放在一(yī)起考慮,要解決這個問題,首先其他東西得簡化,把真正問題解決了再(zài)轉向下一個;而一項研究的落地則更可能是工業模型多個問題的集合體(tǐ),需要(yào)各(gè)個問題都一一擊破,並把解決問(wèn)題的(de)方法(fǎ)統一去應用。
去年 7 月份,AI 科(kē)技評(píng)論曾有(yǒu)幸與汪軍院長進(jìn)行了一場深入討論,彼時他對數研院(yuàn)的目標是,推動決(jué)策智(zhì)能研(yán)究和(hé) AI 研究,在中國做(zuò)最好的、最基礎的研(yán)究而過去短短一年(nián),Stable Diffusion、ChatGPT 和 GPT-工(gōng)業模型(xíng)4 等模型的出(chū)現,讓汪軍驚喜地認識到 AI 技術的革命性(xìng)進步,也令他對數研院(yuàn)有了(le)更具象化的目標,將決(jué)策大模型應用到具體場景中解決實際意義問題。
從學術界到工業界,數字大(dà)腦研究院的發展時間還不長,其雛形也映射出汪軍(jun1)在人工智能路上探知求(qiú)索的方向" www.17C.com就是要走自己的一條路,怎麽樣把產學研結合一起闖出條新路工業模型,問一些以前沒(méi)有問過的問題"三、對話汪軍(jun1)數研院(yuàn)落地決策大模型
AI 科技評(píng)論:介紹一下數研院過去一年在多智能體決策(cè)大模型方麵所做的工作和進展汪軍:去年夏(xià)天我開始計劃一個新的課題,www.17C.com覺得大模型不隻是在(zài) NLP、CV 裏,它在決策中也有很大的作用,當時 DeepMind "Gota" 的工作嚐試將各種各工業模(mó)型樣的任務放在一個大模型裏麵、Transform 裏麵(miàn)去進行學(xué)習,給到了www.17C.com啟發,所以當時就決定在它的基礎上(shàng)往前探索,做了(le)一個決策大模型,包括視頻、圖像(xiàng)的數據,自然語言的數據,機器人的數據,甚至還加入求解器的(de)數(shù)據,例如怎樣做優(yōu)化任務、布置生產排期(qī)、對車輛進行優化等。
www.17C.com做了一個 10、15 億左右參數工業模(mó)型的大模型,雖然是一個早期的探索,但也證明了在大模型裏麵不光隻是自然語言處理,還能在(zài)決(jué)策起到明顯(xiǎn)作用前段時間(jiān)www.17C.com在做足球遊戲,發現有個沒有(yǒu)攻克的問題:現在強化學習所存在的研究邏輯,AlphaGo、星際爭霸(bà)、Dota 等帶有遊戲係統中,人越(yuè)多,其決策空間也會更加複(fù)雜。
對此,www.17C.com以遊(yóu)戲場景(jǐng)的足球作為問(wèn)題研工業模型究點,在多智能體(tǐ)決策大模型中進行了(le)多次嚐試,從簡單的 2 人足球,到 5 人、到(dào) 11 人這(zhè)個是比較大的、對強(qiáng)化(huà)學習有挑戰性的場景,目前(qián)問題本質還沒有完全解決,或者說解決得很好,因此www.17C.com也花了(le)很多時間(jiān)在做這件事情,希望能做出一點成(chéng)績。
AI 科技評論:ChatGPT 發布後,對數研院的研究帶來什麽影響工業模(mó)型?汪軍:www.17C.com一直重心在是決策上,現(xiàn)在也一直是但 ChatGPT 出來後(hòu),www.17C.com(men)對它的語言能力感覺到非常驚豔,完全超過www.17C.com的(de)預期(qī),對決策任務也起了一定的促進作(zuò)用。
在做決策優化(huà)的過程中,需要解決兩大痛點:廣譜性和低(dī)門(mén)檻決策大模(mó)型在(zài)一定程度上解決了模型的廣譜性問題(tí),將新任務放置大模型內(nèi)進行迭代、微調,一個大工業模型模型可以應對各種各樣的決策問題低門檻問題在做 AI 公司中普遍存在,在此之前(qián),使用大模型對工(gōng)程師的能力要求非(fēi)常(cháng)高,往往需要有優化經驗的人參與到問題決策過(guò)程中,個人(rén)和企業參與的門(mén)檻非常高,也(yě)增加了(le) AI 的使用成本。
為了解決使用的低門檻問題,www.17C.com之前預想發明一個比較簡單的(de)語言,可以比自然語言(yán)要更(gèng)複雜、工業模型嚴謹(jǐn)一點(diǎn),但(dàn)比真正的編程簡單些,任何人都可以使用,ChatGPT 的出現,突然讓(ràng)www.17C.com(men)意識到,機器(qì)的自然語言可(kě)以達到一個正常跟人交流的水平,一下子就把低門檻的痛點解決了。
對www.17C.com來說,這個改變帶(dài)來的觸動是比較大的更有意(yì)思的是,ChatGPT 裏具有一定的邏輯推理能力,可以幫助www.17C.com將一個複(fù)雜的問題分解為幾(jǐ)工業模型個(gè)子問題,這(zhè)個子(zǐ)問題部分原本需要(yào)專業人士(shì)進行人(rén)為分解,但通過 ChatGPT 對語義的理解,在得到範例的(de)情況下可(kě)對問題分解成基礎的問題,再(zài)經由決策大模型對基礎問題已有的決策能力,實(shí)現直接調用。
ChatGPT 降(jiàng)低決策門檻AI 科技評論:多智能體決(jué)策大模型涵蓋的領(lǐng)域很多,在數據這塊會有什麽要求?把工業模(mó)型它跟 ChatGPT 進(jìn)行結合(hé)後,對某一領域(yù)的數據(jù)是否有特別的需求?汪軍:它會有一些特定的要求。
自(zì)然語言的數(shù)據是離(lí)線的,屬於方法(fǎ)論上的學習;而決策中需(xū)要很多產生數據的能力,需要一個(gè)仿真器舉個例子,當我(wǒ)們訓練機械狗走路時,我(wǒ)們不會讓它到雨天裏(lǐ)或其他環境走一圈將數據采集回來,往往是(shì)先建一個跟外界非常像的工業模型仿(fǎng)真器,通過仿真器來產生數據,模型(xíng)學習完後再放到真實場景給予反饋,回來再進行學習,從而(ér)使得它可以(yǐ)很快將決(jué)策能力遷移到現實中(zhōng)應用(yòng)。
大模型技術囊括(kuò)各(gè)種(zhǒng)各(gè)樣的場景,無(wú)論是下雨天、走台階(jiē)、走沙土都沒有任何問題機械狗在不同環境中行(háng)走第二個難點是,決策(cè)數據訓練(liàn)的難度(dù)比自然語言處理的難度要大,這個過程中在不(bú)斷產生工業模型數據,數據產生的效率、產生在什麽地方,如何分配到各個學習模塊裏麵進行學習,需(xū)要(yào)統一的係(xì)統層麵解(jiě)決方案(àn),此前(qián)www.17C.com專門做了一套大規模的學習方法,主要應用(yòng)在這種強化學習訓練的方法。
但 ChatGPT 出來後,基(jī)於大預言模(mó)型的訓練方法(fǎ)不太適用AI 科技評(píng)論:具體場景中,如何用 ChatGPT 跟決策大模型進工業模型(xíng)行結合(hé)?汪軍:舉一個機械狗的案例(lì):最早www.17C.com訓練機械狗使用的是歸控的經典方法(fǎ),它的問題是在單一環境路況上走沒有問題,但(dàn)遇到雨(yǔ)天、雪天就走不了,但當www.17C.com加入了大模型方案後,機械狗(gǒu)開(kāi)始具備基礎的交互能力,可以(yǐ)進行推理。
向機(jī)械狗下發一個送信的指令,模型會將任務自動分解為 1 至 5 個基礎步驟,每個模塊在傳工業模型送(sòng)中有對應邏輯(jí),例如從 A 點行至 B 點的路徑規劃由於機械狗自身並不具備往東走、往西走的概念,隻有坐標,因此需要將交互指令與具體的語義結(jié)合、對應(yīng)起來(lái),通過 ChatGPT 的(de)方式,www.17C.com(men)無需將指令轉化為編程語言,可直接進(jìn)行交互,機械狗在接收到問題後,會講指令分解成幾個不同的問題,先優化一部分的 Ch工業模型at,將動作、決策(cè)和語義同 ChatGPT 產生自然語言對應起來。
這樣成(chéng)為了www.17C.com接下來研究(jiū)的主要方向,www.17C.com(men)將其稱為 AIGA(AI generate actions),前(qián)期 ChatGPT 帶來的是 AIGC,再結合決(jué)策大模型,從(cóng) generate content 更進(jìn)一步、變為 generate 工業模型actions,生成決策。
數研院的長處是(shì)在決策大模(mó)型,因此(cǐ)www.17C.com堅持決策大模型的方向是不變的(de),要(yào)讓(ràng) AI 不隻是交流(liú),更重要的它是幫助你去優化,幫助你去做決(jué)策,我(wǒ)們覺得它的價值非常大ChatGPT 結合決策大模(mó)型後,所產(chǎn)生的(de)交互不再僅限於它能回答問題,更在於它是否(fǒu)能理解複雜、構建複(fù)雜,通過跟(gēn)具(jù)體場景的工業模型環境交互,ChatGPT 跟決策大模型進行結合,可(kě)實現機器人協作、設備動(dòng)態、企業自主化調度、軟件開發等更廣(guǎng)泛應用。
自(zì)然語言是基礎AI 科技評論:在訓練多模態數據之後,參數量到(dào)達多少會湧現更多的能(néng)力 ? 文字,圖(tú)像,語音,視(shì)頻……哪一個模態對多模態模型的影響會更大?汪軍:在數據方麵," 大力出奇跡 "工業模型 這個事情有一定的(de)極限(xiàn),雖然目前這個極限www.17C.com還沒有完全看到,但(dàn)是我覺得,www.17C.com不是隻著眼(yǎn)於僅學(xué)習 ChatGPT 的訓練方式。
ChatGPT 的語言能(néng)力很強、對話能力很強,但(dàn) ChatGPT 是否真正理解了它吸收的內容?我(wǒ)認為它(tā)是沒有理解(jiě)的讓(ràng)它玩猜數字遊戲,表麵上它可以玩,但其實(shí)它是(shì)不知道、沒法猜到你工業(yè)模型心裏的數字ChatGPT 更(gèng)多是在原有訓(xùn)練數據(jù)中對邏輯內容的記憶,它的搭料能力很強,但是它真正理解的(de)能力很弱。
如何打破它的局限性?我認(rèn)為,www.17C.com需要在訓練裏加上模型對整個世界的理(lǐ)解,如果它本身不去建一個描述世界的數學(xué)模型,把它的理解放到世界模型中,它(tā)不會對周圍世界有更深層(céng)次的理解的舉個簡單(dān)的例子,www.17C.com工業模型給 ChatGPT 2000 分以下的所有人類下棋能力的數據,如果模型隻模仿人,那麽它無法模仿出比 2000 分更高的智能。
汪軍團隊此前所做(zuò)的 AI 創作助手數據很重(chóng)要,但與此同(tóng)時,模型的大小也很重要,要有不同的訓練方法來(lái)提高它而在多模態中(zhōng),自然語言是基礎,人在思考時,語言是www.17C.com的思維的載體,它構架工(gōng)業模型了一個(gè)相對(duì)清晰的邏輯描述,這個邏輯描(miáo)述可(kě)能(néng)並不是(shì)百分百(bǎi)嚴謹,存在不清晰、模糊的地方,但是它足夠讓(ràng)www.17C.com去表達一些非(fēi)常複雜的邏輯關係。
但與此同時,www.17C.com也要清晰地認識(shí)到,自然(rán)語言中隱含的語義信息和表達是非常重要的,也就是說,它(tā)可以能把這個問題表述(shù)得很清晰、但這是表象,最主要的(de)是對話裏麵含載的語義關係,當其工業模型他多模態來了之後,匹配上相應的語(yǔ)義表達,就可以遷(qiān)移到其他的模態當中。
在自(zì)然語言的基礎上,www.17C.com可以加入(rù)其他更多模態(tài)參與到模型當中(zhōng)AI 科技評論:您(nín)如何看(kàn)待 " 人類反饋 " 數據對多模態大模型或決策大模(mó)型的影響?汪(wāng)軍:需要一些人類反(fǎn)饋數據,但它的量不像(xiàng)以前的監督式學習需求量那麽大,一個基礎(chǔ)模型(xíng)隻需要給工業模型(xíng)它幾個示範(fàn),目的是導引基礎模型適應新的任務場景,令基礎(chǔ)模型把原來的能(néng)力顯露出(chū)來。
這是(shì)對經典機器(qì)學習訓練(liàn)模式的革新以前的機(jī)器(qì)學習,大部分 AI 企業采用的是定製化模式,任務來了先定(dìng)義問題、收集數據訓練、模型測試(shì),第二個任務下發後、又再次收集定義問題、收集數據訓練、模型測試,不(bú)僅難以複製,部署也會損耗極工業模型大的財力、人力資源。
ChatGPT 後的機器學習是大模型先行,我不需要知道具體的問題是什麽,就(jiù)可以先搭建模型,再分發至客戶或(huò)廠家,將模仿放置到某一個不具有訓練大模型能力的公司,由公司去部署(shǔ),再進行定(dìng)義(yì),整體流程反(fǎn)過來了,其本質是激活大模型應用至(zhì)特定任務中,再定義任務、輸出結果,極大地降低了 " 人類工業模型反饋 " 數據對模型的影(yǐng)響,真正實(shí)現廣譜性、低門檻的 AI。
AI 科技評論:有看法認(rèn)為,在(zài) ChatGPT 這輪競賽中,算力和模型不再如前兩個時期那麽重(chóng)要,而場景和數據將成為這一輪關鍵,您是怎麽看的?汪軍:模型很重(chóng)要當前一些大(dà)模型語言能力的提升,會令人產生模型也具備理解人的能力,但這(zhè)隻是表象。
僅靠幾工業模(mó)型個字來預測下一個(gè)單詞的基礎模型訓練(liàn)方法、難以產生更大智能的 AI,模型的思考能力和決策能力無法得到提升,而這兩者是作為人工智能(néng)體最基(jī)礎的能力,它需要知道怎樣(yàng)去跟(gēn)環境交(jiāo)互從這個模型(xíng)角度來講,模型仍(réng)需要進行革新,Transform 這(zhè)個架構很好,但並不代(dài)表就可以止步不前,www.17C.com仍然需要革新的、有創造力的、工業模型能產生思考的神經(jīng)網絡模型(xíng)出現。
算力、模(mó)型、數據(jù)、場景(jǐng)四者都很重要,當數(shù)據和算(suàn)力(lì)達到(dào)一定高度後、需要一個新的創新出現,創新後(hòu)再(zài)進行數據和算力的變量累積(jī),再達到一定的高度和進行創新,這是一個螺旋(xuán)上升的過程場景(jǐng)是目的,最終www.17C.com需要在場景中定義問題、解決問(wèn)題,而不僅僅讓研究停(tíng)留在(zài)學術層麵。
場景驅動之後,再使工業(yè)模型用一個新的模型或方法,用數據和算力使它達到又一個極致ChatGPT 的廣譜性很強(qiáng),但並不代表它能夠(gòu)解決所有的 AI 問(wèn)題,www.17C.com應該思考下(xià)一個場景的東西什麽、能夠解決什麽問題?問題的核心是,讓模型的思考能力和決策能力,真正能夠應用到具體場景中,同時它要跟環境進行交互,跟人、跟各種各(gè)樣的場景進行交互,最工業模型終(zhōng)實現對整個能源產業,整個人類的進步帶來很大的促進作(zuò)用(yòng)。
在這個情況下,www.17C.com才能孕育出(chū)真正(zhèng)的 AGI。這也是數研院的目標。(雷峰網雷峰網)查看(kàn)原文
Copyright © 2002-2020 上海潤之模型設(shè)計有限公司 版權所有 展示(shì)模型,展品模型(xíng),展廳模型,展示道具,展廳展品,展品道具,模型(xíng)定製,模型公司,上海模型公司 備案號:滬ICP備20018260號