新聞動態

免費（fèi）谘詢熱線

13621929115

常（cháng）見問題

工業模型

發布日期：2023-04-04 21:58瀏覽次數：

過去短（duǎn）短不到一年裏，ChatGPT、GPT-4 的相繼麵（miàn）世，不（bú）斷刷新人們對 AI 的認知新技術帶（dài）來（lái）變革，也引發了外界對 AI 是（shì）否會取（qǔ）代人的討（tǎo）論（lùn），OpenAI 首席執行官 Sam Altman 也公開表示，對人工智（zhì）能技術的強大能力有些擔憂。

近日（rì），倫敦大（dà）學學院（UCL）計算機係教授汪軍在接受 AI 科工業模（mó）型技評論采訪時坦言，雖然 ChatGPT 的（de）語言能力、對話能力很強，但其（qí）並無法（fǎ）進行係統性決策，例如機器控製、群體協作、動（dòng）態調（diào）度等，而這些是 AI 技（jì）術浪潮中更具革命性的部分。

汪軍，倫敦大學（xué）學院（yuàn）（UCL）計算機係教授，阿蘭 · 圖靈研究所 Turing Fellow其主要研究智能信息係統，包括機器學（xué）習、工業模型強化學習、多智能體（tǐ），數據挖掘、計算廣告學、推薦係統等；穀（gǔ）歌學術被引用量超過 1.6 萬次，已發表學術論文 120 多篇，曾多次獲（huò）得最佳（jiā）論文獎。

汪軍2022 年 4 月，上海數字大腦研究院正式創（chuàng）立（lì），內部孵化並成立了 Enigma Tech（中文名 " 謎（mí）題科技 "）, 汪（wāng）軍擔任（rèn）上海（hǎi）數字大腦研究院聯合創工業（yè）模型（xíng）始人、院（yuàn）長，並出任謎題科技首席科學家；下半年，數研（yán）院研發出（chū）全球第一個多智能體決策大模型，該大模型（xíng）集合 CV、NLP、強化學習（xí）和多智（zhì）能體，致（zhì）力於幫助企業（yè）解決多場景決策問題。

汪軍認為，ChatGPT 的出（chū）現，解決了以往大模型訓練中如何降低（dī）門檻的難題（tí），通過將自然語言處理與決（jué）策大模型的結合（hé），ChatGPT 工（gōng）業模型帶（dài）來（lái）的不能（néng）隻是聊天，而是在 AIGC（AI Generated Content，內容生產）的基礎上更進一步探索 AIGA（AI Generated Actions，決策生成（chéng）），讓模型的思（sī）考（kǎo）能力和決策能力應用到具體（tǐ）場（chǎng）景中，真正實現幫助企業和人們解（jiě）決決策問題，將人類釋放到更具創造性的活動中。

一、在多智工業模型能體中通向 " 智能 "AI 智能探索的進程中，脫（tuō）離不（bú）開對定義問題的終（zhōng）極追求汪軍將通往（wǎng）智能的路徑分為兩步第一步（bù），需要先明確生物係統（Living System，人歸屬（shǔ）於生物係統）和非生物係統的差別。

2013 年，生物物理學家 Jeremy England 提（tí）出一（yī）個開（kāi）創性 " 耗散適應（yīng） " 理論（di工業模型ssipation-driven adaptation），將生命起源（yuán）歸結於熱力學的必然結果，無分子係統在一定條件下通過化學反應代謝消耗能量，以促進能量持續消耗及（jí） " 熵 " 的增加。

在（zài）熵增熵減理論中（zhōng），生命體從（cóng）無序變成有序的過程（chéng）持續吸收能量不斷（duàn）熵減，汪軍認為，AI 從人產（chǎn）生（shēng），因（yīn）此也是（shì）吸收能量幫助人完（wán）成工（gōng）業模型熵減的使（shǐ）命，解決基礎問題的關鍵點在於如何定義智能，明確 AI 需要吸收多少能量才能達到一定（dìng）的智能。

使用 AI 做圖像分類識別時，分類算法其準確率可達到 98%通過分類，AI 幫助www.17C.com可以將處於無序狀（zhuàng）態的圖像（xiàng）內容組織轉（zhuǎn）變為有序、有規律可循（xún）的圖像，係統中不確定性減小（xiǎo），產生熵減熵減也需要計（jì）算，形成算法的算工業模型力多少，算力即是消耗能量的一種體現。

通往智能的第（dì）二步，汪軍（jun1）認為，是分辨生物係（xì）統、所謂的 AI 係統的意（yì）識問題當前，人工智能作為工具（jù）存在，算法隻能判（pàn）別 AI 工作的優良程度，機器本身並（bìng）不存在思考，如何使機器最終（zhōng）達到與人相等的思考能（néng）力，需要先理解人類大腦的各（gè）種現象，並增（zēng）加對 AI 意識的關注。

在汪軍看來工業模型，意識是智能的一個重（chóng）要表現，哺乳動物可以察覺意識、感知意識並形成主觀感受；同時，當多個（gè）個體與環境（jìng）交互時，必（bì）須存在除單個個體（tǐ）外、另一有意識個體與環境發生（shēng）影響、產生共鳴，從而使主觀感受得以（yǐ）表達對此，汪軍和團隊提出，在 AI 研究中，必須有多智能體（tǐ）（Multi-Agent）的相互作用（yòng）來引發意識。

以大模型為工業（yè）模型例，跨任（rèn）務是人為定義的，隻局限在給定一個特定任（rèn）務，把算法設計好讓機器去跑，難以產生更大智能的（de） AI，模型的思考能力和決策能力也無法得到提升汪軍告訴 AI 科技評論，" 在同時推進多個事情（qíng）時，需要大的思想來指導。

如（rú）果沒有（yǒu），顯然還缺乏一個內在的（de）規律" 這個規律，正是機器模型通往更大 " 智能 " 的關鍵工業模型路徑2022 年 5 月，DeepMind 發布集合 CV 和 NLP 的通用智能體 "GATO"，它可以玩雅達利遊戲、輸出圖片字幕（mù）、用機械（xiè）臂堆疊積木、跟人聊天等等，還能（néng）根據上下文決定是否輸出（chū）文本、關節力矩（jǔ）、按（àn）鈕按（àn）壓或其他 token（逐詞（cí）），這項工（gōng）作在當時引起了不（bú）小的討論。

汪軍也是關注者之一事實上工業模型，從 2021 年開始（shǐ），汪軍和團（tuán）隊就開始思考創（chuàng）建一個可實現跨任務，將 CV、NLP、強化學習和多智能體四者嵌套為一個統一體（tǐ）決策模型的（de）可能性"GATO" 的出現讓汪軍看到（dào）大模型廣闊的可探索空間，" 這足以證明，一個模型解決（jué）多個領域任務是大勢所趨。

"決策大模（mó）型並（bìng）不能單純從模型大小意義出發（fā），究其本質，是在工業模型數據（jù）集中通過強化學習與環境（jìng）不斷交互所達到的（de）一定的認（rèn）知水平，如何攻破這個問題？當（dāng）中最大（dà）的技術點就在於，降低強化學（xué）習和環境交互（hù）的複雜度原有數據在這一環節中起到關鍵性作用。

通過對其他任務或算法同環境交互產（chǎn）生的原有數（shù）據訓練（liàn），搭建一個預（yù）訓練模型（xíng），這一模型在麵（miàn）對新任（rèn）務時即可迅速在進行應用，從而實現規律（lǜ）、關係（xì）和數工業模型（xíng）據的價（jià）值最大化而伴隨預訓練數據集的不斷擴大，模型也隨之（zhī）變（biàn）大，直至它可覆蓋的所有任務。

最終結果是（shì），解決問題的方法聚（jù）攏，多個方向匯聚、統一為一個可（kě）預約、可跨任務泛化的多智能體（tǐ）多智能體（tǐ）往往（wǎng）需要考慮平衡關係（xì），即在達到（dào）自我目標的同時，使對方也能達到它的目標，互相牽製從而保持一個穩定的平衡進（jìn）入實際應用場景中，多（duō）工業模型（xíng）智能體也可（kě）以幫人們解決很多實際問題，例如（rú）搜索、推薦，甚至互聯網廣告，其本質上（shàng）是一個決策的過程，幫助用（yòng）戶（hù）找到需要（yào）的內容，而且這個內容是符合用戶喜好（hǎo）的，" 推薦給你看，其實（shí）就是個決策。

"多智能體的（de）優勢在於，可以很好地發揮（huī）其跨任務的（de）能力事（shì）實上，早在 2017 年開始，汪軍和其學生張（zhāng）偉楠（上海交通大學教（jiāo）授）工業模型就開始了跨任務嚐試，在自然語言處理（NLP）中加入強化學習以往（wǎng）的自然語言處理使用 GAN 生成（chéng）文字時，由於詞索（suǒ）引與詞向量在（zài）轉換過程中的數（shù）據不連續，經常會導致微調（diào）參數不（bú）起作用；不僅如此，由於 GAN 的（de）判別模型隻對生成數據（jù）整體打分，但文字一般均為逐詞生成，難（nán）以控製（zhì）細節。

為此，他們提出 SeqGAN 模工業模（mó）型（xíng）型，通過在借鑒強化（huà）學習策略，解決了 GAN 應用於離散數據的問題，這也是最早（zǎo）利（lì）用強化學習（xí）訓練生成性語言（yán）模型的論文之一，實現了文本生成，在自然語言處理和（hé）信息檢索（suǒ）等不同領域具有廣泛的應用。

論文地址：https://arxiv.org/pdf/1609.05473.pdf" 強化學習和決策本質上是相通的，工業模型通過強（qiáng）化學（xué）習，可（kě）以解決一些決策（cè）問題" 在汪軍看來，決策是一個長期研究的問題，多智能體決策大（dà）模型的提出，經泛化後可在某些特定領域形成特有優勢，AI 中大部分問題均可借（jiè）助決策大模型來解決。

二、AIGA 比 AIGC 更進一（yī）步（bù）ChatGPT 掀（xiān）起的（de）熱度還未過，3 月 15 日，多模態預訓練大模型 GPT-工業（yè）模型4 發布後，又一場顛覆性（xìng）的變革呼嘯而至在這場關於通用人工智能（néng）的角逐中，ChatGPT、GPT-4 不是終（zhōng）點，競賽的關鍵聚（jù）焦在浪潮下更具價值的產業革命和（hé）創新中。

期間，汪軍也與（yǔ）關注市場資本的朋友保持密切溝通在汪軍看來，學術圈裏麵的問題有些不夠大膽、受資源約束，思考問題會受到一定因素的約束而在（zài）工業界，決策工業模型大模型可以擁有更豐富的應用場景，無論是在傳統產業，互聯網搜索推薦，到工業互聯網等等，都需要各種各樣的決策。

帶著這樣的想法，汪軍開（kāi）始考慮將決策大模型在（zài）產學研三棲結合的可能（néng）性經（jīng）過一年（nián）的籌備（bèi）期，2022 年 4 月上海（hǎi）數字大腦研究院正式（shì）創立，內部孵（fū）化並成立 Enigma Tech（" 謎題科技 "），主要工業模型負（fù）責將數研院的科研成（chéng）果麵向產業落（luò）地，為數（shù）研院提供現實場景及真實業務數（shù）據。

汪軍擔任數（shù）研院聯合創始人、院長，並出任謎題科技首席科學家（jiā）當大（dà）模型邁進實際（jì）的應用場景裏，企業（yè）往往麵臨著模型廣譜性不強、入局門檻高的兩大痛點經典的機器學習方法采用的是定製化模式，企業下發任務（wù）後，先定義問（wèn）題、收集數據訓練、模型測試，二工業模型次任務下發後，模型需要再次收集定義問題（tí）、收集數據訓練、模型測試，往往會（huì）導致企業在部署上就已經損耗了極大的財力、人力資源，廣譜性不強。

同時，使用大模型對工程師的技術能力要求極高，需（xū）要具備一定的優化經驗，企業參與門檻高汪軍認為，ChatGPT 結（jié）合決策大模型，可以有效解決低門檻、廣譜性的（de）問題在這（zhè）樣的思考工業（yè）模型下，汪軍領導（dǎo）謎題科技團隊提出 DB 大模型（AIGA 方（fāng）向大模型，AIGA：AI Generated Actions，決策生（shēng）成），其首發的 DB1 為全球（qiú）首個多模態決策大模型，對標 DeepMind 推出的 GATO，可（kě）全麵支撐多智能體，能夠並發處理（lǐ）千個以上決（jué）策任務。

DB1 在車輛協同任務中的表現通工業模型過將（jiāng） ChatGPT 與決策大模型的結合，ChatGPT 帶來的不能（néng）隻是聊天，而是在 AIGC 的基礎上更進一步探索 AIGA，讓模型（xíng）的思考能（néng）力和決策能力（lì）應用到具體場景中，所產生的交（jiāo）互通過跟具體場景的環境交互，小數據完成大（dà）任務，可直接麵（miàn）向產業（yè）真實場（chǎng）景，借助大模型實現任務閉環，實現機器人（rén）協作、設（shè）備動態工業模型、企（qǐ）業自主化調度、軟件開發等更廣泛應用。

進而真正幫助企業和人們解決決策問題，將人類釋放到更具創造（zào）性（xìng）的（de）活動（dòng）中" 最終為整個人類的進步帶來很大（dà）的促進作用在這個情況下，www.17C.com才能孕育出真正的 AGI（通用人工（gōng）智能）"目前，數字大腦研究院的基本架構已搭建完成，業務內容從算法、係統到（dào）具體工程項目均有覆蓋，可應用工業模型於推薦係統、故障預測、自動（dòng）駕駛、市場設計、遊（yóu）戲場景、EDA 優化等（děng）多個場景，解決企業運作過程（chéng）中的實際問題。

走出實驗室、成立數（shù）字大腦研究院，對汪軍而言，感受和狀態（tài）是截然不同的：研究不可能將所有因素放在一（yī）起考慮，要解決這個問題，首先其他東西得簡化，把真正問題解決了再（zài）轉向下一個；而一項研究的落地則更可能是工業模型多個問題的集合體（tǐ），需要（yào）各（gè）個問題都一一擊破，並把解決問（wèn）題的（de）方法（fǎ）統一去應用。

去年 7 月份，AI 科（kē）技評（píng）論曾有（yǒu）幸與汪軍院長進（jìn）行了一場深入討論，彼時他對數研院（yuàn）的目標是，推動決（jué）策智（zhì）能研（yán）究和（hé） AI 研究，在中國做（zuò）最好的、最基礎的研（yán）究而過去短短一年（nián），Stable Diffusion、ChatGPT 和 GPT-工（gōng）業模型（xíng）4 等模型的出（chū）現，讓汪軍驚喜地認識到 AI 技術的革命性（xìng）進步，也令他對數研院（yuàn）有了（le）更具象化的目標，將決（jué）策大模型應用到具體場景中解決實際意義問題。

從學術界到工業界，數字大（dà）腦研究院的發展時間還不長，其雛形也映射出汪軍（jun1）在人工智能路上探知求（qiú）索的方向" www.17C.com就是要走自己的一條路，怎麽樣把產學研結合一起闖出條新路工業模型，問一些以前沒（méi）有問過的問題"三、對話汪軍（jun1）數研院（yuàn）落地決策大模型

AI 科技評（píng）論：介紹一下數研院過去一年在多智能體決策（cè）大模型方麵所做的工作和進展汪軍：去年夏（xià）天我開始計劃一個新的課題，www.17C.com覺得大模型不隻是在（zài） NLP、CV 裏，它在決策中也有很大的作用，當時 DeepMind "Gota" 的工作嚐試將各種各工業模（mó）型樣的任務放在一個大模型裏麵、Transform 裏麵（miàn）去進行學（xué）習，給到了www.17C.com啟發，所以當時就決定在它的基礎上（shàng）往前探索，做了（le）一個決策大模型，包括視頻、圖像（xiàng）的數據，自然語言的數據，機器人的數據，甚至還加入求解器的（de）數（shù）據，例如怎樣做優（yōu）化任務、布置生產排期（qī）、對車輛進行優化等。

www.17C.com做了一個 10、15 億左右參數工業模（mó）型的大模型，雖然是一個早期的探索，但也證明了在大模型裏麵不光隻是自然語言處理，還能在（zài）決（jué）策起到明顯（xiǎn）作用前段時間（jiān）www.17C.com在做足球遊戲，發現有個沒有（yǒu）攻克的問題：現在強化學習所存在的研究邏輯，AlphaGo、星際爭霸（bà）、Dota 等帶有遊戲係統中，人越（yuè）多，其決策空間也會更加複（fù）雜。

對此，www.17C.com以遊（yóu）戲場景（jǐng）的足球作為問（wèn）題研工業模型究點，在多智能體（tǐ）決策大模型中進行了（le）多次嚐試，從簡單的 2 人足球，到 5 人、到（dào） 11 人這（zhè）個是比較大的、對強（qiáng）化（huà）學習有挑戰性的場景，目前（qián）問題本質還沒有完全解決，或者說解決得很好，因此www.17C.com也花了（le）很多時間（jiān）在做這件事情，希望能做出一點成（chéng）績。

AI 科技評論：ChatGPT 發布後，對數研院的研究帶來什麽影響工業模（mó）型？汪軍：www.17C.com一直重心在是決策上，現（xiàn）在也一直是但 ChatGPT 出來後（hòu），www.17C.com（men）對它的語言能力感覺到非常驚豔，完全超過www.17C.com的（de）預期（qī），對決策任務也起了一定的促進作（zuò）用。

在做決策優化（huà）的過程中，需要解決兩大痛點：廣譜性和低（dī）門（mén）檻決策大模（mó）型在（zài）一定程度上解決了模型的廣譜性問題（tí），將新任務放置大模型內（nèi）進行迭代、微調，一個大工業模型模型可以應對各種各樣的決策問題低門檻問題在做 AI 公司中普遍存在，在此之前（qián），使用大模型對工（gōng）程師的能力要求非（fēi）常（cháng）高，往往需要有優化經驗的人參與到問題決策過（guò）程中，個人（rén）和企業參與的門（mén）檻非常高，也（yě）增加了（le） AI 的使用成本。

為了解決使用的低門檻問題，www.17C.com之前預想發明一個比較簡單的（de）語言，可以比自然語言（yán）要更（gèng）複雜、工業模型嚴謹（jǐn）一點（diǎn），但（dàn）比真正的編程簡單些，任何人都可以使用，ChatGPT 的出現，突然讓（ràng）www.17C.com（men）意識到，機器（qì）的自然語言可（kě）以達到一個正常跟人交流的水平，一下子就把低門檻的痛點解決了。

對www.17C.com來說，這個改變帶（dài）來的觸動是比較大的更有意（yì）思的是，ChatGPT 裏具有一定的邏輯推理能力，可以幫助www.17C.com將一個複（fù）雜的問題分解為幾（jǐ）工業模型個（gè）子問題，這（zhè）個子（zǐ）問題部分原本需要（yào）專業人士（shì）進行人（rén）為分解，但通過 ChatGPT 對語義的理解，在得到範例的（de）情況下可（kě）對問題分解成基礎的問題，再（zài）經由決策大模型對基礎問題已有的決策能力，實（shí）現直接調用。

ChatGPT 降（jiàng）低決策門檻AI 科技評論：多智能體決（jué）策大模型涵蓋的領（lǐng）域很多，在數據這塊會有什麽要求？把工業模（mó）型它跟 ChatGPT 進（jìn）行結合（hé）後，對某一領域（yù）的數據（jù）是否有特別的需求？汪軍：它會有一些特定的要求。

自（zì）然語言的數（shù）據是離（lí）線的，屬於方法（fǎ）論上的學習；而決策中需（xū）要很多產生數據的能力，需要一個（gè）仿真器舉個例子，當我（wǒ）們訓練機械狗走路時，我（wǒ）們不會讓它到雨天裏（lǐ）或其他環境走一圈將數據采集回來，往往是（shì）先建一個跟外界非常像的工業模型仿（fǎng）真器，通過仿真器來產生數據，模型（xíng）學習完後再放到真實場景給予反饋，回來再進行學習，從而（ér）使得它可以（yǐ）很快將決（jué）策能力遷移到現實中（zhōng）應用（yòng）。

大模型技術囊括（kuò）各（gè）種（zhǒng）各（gè）樣的場景，無（wú）論是下雨天、走台階（jiē）、走沙土都沒有任何問題機械狗在不同環境中行（háng）走第二個難點是，決策（cè）數據訓練（liàn）的難度（dù）比自然語言處理的難度要大，這個過程中在不（bú）斷產生工業模型數據，數據產生的效率、產生在什麽地方，如何分配到各個學習模塊裏麵進行學習，需（xū）要（yào）統一的係（xì）統層麵解（jiě）決方案（àn），此前（qián）www.17C.com專門做了一套大規模的學習方法，主要應用（yòng）在這種強化學習訓練的方法。

但 ChatGPT 出來後，基（jī）於大預言模（mó）型的訓練方法（fǎ）不太適用AI 科技評（píng）論：具體場景中，如何用 ChatGPT 跟決策大模型進工業模型（xíng）行結合（hé）？汪軍：舉一個機械狗的案例（lì）：最早www.17C.com訓練機械狗使用的是歸控的經典方法（fǎ），它的問題是在單一環境路況上走沒有問題，但（dàn）遇到雨（yǔ）天、雪天就走不了，但當www.17C.com加入了大模型方案後，機械狗（gǒu）開（kāi）始具備基礎的交互能力，可以（yǐ）進行推理。

向機（jī）械狗下發一個送信的指令，模型會將任務自動分解為 1 至 5 個基礎步驟，每個模塊在傳工業模型送（sòng）中有對應邏輯（jí），例如從 A 點行至 B 點的路徑規劃由於機械狗自身並不具備往東走、往西走的概念，隻有坐標，因此需要將交互指令與具體的語義結（jié）合、對應（yīng）起來（lái），通過 ChatGPT 的（de）方式，www.17C.com（men）無需將指令轉化為編程語言，可直接進（jìn）行交互，機械狗在接收到問題後，會講指令分解成幾個不同的問題，先優化一部分的 Ch工業模型at，將動作、決策（cè）和語義同 ChatGPT 產生自然語言對應起來。

這樣成（chéng）為了www.17C.com接下來研究（jiū）的主要方向，www.17C.com（men）將其稱為 AIGA（AI generate actions），前（qián）期 ChatGPT 帶來的是 AIGC，再結合決（jué）策大模型，從（cóng） generate content 更進（jìn）一步、變為 generate 工業模型actions，生成決策。

數研院的長處是（shì）在決策大模（mó）型，因此（cǐ）www.17C.com堅持決策大模型的方向是不變的（de），要（yào）讓（ràng） AI 不隻是交流（liú），更重要的它是幫助你去優化，幫助你去做決（jué）策，我（wǒ）們覺得它的價值非常大ChatGPT 結合決策大模（mó）型後，所產（chǎn）生的（de）交互不再僅限於它能回答問題，更在於它是否（fǒu）能理解複雜、構建複（fù）雜，通過跟（gēn）具（jù）體場景的工業模型環境交互，ChatGPT 跟決策大模型進行結合，可（kě）實現機器人協作、設備動（dòng）態、企業自主化調度、軟件開發等更廣（guǎng）泛應用。

自（zì）然語言是基礎AI 科技評論：在訓練多模態數據之後，參數量到（dào）達多少會湧現更多的能（néng）力 ? 文字，圖（tú）像，語音，視（shì）頻……哪一個模態對多模態模型的影響會更大？汪軍：在數據方麵，" 大力出奇跡 "工業模型這個事情有一定的（de）極限（xiàn），雖然目前這個極限www.17C.com還沒有完全看到，但（dàn）是我覺得，www.17C.com不是隻著眼（yǎn）於僅學（xué）習 ChatGPT 的訓練方式。

ChatGPT 的語言能（néng）力很強、對話能力很強，但（dàn） ChatGPT 是否真正理解了它吸收的內容？我（wǒ）認為它（tā）是沒有理解（jiě）的讓（ràng）它玩猜數字遊戲，表麵上它可以玩，但其實（shí）它是（shì）不知道、沒法猜到你工業（yè）模型心裏的數字ChatGPT 更（gèng）多是在原有訓（xùn）練數據（jù）中對邏輯內容的記憶，它的搭料能力很強，但是它真正理解的（de）能力很弱。

如何打破它的局限性？我認（rèn）為，www.17C.com需要在訓練裏加上模型對整個世界的理（lǐ）解，如果它本身不去建一個描述世界的數學（xué）模型，把它的理解放到世界模型中，它（tā）不會對周圍世界有更深層（céng）次的理解的舉個簡單（dān）的例子，www.17C.com工業模型給 ChatGPT 2000 分以下的所有人類下棋能力的數據，如果模型隻模仿人，那麽它無法模仿出比 2000 分更高的智能。

汪軍團隊此前所做（zuò）的 AI 創作助手數據很重（chóng）要，但與此同（tóng）時，模型的大小也很重要，要有不同的訓練方法來（lái）提高它而在多模態中（zhōng），自然語言是基礎，人在思考時，語言是www.17C.com的思維的載體，它構架工（gōng）業模型了一個（gè）相對（duì）清晰的邏輯描述，這個邏輯描（miáo）述可（kě）能（néng）並不是（shì）百分百（bǎi）嚴謹，存在不清晰、模糊的地方，但是它足夠讓（ràng）www.17C.com去表達一些非（fēi）常複雜的邏輯關係。

但與此同時，www.17C.com也要清晰地認識（shí）到，自然（rán）語言中隱含的語義信息和表達是非常重要的，也就是說，它（tā）可以能把這個問題表述（shù）得很清晰、但這是表象，最主要的（de）是對話裏麵含載的語義關係，當其工業模型他多模態來了之後，匹配上相應的語（yǔ）義表達，就可以遷（qiān）移到其他的模態當中。

在自（zì）然語言的基礎上，www.17C.com可以加入（rù）其他更多模態（tài）參與到模型當中（zhōng）AI 科技評論：您（nín）如何看（kàn）待 " 人類反饋 " 數據對多模態大模型或決策大模（mó）型的影響？汪（wāng）軍：需要一些人類反（fǎn）饋數據，但它的量不像（xiàng）以前的監督式學習需求量那麽大，一個基礎（chǔ）模型（xíng）隻需要給工業模型（xíng）它幾個示範（fàn），目的是導引基礎模型適應新的任務場景，令基礎（chǔ）模型把原來的能（néng）力顯露出（chū）來。

這是（shì）對經典機器（qì）學習訓練（liàn）模式的革新以前的機（jī）器（qì）學習，大部分 AI 企業采用的是定製化模式，任務來了先定（dìng）義問題、收集數據訓練、模型測試（shì），第二個任務下發後、又再次收集定義問題、收集數據訓練、模型測試，不（bú）僅難以複製，部署也會損耗極工業模型大的財力、人力資源。

ChatGPT 後的機器學習是大模型先行，我不需要知道具體的問題是什麽，就（jiù）可以先搭建模型，再分發至客戶或（huò）廠家，將模仿放置到某一個不具有訓練大模型能力的公司，由公司去部署（shǔ），再進行定（dìng）義（yì），整體流程反（fǎn）過來了，其本質是激活大模型應用至（zhì）特定任務中，再定義任務、輸出結果，極大地降低了 " 人類工業模型反饋 " 數據對模型的影（yǐng）響，真正實（shí）現廣譜性、低門檻的 AI。

AI 科技評論：有看法認（rèn）為，在（zài） ChatGPT 這輪競賽中，算力和模型不再如前兩個時期那麽重（chóng）要，而場景和數據將成為這一輪關鍵，您是怎麽看的？汪軍：模型很重（chóng）要當前一些大（dà）模型語言能力的提升，會令人產生模型也具備理解人的能力，但這（zhè）隻是表象。

僅靠幾工業模（mó）型個字來預測下一個（gè）單詞的基礎模型訓練（liàn）方法、難以產生更大智能的 AI，模型的思考能力和決策能力無法得到提升，而這兩者是作為人工智能（néng）體最基（jī）礎的能力，它需要知道怎樣（yàng）去跟（gēn）環境交（jiāo）互從這個模型（xíng）角度來講，模型仍（réng）需要進行革新，Transform 這（zhè）個架構很好，但並不代（dài）表就可以止步不前，www.17C.com仍然需要革新的、有創造力的、工業模型能產生思考的神經（jīng）網絡模型（xíng）出現。

算力、模（mó）型、數據（jù）、場景（jǐng）四者都很重要，當數（shù）據和算（suàn）力（lì）達到（dào）一定高度後、需要一個新的創新出現，創新後（hòu）再（zài）進行數據和算力的變量累積（jī），再達到一定的高度和進行創新，這是一個螺旋（xuán）上升的過程場景（jǐng）是目的，最終www.17C.com需要在場景中定義問題、解決問（wèn）題，而不僅僅讓研究停（tíng）留在（zài）學術層麵。

場景驅動之後，再使工業（yè）模型用一個新的模型或方法，用數據和算力使它達到又一個極致ChatGPT 的廣譜性很強（qiáng），但並不代表它能夠（gòu）解決所有的 AI 問（wèn）題，www.17C.com應該思考下（xià）一個場景的東西什麽、能夠解決什麽問題？問題的核心是，讓模型的思考能力和決策能力，真正能夠應用到具體場景中，同時它要跟環境進行交互，跟人、跟各種各（gè）樣的場景進行交互，最工業模型終（zhōng）實現對整個能源產業，整個人類的進步帶來很大的促進作（zuò）用（yòng）。

在這個情況下，www.17C.com才能孕育出（chū）真正（zhèng）的 AGI。這也是數研院的目標。（雷峰網雷峰網）查看（kàn）原文

標簽：

上一篇（piān）：展品模型（xíng）

下一篇：航空（kōng）航天模（mó）型

新聞動態

常（cháng）見問題

工業模型

產品推薦

微信號：微（wēi）信二維碼