免費谘詢熱(rè)線
13621929115文|自象限 羅輯 編輯|莊顏 ChatGPT在全球掀起AI大模型的浪潮 在美國,以OpenAI、Anthropic等初創企業和以(yǐ)微軟、Google為代表的科技巨頭帶領著美國在AI大模型的道路上蒙眼狂奔,最大參數已卷到5620億。
在中國,美團王慧(huì)文、阿裏賈揚清、前搜狗CEO王小川(chuān)、前京東(dōng)AI掌門展品道具人周伯文等眾多早已功成名(míng)就的(de)科技(jì)大佬再次披掛 AI大模型一時間如烈火烹(pēng)油 但在這一輪浪(làng)潮中, 大家主(zhǔ)要關注的(de)還是中美(měi)兩國的進展在此之外,世界其他國家和地區如何看待AI大模型,在(zài)發展大模(mó)型上又進展如何(hé),不同國家和地區的AI大模型發展呈現出哪些特點?這些問題在中美的光環(huán)下其實是失焦(jiāo)的。
所謂它山之石可展品(pǐn)道具以攻(gōng)玉,在這樣(yàng)的背景下,‘自象限(xiàn)’梳(shū)理了包括中國、美國、韓(hán)國、日本和歐洲等主要國家AI大模型的發展現狀 www.17C.com發現,一方麵,不同國家(jiā)AI大模型的發展與所在國的互聯網發展息息相關;另一方麵,包括芯片(piàn)、雲計算、高質(zhì)量數據等產業基礎,模型構架和算法經(jīng)驗,以及用戶群體、社會文(wén)化又共同決定(dìng)了所在國家AI大模型展品道(dào)具的發展高度。
就(jiù)如同比爾 蓋茨將(jiāng)ChatGPT的發布比(bǐ)做互(hù)聯網的發明,並(bìng)認為它可以改變世界一樣,英偉達CEO黃仁勳也在GTC2023上三次提(tí)到“AI迎來iphoness時刻”AI大模型是全世界的機會,而中國創業者更不應該存(cún)在視野盲區。
將(jiāng)視野拉遠(yuǎn)便會發現,各國大模型都繼承了本國(guó)“基因”,前二十年互聯網(wǎng)與科技展品道(dào)具積累的成果,也都在AI 2.0的大考下,瞬間爆發有人交了滿分答卷,也有人名落孫山 美國在AI大(dà)模型方麵的強,不是現在強,而是一直以來都很強。
從(cóng)2012年AI萌芽時期,到2016年AI1.0時期,再到2022年ChatGPT帶來的AI2.0時期,美國一(yī)直是AI領域的破局者,引領著(zhe)全世界AI發展再進一(yī)展品道具步 比如現在幾乎所有AI大模(mó)型訓練(liàn)時采用的Transformer網絡結構,是穀歌在(zài)2017年提出的,它具有優秀(xiù)的長序列(liè)處理能力,更高的並行計算效率,無需手動設計以及更強的語(yǔ)義表達能力等特征。
Transformer的提出讓大模型訓練成為可能 算力(lì)是保(bǎo)證AI大模型出現在美國的另一個關鍵,而美國一手雲展品道具大廠(chǎng),一手英偉達,手握著全球算力的核心資源 雲計算能夠為AI大模型訓練提供計算、存儲、網絡和應(yīng)用平台,同時也提供數據處理、模型部署、推(tuī)理等AI工具和服務。
讓企(qǐ)業能夠快速(sù)訓練大模型,而不用再花費(fèi)你大量時間和金錢去建立和維護自己的數據中心 目前,美國擁有世(shì)界(jiè)上最大的雲計算企業IDC數據顯示,2021展(zhǎn)品道具年全球IaaS市場中,包括亞馬遜(xùn)、微軟、穀歌、IBM在內的美國企業合計占比近(jìn)70%。
而美國最具(jù)代(dài)表性的AI大模型初創企業,無論(lùn)是OpenAI還是Anthropic都接受了微軟和穀歌這樣的雲大廠投資這背後除了資金支持(chí)外,更重要的原因還(hái)在於背後的(de)雲計算資源
算力的(de)另一個維度是芯片,高性能的芯片可以提(tí)供更加(jiā)展品道具高效的計算能力,從而加速訓練(liàn)過程 速(sù)度有多快呢?2016年,黃仁勳親手將世界第一台DGX-1(英(yīng)偉達計算平(píng)台)捐獻給了OpenAI,DGX-1是(shì)3000人(rén)花費(fèi)3年時間才研發出來(lái)的首(shǒu)個輕量化的小型超(chāo)算,計算和吞吐能力相當於 250台傳統服務器。
有了DGX-1,OpenAI之前一年的計算量(liàng)隻要一個月就展品道具能完成 而目前為止,英偉達的A100芯片仍然是唯一能夠在雲端實際執行任務(wù)的GPU芯片最近的GTC2023上,黃仁勳又更新了新芯片H100的進度H100配有Transformer引擎,可(kě)以專門用作處理類似ChatGPT的AI大模型,由其構建的服務器效率是A100的十倍。
可以說,在AI大模型領域,目前展品道具的美國就是妥妥的“別人(rén)家孩子”,這也導致目前行業最具代表性的AI大模型都集(jí)中在美國 比如(rú)OpenAI最新發布的多模態預訓(xùn)練大模型GPT-4,穀歌最(zuì)新推出“通才”大模(mó)型PaLM-E,擁世界最大規模的5620億參數,能看圖說話、能(néng)操控。
機器人,以及剛剛(gāng)解決AI繪畫手指問題的Midjourney等等(děng) 展品道具但在快(kuài)速(sù)發展的過程中,美國(guó)業界對於AI大模型也持激進和保守兩種不同的態度 其中,微軟支持(chí)的OpenAI在推動大模型落地時就更加激進根據OpenAI關於GPT-4的安全文檔,OpenAI曾在發布(bù)GPT-4前聘請安全專家進行測試。
OpenAI在(zài)文檔中(zhōng)寫道:“GPT-4表現出一些特別令人擔憂的能力,例(lì)如展品道具製定和實施長期(qī)計劃的能力,積累權力和(hé)資源(尋求權力),以及表現出越來越‘代理’的行為”因此有安全專(zhuān)家建議將 GPT-4 的部署(shǔ)時間推遲 6 個月,到今年秋季再發布,但OpenAI並沒有采納這份(fèn)建議。
而另(lìng)一方麵,在ChatGPT發布(bù)之後,穀(gǔ)歌曾表示自己已經具備相似能力的AI大模(mó)型(xíng),但基於安全考慮並沒有展品道具及時推向市場包括OpenAI創始人Sam Altman和馬斯克(kè)都曾(céng)多次在公開場合(hé)表達了對AI大(dà)模型和人工智能的擔憂,表示(shì)應該更(gèng)謹慎地對待大模(mó)型(xíng)的市場化。
目前由(yóu)穀歌投資的,能夠對標OpenAI的另(lìng)一家AI初創公司Anthropic其實就是因為這樣的理念不同,而從OpenAI出走並自立門戶(hù)的 當然(rán),在展品道具(jù)激烈的市場(chǎng)競爭下,即使曾經相對謹慎的穀歌也似乎忘記了這條(tiáo)擔憂,並在3月7日報複(fù)性砸出5620億參數大模型,甚至能夠控製機器人運(yùn)動。
目前,以微軟和OpenAI為代表(biǎo),美國AI大模型正在積(jī)極推動產業應用微軟早在2月份就宣布將會在全線(xiàn)產品接入ChatGPT,並以幾乎一周一個產品的速度向外更(gèng)新 從New 展品道具Bing到(dào)加入最新功能Copilot的Microsoft Teams正在攪(jiǎo)動全(quán)球的產業變革。
如果說(shuō)美國是(shì)最厲(lì)害的大模型“老炮”,那日本可能就要淪為這次排名的“吊車尾” 日本的落後其實要從上個互聯網時代講起www.17C.com盤(pán)點世界AI大模型(xíng)領域的關鍵角色會發現,無論是中國的BAT,韓(hán)國的Naver,還是美國的(de)穀展品道(dào)具歌、亞馬遜,他們都(dōu)是互聯網時代的(de)巨頭。
一方麵,這些企業通過互聯網業務積(jī)累了大量(liàng)的高質量數據;另一方麵,他們在自身業務推動下建立了完整的雲計算體係但(dàn)盤點之後www.17C.com發現,整個日本既沒有叫得出名(míng)字的互聯網巨頭,也沒有拿得(dé)出手的雲計算廠商 目前,日本的即(jí)時通訊軟件來自(zì)韓(hán)國的LINE,雲計算業(yè)務也被美(měi)國企業長展品道具(jù)期把持(chí)。
2022年(nián),日本雲計算市場份額約占全球的4%,排名第四但日本雲(yún)計算市場的主要(yào)競爭者(zhě)卻是美國的(de)三大雲巨(jù)頭亞馬遜、微軟和(hé)穀歌,它們在日本的(de)市場占有率已經達到(dào)60%~70% 除此之外,日本其實還麵臨許多其他問題,比如由(yóu)於半導體產業的(de)衰落,讓(ràng)日本在本應成為(wéi)最大優勢的AI芯片領域缺位;比如作為一(yī)個小展品道具語種國家,日語麵臨和中文一樣缺乏語料的問題。
在這樣(yàng)的背景下,日本在AI時代其實(shí)早就喪失了(le)自主權所以www.17C.com盤點日本的AI大模型,會發現它們大多具有美國或者韓國色彩 比如日本最早公開上線的(de)NLP大模型(xíng)是2020年發布的NTELLILINK Back Office NLP,當時它能實現如文檔分類(lèi)、知識閱讀展品道具理解、自動(dòng)總結等功(gōng)能。
但NTELLILINK Back Office是在穀(gǔ)歌BERT基礎(chǔ)上(shàng)開(kāi)發的應用,就像中國許多基於GPT-3開發(fā)的應用一樣 更有日本血統的生成式AI其實(shí)是HyperCLOVA、Rinna 和 ELYZA Pencil,但其中HyperCLOVA 和 Rinna 也都有外國基(jī)因。展品道具
其中,HyperCLOVA最早是韓國搜索巨頭NAVER在2021年推出的,其日本版是由NAVER和其子公司(sī)LINE(韓(hán)國軟件在日本經營)一起(qǐ)研發但HyperCLOVA確實(shí)是第一個專門針對日語的大語言模型,其通過爬取日本的博客服務來獲取(qǔ)訓練數據,並在2021年舉行的對話係統現場比賽中獲得了(le)所有賽道的第展品道(dào)具一名。
基於HyperCLOVA,LINE也推(tuī)出許多應用,比如聊天機器(qì)人CLOVA Chatbot、圖像識別CLOVA OCR和科洛瓦演(yǎn)講CLOVA Speech等等HyperCLOVA擁有820億參數,目(mù)前正計劃通過超100億頁的日文數據作為學習數據將模型(xíng)規模(mó)擴大到1750億。
▲ 圖源日(rì)本版Hype展品道具rCLOVA官網(wǎng) 日本的另一個AI大模型Rinna則與微軟有關,Rinna最早是微軟日本研發的一款聊天機器人,類似(sì)於國內的小冰(之前叫微軟小冰,目前已獨立運營) 2021年8月,Rinna發布了一(yī)個(gè)名為GPT2-medium的模型,然後又在次年推出了日本版的GPT-2,參數達到13億。
日語版GP展品道具T-2與GPT-2的區別在於,GPT-2采用的是英(yīng)文語料,而日語版GPT-2是基於日語語料訓練
▲ 圖源日本Rinna官網 目前,Rinna的日語版(bǎn)GPT-2和HyperCLOVA已經是日本參數規模最大,最具代表(biǎo)性的(de)大模型了 當然,日本也有(yǒu)一些(xiē)真正土生土長的大模型,比如2022年3月,由東(dōng)京大學鬆展品道(dào)具尾研究所的AI初創公司 ELYZA Co., Ltd.推出大語言模(mó)型,它(tā)以(yǐ)產品“ELYZA Pencil”的方式推向市場。
輸入(rù)幾個關鍵字,ELYZA Pencil可以(yǐ)在大約 6 秒內創建三種類型的日語新聞報(bào)道、電子郵件(jiàn)或簡曆
▲ 圖源(yuán)ELYZA Pencil官網 所以(yǐ)算起來,ELYZA Pencil展品道具才算真正意(yì)義上日(rì)本首次公開發布的生成式AI產品(pǐn),但僅有ELYZA Pencil顯然很難成(chéng)為全村的希望 日本政府其實也在想辦法扭轉這種局麵,比如2022年5月,日本政府計劃將(jiāng)雲計算服務列為涉及國家安全的“特定(dìng)重要(yào)物資”,並將加(jiā)強(qiáng)日本本國的“國產雲”,但執行下(xià)來其實收(shōu)效甚微。
畢竟無論是互聯網還是雲計算(suàn)展品道具都是(shì)規模經濟,需要有足夠的市場容量才能產生經濟效益這也導致日本互聯網和雲計算無論是在全球(qiú)市場,還是(shì)在本土市場都缺乏充足的成(chéng)長空間 但即便如此,日本市場也在積極做著大(dà)模型的應用的研(yán)究。
比如2022年5月,東京大學和 Google Brain 的一個研究團隊(duì)發布了論文《Large Language M展品道具odels are Zero-Shot Reasoners》,解決(jué)了大模型0樣本學習的部分問題。
而在日本的(de)互聯網上,日本網友也在積極調用GPT-3的(de)API,嚐試開發自己的獨特應用此外,在剛剛舉行的英偉達GTC 2023上,英偉達(dá)與日本三菱聯合打造了(le)日本第一台用於加速藥研的生成式AI超(chāo)級計算機 沒想展品道具到的是,一直被日本看不上的韓國(guó),在(zài)大模型領域反(fǎn)而比日本跑得(dé)更快些。
事實(shí)上,韓國是最早加入AI大模型研發(fā)的國家之一,但韓國的AI大模型這個國家的經濟一樣,隻有財閥的身影,沒有初創公司的故事目前,韓國(guó)在大模型領域的代表隻(zhī)有互聯網巨頭Naver和Kakao,移動(dòng)運(yùn)營(yíng)商巨頭KT和(hé)SKT,以及通(tōng)信巨頭LG。
除展品道具(jù)了財閥唱主角之外,緊跟美國步伐也是他們的一個重要特點 比如在GPT-3的應用上(shàng),2020年OpenAI發布GPT-3的論文,韓國企業在2021年就推出了相應(yīng)產品,反應速度(dù)比中國更快這種(zhǒng)緊跟在AI方麵也是如此,2020年穀歌、亞馬(mǎ)遜等美國巨頭開始推出(chū)AI加速芯片時,SKT就同步推出了自主研發(fā)的AI加(jiā)展品道具速(sù)芯片SAPEON X220。
韓國在芯片半導體方麵的積累也放大了它在AI大模(mó)型方麵的優勢目前韓國(guó)企業正在和半導體企業積(jī)極結盟,以應對大模型發展帶來的算(suàn)力挑戰 比如2022年底,Naver就開始和三星(xīng)電子合作開發下(xià)一代人工(gōng)智(zhì)能(néng)芯片解決(jué)方案,該解決方案基於Naver推出(chū)的(de)AI大模型Hyperclova展品道具進(jìn)行優化,目前開發(fā)已進入最後階段。
同年,KT公(gōng)司也(yě)對芯片設計公司 Rebellions Inc.進行了戰略投資,這(zhè)是(shì)一家位於韓國本土的AI初創公司,在專(zhuān)用芯片(piàn)方麵擁(yōng)有獨特的技術Rebellions將為(wéi)KT公司優化MI:DEUM,並推動其商業化。
除此之外,KT公司還投資了AI初創公司Moreh,並(bìng)計劃(huá)展品道具在今年推出一套韓國的半(bàn)導體,其效率可能是現在半導體的三倍以上(shàng)KT希望通過這種(zhǒng)方式,全麵進入(rù)目前由(yóu)英偉達主導的AI半導(dǎo)體市場 第三點,則是(shì)韓國在AI大模型的垂類應用已經有比較多的探索。
比如KoGPT在醫療保健方麵的應用,Exaone在生物醫藥和智能製造方麵(miàn)的應用等等 整體上看,韓國(guó)的AI大模型在基展品道(dào)具礎設施方麵非常完善,比如在算(suàn)力方麵有三(sān)星電子,SKT等半導體巨頭;互聯網方(fāng)麵有(yǒu)Naver和Kakao這樣的標杆企業,這些特點都讓韓國能在AI大模型的發(fā)展浪潮中走在世界前列,並推出了(le)一係列具有代表性的(de)AI大模型(xíng)。
比如前麵提到,韓國最大的(de)搜索公(gōng)司Naver在2021年推出了(le)HyperCLOVA,韓國版的展品道具 HyperCLOVA 擁有(yǒu)2040億參數,比GPT-3還要多290億,且其中97%使用的是韓文語料 目前,Naver已計劃在今(jīn)年(nián)上半年基於HyperCLOVA推出Search GPT(類似微(wēi)軟New Bing)並在7月份推出HyperCLOVA X,這是HyperCLOVA 的最新版本。
▲ 圖源展品道具韓國版HyperCLOVA架構 同樣是在2021年,韓國另一家互聯網巨頭Kakao 旗下的AI研究部門Kakao Brain發布了一個基(jī)於(yú)GPT-3的KoGPT,之後Kakao Brain又將KoGPT更新至(zhì)GPT-3.5,實現與 ChatGPT使用相(xiàng)同版(bǎn)本的預訓練大模型。
Kakao Brain 展品(pǐn)道具(jù)首席技術官 Kim Kwang-seob 表示:“KoGPT將專注於(yú)開(kāi)發基於 AI 的圖(tú)像創建技術和醫療保健技術” Kakao Brain在KoGPT之外還推出了基於人工智能的圖像生成器 Karlo,BEDIT和BDiscover,類似於stable diffusion。
▲ 圖源KoGPT研發團隊展品道具 圖源Kakao Brain官網 2022年5月,SKT推出了基於GPT-3的聊天(tiān)機器人A.的測試版,用來處理客(kè)戶的(de)特定任務目前,A.在韓國已經獲得了100萬用戶,並計劃在今年推出正式版(bǎn)。
2022年12月,LG集團的人工智能智(zhì)庫LG AI Research 推出(chū)了Exaone這是一個擁(yōng)有3000億展品道(dào)具參數,使用圖像和文本數據(jù)的多(duō)模態模(mó)型,也是目前韓國參數規模(mó)最大的模型Exaone應(yīng)用在(zài)生物醫藥和智(zhì)能製造方麵(miàn),有助於加速抗癌疫苗和創新電池的開發。
▲ 圖源Exaone在電池產業(yè)和生物醫藥的應用 到今年1月,據韓國經(jīng)濟(jì)日報報道(dào),韓國KT公司也將在上半年推出(chū)自己的類ChatGPT產(chǎn)品此前,KT公司在2展品道具022年11月推出了基於GPT-3的人工智能服務MI:DEUM,它(tā)能夠實時回答問題、總結報紙文章,並給出(chū)投資建議。
KT公司目前也正在(zài)積極向韓國(guó)的金(jīn)融服務(wù)公司(sī)推廣MI:DEUM 但韓國同時也麵臨許多挑戰,比如韓文在語料方麵和中文、日語一樣,麵臨複雜的語言體係和語料不足的問題 HyperCLOVA的展品道具工程師(shī)提到:“韓語是一種凝(níng)集性語言,名詞後麵(miàn)有例子,動詞和形容詞的詞幹後(hòu)麵有尾音(yīn),並有各種(zhǒng)語法性質的表達。
對韓語使用類似英語(yǔ)的標記化已(yǐ)被證明會降低韓(hán)語語言模型的性(xìng)能” 除此之外(wài),韓國產業界認為,韓國嚴(yán)格的數據使(shǐ)用規定阻礙了韓國初創企(qǐ)業收集足夠大的數據來(lái)訓練AI大模型 韓國是目前世界上數據信息管理展品道具最嚴格的國(guó)家之一。
雖然在2020年韓國通過了三大數據隱私(sī)法的修訂法案,以放寬對個人信息使用的規定,但該國對數據使(shǐ)用的規定仍然比其他國(guó)家更嚴格 2021年初,韓國AI初創公司Scatter Lab上線了一款基於Facebook Messenger的AI聊天機器人(rén)“李LUDA”,但(dàn)僅僅過了20天,“李展品道具LUDA”就不得不終止服務,Scatter Lab甚(shèn)至為此公開道歉。
原因在於(yú),“李LUDA”上線之後,一些韓國男性(xìng)用戶將其視作性對象甚至“性奴隸”,肆意(yì)發泄自身的惡意他們對“李LUDA”進行各種言語上的(de)侮辱,並(bìng)以此作為(wéi)炫耀的資本(běn),在網上掀起“如何讓LUDA墮(duò)落”的(de)低俗討論。
受這些信息影響,“李LUD展品道具A”很快開(kāi)始發表各種歧視(shì)性言論,涉及女性、同性戀、殘障人士及不同種族人群“李LUDA”的(de)問題也牽涉出韓(hán)國的個人信息保護問題,並(bìng)有相(xiàng)關部門(mén)介入調查 “李LUDA”的案例就像總能直擊人心的韓國(guó)電影一樣,為世界AI大模型的發展(zhǎn)提供了更多(duō)關於倫理、道德等方麵的啟(qǐ)示。
許多人害怕AI的惡意,但AI其(qí)實本沒有善展品道具惡之分,所(suǒ)謂的善(shàn)惡其實都來自於人類自己(jǐ),這(zhè)取(qǔ)決於你給AI什麽樣數據,就像www.17C.com教(jiāo)予孩子什麽樣的知識一樣 除(chú)此(cǐ)之外,韓國AI大模型領域缺少初創公司的身(shēn)影,且韓國對初創公司的投資也比較匱乏。
根據斯坦福大學HAI發布的 AI Index 2022,韓國初創企業獲得投資額為(wéi)11億美元(yuán),僅占(zhàn)美國初創企(qǐ)業(yè)獲得投展品道具資額(é)529億美元的2%,甚至(zhì)低於(yú)以色列的24億美元這也導致韓國在AI初創公司獨角獸方麵落後於其他(tā)國家。
根據全球科技市場追蹤機構 CB Insights 的數據,截至 2022 年 12 月,美國的 AI 獨角獸數量最多,有 53 家初創公司中(zhōng)國(guó)以 19 家位居第二,其次是英國有4家,但韓國卻沒有AI展品道具獨角獸公司,而即使是國內生(shēng)產總值 (GDP) 低於韓國的(de)以(yǐ)色列也有 3 家。
▲ 圖源數據(jù)來源CB Insights 一家專注於(yú)交互式 AI 技術的韓(hán)國機器學習技(jì)術的企業Genesis Lab Inc. 創始人兼CEO Lee Young-bok 表(biǎo)示,韓國公(gōng)司總體上對人工智能並不友好,並補充(chōng)說政府展品道具或公共組織應(yīng)該更加積極地采(cǎi)用(yòng)人(rén)工智能技術。
一直以來,歐洲似乎是僅次於美國的存在,但在AI 大模型方麵,歐洲並不比日本更出色,甚至處(chù)於持續(xù)擺爛狀態 Future of Life Institute (FLI)曾在2022年11月發表過一篇報告提到:“歐洲沒有開發通用(yòng)人工智能係統,也不太可(kě)能很快開(kāi)始這展品道具樣做。
” FLI是美國的一家致力於減少人類麵臨的全球災難性和生存風險非營利性(xìng)機(jī)構,先進人工智能帶來的風險是其最重要的研究方(fāng)向之一,其創始人包括DeepMind研究科學家 Viktoriya Krakovna,馬斯克也在該機構擔任顧問,並(bìng)提供資助。
FLI認為,在AI大(dà)模型方麵,歐洲可能會主要扮演一個展品道具使用者的角色,即通過接入其他國家開發的大模型API來開(kāi)發應用 比如芬(fēn)蘭的Flowrite,一個基於AI的寫作工(gōng)具,可以將輸(shū)入關鍵詞生成郵件、消息等(děng)內容。
比如荷蘭的MessageBird,一個全渠道通信平台(tái),這兩者都是在GPT-3的基礎(chǔ)上運(yùn)行的 歐洲(zhōu)在AI大模型方麵確實缺少有影響力的(de)企業,唯(wéi)一一個展品(pǐn)道具總部位於英國的DeepMind還是由 Alphabet 全資擁有。
整個歐洲,唯一擔心因為(wéi)大模型落後(hòu)而(ér)被世(shì)界(jiè)甩開,並為此操碎了心的隻有德國 比如穀歌3月7日最新推(tuī)出的多模態(tài)大(dà)模型PaLM-E,就由穀歌和柏林工業大學(xué)共同打造,目前PaLM-E擁有5620億參數,是全球最大的視覺語言模型。
除了合作研發之展品道具外,德國還擁有歐(ōu)洲目前(qián)唯一一款AI大模型 2022年4月,位於海德堡的德國初創公司(sī)Aleph Alpha發布了一(yī)款擁有700億參數的預訓(xùn)練模型Luminous,大約是GPT-3的一半左右。
Aleph Alpha在此(cǐ)基礎上訓練了聊天機器人Lumi,並計劃在今年晚些時候發布最新版Luminous-Wo展品道具rld,其參數規模將達到3000億 作為歐洲企業,Luminous最大的特點在於更保護安全和隱私,Aleph Alpha 表(biǎo)示他們“不記錄(lù)任何用(yòng)戶數據”。
而包括(kuò)OpenAI在內的大多數AI大模型需要用戶數據進行訓練(數據收集過程是透明的)
▲ 圖源Luminous官網 除了建設(shè)大模型,德國也為歐洲展品道具薄弱的人工(gōng)智能基礎設施操碎了心 德國(guó)人工(gōng)智能協會正在開展一項大型歐洲人工智(zhì)能模(mó)型(LEAM) 的計劃,並得到博(bó)世、SAP、大陸、拜耳、默克等德國行(háng)業巨(jù)頭以及歐洲(zhōu)類似人工智能協會的支持。
LEAM計(jì)劃投資3.5億歐元,從數據收集、人才培訓、基礎設施建設等方麵為歐洲AI大模型的發展建立一個有競爭力的 A展(zhǎn)品道具I 生(shēng)態係統(tǒng) 當然,你可以吐槽歐洲在技術和商業上的拉胯,但不能吐槽它在公共事業上的努力(lì)。
歐洲(zhōu)還有一個名叫BLOOM的大模型,發布在2020年8月這是一個由 AI 初創公司 Hugging Face 在法(fǎ)國政(zhèng)府的資助下發起的項目,全球 1000 多名誌願者研究人員耗時一年多創建的 AI 模型,旨在消展品(pǐn)道具除傳統大語言模(mó)型的保(bǎo)密性和排(pái)他性(xìng),並從一開始就嵌(qiàn)入倫理考量。
BLOOM有 1760 億參數,它被設計得盡(jìn)可能透明,並且是第一次采用了西(xī)班(bān)牙語、阿拉伯語等語言訓(xùn)練BLOOM最大的(de)特點在於可訪(fǎng)問性,任何人都可以從 Hugging Face 網站免費下載它進(jìn)行研究。
BLOOM的研究人員認為,開發一個任何人展品道具都(dōu)可以使用(yòng),並且性能與其他高級模型相(xiàng)當的大語言模型將帶來人工智能開發文化的(de)長期變化。所以從歐洲的(de)視角(jiǎo)來看,這是一(yī)項致力於AI民主化的重要工作。
從 BLOOM的視角可以看(kàn)出,歐洲在AI大模型(xíng)上的關(guān)注重點與世界其他國家是不一樣的,開源普惠,綠色安全這一類關於SDG的詞匯一直是歐洲關注(zhù)的重點所以在AI大(dà)模展品道具型之後,歐洲(zhōu)大量精力其實都用在了(le)立法上 比如最重要的一項立法就是即將在3月底提交歐盟議會表(biǎo)決的《人(rén)工智能法案》。
這項法案(àn)是歐盟委員會在2021年提出的,原因是(shì)歐盟認為從(cóng)跨國視角來(lái)看(kàn),各國獨立的監管措施會導(dǎo)致監管碎片化,進(jìn)而妨礙跨境人工智能市場的形成,並威脅到數字主(zhǔ)權同時他們也擔心複雜的監管會抑(yì)製(zhì)創(chuàng)展品道具新、威脅個人隱私、甚至AI一旦(dàn)失(shī)控帶來的一些(xiē)潛在風險。
當然,最重(chóng)要的是,歐盟(méng)希(xī)望通過立法的方式參與到全球人工智能的標準製定當中 具體而言,歐盟希望將(jiāng)不同(tóng)的AI技術根據風險水平進行分類,具體為:最小、有限、高以及不可接受高風險技術不會被禁(jìn)止,但相關公司(sī)將被要求在運營中保持高度透(tòu)明。
而(ér)所謂透明,其中的展(zhǎn)品道具規(guī)則就是迫使相應的公司闡明其人工智(zhì)能模型的內部運作方式 而這項法案(àn)一旦(dàn)通過,意味著將成為歐盟成員國內直接適用的(de)法律,之後如果企業想在(zài)歐盟銷售或使用人工(gōng)智能(néng)產品就必須遵守相應的法規,否則將麵臨高達其全球年營業額 6% 的罰款。
但FLI認為,歐洲(zhōu)對其他國家的技術依賴可(kě)能阻礙歐盟參與製定(dìng)人(rén)工(gōng)智能全球標準(zhǔn)展品道具的努力 歐洲的問題在於,缺乏一個(gè)統一的大市場 在GDP總量上,歐盟2022年GDP16.65萬億美元與中國相當;在人口數量(liàng)上,歐盟2022年人口4.46億,甚至超過美國3.32億。
但歐盟(méng)卻擁有(yǒu)28個國家,23種官方語(yǔ)言,再加上與美國的深度綁定(dìng),都導致歐盟在互聯網時(shí)代沒有創造出一個(gè)大型的互聯網企業展(zhǎn)品道(dào)具,進而在數據量、雲計算、推理訓練等AI大模型相關的基礎設施上被持續拉開 如今在AI大模型領(lǐng)域,歐洲已經很難組織起(qǐ)一場強有力的阻擊(jī),但對於中國企業來說,歐洲仍然是一個廣闊的市場。
許多人可能會認為,中國的AI大模型(xíng)是(shì)從(cóng)“文心一言”開始的但“文心(xīn)一言”其實隻是一(yī)個類ChatGPT的產品,背後驅動(dòng)它(tā)的(de)AI展品道具大模型無論是百度、阿裏、還是騰訊、華為都早(zǎo)有布局 但有意思(sī)的是,中國第一個AI大模型並(bìng)不來(lái)自於這些牛逼哄哄的大企業,而是2021年3月由智源研究院發布的“悟道1.0”。
可能會有人好奇(qí),智源研究院(yuàn)是個(gè)什麽角(jiǎo)色,那我告訴你,它(tā)是(shì)妥妥的國家隊 智(zhì)源研究院是科技(jì)部和北(běi)京市支持的,依托北京大學、清華大學、展品道(dào)具(jù)中(zhōng)國科學院、百度、小米、曠視科技等北京人工智能(néng)方麵優勢企業共同建立(lì)的研究機構。
智源(yuán)研究院推出的悟道1.0並不是某個大模型的名稱(chēng),而是一係列大模型(xíng)的統稱(chēng) 具體包括我國首個麵向中文的預(yù)訓練語言模型悟道·文源;首個公開的中文通用圖文多(duō)模態預訓練模型悟道·文瀾,首個具有認知(zhī)能力的超大規模預訓練模型悟道·文展品道具匯和超大規模蛋白質(zhì)序列預測預訓練模型悟道·文溯。
除了發布(bù)了諸多冠名(míng)“第一”的大模型之外(wài),智源研究院還為中國構建了大規模預訓練模型技術體係,並(bìng)建設開(kāi)放了全球最大中文語料數據庫WuDaoCorpora,為後來其他企業發展AI大(dà)模型打(dǎ)下了基礎 而或許是受“悟道1.0”的影響,後來幾(jǐ)乎所有企業(yè),在發布大模展品道具型的時候都不止發一個(gè),而是一串。
比如百度在2019年發布了文心(xīn)大模型和悟道AI一樣,文心大(dà)模型也是諸多模型的統(tǒng)稱,包括NLP、CV(機器學習)、跨模態大模型和生命計算大模型四個類別36個大模(mó)型 3月16日,基於文心大模型,百度發布(bù)文心一言,成為中國第一個類ChatGPT產品。
華為在在2021年基於展品道具昇(shēng)騰 AI 與鵬城實驗室聯合發布了鵬程盤古大模型盤古大模型包括CV和(hé)NLP兩類大模型其中,盤古NLP大模型(xíng)是業界首個(gè)千億級中文NLP大模型 阿裏在2022年9月發布了“通義”大模型係(xì)列,包含NLP大模型AlicMind、視覺大(dà)模型CV,多模態大模(mó)型M6。
其中M6大(dà)模型是國內首個千億參數多模態大模型展(zhǎn)品道具 目前,阿裏巴巴“”通義”大模型係列已在超過200個場景中提供服務,實現了2%-10%的應(yīng)用效果提升典型使用場景包括電商跨模態搜(sōu)索、AI輔助設計、開放域人機對話、法律文書學習、醫療文(wén)本理解等。
▲ 圖源阿裏官網 同(tóng)樣在2022年,騰訊(xùn)發布混元AI大模型,其中包含NLP、CV和多(duō)模態等基礎模(mó)型和眾多展品道具(jù)行業/領域模型到今年2月初,騰訊混元AI大模型團隊再推出萬億中文NLP預訓練模型HunYuan-NLP-1。
目前HunYuan-NLP-1T大模型(xíng)已在騰訊(xùn)廣告、搜索、對話等內部產品落地,並通過騰訊(xùn)雲(yún)服務外部(bù)客戶 到今年2月底,騰訊也開始研發類ChatGPT產品,並已(yǐ)成立“混元助(zhù)手(HunyuanA展品道具ide)”項目組。
商湯在(zài)3月14日發布多模態通用大模型“書生2.5”,擁有(yǒu)30億參(cān)數(shù),其圖文跨模態開放任務處理能力可為自動駕駛、機器人等通用場景任務提供感知和(hé)理解能力支持“書生(INTERN)”最初版本由商湯科技(jì)、上海人工智能實驗(yàn)室、清華大學、香港中文大學、上海交通大學在2021年11月(yuè)首次共同發布展(zhǎn)品道具。
在此(cǐ)之外,京東在2月10日宣布研發產(chǎn)業版ChatGP—ChatJD,網易、360、字節跳(tiào)動等也宣布(bù)了在AI大(dà)模型方麵的布局 可以說,目前國內有頭有臉的互聯(lián)網(wǎng)企業基本都擁(yōng)有一個AI大模型,或者製定了相應的計劃。
而與國外企業大(dà)多專(zhuān)注於一個大模型不同,中國企業在大(dà)模(mó)型方(fāng)麵的布局並不愛(ài)單打(dǎ)獨鬥,而是喜(xǐ)歡展品道具通過一(yī)個係列來打組合拳 另一個特(tè)點在於,與國(guó)外(wài)大模型在實驗室打磨成熟之外,中國大模型都是從(cóng)產業端(duān)實戰出來的比如阿裏、百(bǎi)度(dù)、騰訊的大(dà)模型都會應用到廣告推(tuī)送、社交平(píng)台的圖片(piàn)識別,內容分發等領域(yù)。
因(yīn)此在中國企業發力大模型的時(shí)候,消費端的用(yòng)戶感知其實並不強烈,但當你(nǐ)體驗到(dào)廣告(gào)推送越(yuè)來越準確,視頻平台和電商展品(pǐn)道具平台的猜你(nǐ)喜歡越來越能Get到你的點,後麵都有大模型的功勞 在大廠之外,與韓國缺少創業不同,AI大模型正在中國帶(dài)動AI大模型領域的(de)創業風潮。
從前美團聯(lián)合創始人王慧文在(zài)朋友圈(quān)公開組(zǔ)隊開始,阿裏(lǐ)VP賈揚清,創新工場CEO李開複、前搜狗CEO王小(xiǎo)川、前(qián)京東AI掌門(mén)人周伯文、出門問問創始人李誌飛等人紛紛下展品道具場創(chuàng)業,據‘自象限(xiàn)’不完全(quán)統計,目前下場的大佬已有10位(wèi)。
除(chú)了(le)創業(yè)之外,中國投資機構也在躍躍欲試 在王慧(huì)文確認下場AI大模型之後,一張真(zhēn)格基金合夥人戴雨森、劉元(yuán)與王慧文(wén)、李誌飛喝酒的圖片在網上瘋傳,被認(rèn)為是AI大模型時代的標誌性照片目前,王慧文的光年之外已經確(què)認2.3億美元的(de)新(xīn)一(yī)輪融資,其中可能包展品道(dào)具括真格資本和源碼資本。
除此之外,在奇(qí)績創壇2022年11月舉辦的2022年秋季路演中,陸奇選擇的55個項目,其中就有16個項目與大模型相關 可以說(shuō),AI大模(mó)型正在成(chéng)為中國(guó)硬(yìng)科技投資的一(yī)個新(xīn)風向整體來看,從投資、創業到應用,中國幾乎是(shì)目前世界上(shàng)最活躍的市(shì)場。
排版|李帛錦 參(cān)考資料: https:展品(pǐn)道具//www.intellilink.co.jp/column/ai/2022/070800.aspx https://bigscience.huggingface.co/blog/bloom
https://futureoflife.org/wpcontent/uploads/2022/11/Eme展品道具rging_NonEuropean_Monopolies_in_the_Global_AI_Market.pdf
http://m.ce.cn/gs/gd/202303/15/t20230315_38444222.shtml
海量資訊、精準解(jiě)讀,盡在新浪財經APP責任(rèn)編輯:張澤宇
Copyright © 2002-2020 上海潤之模型設計有限公司 版權所有 展(zhǎn)示模型,展品模型,展廳模型,展示道具,展廳展品,展品道具,模型定製,模型公司,上海模型(xíng)公司 備案號:滬ICP備20018260號