7月8日下午,以“智聯世界,生成未來”為主題2023世界人工智能大會在上海世博中心閉幕。今年的大會上,“大模型”是當仁不讓的C位。
在今年的閉幕式上,《上海市推動人工智能大模型創新發展的若干措施》公布,并發布了“模”都倡議,簽約了三批人工智能項目,成立上海人工智能開源生態產業集群。
上海市經信委副主任張英介紹,措施圍繞創新能力、創新要素、創新應用、創新環境四大方向,重點打造三項計劃以及五大平臺。破解發展瓶頸的三項計劃,一是大模型創新扶持計劃,重點支持上海市創新主體研發具有國際競爭力的大模型,實施專項獎勵,加速模型迭代;二是智能算力加速計劃,強化大模型智能算力建設力度,建立綠色通道;三是示范應用推進計劃,加強大模型在智能制造、教育教學、科技金融、設計創意、科學智能等垂直領域的深度應用和標桿場景打造。
(資料圖片)
今年的人工智能大會上,30余款大模型集體亮相,包括商湯日日新、百度文心一言、科大訊飛星火認知大模型、華為云盤古大模型、阿里云通義千問、京東云言犀大模型等匯聚一堂,群“?!辫?。
這些大模型技術水平到底如何?我們該如何認識這些大模型?下面是澎湃新聞記者梳理的了解這些大模型的5個維度。
進度:大模型廠商紛紛“搶跑”
眾人口中的“大模型”究竟是什么?公開資料顯示,大模型是指一種參數規模非常大的人工神經網絡。因為參數足夠大之后它能力非常強,所以在很多任務上都表現出非常好的能力。在大模型學習了非常多的知識,經過了非常多的數據訓練后,這樣就具有了非常好的通用性。
從各大廠商的動作來看,其中一大共同趨勢是,大模型發布的更新迭代速度極快??拼笥嶏w高級副總裁、認知智能全國重點實驗室主任胡國平在昇騰人工智能產業高峰論壇上透露,10月24日科大訊飛將發布通用大模型,全面對標ChatGPT,并且中文上全面超越。
此前6月9日,科大訊飛董事長劉慶峰曾宣布,將訊飛星火大模型升級到V1.5;8月25日,訊飛星火認知大模型將突破代碼能力和多模態交互;10月24日,訊飛星火認知大模型的通用模型要整體對標ChatGPT(GPT3.5階段),中文能力實現超越GPT3.5,英文能力與GPT3.5相當。
百度CTO王海峰則在現場介紹了文心大模型3.5的核心技術創新,今年3月,百度發布大模型產品“文心一言”。6月,百度CEO李彥宏表示,百度文心大模型已經迭代到3.5版本。王海峰表示,文心大模型3.5效果、功能、性能全面提升,實現了基礎模型升級、精調技術創新、知識點增強、邏輯推理增強等,模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
另外,文心大模型3.5還新增了插件機制,文心一言已經于6月17日對外發布官方插件百度搜索和ChatFile。百度搜索是默認的內置插件,使得文心一言具備生成實時準確信息的能力。ChatFile是長文本摘要和問答插件,支持超長文本輸入。
阿里云CTO周靖人則宣布,阿里云將把促進中國大模型生態的繁榮作為首要目標,向大模型創業公司提供全方位的服務。據透露,阿里云魔搭社區現已聚集180萬AI開發者和由20多家頂尖人工智能機構貢獻的900多個優質AI模型,將努力把魔搭社區培育成中國最大的‘大模型自由市場"。”
此前4月份,阿里云發布“通義千問”大模型,并宣布阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面改造,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等。
落地:從“通用”到“垂直”
值得注意的是,相比在大模型剛推出時,對于算力和技術的關注更多,如今輿論熱議的焦點從大模型的技術轉移到了實際的商業前景。
7月6日,華為發布盤古大模型3.0,包括“5+N+X”三層架構。華為常務董事、華為云CEO張平安張平安表示,盤古大模型不會作詩只做事,將圍繞“行業重塑”“技術扎根”“開放同飛”三大創新方向,持續打造核心競爭力,為行業客戶、伙伴及開發者提供更好的服務。
華為云盤古大模型3.0明確定位“為行業而生”,張平安表示,盤古大模型要讓每個行業、每個企業、每個人都擁有自己的專家助手,讓工作更高效更輕松,“我堅信大模型將重塑千行百業,而每一個開發者都將是改變世界的英雄。”
此前,華為云人工智能領域首席科學家田奇表示,目前全球基于大模型開發To B應用的企業不到三分之一,行業中的海量業務場景迫切需要更多專業的大模型和專業的AI應用來解決,彌補通用大模型落地行業的不足。
對此,騰訊高級執行副總裁、云與智慧產業事業群CEO湯道生也提到,通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業某個場景的需求。相比盲目使用通用大模型,企業基于行業大模型構建自己的專屬模型,也許是更優的選項。模型參數比通用大模型少,訓練和推理的成本更低,優化也更容易。
“通用大模型和行業大模型并不是對立的。”騰訊云副總裁吳運聲告訴澎湃新聞記者,訓練和部署專屬行業大模型,讓“通才”變“專才”,對企業來說或許是一個可行路徑,但又普遍存在計算資源少、數據質量差、投入成本高、專業經驗少等現實挑戰。此外,安全、合規,也是企業需要考慮的關鍵因素。
算力:本土算力如何滿足需求?
在世界人工智能大會現場,中國工程院院士、清華大學講席教授張亞勤表示,大模型目前在時效性、準確性、算力效率、隱私保護方面還面臨著一些挑戰和局限性。其中,算法本身沒有辦法解決錯誤和不實的信息,因為用戶本身就具備創意。而在算力效率方面,人腦有860億個神經元,每個神經元差不多有將近1萬個突觸。GPT4有著萬億參數模型,但需要巨大的算力和能源。
他提到,如何能降低計算耗能,增加效率是一個大的問題。在此背景下,目前的大模型很難大規模商用,可能至少要提高10倍效率才可以。
華為輪值董事長胡厚崑則表示,伴隨大模型帶來的生成式AI突破,人工智能正在進入一個新的時代。算力是人工智能產業創新的基礎,大模型的持續創新,驅動算力需求的爆炸式增長。可以說,大模型訓練的效率或者是創新的速度,根本上取決于算力的大小。中國的算力已經成為一個越來越稀缺的資源了。
值得注意的是,由于美國對半導體出口限制,英偉達最先進的A100、H100芯片無法在國內銷售。而英偉達專門針對中國市場推出的A800和H800又缺貨嚴重。中國本土算力究竟何時能夠滿足大模型的需求,成為業界關注的焦點。
上海天數智芯半導體有限公司(天數智芯)是一家做通用GPU的芯片公司,天數智芯董事長兼CEO蓋魯江接受澎湃新聞記者采訪時表示:“目前我們已經證明可以用了,不管他們的能不能買,或者賣不賣給中國,我們的產品現在已經在用起來了。”
燧原科技展臺一位產品經理接受澎湃新聞記者采訪時表示,燧原科技產品主要供給各地的人工智能算力中心、科研院所用的算力中心?!爸劣趪a算力能否替代英偉達的芯片,這個有個灰度問題,今天所有的產品放在三五年前都是非常領先的產品,但你有一個英偉達在那里作為標桿,那你性能上就會去對標。”他表示,有些領域還是會用英偉達的產品,而信創等國家非常重要的領域會更多采用本土算力。
據中國信通院報告指出,我國基礎算力呈現過飽和現象,而智能算力存在一定的缺口。報告同時指出,在算力發展過程中,應當維持合適的超前發展,但需要避免算力基礎設施的浪費。
對標:和“世界一流”差多遠?
“中國一旦下定決心要做一件事情,就一定能做好,各個產業都是這樣,包括人工智能,中國會有很強的人工智能能力?!痹诮衲甑氖澜缛斯ぶ悄艽髸_幕式上,特斯拉CEO埃隆·馬斯克在視頻演講中提到。
國產大模型如何超越ChatGPT,一直廣受輿論關注。對此,周鴻祎曾調侃,不少同行都聲稱將在某年某月某一天超過GPT-4,給自己的版本號安上了3.5、4.0各種名頭,暗示自己的產品和國際沒有差距,甚至反超了。今年年初,在ChatGPT發布后,中國已經進入百模大戰,各家企業都發布了自己的大模型產品,這三個月相當于人工智能行業過去的三十年。
“原先我曾說國內大模型和國際差距有一兩年,現在我收回這句話,中國大模型的發展速度已經基本趕上國際先進水平,整體的基本水平已經趕上GPT-3.5,追趕GPT-4的速度也超過自己的想象?!睂τ趪鴥却竽P秃蛧H上的差距,周鴻祎表達了信心。
“在大模型上,中國和美國有不同的優勢。我不同意說中國從今年才開始發力AI的說法,包括騰訊在內,中國很多企業在AI領域有多年發展。盡管國外在今年有突破性技術進展,也超越了國內,但我相信這方面的差距一定會不斷縮小,但具體要多久才能追上,恐怕很難給出一個定論。”騰訊副總裁、華東區總經理張立軍在接受澎湃新聞記者采訪時表示。
京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬則向記者坦言,中國和海外差距沒有想象中那么大,在算法的研究中中國也有很大貢獻,需要關注的反而是細節上的差距,需要對數據、對落地、和組織團隊等一系列細節進行深入的反思,要有足夠的冒險精神,才能在AI領域實現革命性的突破。
據大會發布的《2022全球人工智能創新指數報告》顯示,在人工智能發展上,中美兩國引領、呈梯次分布。中國人工智能發展成效顯著,人工智能創新指數近三年一直保持全球第二水平,在人才、教育、專利產出等方面均有所進步,但基礎資源建設水平仍有待提高。
值得注意的是,在世界人工智能大會現場,國家標準委指導的國家人工智能標準化總體組宣布中國首個大模型標準化專題組組長,由上海人工智能實驗室與百度、華為、阿里、360等企業聯合擔任,現場進行了證書頒發并正式啟動大模型測試國家標準制訂。
安全:大模型狂飆,誰來系“安全帶”
隨著人工智能技術的快速發展,大模型的安全問題也成為熱議的話題,業內擔心快速發展的大模型會發展出一定智能,從而影響人類的正常生活。對此,360創始人周鴻祎曾表示,要保持大模型只是輔助角色,未來要把大模型關到“籠子”里,并呼吁大家在企業級上步子要邁得小點。
在世界人工智能大會上,中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發起《AIGC可信倡議》。該倡議得到數十家單位參與,圍繞人工智能可能引發的經濟、安全、隱私和數據治理等問題,提出構建AIGC可信發展的全球治理合作框架,采用安全可信的數據資源、技術框架、計算方法和軟件平臺等全面提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可釋。
此外,清華大學與螞蟻集團聯合發布AI安全檢測平臺“蟻鑒2.0”,可識別數據安全、內容安全、科技倫理3個類別的數百種風險。螞蟻集團大安全事業群技術部總裁李俊奎表示,生成式大模型是一種“深黑盒”技術,作為“紅隊測試”方,“蟻鑒2.0”扮演了“壞人”角色,通過智能博弈對抗技術,模擬黑產以及自動化生成海量測試集,實現生成式機器人對AIGC生成式模型的誘導式檢測計算,從而給大模型找茬,反饋安全問題所在。