作為支撐AI數據和模型的底層能量,算力正在成為數字經濟時代新型生產力的主要形式,有望迎來重大發(fā)展機遇。
7月7日,在2023WAIC“計算+:讓人工智能更通用賦能”論壇上,畢馬威中國數字化賦能主管合伙人張慶杰接受了21世紀經濟報道記者的專訪,在他看來,國內各大科技公司近日紛紛推出了自家的大模型產品,AI大模型的競賽正在打響。未來行業(yè)應該從“大規(guī)模、低成本與低能耗”三個方向來進一步夯實算力基礎。
“據公開資料,目前在追趕GPT3.5的中國團隊約有10個,在這一背景下,能否擁有或持續(xù)獲取算力將成為未來決定競爭格局的關鍵?!睆垜c杰說道。
(資料圖)
《21世紀》:您如何看待中國大模型的競爭現(xiàn)狀和發(fā)展前景?
張慶杰:大模型的核心技術壁壘是數據、算法、算力等要素資源的精巧組合,單純從時間維度來評價發(fā)展差距可能過于片面。能夠擁有或持續(xù)獲取算力將是決定未來競爭格局的關鍵。
AI大模型的真正價值最終將體現(xiàn)在具體場景,可以依靠“大模型+小模型”的方式來推進,即大小模型協(xié)同進化,在利用大參數訓練完大模型之后,通過高精度壓縮,將大模型轉化為端側可用的小模型,大模型相當于超級大腦,小模型相當于垂直領域專家,進而實現(xiàn)場景化應用。
《21世紀》:您認為算力如何更好地支持大模型發(fā)展,還面臨哪方面挑戰(zhàn)?
張慶杰:中國是世界人工智能重要領軍國家之一,但做大模型還面臨多方面的挑戰(zhàn),需要在政策、技術、資源、人才培養(yǎng)等方面進行綜合的改革和發(fā)展。
首先在計算資源方面,大模型的訓練需要大量的計算資源,包括CPU、GPU、TPU等。雖然中國算力具備一定的基礎,但在計算資源方面還存在一定的短板,各行各業(yè)在底層計算資源上存在缺乏,這會限制大模型的訓練和優(yōu)化。
除此之外,大模型的訓練需要大量的高質量數據,但是目前在數據質量方面還存在一定的問題,包括數據噪聲、數據缺失、數據不平衡等問題。這會影響大模型的訓練效果和準確性。
而在投入成本方面,大模型的訓練需要大量的資金支持,包括硬件設備、人才引進、技術研發(fā)等方面的投入。最后,行業(yè)應該在專業(yè)人才、技術生態(tài)以及計算架構方面進行發(fā)力,來進一步夯實算力基礎。
《21世紀》:我國高度重視人工智能產業(yè)發(fā)展,智能算力發(fā)展的基礎在不斷夯實。請問智能算力如何推動人工智能的發(fā)展?
張慶杰:對通用人工智能(AGI)的來說,數據、算力、算法三大核心要素中,算力向下扎根于數據,向上支撐著算法,將是驅動AGI發(fā)展的核心動力。算力發(fā)展需要滿足大規(guī)模、低成本與低能耗三個方面。
首先在算力規(guī)模方面,在大數據、大模型、大算力的相互作用下,全球人均算力有望實現(xiàn)G-T-P三連跳,即從GFLOPS級別躍升到TFLOPS再到PFLOPS,乃至更高級別。正如工業(yè)經濟模式下,人均用電量和人民生活質量成正比,在數字經濟時代,人均算力也將會是衡量人民智能化生活水平的重要指標,算力需同電力一樣成為規(guī)?;l(fā)展的公共資源。
但與此同時,大模型訓練依然面臨著高昂的成本。放眼全球,除了幾大科技巨頭外,幾乎沒有企業(yè)承擔得起大模型訓練的高昂成本,算力不實現(xiàn)普惠化,任何關于AI和科技革命的暢想都將是空中樓閣。
目前偏大規(guī)模的算力需求以B端和G端為主,算力降本需求十分迫切,要利用有限資金獲取更多元的算力,同時優(yōu)化算力資源配置和利用效率。
最后,低能耗也是行業(yè)需要探索的方向。數據中心是各國算力發(fā)展的重中之重,但也存在著嚴重的碳排放問題,隨著“碳中和”目標成為全球共識,大部分國家都提出了較為嚴格的數據中心節(jié)能減排要求。
《21世紀》:ChatGPT的出現(xiàn)具有顛覆性意義,中國可以從哪些方面發(fā)力去鼓勵ChatGPT這一類的技術顛覆式創(chuàng)新?
張慶杰:ChatGPT的顛覆性意義在于打破了以往人工智能技術發(fā)展的慣性思維,即從弱人工智能轉向強人工智能(也稱通用人工智能),智能不再局限于某些專用領域,如人臉識別、機器翻譯等,而是在盡可能多的領域中,幫助甚至代替人類執(zhí)行體力和智力任務。
對于鼓勵ChatGPT一類的技術顛覆式創(chuàng)新來說,中國可以從基礎研究、應用創(chuàng)新發(fā)力等方面發(fā)力。
首先,基礎研究是整個科學體系的源頭,也是所有技術問題的總機關,在實現(xiàn)高水平科技自立自強、建設科技強國的時代背景下,基礎研究的重要性愈發(fā)凸顯。
中國近年來一直在持續(xù)加強基礎研究投入,科技部數據顯示,基礎研究經費已從2012年的499億元增長到2022年的1951億元,年均增長近15%,接近全社會研發(fā)投入增長速度的2倍。在通用人工智能這一嶄新發(fā)展機遇面前,圍繞產出重大原創(chuàng)成果,堅持目標導向、市場導向和自由探索將有利于中國在人工智能領域取得重大突破。
與此同時,通用人工智能也應當與經濟社會深度融合,在重大應用場景中錘煉技術。圍繞場景創(chuàng)新加快資本、人才、技術、數據、算力等要素匯聚,促進人工智能創(chuàng)新鏈、產業(yè)鏈深度融合,將會是推動通用人工智能落到實處的重要方式。
夯實底層算力。當前中國各大科技公司正不斷加碼算力進行大模型訓練,普遍要承擔巨大的成本投入。
以構建GPT-3為例,OpenAI數據顯示,滿足GPT-3算力需求至少要上萬顆英偉達GPU A100,一次模型訓練總算力消耗約3,640PF-days(即每秒一千萬億次計算,運行3640天),成本超過1200萬美元,這還不包括模型推理成本和模型后續(xù)升級所需的訓練成本。
因此,推動算力更加普適和智慧,才能切實助力科技企業(yè)等創(chuàng)新主體實現(xiàn)技術攻關。
《21世紀》:ChatGPT在聊天機器人、文本生成和語音識別等領域取得了巨大進展,未來大模型在實體行業(yè)的應用前景如何?
張慶杰:ChatGPT在一定程度上驗證了沿著“大數據、大模型、大算力”路徑發(fā)展通用人工智能的可行性。目前,各類科技創(chuàng)新企業(yè)都在積極探索這種可能性,相關方向包括教育、移動、搜索引擎、內容制作、醫(yī)藥等。
判斷這些應用價值關鍵在于落地成效如何,需要技術提供商和應用側企業(yè)共同厘清落地成效的具體維度和評估方式。
大模型在實體行業(yè)應用中面臨的挑戰(zhàn)和算力的落地挑戰(zhàn)存在共性??傮w來說,算力在各行業(yè)的落地挑戰(zhàn)主要包括算力總量亟需補充、邊緣算力較為緊缺、單位能耗算力性能有待提升、中心式計算架構需轉型等。
預計隨著各行業(yè)全要素、全流程、全場景邁向數字化和智能化,實現(xiàn)“業(yè)務、數據、算力”之間的高效聯(lián)動,將是保證各類大模型或小模型按需匹配、精準賦能的重要前提。
(文章來源:21世紀經濟報道)
關鍵詞: