在Scaling Law(規(guī)模定律)推動下,國內電信運營商亮出打造算力、數(shù)據(jù)兩張網(wǎng)絡的野心。
Scaling Law解釋了模型性能與計算量、模型參數(shù)量和數(shù)據(jù)大小三者之間的關系,盡管業(yè)界對它有所質疑,但不可否認,當前它仍指引著人工智能產(chǎn)業(yè)鏈的商業(yè)發(fā)展方向。
其中,在計算規(guī)模上,IDC曾預計,到2027年,中國智能算力規(guī)模將達1117.4 EFLOPS(每秒一百京次浮點運算)。數(shù)據(jù)量方面,根據(jù)艾瑞咨詢推算,2023年,中國AI(人工智能)基礎數(shù)據(jù)服務市場規(guī)模為45億元,預計2028年將達170億元。
龐大的市場需求催生電信運營商建設算力、數(shù)據(jù)網(wǎng)絡的野心。9月13日,在2024年中國國際服務貿易交易會的企業(yè)數(shù)字化轉型論壇及大模型應用創(chuàng)新論壇上,與會嘉賓共同討論了數(shù)字技術如何賦能企業(yè)數(shù)字化轉型、國內大模型應用現(xiàn)狀與制約。其中,中國電信、中國移動、中國聯(lián)通等電信運營商代表展現(xiàn)了各自的算力、數(shù)據(jù)布局。
國產(chǎn)大模型數(shù)量超200個,國內電信運營商積極部署萬卡集群
“百模大戰(zhàn)”后,國內大模型落地開始加速。但工業(yè)和信息化部原黨組成員、總工程師田玉龍在大模型應用創(chuàng)新論壇致辭中指出,大模型應用滯后于其技術發(fā)展,應用創(chuàng)新也面臨諸多挑戰(zhàn)?!爸饕苤朴诖竽P偷挠柧?,需要海量的數(shù)據(jù)和強大的計算能力支持,數(shù)據(jù)瓶頸和算力不足仍然存在?!?/p>
據(jù)不完全統(tǒng)計,國產(chǎn)大模型數(shù)量目前已超過200個。國家互聯(lián)網(wǎng)信息辦公室最新公布數(shù)據(jù)顯示,截至今年3月,我國共有117個生成式人工智能服務完成備案。
工業(yè)和信息化部原黨組成員、總工程師田玉龍。主辦方供圖
2023年12月,國家發(fā)展改革委等五部門曾聯(lián)合發(fā)文要求加快構建全國一體化算力網(wǎng),電信運營商順勢提出建設“算力網(wǎng)絡”——打通數(shù)據(jù)中心之間的網(wǎng)絡鏈接,讓算力像電力和網(wǎng)絡一樣統(tǒng)一調度資源。
“算力網(wǎng)絡是一種新型基礎設施?!痹谄髽I(yè)數(shù)字化轉型論壇上,中國聯(lián)合網(wǎng)絡通信集團有限公司大數(shù)據(jù)首席科學家范濟安說道。具體來看,算力網(wǎng)絡要在云端、邊端按需分配計算、存儲、網(wǎng)絡這三種資源。范濟安表示,在云計算時期,這三種資源仍然獨立、分系統(tǒng)進行調度,沒有一體化標準?!叭绾我惑w化靈活調度這三種資源,是算力網(wǎng)絡建設的主要挑戰(zhàn)。”另外,在“東數(shù)西算”工程要求下,如何保證確定時延,也是挑戰(zhàn)之一。
目前,大模型的算力需求主要集中在訓練層,隨著應用深入,在重要節(jié)點或邊緣側、應用側的推理也對分布式算力提出調度要求。
對此,中國聯(lián)通、中國移動、中國電信等國內電信運營商搭建起通算、智算、超算等一體化算力平臺。其中,中國電信“息壤”平臺的各類智算能力合計22EFLOPS;中國移動“百川”平臺算力超3.3EFLOPS;中國聯(lián)通“星羅”可調動近500個算力資源池。
中國聯(lián)合網(wǎng)絡通信集團有限公司大數(shù)據(jù)首席科學家范濟安。新京報貝殼財經(jīng)記者 韋英姿 攝
另外,電信運營商還積極加入萬卡建設“大軍”。中國移動今年將商用哈爾濱、呼和浩特、貴陽三個萬卡集群;中國聯(lián)通建設上海臨港、呼和浩特等萬卡智算中心;中國電信天翼云上海臨港國產(chǎn)萬卡算力池已正式啟用。
根據(jù)上述三家電信運營商2024年中期報告,中國移動通用算力規(guī)模達8.2EFLOPS,智能算力規(guī)模達19.6EFLOPS;中國電信推理池的智能算力累計21EFLOPS;中國聯(lián)通全網(wǎng)智算算力達10EFLOPS。
打造數(shù)據(jù)網(wǎng)絡有望解決數(shù)據(jù)集質量問題
高質量數(shù)據(jù)集的獲取與標注掣肘人工智能發(fā)展。在中國電信集團科技創(chuàng)新部副總經(jīng)理陳靖翔看來,將依靠人工處理的數(shù)據(jù)集放到數(shù)據(jù)智能中臺上,通過工具處理能夠大幅提高數(shù)據(jù)運營效率。
中國電信集團科技創(chuàng)新部副總經(jīng)理陳靖翔。新京報貝殼財經(jīng)記者 韋英姿 攝
中國移動通信集團信息技術中心、大數(shù)據(jù)BG總經(jīng)理王翼彬表示,通過數(shù)據(jù)網(wǎng)絡平臺,能夠讓數(shù)據(jù)供需雙方發(fā)現(xiàn)彼此,進行數(shù)據(jù)共享、共同建模。他也希望,數(shù)據(jù)網(wǎng)絡能夠解決高質量數(shù)據(jù)和人工智能模型訓練之間的傳輸問題。
王翼彬認為,數(shù)據(jù)網(wǎng)絡能夠幫助國內數(shù)據(jù)交易中心盈利。據(jù)他透露,中國移動的數(shù)聯(lián)網(wǎng),已經(jīng)與鄭州數(shù)據(jù)交易中心、貴陽數(shù)據(jù)交易所等4家數(shù)據(jù)交易所合作,每月交付量大約在1億條以上。
打通數(shù)據(jù)網(wǎng)絡是為了推動數(shù)據(jù)共享,如何建立數(shù)據(jù)共享新模式?
范濟安認為,可以遵循業(yè)務邏輯,“數(shù)據(jù)互聯(lián)往往是同一條產(chǎn)業(yè)鏈的上下游企業(yè)”。他還提出,可以通過跨界融合的方式共享數(shù)據(jù),這“可能出現(xiàn)‘1+1>2’的商機”。另外,還可以通過設立碳排放、綠色金融、ESG等監(jiān)管類政策要求企業(yè)跨行業(yè)融合、加工、處理和應用數(shù)據(jù)。
業(yè)界尚未形成數(shù)據(jù)共享的統(tǒng)一標準或技術路線。范濟安認為,區(qū)塊鏈技術是較為可行的辦法,它能夠在增強數(shù)據(jù)安全、保護隱私的同時,做到去中心化的數(shù)據(jù)流通、共享。
王翼彬則提出隱私計算的方式。他以金融領域為例說明,隱私計算能夠做到數(shù)據(jù)不出域,同時讓模型挖掘數(shù)據(jù)價值。但他也強調,隱私計算還未形成一套標準體系。“預計未來會出現(xiàn)(標準化體系),否則很難形成集約化發(fā)展?!?/p>
中國移動通信集團信息技術中心、大數(shù)據(jù)BG總經(jīng)理王翼彬。新京報貝殼財經(jīng)記者 韋英姿 攝
近年來,中國移動、中國電信、中國聯(lián)通數(shù)字化相關業(yè)務保持快速增長。今年上半年,中國電信產(chǎn)業(yè)數(shù)字化服務收入737億元,同比增長7.2%。中國移動數(shù)字化轉型收入達1471億元,同比增長11%。中國聯(lián)通算網(wǎng)數(shù)智業(yè)務收入435億元,同比增長6.6%。
其中,天翼云收入達552億元,同比增長20.4%;移動云收入504億元,同比增長19.3%;聯(lián)通云收入317億元,同比增長24.3%。
新京報貝殼財經(jīng)記者 韋英姿
編輯 岳彩周
校對 吳興發(fā)