年初,上海重磅發(fā)布人工智能“模塑申城”實(shí)施方案,聚焦“5+6”領(lǐng)域和行業(yè),大力推進(jìn)大模型垂類應(yīng)用。記者最新獲悉,該方案進(jìn)展順利,醫(yī)療、制造兩個(gè)重點(diǎn)行業(yè)已率先破題,構(gòu)建起助推垂類應(yīng)用落地的功能性平臺(tái)。教育行業(yè)的功能性平臺(tái)也即將發(fā)布。
速度之外,功能性平臺(tái)本身亦引發(fā)關(guān)注。它們的定位,在于大模型垂類應(yīng)用“中試訓(xùn)練場(chǎng)”,旨在大幅降低大模型使用門檻。
落地不易
在東方醫(yī)院,被喂了6000本醫(yī)學(xué)教材的AI“醫(yī)生伴侶”,已在輔助醫(yī)生進(jìn)行診斷;在振華重工基地,大量并行交付海外的港機(jī)項(xiàng)目,正由多任務(wù)智能體協(xié)助統(tǒng)籌進(jìn)度。
大模型在不容出錯(cuò)的醫(yī)療和工業(yè)領(lǐng)域,正表現(xiàn)出卓越執(zhí)行力。但殊不知,它們“出道”前卻頗多曲折。
“模型訓(xùn)練一般需要1至2個(gè)月,但此前,資源匹配及各項(xiàng)準(zhǔn)備工作的耗時(shí),可能是真正訓(xùn)練的數(shù)倍。”一家大模型垂類應(yīng)用服務(wù)商向記者詳述工業(yè)用戶為降本增效而苦練大模型的“漫漫長(zhǎng)路”——
制造業(yè)一旦決定問(wèn)計(jì)于大模型,往往自建團(tuán)隊(duì),第一步是尋找算力;诂F(xiàn)實(shí)考慮,企業(yè)多半會(huì)選擇中外芯片“混搭”,這就牽出新的問(wèn)題,即要在多元異構(gòu)的算力下絲滑地完成大模型訓(xùn)練,這絕非易事,需要專業(yè)公司幫助進(jìn)行混合訓(xùn)練、推理加速和算力調(diào)度。另一方面,模型廠商各有強(qiáng)項(xiàng),有些擅長(zhǎng)視頻、圖形和語(yǔ)音處理,有些在長(zhǎng)文本記憶、推理運(yùn)算上有優(yōu)勢(shì)。為此,應(yīng)用方又需要挨個(gè)試驗(yàn)評(píng)估,才能找到最適配的,其中“交學(xué)費(fèi)”在所難免。
通常而言,企業(yè)跑到這一階段,基本無(wú)力再跑。少數(shù)不甘心的企業(yè),會(huì)接續(xù)財(cái)力和資源,向外尋找專業(yè)人員,具體工作包括:開(kāi)發(fā)工具鏈與中間件、外掛知識(shí)庫(kù)、對(duì)模型進(jìn)行反復(fù)精調(diào)和預(yù)訓(xùn)練等。與此同時(shí),企業(yè)還需要為獲取高質(zhì)量語(yǔ)料而奔走……以上諸多環(huán)節(jié),每個(gè)環(huán)節(jié)略有偏差,最終訓(xùn)練出的智能體便可能“失之千里”。
因此,制造業(yè)潛心投入6至12個(gè)月,結(jié)果大模型垂類應(yīng)用始終難以交付的情況非常多見(jiàn)。
按需“中試”
不難想象,大量垂類應(yīng)用需求方都走過(guò)類似“彎路”。在上海市人工智能行業(yè)協(xié)會(huì)秘書(shū)長(zhǎng)鐘俊浩看來(lái),產(chǎn)業(yè)界大可不必“重復(fù)造輪子”。
那么,有沒(méi)有可能搭建一個(gè)平臺(tái),將前輩“踩坑”“交學(xué)費(fèi)”后泣血實(shí)踐出的成熟方案和諸多工具,進(jìn)行集中歸納展示,讓?xiě)?yīng)用方按需取用,看到捷徑的可能?
事實(shí)上,早在“模塑申城”實(shí)施方案正式發(fā)布前,一個(gè)致力于減少大模型試驗(yàn)成本、幫助企業(yè)高效實(shí)現(xiàn)產(chǎn)品化的“中試訓(xùn)練場(chǎng)”,就已經(jīng)由政府部門牽頭推進(jìn)起來(lái)。
今年1月4日亮相的上海新型工業(yè)化MaaS(模型即服務(wù))平臺(tái)便是成果之一。該平臺(tái)的發(fā)起單位包括上海市經(jīng)信委、上海市委網(wǎng)信辦、上海聯(lián)通、上海市先導(dǎo)產(chǎn)業(yè)促進(jìn)中心、上海市人工智能行業(yè)協(xié)會(huì)、上海市互聯(lián)網(wǎng)業(yè)聯(lián)合會(huì)、西門子(中國(guó))有限公司、上海庫(kù)帕思科技有限公司、上海稀宇極智科技有限公司、上海無(wú)問(wèn)芯穹智能科技有限公司、上海羚數(shù)智能科技有限公司等。
從陣容可見(jiàn),平臺(tái)集結(jié)了運(yùn)營(yíng)商、算力、行業(yè)語(yǔ)料、基礎(chǔ)模型及應(yīng)用服務(wù)商等,涵蓋大模型垂類應(yīng)用所需各類基礎(chǔ)能力。
記者發(fā)現(xiàn),去年11月成立的上海醫(yī)療領(lǐng)域公共服務(wù)大MaaS平臺(tái)、今年1月3日成立的天工人工智能工業(yè)平臺(tái),都遵循這一邏輯。
關(guān)鍵在于,這些平臺(tái)足夠垂直、足夠?qū)I(yè)。如新型工業(yè)化MaaS平臺(tái),已天然剔除了與工業(yè)領(lǐng)域大模型不相關(guān)的“輪子”。平臺(tái)上陳列的圖形生成式工具,均偏重于工程圖紙分類識(shí)別及生成,而非針對(duì)電商、游戲等2C端的圖形生成。平臺(tái)上五大場(chǎng)景,即研發(fā)設(shè)計(jì)、生產(chǎn)制造、裝備運(yùn)維、運(yùn)營(yíng)服務(wù)、供應(yīng)鏈管理等,無(wú)不是為工業(yè)場(chǎng)景定做。
“這些平臺(tái)如同成衣店,已陳列了大中小號(hào)各款服裝,應(yīng)用方可入店試衣,并按需購(gòu)買。不用再像過(guò)去那樣,把各款衣服先一路買下來(lái),回家逐件試是否合身,白白浪費(fèi)錢!辩娍『普f(shuō)。
據(jù)透露,除醫(yī)療、工業(yè)行業(yè)之外,第三類“中試訓(xùn)練場(chǎng)”有望在教育行業(yè)誕生。
系統(tǒng)打法
“中試訓(xùn)練場(chǎng)”,只是上海“模塑申城”系統(tǒng)性打法中的一環(huán)。
上海垂類應(yīng)用加速度的背后,有著上海算力基礎(chǔ)設(shè)施、基礎(chǔ)模型、語(yǔ)料、資本、人才等要素的全面布局與支撐。
大模型訓(xùn)練遵循“尺度定律”,即訓(xùn)練計(jì)算量、訓(xùn)練數(shù)據(jù)規(guī)模、模型參數(shù)量,與模型效能之間存在正向關(guān)聯(lián)。簡(jiǎn)言之,就是“大力出奇跡”。為此早在2023年,上海就超前提出了10萬(wàn)卡以上超大規(guī)模智算算力投入。而此次人工智能“模塑申城”實(shí)施方案中,又提出到2025年,全市智算規(guī)模力爭(zhēng)突破100EFLOPS(每秒能進(jìn)行100億億次浮點(diǎn)運(yùn)算的計(jì)算能力)。這相當(dāng)于30萬(wàn)張英偉達(dá)A100芯片的算力,規(guī)模超過(guò)目前北京和深圳算力規(guī)模的總和。
超大規(guī)模算力,致力于訓(xùn)練出上海自己的基礎(chǔ)模型。記者獲悉,經(jīng)數(shù)年苦練,上海“1+3”基礎(chǔ)模型格局基本形成,包括上海人工智能實(shí)驗(yàn)室書(shū)生·浦語(yǔ)大模型,以及商湯、MiniMax、階躍星辰模型。
語(yǔ)料方面,上海成立了全國(guó)首家人工智能語(yǔ)料公司“庫(kù)帕思”。
由此,算力、基模、語(yǔ)料,已然齊備。有此底氣,去年8月起,上海開(kāi)始強(qiáng)力推進(jìn)大模型垂類應(yīng)用,敲定“5+6”領(lǐng)域及行業(yè),“5”指智能終端、科學(xué)智能、在線新經(jīng)濟(jì)、自動(dòng)駕駛、具身智能5個(gè)關(guān)鍵領(lǐng)域;“6”指金融、制造、教育、醫(yī)療、文旅、城市治理6個(gè)重點(diǎn)行業(yè)。上海市人工智能行業(yè)協(xié)會(huì)也隨之轉(zhuǎn)變角色,從過(guò)去致力于生態(tài)搭建,轉(zhuǎn)向?qū)W⒂诋a(chǎn)業(yè)平臺(tái)建設(shè)。
此外,圍繞產(chǎn)業(yè)對(duì)接,上海相繼成立225億元人工智能母基金、600億元人工智能國(guó)家大基金,以及100億元人工智能生態(tài)基金,逐漸形成近千億元級(jí)的基金規(guī)模。
“所有努力,都在于以全要素支撐保障,來(lái)解決人工智能‘叫好不叫座、發(fā)光不發(fā)熱’問(wèn)題!辩娍『普f(shuō)。
殊不知,“中試訓(xùn)練場(chǎng)”的目標(biāo)已寫(xiě)入“模塑申城”方案中,即到今年底,上海要建成50個(gè)具有顯著成效的行業(yè)開(kāi)放語(yǔ)料庫(kù)示范應(yīng)用成果。種種跡象表明,而今,上海儼然將整座城市變成了一座人工智能大廠。

關(guān)注精彩內(nèi)容