?
投資 干貨 消費 評論 學院 滾動
風投 科技 創(chuàng)業(yè) 業(yè)內(nèi) 要聞
北京制定通用人工智能創(chuàng)新措施:組織商業(yè)算力定向滿足緊迫需求
發(fā)布日期: 2023-05-16 08:42:53 來源: 澎湃新聞

·在加強算力資源統(tǒng)籌供給能力方面,征求意見稿提出,組織商業(yè)算力定向滿足該市緊迫需求,高效推動新增算力基礎設施建設,建設統(tǒng)一的多云算力調(diào)度平臺。

·在提升高質(zhì)量數(shù)據(jù)要素供給能力方面,征求意見稿提出,歸集高質(zhì)量基礎訓練數(shù)據(jù)集,打造“國家數(shù)據(jù)基礎制度先行先試示范區(qū)”、謀劃國家級數(shù)據(jù)訓練基地,搭建數(shù)據(jù)集精細化標注眾包服務平臺。


(資料圖片)

據(jù)北京市政府網(wǎng)站消息,北京市科委、中關村管委會制定了《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)(征求意見稿)》,5月12日-19日向社會公開征求意見。

加強算力資源統(tǒng)籌供給能力方面,征求意見稿提出,組織商業(yè)算力定向滿足該市緊迫需求。加強與頭部公有云廠商等市場主體合作,實施算力伙伴計劃,并確定首批伙伴計劃成員,明確供給技術標準、軟硬件服務要求、算力供給規(guī)模、優(yōu)惠策略等,向在京高校院所和中小企業(yè)公布一批優(yōu)質(zhì)算力供應商。

文件還提出,高效推動新增算力基礎設施建設。將新增算力建設項目納入算力伙伴計劃,加快推動海淀區(qū)“北京人工智能公共算力平臺”,朝陽區(qū)“北京數(shù)字經(jīng)濟算力中心”等項目建設,快速形成規(guī)?;冗M算力供給能力,支撐千億級參數(shù)量的大型語言模型、多模態(tài)大模型、大規(guī)模精細神經(jīng)網(wǎng)絡模擬仿真模型、腦啟發(fā)神經(jīng)網(wǎng)絡等研發(fā)。

提升高質(zhì)量數(shù)據(jù)要素供給能力方面,征求意見稿提出,針對目前大模型訓練高質(zhì)量中文語料占比過少,不利于中文語境表達及產(chǎn)業(yè)應用的問題,整合現(xiàn)有開源中文預訓練數(shù)據(jù)集和高質(zhì)量互聯(lián)網(wǎng)中文數(shù)據(jù)并進行合規(guī)清洗。同時持續(xù)擴展高質(zhì)量多模態(tài)數(shù)據(jù)來源,建設合規(guī)安全的中文、圖文對、音頻、視頻等大模型預訓練語料庫,通過北京國際大數(shù)據(jù)交易所社會數(shù)據(jù)專區(qū)進行定向有條件開放。

文件還提出,加快推動數(shù)據(jù)要素高水平開放的“國家數(shù)據(jù)基礎制度先行先試示范區(qū)”建設,爭創(chuàng)國家級數(shù)據(jù)訓練基地,提升北京人工智能數(shù)據(jù)標注庫規(guī)模和質(zhì)量。倡議高質(zhì)量數(shù)據(jù)網(wǎng)站所屬企業(yè)提供部分脫敏高質(zhì)量數(shù)據(jù),進行定向有條件開放,企業(yè)或科研機構通過在線申請進行有償使用,并探索基于數(shù)據(jù)貢獻、模型應用的商業(yè)化場景合作。

系統(tǒng)布局大模型技術體系方面,文件提出,開展大模型創(chuàng)新算法及關鍵技術研究,加強大模型訓練數(shù)據(jù)采集及治理工具研發(fā),開放大模型評測基準及工具,探索具身智能、通用智能體和類腦智能等通用人工智能新路徑等。

對于場景應用,征求意見稿提到政務服務、醫(yī)療、科學研究領域、金融、自動駕駛、城市治理等六個領域。

文件提出探索營造包容審慎的監(jiān)管環(huán)境,鼓勵生成式人工智能產(chǎn)品在科研等非面向公眾服務領域?qū)崿F(xiàn)向上向善應用,發(fā)布《北京市互聯(lián)網(wǎng)信息服務算法推薦合規(guī)指引》等。

附:北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)(征求意見稿)

為搶抓大模型發(fā)展機遇,重視通用人工智能發(fā)展,充分發(fā)揮政府引導作用和創(chuàng)新平臺催化作用,整合創(chuàng)新資源,加強要素配置,營造創(chuàng)新生態(tài),重視風險防范,推動我市通用人工智能領域?qū)崿F(xiàn)創(chuàng)新引領,提出以下落實措施:

一、加強算力資源統(tǒng)籌供給能力

(一)組織商業(yè)算力定向滿足本市緊迫需求

加強與頭部公有云廠商等市場主體合作,實施算力伙伴計劃,并確定首批伙伴計劃成員,明確供給技術標準、軟硬件服務要求、算力供給規(guī)模、優(yōu)惠策略等,向在京高校院所和中小企業(yè)公布一批優(yōu)質(zhì)算力供應商。

(二)高效推動新增算力基礎設施建設

將新增算力建設項目納入算力伙伴計劃,加快推動海淀區(qū)“北京人工智能公共算力平臺”,朝陽區(qū)“北京數(shù)字經(jīng)濟算力中心”等項目建設,快速形成規(guī)?;冗M算力供給能力,支撐千億級參數(shù)量的大型語言模型、多模態(tài)大模型、大規(guī)模精細神經(jīng)網(wǎng)絡模擬仿真模型、腦啟發(fā)神經(jīng)網(wǎng)絡等研發(fā)。

(三)建設統(tǒng)一的多云算力調(diào)度平臺

利用政府統(tǒng)一入口,降低公有云采購成本,普惠中小企業(yè),同時減少企業(yè)分別面對不同云廠商的溝通成本。針對彈性算力需求,建設統(tǒng)一的多云算力調(diào)度平臺,實現(xiàn)異構算力環(huán)境統(tǒng)一管理、統(tǒng)一運營,方便企業(yè)在不同云環(huán)境上無縫、經(jīng)濟、高效地運行各類人工智能計算任務。建設北京與河北、天津、山西、內(nèi)蒙古等?。ㄊ校┧懔旱闹边B基礎光傳輸網(wǎng)絡,進一步提升平臺對四地算力資源感知能力,探索開展算力交易。

二、提升高質(zhì)量數(shù)據(jù)要素供給能力

(四)歸集高質(zhì)量基礎訓練數(shù)據(jù)集

針對目前大模型訓練高質(zhì)量中文語料占比過少,不利于中文語境表達及產(chǎn)業(yè)應用的問題,整合現(xiàn)有開源中文預訓練數(shù)據(jù)集和高質(zhì)量互聯(lián)網(wǎng)中文數(shù)據(jù)并進行合規(guī)清洗。同時持續(xù)擴展高質(zhì)量多模態(tài)數(shù)據(jù)來源,建設合規(guī)安全的中文、圖文對、音頻、視頻等大模型預訓練語料庫,通過北京國際大數(shù)據(jù)交易所社會數(shù)據(jù)專區(qū)進行定向有條件開放。

(五)打造“國家數(shù)據(jù)基礎制度先行先試示范區(qū)”,謀劃國家級數(shù)據(jù)訓練基地

加快推動數(shù)據(jù)要素高水平開放的“國家數(shù)據(jù)基礎制度先行先試示范區(qū)”建設,爭創(chuàng)國家級數(shù)據(jù)訓練基地,提升北京人工智能數(shù)據(jù)標注庫規(guī)模和質(zhì)量。倡議高質(zhì)量數(shù)據(jù)網(wǎng)站所屬企業(yè)提供部分脫敏高質(zhì)量數(shù)據(jù),進行定向有條件開放,企業(yè)或科研機構通過在線申請進行有償使用,并探索基于數(shù)據(jù)貢獻、模型應用的商業(yè)化場景合作。

(六)搭建數(shù)據(jù)集精細化標注眾包服務平臺

建設指令數(shù)據(jù)集及多模態(tài)數(shù)據(jù)集眾包服務平臺,開發(fā)集成相關工具應用的智能云服務系統(tǒng),鼓勵并組織來自不同學科的專業(yè)人員標注通用人工智能模型訓練數(shù)據(jù)及指令數(shù)據(jù),提高訓練數(shù)據(jù)的多樣性,給予貢獻者適當獎勵,推動平臺持續(xù)良性發(fā)展。

三、系統(tǒng)布局大模型技術體系,持續(xù)探索通用人工智能路徑

(七)開展大模型創(chuàng)新算法及關鍵技術研究

圍繞大型語言模型構建、訓練、調(diào)優(yōu)對齊、推理部署等全流程,支持開展創(chuàng)新算法及核心技術研究,形成完整高效的訓練體系并對外開源。探索多模態(tài)通用模型架構,研究大模型高效并行訓練技術,以及邏輯和知識推理、指令學習、人類意圖對齊等調(diào)優(yōu)方法,研發(fā)支持百億參數(shù)模型推理的高效壓縮技術。

(八)加強大模型訓練數(shù)據(jù)采集及治理工具研發(fā)

從“采、存、管、研、用”五個方面,研發(fā)包含數(shù)據(jù)采集、清洗、標注、脫敏、存儲等功能在內(nèi)的數(shù)據(jù)處理工具。重點研究互聯(lián)網(wǎng)數(shù)據(jù)全量實時更新技術,多源異構數(shù)據(jù)整合與分類方法,數(shù)據(jù)管理平臺相關系統(tǒng),數(shù)據(jù)清洗、標注、分類、注釋等軟件工具及算法,數(shù)據(jù)內(nèi)容安全審查算法及工具等。

(九)開放大模型評測基準及工具

構建多模態(tài)多維度的基礎模型評測基準及評測方法。建立基礎模型評測工具集,提供適應性的工具進行評測。建立公平高效的自適應評測機制,根據(jù)評測目標的不同,自動適配不同的工具和指標。研究人工智能輔助的智能模型評測算法,面向主觀型或生成式的任務,構建自動化評估工具。集成包括通用性、高效性、智能性、魯棒性在內(nèi)的多維度評測工具,構建基礎模型線上評測服務平臺。

(十)推動大模型基礎軟硬件體系研發(fā)

支持研發(fā)分布式高效訓練系統(tǒng),實現(xiàn)模型訓練任務高效自動并行。研發(fā)適用于模型訓練場景的新一代人工智能編譯器,實現(xiàn)算子自動生成和自動優(yōu)化,推動人工智能芯片與框架的廣泛適配。研發(fā)人工智能芯片評測系統(tǒng),實現(xiàn)多芯片多框架的自動化評測。為大模型訓練和應用提供自主創(chuàng)新的基礎軟硬件生態(tài)底座。

(十一)探索具身智能、通用智能體和類腦智能等通用人工智能新路徑

發(fā)展面向通用人工智能的基礎理論框架體系,加強人工智能數(shù)學機理、自主協(xié)同與決策等基礎理論研究。推動具身智能系統(tǒng)研究及應用,突破機器人在開放環(huán)境、泛化場景、連續(xù)任務等復雜條件下的感知、認知、決策技術。探索價值與因果驅(qū)動的通用人工智能新路徑研究,打造通用人工智能統(tǒng)一理論框架體系、評級標準及測試平臺,研發(fā)通用人工智能操作系統(tǒng)和編程語言,推動通用智能體底層技術架構應用。探索類腦智能等交叉學科研究,通過大腦神經(jīng)元連接模式、編碼機制、信息處理原理研究,啟發(fā)新型人工神經(jīng)網(wǎng)絡模型建模和訓練方法。

四、推動通用人工智能技術創(chuàng)新場景應用

(十二)推動在政務服務領域率先試點應用

圍繞政務咨詢、政策服務、接訴即辦、政務辦事等工作,率先實現(xiàn)大模型技術賦能。借助大模型語義理解、自主學習和智能推理等能力,提高政務咨詢系統(tǒng)智能問答水平,增強多語種交互能力。支撐“京策”平臺建設,優(yōu)化政策規(guī)范管理和精準服務。輔助市民服務熱線更高效回應市民訴求,深化民生大數(shù)據(jù)高效利用。提升辦事服務便利度,輔助引導辦事人員表單填寫,輔助綜合窗口人員更精準提供辦事指引,輔助審批人員提高審批效率,推進業(yè)務數(shù)據(jù)更充分共享、業(yè)務流程更高效協(xié)同。

(十三)探索在醫(yī)療領域示范應用

支持我市有條件的研究型醫(yī)療機構提煉智能導診、輔助診斷、智能治療等場景需求,充分挖掘醫(yī)學文獻、醫(yī)學知識圖譜、醫(yī)學影像等多模態(tài)醫(yī)療數(shù)據(jù),構建基于醫(yī)療領域通用數(shù)據(jù)與專業(yè)數(shù)據(jù)的智能應用,實現(xiàn)對各種疾病和癥狀的準確識別和預測,輔助醫(yī)療機構提高疾病診斷、治療和預防的決策水平。

(十四)探索在科學研究領域示范應用

發(fā)展科學智能,加速人工智能技術賦能新材料和創(chuàng)新藥物領域科學研究。支持我市能源、材料、生物領域相關實驗室設立科研合作專項,與我市相關科研機構和創(chuàng)新企業(yè)開展聯(lián)合研發(fā),充分挖掘材料、蛋白質(zhì)和分子藥物領域?qū)嶒灁?shù)據(jù),研發(fā)科學計算模型,開展新型合金材料、蛋白質(zhì)序列和創(chuàng)新藥物化學結構序列預測,縮短科研實驗周期。

(十五)推動在金融領域示范應用

進一步挖掘我市金融行業(yè)應用場景,系統(tǒng)布局一批金融機構場景開放“揭榜掛帥”項目。支持金融科技企業(yè)針對金融場景中信息負載高,信息更新快,金融從業(yè)者難以快速全面的獲取準確信息的問題,探索面向金融文本深度理解和分析的人工智能技術應用。聚焦智能風控、智能投顧、智能客服等環(huán)節(jié),推動實現(xiàn)金融專業(yè)長文本的精準解析和模型知識的更新,突破復雜決策邏輯與模型信息處理能力間的融合技術,實現(xiàn)從復雜金融信息處理到投資決策建議的轉(zhuǎn)化,支撐金融領域的投資輔助決策。

(十六)探索在自動駕駛領域示范應用

支持自動駕駛企業(yè)研發(fā)多模態(tài)自動駕駛技術,發(fā)揮大型語言模型高維語義理解和泛化優(yōu)勢,基于車路協(xié)同數(shù)據(jù)和車輛行駛多傳感器融合數(shù)據(jù),提高自動駕駛模型多維感知和預測性能,有效解決復雜場景長尾問題,輔助提高車載自動駕駛模型泛化能力。支持在北京市高級別自動駕駛示范區(qū)3.0建設中,構建車路協(xié)同數(shù)據(jù)庫,引導企業(yè)開展基于真實場景的自動駕駛模型訓練迭代。探索基于低時延通訊的云控自動駕駛模型測試,發(fā)展自動駕駛新技術路徑。

(十七)推動在城市治理領域示范應用

支持人工智能研發(fā)企業(yè)結合智慧城市建設場景需求,率先在城市大腦建設中引進大模型技術,開展多感知系統(tǒng)融合處理技術研發(fā),打破城市治理中各系統(tǒng)數(shù)據(jù)孤島,實現(xiàn)智慧城市底層業(yè)務的統(tǒng)一感知、關聯(lián)分析和態(tài)勢預測,科學調(diào)配政府資源和行政力量,為城市治理提供更加綜合全面的輔助決策能力。

五、探索營造包容審慎的監(jiān)管環(huán)境

(十八)持續(xù)推動監(jiān)管政策和監(jiān)管流程創(chuàng)新

探索營造穩(wěn)定包容的監(jiān)管環(huán)境,積極推動人工智能領域新技術賦能傳統(tǒng)行業(yè)的包容審慎監(jiān)管,支持人工智能算法、框架等基礎技術的自主創(chuàng)新、推廣應用、國際合作。鼓勵優(yōu)先采用安全可信的軟件、工具、計算和數(shù)據(jù)資源,通過改進算法等技術手段,確保訓練數(shù)據(jù)集的規(guī)范性。鼓勵生成式人工智能產(chǎn)品在科研等非面向公眾服務領域?qū)崿F(xiàn)向上向善應用。積極向國家網(wǎng)信部門爭取,在中關村核心區(qū)建立先行先試,推動實行包容審慎監(jiān)管試點。

(十九)建立常態(tài)化服務和指導機制

做好對擬面向公眾提供服務的生成式人工智能產(chǎn)品的安全評估工作,建立常態(tài)化聯(lián)系服務和指導機制,督促企業(yè)遵守法律法規(guī)要求,尊重社會公德、公序良俗。優(yōu)化安全評估流程機制,細化對大模型算法設計、訓練數(shù)據(jù)源篩選、內(nèi)容安全性、人工標注規(guī)則的審核評估標準,開展精準化服務指導,加快推進我市人工智能企業(yè)相關技術產(chǎn)品的安全評估工作。指導企業(yè)建立健全算法安全防范機制,在產(chǎn)品研發(fā)階段引入技術工具進行安全檢測,督促企業(yè)積極履行算法備案和變更、注銷備案手續(xù)。發(fā)布《北京市互聯(lián)網(wǎng)信息服務算法推薦合規(guī)指引》,引導創(chuàng)新主體樹立安全責任意識,健全管理制度、強化技術手段、促進企業(yè)算法合規(guī)發(fā)展。

(二十)加強網(wǎng)絡服務安全防護和個人數(shù)據(jù)保護

指導算力運營主體落實《網(wǎng)絡安全法》《數(shù)據(jù)安全法》《個人信息保護法》等法律規(guī)定,加強網(wǎng)絡和數(shù)據(jù)安全管理,明確網(wǎng)絡安全、數(shù)據(jù)安全和個人信息保護主體責任,強化安全管理制度建設和工作落實,鼓勵企業(yè)開展數(shù)據(jù)安全管理認證及個人信息保護認證,落實數(shù)據(jù)跨境傳輸安全管理制度,全面提升網(wǎng)絡安全和數(shù)據(jù)安全防護能力。

(二十一)持續(xù)提升人工智能產(chǎn)業(yè)倫理治理自律自治能力

落實國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)建設任務,加強人工智能倫理安全規(guī)范及社會治理實踐研究,研發(fā)并部署人工智能倫理治理公共服務平臺,服務政府監(jiān)管與產(chǎn)業(yè)自律自治,強化相關責任主體科技倫理規(guī)范意識,提升科技倫理治理能力。

附:關于《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施(2023-2025年)(征求意見稿)》的起草說明

一、起草背景

為搶抓大模型發(fā)展機遇,重視通用人工智能發(fā)展,充分發(fā)揮政府引導作用和創(chuàng)新平臺催化作用,整合創(chuàng)新資源,加強要素配置,營造創(chuàng)新生態(tài),重視風險防范,推動我市通用人工智能領域?qū)崿F(xiàn)創(chuàng)新引領,特制定本措施。

二、主要內(nèi)容

《若干措施》針對加強算力資源統(tǒng)籌供給能力、提升高質(zhì)量數(shù)據(jù)要素供給能力、系統(tǒng)布局大模型技術體系持續(xù)探索通用人工智能路徑、推動通用人工智能技術創(chuàng)新場景應用、探索營造包容審慎監(jiān)管環(huán)境五大方向,明確組織機制,提出21項具體措施。

一是加強算力資源統(tǒng)籌供給能力方向,依托全市數(shù)據(jù)中心統(tǒng)籌聯(lián)席會議工作機制,加強市區(qū)兩級相關單位與重點新型研發(fā)機構、云服務企業(yè)、算力建設企業(yè)、基礎電信企業(yè)等單位的溝通協(xié)作,推動存量算力歸集、新建項目論證和存量項目改造。該方向提出組織商業(yè)算力、新增算力基礎設施建設、建設多云算力調(diào)度平臺3項具體措施。

二是提升高質(zhì)量數(shù)據(jù)要素供給能力方向,聯(lián)合相關單位構建大規(guī)模預訓練基礎數(shù)據(jù)集、高質(zhì)量微調(diào)數(shù)據(jù)集。建立訓練數(shù)據(jù)的供給和使用協(xié)調(diào)機制,強化相關行業(yè)主管部門、相關區(qū)政府和重點研發(fā)單位、平臺企業(yè)、數(shù)據(jù)交易機構等市場主體的溝通協(xié)作。該方向提出歸集高質(zhì)量基礎訓練數(shù)據(jù)集、打造“國家數(shù)據(jù)基礎制度先行先試示范區(qū)”謀劃國家級數(shù)據(jù)訓練基地、搭建數(shù)據(jù)集精細化標注眾包服務平臺3項具體措施。

三是系統(tǒng)布局大模型技術體系,持續(xù)探索通用人工智能路徑,支持開展大模型創(chuàng)新算法及關鍵技術研究,支持大模型基礎軟硬件體系、訓練數(shù)據(jù)采集及治理工具、評測工具研發(fā),并支持探索通用人工智能新路徑。該方向提出開展大模型創(chuàng)新算法及關鍵技術研究、加強大模型訓練數(shù)據(jù)采集及治理工具研發(fā)、開放大模型評測基準及工具、推動大模型基礎軟硬件體系研發(fā)、探索通用人工智能新路徑5項具體措施。

四是推動大模型技術創(chuàng)新場景應用方向,充分發(fā)揮大模型泛化能力強的特點,結合我市優(yōu)勢場景資源,引導企業(yè)充分挖掘領域數(shù)據(jù)資源,開展領域大模型應用技術研究,拓展大模型應用邊界,探索面向細分垂直領域的大模型商業(yè)模式和創(chuàng)新生態(tài)。該方向提出面向政務服務、醫(yī)療、科學研究、金融、自動駕駛、城市治理領域拓展應用場景6項具體措施。

五是探索營造包容審慎監(jiān)管環(huán)境方向,建立與大模型企業(yè)常態(tài)化聯(lián)系與服務機制,持續(xù)調(diào)研跟蹤企業(yè)在安全評估中遇到的難點堵點,加強同國家網(wǎng)信辦溝通協(xié)調(diào),積極爭取在中關村核心區(qū)建立先行先試特區(qū),推動實行包容審慎監(jiān)管試點。該方向提出持續(xù)推動監(jiān)管政策和監(jiān)管流程創(chuàng)新、建立常態(tài)化服務和指導機制、加強大模型網(wǎng)絡安全防護和個人數(shù)據(jù)保護、持續(xù)提升人工智能產(chǎn)業(yè)倫理治理自律自治能力4項具體措施。

關鍵詞:
24小時熱點 精彩推薦
資訊新聞
?