教育部:加快領(lǐng)域大語言模型應(yīng)用試點 研制語料和數(shù)據(jù)質(zhì)量評價標準
中國青年報客戶端北京3月31日電(中青報·中青網(wǎng)記者 楊潔)“今年,是落實《教育強國建設(shè)規(guī)劃綱要(2024—2035年)》的關(guān)鍵之年,語言文字信息化發(fā)展將展望十年、謀劃五年、立足三年,把握賦能全局高度,加快試點先行進度,激發(fā)協(xié)同創(chuàng)新力度,在落實重點任務(wù)上下功夫、見實效。”今天,在教育部新聞發(fā)布會上,教育部語言文字信息管理司司長劉培俊說。
其中要以示范項目支撐重大任務(wù),具體來說,劉培俊介紹,在技術(shù)創(chuàng)新應(yīng)用上,發(fā)揮自然語言處理技術(shù)支撐人工智能發(fā)展的基礎(chǔ)作用,主要包括:加快領(lǐng)域大語言模型應(yīng)用試點,確保規(guī)范安全,示范應(yīng)用;研制面向人工智能的語言資源建設(shè)、管理、應(yīng)用標準特別是語料和數(shù)據(jù)質(zhì)量評價標準等。
在數(shù)據(jù)資源建設(shè)上,發(fā)揮語言文字服務(wù)國家語言能力建設(shè)的戰(zhàn)略作用,主要包括實施國家關(guān)鍵語料庫建設(shè)計劃,建設(shè)大規(guī)模中文語料庫等。在關(guān)鍵領(lǐng)域賦能上,發(fā)揮信息技術(shù)賦能國家語言服務(wù)體系構(gòu)建的全局優(yōu)勢,主要包括研制大語言模型能力素養(yǎng)框架(師生版),推進甲骨文數(shù)字化共享,實施中華文化優(yōu)秀課程多語種數(shù)字化傳播計劃等。
此外,劉培俊介紹,堅持需求牽引,加快建設(shè)國家語言文字大數(shù)據(jù)中心、國家關(guān)鍵語料庫和國家語言資源信息庫。堅持深度融合,推進自然語言處理技術(shù)、大語言模型等創(chuàng)新應(yīng)用,堅持資源開發(fā),分類建設(shè)基礎(chǔ)性、應(yīng)用性、戰(zhàn)略性、特色性等多類高質(zhì)量語言資源。堅持數(shù)據(jù)應(yīng)用,支持語言文字信息技術(shù)新產(chǎn)品、新職業(yè)、新業(yè)態(tài)發(fā)展。堅持數(shù)字賦能,推動數(shù)字中文發(fā)揮立德樹人的基礎(chǔ)作用、推進科技創(chuàng)新的支撐作用、傳承中華文化的根脈作用、賦能產(chǎn)業(yè)升級的關(guān)鍵作用和服務(wù)社會需求的民生作用。
劉培俊提到,鼓勵一地一策、一校一品制定數(shù)字中文建設(shè)計劃,支持創(chuàng)建試驗區(qū)和示范點,營造穩(wěn)中求進、務(wù)求實效、數(shù)字賦能的良好氛圍。
免責聲明
以上內(nèi)容來自網(wǎng)絡(luò),本站轉(zhuǎn)載本文的目的在于宣傳和傳遞更多信息,以上內(nèi)容并不代表本站觀點,由于各方面情況的不斷調(diào)整與變化,涉及到相關(guān)政策請以原文內(nèi)容為準,文章版權(quán)歸原作者所有,如涉及作品內(nèi)容、版權(quán)和其它問題請與我們聯(lián)系,我們將第一時間刪除內(nèi)容。
來源鏈接:http://www.moe.gov.cn/jyb_xwfb/s5147/202504/t20250401_1185735.html