教育部 国家语委 中央网信办关于加强 数字中文建设 推进语言文字信息化发展的意见
教语信〔2025〕1号
各省、自治区、直辖市教育厅(教委)、语委、党委网信办,新疆生产建设兵团教育局、语委、党委网信办,国家语委各委员单位,部属各高等学校、部省合建各高等学校:
为深入贯彻落实党中央、国务院关于数字中国建设和教育强国建设的总体部署,加快推进以信息化促进语言文字事业高质量发展,以数字化赋能语言文字更好服务全面建设社会主义现代化国家,根据中共中央、国务院《数字中国建设整体布局规划》《教育强国建设规划纲要(2024—2035年)》和国务院办公厅《关于全面加强新时代语言文字工作的意见》(国办发〔2020〕30号)要求,现就加强数字中文建设、推进语言文字信息化发展提出以下意见。
一、总体要求
以习近平新时代中国特色社会主义思想为指导,全面贯彻落实党的二十大和二十届二中、三中全会精神,贯彻落实全国教育大会精神,坚持围绕中心、服务大局、支撑战略,全面推进语言文字信息化发展,以加强数字中文建设为重点,以集成化、智能化、国际化为导向,加强政策引导,优化要素配置,促进协同创新,强化技术赋能,着力提升语言文字服务数字教育、数字科技、数字文化、数字经济、数字社会建设的实际能力,全方位释放语言文字在数字时代经济社会发展中的数据要素价值,全力服务教育强国、科技强国和文化强国建设,为以中国式现代化全面推进强国建设、民族复兴伟业作出新的更大贡献。
坚持需求导向、支撑战略。以服务国家战略为目标,聚焦重点领域需求,以关键任务为驱动,确保数字中文建设取得新进展。坚持突出重点、突破创新。实施数字化示范项目,打造数字化引领品牌,在汇聚数据资源、创新应用形态、提升赋能效果等关键环节开辟新空间。坚持融合发展、协同推进。加强统筹协调,大力推进语言文字与信息技术深度融合,推动语言文字信息化发展迈上新台阶。
到2027年,国家数字中文建设行动取得重要成效,语言文字数据要素价值有效释放。基本形成“政府主导、部门协同、社会参与、共建共享”的语言文字信息化工作机制;基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库;语言文字信息化标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。到2035年,中文在全球数字空间、网络空间以及生成式人工智能等关键应用场景中的使用占比显著提高;语言文字信息化有力支撑国家语言能力建设、语言文字事业和经济社会高质量发展,整体水平位居世界前列。
二、加快推进语言文字信息化发展
1.高度重视语言文字信息化。语言文字是人类智能发展、信息交流、思想表达、文明互鉴以及融入社会和联通世界的基础工具,是国家重要教育资源、科技资源、文化资源、经济资源、安全资源和战略资源,是国家综合实力的重要支撑,事关国家主权、安全和发展大局。没有信息化就没有现代化。以加强数字中文建设为重点全面推进语言文字信息化发展,是自然语言处理技术发展新阶段的客观需要,是大语言模型等新兴科技创新应用的重要基础,是赢得人工智能技术竞争先机的时代要求,是有效发挥语言文字资源优势服务数字中国建设的战略举措,对于语言文字事业全面深化改革、实现高质量发展和服务经济社会发展意义重大、影响深远。
2.系统推进数字中文建设。以发挥中文数据的赋能作用为着力点,将数字中文建设作为服务数字中国建设的重要任务和全面推进语言文字信息化发展的突出重点,着力推进中文数字化与数据中文化、创新应用与规范安全、新型中文服务体系构建与语言文字治理体系完善,促进中文数据的规模生产、优质集成、融合创新、规范治理和复用增效,助力中文发挥立德树人的基础作用、传承中华文化的根脉作用、推进科技创新的支撑作用、赋能产业升级的关键作用,服务当前和今后一个时期经济社会关键领域的信息化建设、数字化赋能和智能化发展。
三、全面加强语言文字信息化体系建设
3.完善规范标准体系。标准化是信息化的基础和前提。统筹推进语言文字基础性标准和信息化标准一体建设,构建覆盖全面、结构合理、科学可行的数字时代语言文字规范标准体系。以语言文字信息处理标准建设为基础,支持面向信息技术及人工智能领域的语言资源建设、管理、应用、共享标准研究,重点推进语料库、数据标注、数据评价等规范标准的制修订。推进大语言模型等基础术语规范化。制定手语和盲文的信息化标准。研制民族语言文字信息化标准。研制甲骨文数字化共享技术标准。
4.健全资源服务体系。通过组织开发、征集遴选、集成汇聚等方式,多渠道建设大规模多模态优质语言资源,促进多方协作、多元融合与共建共享。加快建设国家语言文字大数据中心,以数字化技术动态监测、收集和分析语言文字事业发展、国家语言能力建设、重点规划实施、重大工程进展等核心业务数据,提高数据支持决策效率。以国家语言资源服务平台建设为基础,带动地方语言资源平台建设。推动基础性语言资源建设,实施国家关键语料库共建共享计划,重点支持建设大规模中文语料库及高质量民族语言文字语料库、手语盲文语料库、行业领域语料库、语言监测动态语料库等。加快应用性语言资源建设,重点推进助力学校教育教学、文化传承发展的资源建设。开展战略性语言资源建设,建设国家战略语言资源信息库,重点建设支撑国家安全与发展、服务共建“一带一路”等语言资源。强化特色性语言资源建设,重点推进中国语言资源保护工程数字化建设,开发利用好国家语言地图、中国语言知识图谱、中华精品字库等。
5.建强人才培养体系。建立产学研用协同培养语言文字信息化相关人才的机制,建设高水平人才队伍。依托国家语言文字关键研究领域领航计划,培养精通语言文字信息化建设的高层次紧缺急需人才。加强语言人才供需机制研究,支持高等学校语言学科与多学科深度交叉融合发展,加强“语言+人工智能”复合型人才培养。面向语言文字信息技术产业及未来发展方向,加强高素质技能人才培养。
6.构建协同创新体系。加强科教融汇、产教融合、校企合作、校际合作,协同推进语言文字信息技术的科学研究、技术攻关、应用创新和产业发展。充分发挥地方、高等学校、职业学校、科研机构、行业企业、社会团体等协同作用,共建“数字中文”联盟,形成语言文字信息技术融合创新、共建共享和转化应用机制。探索国际科研合作机制,提升语言文字信息技术的理论研究水平、产业应用能力和社会服务效能。
7.强化安全保障体系。重点加强语言文字资源信息安全治理,切实加强数据安全、伦理道德、价值观对齐等重点事项的监测与管理,提升资源和技术的可信性、可控性和可靠性。支持生成式人工智能的语料规范性、生成内容评测评价和全流程追溯机制研究。加强面向语言资源监测的自然语言处理技术研究,强化语言文字信息安全的态势感知、监测预警、风险评估和应急处置。规范网络空间、数字空间的语言生态,建设健康文明的网络语言环境,守住网络安全底线。
四、着力提升语言文字信息化服务水平
8.实施数字中文服务教育发展行动。服务国家教育数字化战略行动,加强语言文字信息化建设成果在国家智慧教育公共服务平台和地方智慧教育平台上推广共享;助力打造中国版人工智能教育大模型;研究基于大语言模型的教学新范式,研制大语言模型能力素养框架(师生版);提升信息化场景下教师语言文字教学能力;强化数字化教学资源和应用系统的语言文字规范使用。加大国家通用语言文字推广普及数字化赋能力度,高水平开展基于数字技术的普通话水平测试,服务铸牢中华民族共同体意识。以信息化手段促进民族地区、边境地区、偏远地区和农村地区的语言文字教育和培训。推动全球中文学习平台、中文联盟平台等建设,提升国际中文教育的能力和水平。
9.实施数字中文助力科技创新行动。服务高水平科技自立自强,推动语言文字信息技术创新应用。加强有组织科研,探索自然语言处理、大语言模型等理论和技术创新,重点推动生成式人工智能、多模态信息处理、语言理解与生成、跨语言跨模态翻译等方面的技术创新。坚持试点先行,支持面向重点行业、战略区域和关键学科等的垂直领域大语言模型建设与应用。强化语言文字信息化研究成果转化,鼓励战略急需、产业紧缺、民生期盼的数字化语言服务示范应用。加快布局支持一批新型语言文字交叉领域科研机构,重点建设多语言智能化科技创新中心和实验室。支持数字中文建设、生成式人工智能技术等前沿领域的学术研讨和竞赛活动。
10.实施数字中文赋能文化传承行动。服务国家文化数字化战略,赋能中华优秀语言文化的创造性转化和创新性发展。推动中国语言资源博物馆和地方语言资源博物馆的数字化建设。建设好中国语言文字数字博物馆。以信息化手段加强全民语言文化素养的监测反馈、资源开发和教育活动。推进中华思想文化术语传播工程成果的数字化应用。加强古籍数字化整理关键技术研究。推进甲骨文数字化共享。实施中华文化优秀课程多语种数字化全球传播计划,推动构建中文数字化国际化的立体传播体系。
11.实施数字中文推动产业升级行动。服务数字经济做强做优做大,推进语言技术赋能数字经济发展。支持语言文字信息技术新产品、新职业和新业态发展,鼓励传统语言产业数字化转型升级,培育基于数字中文的新型语言产业。推动语言资源、语言翻译、智能机器人、中文内容服务等软硬件产品研发应用,支持围绕语音、语料、语言应用生态形成产业聚集,鼓励创建语言产业应用示范品牌。持续推进《信息技术产品国家通用语言文字使用管理规定》实施,开展信息技术产品国家通用语言文字使用状况监测、符合性认证与行业采信。支持解决信息技术产品生僻字问题,推动GB 18030《信息技术 中文编码字符集》深入实施应用。
12.实施数字中文促进社会进步行动。服务数字社会精准化普惠化便捷化建设,持续提升关键领域数字中文服务水平。指导关键任务场景语言翻译数据库建设,研发特定科技产品,服务国家外交,维护国家安全。推动国家应急语言服务数字化技术应用和智能化服务模式创新,支持自然灾害、公共卫生等突发事件应对。支持研发面向语言障碍人群、老年群体的科技设备,鼓励智能终端设备的适老化研发及无障碍改造。支持数字时代的语言生活状况研究。
五、组织实施
教育部、国家语委、中央网信办会同国家语委委员单位统筹推进全国语言文字信息化工作,加强工作监督检查,推进工作落实见效,支持有条件地区建设数字中文建设试验区。各地区、各单位要将语言文字信息化纳入本地区、本单位信息化工作规划,因地制宜制定本地区、本单位语言文字信息化工作专项方案,实施特色项目,打造引领品牌。充分发挥语委委员单位、各级各类学校、研究机构和社会组织等多方作用。各地区、各单位要加大统筹力度,优化支出结构,加强语言文字信息化工作经费保障。健全多渠道投入机制,鼓励社会力量参与,形成共建共享机制。各地区、各单位要及时总结工作中的好经验好做法,加大宣传推广力度,征集并发布数字中文建设案例,促进区域、学校间交流,营造多部门参与、多方面支持、多层级联动的良好氛围。
教 育 部 国 家 语 委 中央网信办
2025年1月8日
相关文章:
深圳唯一!北大深圳医院荣获“全国卫生健康系统先进集体”04-01
@绵阳创业者,这些资源可以用起来04-01
《国家创新指数报告2024》发布04-01
教育部:加快建设国家语言文字大数据中心04-01
明确核心理念,抓好融合教育为孤独症儿童建立支持体系04-01