Copyright © www.selectshandong.com. All Rights Reserved
山东省商务厅 版权所有
来源: 大众日报2026-02-06 09:48:19
记者从山东省工信厅了解到,围绕高端装备、烟草制品业、农副食品加工业、家具制造业、木材加工、皮革毛皮羽毛及其制品和制鞋业、仪器仪表制造业、废弃资源综合利用业等行业,山东将开展语料库揭榜挂帅项目申报,重点推进行业关键数据技术攻关、行业数据语料标准研制、高质量行业语料库打造、语料应用场景落地等。
重点行业语料库揭榜挂帅项目,聚焦工业制造重点行业的基础理论研究、产品研发设计、生产管理运行、过程质量检测等关键环节和特定场景的知识语料汇聚,基于结构化数据(如数据库中的表格数据)、非结构化数据(如文本、图像、语音等)和半结构化数据(如日志文件、XML文件等),通过清洗、去噪和统一格式,用于支持自然语言处理、计算机视觉、机器学习、深度学习等任务,满足行业大模型或场景大模型开发、训练和微调需求的高质量语料库。项目验收时行业相关语料库数据量不低于10万条,具有较高的数据质量、领域覆盖程度、潜在价值和应用成效,项目验收时应通过第三方测评;同时,山东鼓励各行业语料库项目加快语料资源优化整合,积极开放公共语料。
(大众新闻记者 付玉婷)
分享