三项举措齐发,开源数据集生态建设按下“加速键”
2026-03-18 09:08:25
人工智能的浪潮下,数据已成为驱动产业创新的核心生产要素,而开源数据集更是AI研发、模型训练与场景落地的关键基石。为破解数据孤岛、标准不一等行业痛点,推动人工智能开源生态数据底座,3月16日下午,开放原子“园区行”(上海站)——开源数据集专场在上海市徐汇区漕河泾会议中心成功举办。
本次活动由开放原子开源基金会主办,开放原子上海开源促进中心、中国信息通信研究院人工智能研究所、中国人工智能产业发展联盟数据委员会、上海市人工智能行业协会、乐聚智能(深圳)股份有限公司联合承办。活动搭建了产业界、学术界与开源社区的交流合作平台,人工智能开源数据集领域三项举措集中推出,加速了我国人工智能开源数据生态建设进程。
一、开源数据集工作组正式启动,多方共建产业规范
为顺应数字经济与人工智能产业高质量发展趋势,破解开源数据集标准不统一、数据集质量层次不齐、生态协同和管理运营体系缺位等行业痛点。开放原子开源基金会联合中国信息通信研究院、库帕思启动“开源数据集工作组”建设工作,乐聚智能、上海人工智能实验室、华东师大、百度、海天瑞声、国家地方共建人形机器人创新中心、无问智行科技、安势信息等单位共同参与启动仪式。

开放原子开源基金会人工智能开源社区开源数据集工作组启动仪式
工作组将秉持规则先行、技术引领、生态共建、合规发展的原则,系统性推进开放数据集领域的技术规范、标准体系、安全合规、应用实践与生态共识建设。此次启动标志着我国开源数据集领域从分散发展向系统化、标准化发展迈进,将有效解决数据互通性差、复用效率低等问题,降低数据集开放与使用成本,助力我国人工智能开源生态高质量发展,推动“人工智能+”产业应用落地。
二、具身智能开源数据集社区落地,填补细分生态空白
活动现场,具身智能开源数据集社区同步启动。该社区是由乐聚机器人在开放原子开源基金会平台发起建立的开源社区,以开放共享、标准共建、生态共赢为理念。乐聚智能、蚂蚁灵波科技、库帕思、具识智能科技、具脑磐石科技、无问智科、哈尔滨工业大学苏州研究院、同济大学智能机器人与计算感知实验室、上海交通大学人工智能研究院等单位共同参与启动仪式。

开放原子开源基金会人工智能开源社区具身智能开源数据集社区启动仪式
社区将核心聚焦人形机器人领域的真实数据开源与生态共建,致力于打造国内具身智能领域权威数据资源枢纽与协作创新平台。通过开放全尺寸人形机器人真机数据与模型训练工具链,构建开发者生态,孵化创新团队。针对性解决具身智能数据集开发、共享、应用中的行业问题,填补了国内具身智能开源数据集领域的生态建设空白。为全球开发者、科研团队及企业搭建协作桥梁,加速具身智能技术的研发与产业落地。
三、OpenLET数据集全球首发,提供具身智能“全身训练样本”
作为具身智能开源数据集社区首批成果,OpenLET“触觉灵巧操作+全身运动”数据集在AtomGit平台进行全球首发。这是全球首个融合触觉灵巧操作与全身高动态运动的稀缺数据集,为具身智能提供了关键的“全身训练样本”。

OpenLET“触觉灵巧操作+全身运动”数据集在AtomGit人工智能开源社区全球首发
该数据集由乐聚智能、国家地方共建人形机器人创新中心、灵心巧手等单位联合打造,聚焦具身智能核心应用场景。首发的两大真机数据集均为多模态高质量样本,填补了行业相关数据空白。
1、触觉灵巧操作数据集:基于高密度触觉灵巧手与力反馈外骨骼遥操系统采集,新增高维触觉信息并完整复刻人类手部运动轨迹。包含800条真机操作数据,涵盖快递分拣、快消上料、家庭物品抓取等典型任务。
2、全身运动数据集:基于全身动捕遥操技术,将人类操作员的生物力学特征转化为机器人的关节轨迹与力控指令,为端到端模仿学习提供了稀缺的“真机级”高质样本。数据包含41个关节的精细控制信号,任务维度延伸至深度下蹲、灵活弯腰、非结构化物体抓取等高难度全身联动任务。
从顶层设计到硬核开源,本次活动的三项成果为我国人工智能开源数据生态建设注入了新的实践动能。随着开源数据集工作组与具身智能社区的深入推进,以及OpenLET数据集的开源开放,一个更加开放、协同、规范的人工智能开源数据生态正在加速形成。未来,开放原子开源基金会将持续携手产业界与学术界,推动更多高质量开源数据集开放共享,强化人工智能数据要素供给,助力产业创新。
共筑AI数据开源新生态,开放原子园区行(上海站)开源数据集专场成功举办
2026-03-17 09:31:223月16日,开放原子园区行(上海站)开源数据集专场活动在上海市徐汇区顺利举办。本次活动以激活数据价值、共筑开源生态为核心,聚焦人工智能开源数据集建设与发展,搭建起产业界、学术界与开源社区的深度交流平台。工业和信息化部信息技术发展司有关负责同志、上海市经济和信息化委员会总工程师裘薇、上海市徐汇区人民政府副区长陈勇、开放原子开源基金会理事长程晓明等领导出席活动。来自人工智能领域的科研机构、龙头企业、高校专家及开发者代表共同探索数据资源开放共享新模式,共促开源技术与人工智能数据要素深度融合。
上一篇重塑软件开发模式,开源AI生态强势崛起
2024-12-25 18:01:02生成式AI的快速发展正深刻改变全球软件开发的格局。开源AI生态凭借其坚实的支撑基础,为开发者提供了一个高效且便捷的开发环境,显著加速了人工智能技术的创新进程,并推动其在实际应用中的快速落地。
推荐阅读