清华大学推出十亿像素级别视频数据集PANDA 突破人眼分辨率极限

为了促进对于大规模时空范围内的人群活动的长时间、长距离分析,清华大学推出一个新的十亿像素级别视频数据集:PANDA。

该数据集在自然场景中由十亿像素相机收集,能同时保证宽视场(最大可覆盖1平方千米的自然场景)和高分辨率(每帧视频接近10亿像素),以此提供一个标准化的评测基准,促进新的算法来理解大规模现实世界场景中复杂的人群活动及社交行为。

近日,百度智能云数据众包与清华大学开展项目合作,推进全球首个十亿像素级视频数据集PANDA的建设工作,用以支持未来在公共安全、智慧城市、虚拟现实等领域的各项研究及应用。

本次项目共完成7200余帧亿级像素图片,共计超过106万张切图的数据标注工作,包括物体间关系近2万组、交互行为近20万个、移动物体轨迹点近30万组,以及数十亿3D点云数据的语义分割及实例标注。

据了解,PANDA是全球首个十亿像素级视频数据平台,它突破了人眼视觉分辨率的极限,赋予视觉计算更高质、更真实、更全面的源数据,填补了国际上“宽视场、多对象、高分辨率”数据平台的空白,为新一代智能处理技术研究提供了不可或缺的数据基础。

清华大学电子工程系副教授、PANDA 数据集项目负责人方璐介绍,此前清华大学团队曾围绕 PANDA 数据集,在计算机视觉顶级国际会议ECCV 2020上,组织了GigaVision 2020挑战赛并引起广泛关注。

目前,团队正在筹办ACMMM 2021会议的GigaVision主题挑战赛,以及全球人工智能技术创新大赛。

关键词: 十亿像素 视频数据集 PANDA

推荐DIY文章
主机存在磨损或划痕风险 PICO4便携包宣布召回
穿越湖海!特斯拉Cybertruck电动皮卡可以当“船”用
vivoXFold+折叠旗舰开售 配备蔡司全焦段旗舰四摄
飞凡R7正式上市 全系标配换电架构
中兴Axon30S开售 拥有黑色蓝色两款配色
荣耀MagicBookV14 2022正式开售 搭载TOF传感器
it