Windows|揭秘冬奥会上的一项AI黑科技,正从神坛走向大众( 二 )




在直线加速阶段同理 , 教练和运动专家们可通过3DAT生成的核心关节、膝关节、髋关节的旋转角度和角速度 , 以及运动员的质心的轨迹和加速度等数据 , 帮助运动员分析姿态对蹬冰质量和效率的影响 。



实时精准的技术底座

简单易用的背后 , 通常是绝对不简单的底层技术 。 不难理解 , 图像包含的信息量是巨大的 , 要从连续多帧的视频画面中逐层提取出肘、踝、膝、肩关节等关节点的位置信息 , 对计算能力的要求是非常高的 。 而在平时训练中 , 教练员往往要求即时采集、即时生成数据 , 以即时调整技术细节 , 这对计算能力和AI算法又提出了更高的要求 。
据悉 , 3DAT技术不仅支持1080P、4K等画质 , 还能以160fps的帧速率解码 , 支持多路视频的同步采集以及多路视频在后续数据处理过程中的同步处理、多路视频生成3D姿态数据等;并能实现高精度数据生成 , 测量误差可低至5毫米级别 , 角度误差可控制在7-8度左右;在实际应用中 , 还可在训练现场即时生成3D数据和生物力学数据 。
那这些能力背后有着怎样的底层技术支撑呢?
首先 , 英特尔?至强?可扩展平台可实时处理、校验、统计和分析复杂而庞大的训练数据信息 , 确保了3DAT系统的及时性 。
第三代英特尔?至强?可扩展处理器相比上一代产品性能提升高达46% , 支持8通道DDR4/3200 64条PCI EXPRESS 4.0通道 , 全面增强I/O吞吐量 , 为信息量巨大、实时性和精准度要求高的图形、影像处理和3D建模、数据分析 , 提供了坚实的基础 。 英特尔?傲腾? 技术提供充足的数据存储容量的同时 , 可凭借低时延特性确保数据处理效率 。 英特尔?Scalable Video Technology可在不损失图像质量的前提下大幅提升视频编码效率 , 从而能确保视频播放和报告生成的低时延 。
其次 , 3DAT基于英特尔OpenVINO视觉工具套件进行开发 , 基于英特尔?至强?集成了AI加速技术 , 能让视频数据读取、预处理、缺失帧修复、运动数据生成等图像处理更精准、高效 , 测量达像素级精度 , 也显著提升了深度学习推理和训练的性能 , 能让模型生成更高效、更精准 , 推理执行速度大幅提升 。
此外 , 3DAT还具有易部署、易实施的特点 。 基于云/边、端协同 , 通常在现场只需部署2-4台摄像设备 , 甚至在条件有限的情况下采用随身携带的智能手机 , 就能采集视频样本 , 再将视频上传到云端/边缘 , 通过基于英特尔至强处理器的服务器进行高速处理 , 可近乎实时地向教练和运动员反馈分析结果 。

走出奥运 , 普惠大众

简单的讲 , 3DAT技术最显著的特征就是通过机器视觉和AI算法替代了那些放置于运动员身体上的传感器 , 具备简单易用、采集范围大、易部署等优势 , 并基于英特尔?至强?可扩展平台可实现实时、精准的数据分析处理 , 从而降低动作捕捉技术的门槛 。 而由于AI模型可扩展可训练 , 它还易于移植到更多体育比赛项目 , 以及艺术表演、健身、运动康复等广泛的领域 , 进而走向普惠大众之路 。
比如在北京冬奥会开幕式上的《致敬人民》和《雪花》两个节目中 , 英特尔基于3DAT技术 , 联合第三方专业团队定制开发了“基于人工智能技术的演出实时特效系统” , 通过高效部署多个人体检测AI模型和算法调整 , 仅用4台摄像机就完成了上百名演员的精准人体识别 , 及大范围内的人体精准定位 , 并实现了从图像采集、识别、检测到处理全过程不到几十毫秒的端到端时延 , 最终打造出现场屏幕与演员位移实时互动的效果 , 为观众呈现了一场科技与艺术完美融合的视觉盛宴 。

相关经验推荐