做的姿势编辑:LRS
【新智元导读】有大佬最近在好快成人影片中做姿态识别的任务,发帖表示训练集不够用腰疼 。立刻得到蹲热心网友响应:我图解赞助140TB数据!
兄弟们又来正确学技术啦!
今天讲的是人体动作识别(Human Action Recognition),做俯卧撑的正确姿势,正确做核酸检测的姿势,也就是通过模型识别出图片、视频中的人体动作姿势 。
最近Reddit的一个网友蹲突发奇想检测,如果把模型用在成人内容领域,那一定可以大大增加色情视频的鉴别和腰疼搜索的准确度做 。
文章插图
据作者称,他建立的深度学习模型以图像RGB、骨架(Skeleton)和音频作为输入,测血压的姿势不对血压是高还是低,对视频做深拼音中的演员姿势识别打扑准确度已经可以达到75%了 。
文章插图
不过并非只是模型的简单迁移,训练过程做法也测遇到了一些技术上的难关,主要是因为摄像机位置在视频中经常会变换 。
小编根据网友的描述推测,拍摄成人电影的摄像机可能是蹲没有蹲固定机位、或机位变换次数多做法,而人体动作识别的模型通常应用于画监控视频等有固定位置的摄像机 。
作者还表示,躺着做缩肛运动的姿势,训练数据肠镜集相对较小也是一个问题,他只有大约44小时的训练数据,并且影片中的人物位置通常距离很近,所以大多数视频很难得到准确的姿势估计,也就没有办法将所有的位置纳入做缩基于skeleton的模型中 。
一个比较新奇的发现是,输入流中的音频信号,对于4个action的分类是有提升效果的,不过初爱也只是对某些action有用 。
文章插图
帖子核酸一出,也是获得了画技术好快大咖们的一致点赞 。
文章插图
一切高都是为了科学!
文章插图
不过网友们也立刻明白操作了作者的核心运动诉求:求资源!
有网友表示,你要么能108得到海量的资源支持扑克,或者一点也拿不到 。
文章插图
也有人表示他曾经也做过类似的做深项目,他遇到的问题主要是高度嘈杂的场景和非常不稳定的摄像机 。真正困难的场景是有3个以上演员参与的场景,会让实体的区分会变高还是得很困难 。
并且他表示对2人以上的sex position没有概念,所以看到这个模型如此容易地达到这么高的准确率,感觉有点受挫,想肛看看楼主是怎么实现的 。
最慷慨的网友当场表示,我愿意赞助数据集!视频大小140.6TB,时长达到11年6个月,包括6416位表演艺术家,坐的姿势有多少种,还有46.5GB的图片 。
文章插图
有网友时做深跟着评论,替自己搞科研高的朋友同求资源 。
文章插图
至于这项研究有什么意义,网友表示应用前景可大了!以后在资源网站上检索,可以按照指定的position对视频进行过滤,而不只是传统的标签姿、标题、类别等等 。
相关经验推荐
- 穿心莲凉拌菜做法还什么菜搭配 穿心莲凉拌菜做法
- 冰糖雪梨治咳嗽的做法 冰糖雪梨治咳嗽
- 左归丸组成中含有而右归丸组成中不含有的药物是 左归丸组成
- 拼音k的正确书写格式 k的正确书写格式
- 电暖器什么加热*好 电暖器什么加热好
- 购买的机票里面是不是已经包含了人身意外险? 买机票时需要买保险吗
- 魔声ntune 魔声Nergy简介
- 好听的仙气名字 仙气名字
- 狐狸能吃人吃的食物吗 狐狸吃人吗
- 口袋妖怪漆黑的魅影冲浪术在哪获得 口袋妖怪漆黑的魅影冲浪术怎么用