谷歌AI实验室再现新成果:将开源基于机器学习的手部跟踪算法( 三 )

研究过程中,手经常会彼此遮挡(例如手指/手掌的遮挡和握手),同时也缺乏高对比度模式的应用,所以这就为研发增加了很大的难度。

不仅如此,手的运动通常是快速的、微妙的,或者两者兼而有之。计算机根本不擅长实时捕捉到这些运动。

基本上,计算机很难快速做到实时正确解读这些运动。即使使用了多摄像头,SignAll使用的深度感应设备也很难跟踪到每个动作。

但这些并没有阻挡了谷歌的研究脚步,在这种情况下,他们的目标要至少在一定程度上减少算法筛选所需的数据量。因为更少的数据量将实现更快地转换。

首先,他们放弃了让系统检测整只手的位置和大小的想法。

相反,他们只让系统找到手掌,手掌不仅是手最独特、形状最可靠的部分,而且还是方形的,这就意味着他们不必担心系统能够处理高矩形图像、短图像等。

当然,如果手掌一旦被识别出来,手指就会从手掌的一端伸出来,可以单独分析。一个单独的算法会查看图像,并为其分配21个坐标,大致与指关节和指尖协调,包括它们可能的距离(它可以根据手掌的大小和角度等来猜测)。

推荐阅读