如何在虚拟世界里灵活运用你的双手?手势交互方案、算法和场景全解析(14)

上图从左到右展示了迭代初期到迭代结束时的 pose , 这种迭代的数值解法通常对初始化要求较高 , 若初始化的不好 , 则需要很长时间才能迭代收敛 , 还有可能无法收敛到全局最小值(因为损失函数是非凸函数) , 所以算法实现时 , 通常利用上一帧的pose来初始化当前帧的计算 。

这种模型驱动类方法需要手工设计几何模型和损失函数 。 简单的几何模型计算量小 , 复杂的几何模型准确度高 。 通常设计模型时需要在准确度和性能之间做权衡 。

不同的手部几何模型

模型驱动类的算法优势是不需要任何训练数据 , 只要设计的好 , 写完就可以直接用 。 缺点是需要手工设计模型 , 计算量较大 , 容易误差累计导致漂移 , 对初始化要求高 , 通常只能用在手势追踪领域 。

2、数据驱动类算法

此类算法是指利用收集数据中训练样本与其对应的标签关系 , 让机器学习一个从样本到标签的映射 。 此类算法属于判别式方法(Discriminative Approaches) 。

推荐阅读