图灵奖得主 LeCun 用来怼 Google 的乳腺癌 AI 论文,有何过人之处?(12)

ResNet-22的完整架构如图4所示 。 L-CC和R-CC ResNets、L-MLO和R-MLO ResNets共享权重 。 我们在输入模型之前翻转了L-CC和L-MLO图像 , 因此所有乳房图像都是右向的 , 允许共享的ResNet权重在相同方向的图像上操作 。 每个ResNet的中间输出是H×W×256维张量 , 其中H和W从原始输入大小下采样 , CC视图H=42 , W=31 , MLO视图的H=47 , W=28 。 我们在空间维度上对向量进行平均 , 以获得每个视图的256维隐藏向量 。

作为参考 , 我们在表2中显示了ResNet-22的每一层后中间向量的维度 。 将标准Resnets应用于乳房X光摄影的主要原因是需要处理分辨率非常高的图像 , 而不需要在GPU限制下进行下采样来拟合前向过程及梯度计算 。

【表2】

B. 辅助patch-level 分类模型及热图

图像的高分辨率和GPU的有限内存 , 限制了我们在使用全分辨率图像作为输入时在模型中使用相对较浅的resnet 。 为了进一步利用乳腺X线照片中细粒度的细节 , 我们训练了一个辅助模型来对256×256像素的乳腺X线图片进行分类 , 预测在给定的patch中是否存在恶性和良性的病灶 。

推荐阅读