
文章图片

文章图片

文章图片

文章图片

通过细胞图像的标签对模型性能的影响 , 为数据设置优先级和权重 。
许多机器学习任务的主要障碍之一是缺乏标记数据 。 而标记数据可能会耗费很长的时间 , 并且很昂贵 , 因此很多时候尝试使用机器学习方法来解决问题是不合理的 。
为了解决这个问题 , 机器学习领域出现了一个叫做主动学习的领域 。 主动学习是机器学习中的一种方法 , 它提供了一个框架 , 根据模型已经看到的标记数据对未标记的数据样本进行优先排序 。 如果想
细胞成像的分割和分类等技术是一个快速发展的领域研究 。 就像在其他机器学习领域一样 , 数据的标注是非常昂贵的 , 并且对于数据标注的质量要求也非常的高 。 针对这一问题 , 本篇文章介绍一种对红细胞和白细胞图像分类任务的主动学习端到端工作流程 。
我们的目标是将生物学和主动学习的结合 , 并帮助其他人使用主动学习方法解决生物学领域中类似的和更复杂的任务 。
本篇文主要由三个部分组成:
- 细胞图像预处理——在这里将介绍如何预处理未分割的血细胞图像 。
- 使用CellProfiler提取细胞特征——展示如何从生物细胞照片图像中提取形态学特征 , 以用作机器学习模型的特征 。
- 使用主动学习——展示一个模拟使用主动学习和不使用主动学习的对比实验 。
下面是一个来自数据集的全尺寸原始图像的例子:
创建样本DF
原始数据集包含一个export.py脚本 , 它将XML注释解析为一个CSV表 , 其中包含每个细胞的文件名、细胞类型标签和边界框 。
原始脚本没有包含cell_id列 , 但我们要对单个细胞进行分类 , 所以我们稍微修改了代码 , 添加了该列并添加了一列包括image_id和cell_id的filename列:
【细胞图像数据的主动学习】import os sys random
import xml.etree.ElementTree as ET
from glob import glob
import pandas as pd
from shutil import copyfile
annotations = glob('BCCD_Dataset/BCCD/Annotations/*.xml')
df = [
for file in annotations:
#filename = file.split('/')[-1
.split('.')[0
+ '.jpg'
#filename = str(cnt) + '.jpg'
filename = file.split('\\\\')[-1
filename =filename.split('.')[0
+ '.jpg'
row = [
parsedXML = ET.parse(file)
cell_id = 0
for node in parsedXML.getroot().iter('object'):
blood_cells = node.find('name').text
xmin = int(node.find('bndbox/xmin').text)
xmax = int(node.find('bndbox/xmax').text)
ymin = int(node.find('bndbox/ymin').text)
ymax = int(node.find('bndbox/ymax').text)
row = [filename cell_id blood_cells xmin xmax ymin ymax
df.append(row)
cell_id += 1
data = https://mparticle.uc.cn/api/pd.DataFrame(df columns=['filename' 'cell_id' 'cell_type' 'xmin' 'xmax' 'ymin' 'ymax'
)
data['image_id'
= data['filename'
.apply(lambda x: int(x[-7:-4
))
data[['filename' 'image_id' 'cell_id' 'cell_type' 'xmin' 'xmax' 'ymin' 'ymax'
.to_csv('bccd.csv' index=False)
裁剪
为了能够处理数据 , 第一步是根据边界框坐标裁剪全尺寸图像 。 这就产生了很多大小不一的细胞图像:
裁剪的代码如下:
import os
import pandas as pd
from PIL import Image
def crop_cell(row):
推荐阅读
- 宇宙“巴基球”可能是神秘红外线的来源
- 科学与科学家的关系是怎样的?
- 科学家在月球上,发现200个“金发姑娘区”!适合宇航员生存吗?
- 如果没有月球,地球将会怎样?科学家:会多出上万个陨石坑
- 外星人为何没造访地球?美科学家:外星文明自身难保,不来了
- 人为什么会见到“鬼”?科学家通过巧妙实验,证明了“鬼”的真相
- 巴西发现了神秘病毒!90%基因未知,或将成为定时炸弹?
- 奇猎:关于我们不知道地球的10个事实,注意:不要错过2034年
- 同一个宇宙,不同的物理规则?日本和美国科学家发现一个重要结论