赛题5:病理切片识别AI挑战赛
招募中
参赛队伍
参赛人数
作品提交数

FAQ

一、 数据集采用

1. 请问训练集图片命名方式不一样的样本,有什么区别吗?
A:本次大赛数据集的命名方式请参赛选手参考说明文件。标注数据形成两个文件:一是2048×2048图片文件,二是生成覆盖在样本上的标记文件;以便满足不同参赛者使用数据需求。

2. 这次竞赛不能使用外部数据的原因是什么?
A:从技术上来说,病理扫描仪品牌特别多,数据扫描受染色制图方法的不同,产生很多差异性,如染色的差异性、光照的差异性等等。为了给参赛选手营造一个更加公平、公正的比赛环境,大赛组委会决定不能使用外部数据。

二、 数据集标注

1. 初赛训练集里面标注的区域是全部吗?是不是有区域没有标出?
A:病理切片识别AI挑战赛初赛训练集中标注的区域并不是全部癌症区域,只标注了部分癌症区域。本数据集中标注的是视野中典型癌变与其癌变区域的样本。有癌变的样本只标注了一种部分典型癌变区域,用作识别癌变,非癌变区域请参考非癌变样本。

2. 请问标注是一个医生还是多个医生做的?关于人为主观判断的影响怎么考虑?
A:大赛数据集初期由一个病理知识丰富医生进行标注,于观贞老师进行审核;后期由两个病理知识丰富医生进行标注,于观贞老师进行审核。病理标注较为准确,主观判断的影响较小。

3. 样本中肿瘤区域只是标注了一些典型区域,会不会影响到假阳性结果判断?
A:病理切片识别AI挑战赛初赛训练集中图像只标注了一些典型区域,是为了让参赛选手更快的拿到训练数据。训练集不会影响到假阳性的结果判断,因为训练集的数据不是用来评价参赛选手的算法的。评价选手算法的测试集会在近期上线。

4. 请问测试集图像大小是固定的还是任意大小?
A:本次大赛病理切片识别AI挑战赛测试集的图像均为固定大小。

5. 请问使用什么软件进行的标注,保存为SVG文件?
A:本次大赛是用微瞰智能自行开发的一个在线数字病理平台进行标注的。标注文件可保存为多种格式,svg格式只是其中一种。

6. 标识病区的时候用方框可以吗?
A:不可以,参赛者要分割的是每一张图像当中的癌变区域。用方框标识无法做到精准标识癌变区域的。因为癌巢的边缘不一定是一条直线,有可能是一条曲线。所以我们要求参赛者用曲线将一张图像中所有的癌变区域标注出来。

7. 怎么去填充svg文件标记的封闭区域?
A:所给出的训练集中,不光给予选手SVG文件,还给予了在原始图像上进行过标注的图像。填充svg文件标记的封闭区域的方法有很多种,如python,MATLAB等软件进行填充。

8. 缺少详细的标注信息,包括各级的组织信息,或者能否给定一个分级情况?
A:病理切片识别AI挑战赛初赛训练集给予的标注图像以简洁明了为主题,针对各类不同的团队,所以只给予了简洁明了的标注信息。而各级的组织信息、分级情况,此次比赛并未涉及。

9. 在发布的训练集中,是否所有的标注都是封闭的,也就是构成一个圈?尤其是在图像的边缘部分,会不会出现有类似半圆的标注?
A:所有标注都是封闭的,由于图片大小所限,以及肿瘤本身形态,标注会多种多样,边缘部分肯定会出现半圆或者三角等形状。

三、病理相关

1. 怎样看出训练集图片中癌变区域和非癌变区域的区别?
A:标记出的是癌旁区域,没标记的包含了癌变区域和非癌变区域。选手根据标记出的癌变区域和正常样本进行建模即可。区分癌细胞和非癌细胞是病理医师的工作

2. 可以认为数据集中癌变的概率分布和7.18直播中于老师(病理专家)介绍的基本一致吗?
A:基本一致,病理切片识别AI挑战赛初赛训练集只标注了5-10个区域,测试集标注了全部区域。

3. 关于管状腺癌图片,如果只截取癌巢的一部分给医生们看,一般而言医生能识别出来吗?
A:病理科医生是可以识别的。

4. 针对您提出的关于阳性非阳性区域的问题,能说明一下吗?
A:空白周围是肿瘤细胞,空白是细胞形成的管道,这种类型提示是高分化腺癌,没有管道提示低分化肿瘤,这种结构是肿瘤的一部分。

5. 良性的病理切片就全部是0么?
A:是的,没有标注的图片就是指这张图片上的所有区域都是属于正常区域。

四、数据提交

1. 怎样检测我们提交的训练好的成果呢?
A:具体评测标准请参考大赛官网-竞赛-比赛规则页面。

2. 提交结果要给出的癌症区域比是怎么计算的?是癌巢还是所有癌细胞?
A:癌症区域比是指包含了肿瘤细胞、中间的空白结构占整个切片图像的比例。癌巢包括所有的癌细胞,癌巢不仅限于癌细胞,还有癌细胞之间的空白区域。但提交的时候不需要给出癌症区域比。

3. 对于人眼来说,如果把图像都转为黑白,对识别癌巢影响有多大?
A:影响很大,肿瘤细胞分为核和浆,染色是不一样的,黑白就不能分辨。