赛题5:病理切片识别AI挑战赛
招募中
参赛队伍
参赛人数
作品提交数

比赛数据 Competition Data

比赛题目:

要求参赛者使用患者的病理切片数据(tiff格式)训练模型算法,根据独立的测试数据集中病理切片数据判断癌症区域,及判断癌症轮廓准确度和特异性,从而协助医生诊疗。比赛期望参赛者可以提出好的算法,以达到辅助医生进行胃癌诊断的目的。比赛希望通过人工智能辅助手段,提高胃癌检测的速度和精度。
比赛鼓励参赛者使用和设计深度学习算法,但并不局限于此。赛题组希望参赛者可以在结合临床病理学的一般数据特征的基础上,挖掘和创造更多创新性、原创性算法和模型。

数据下载:
1.数据介绍

1)比赛选取胃癌数字病理样本,为常规HE染色,放大倍数20×,图片大小为2048×2048像素,比赛数据为整体切片的部分区域,数据格式为tiff 格式;
2)比赛数据由大赛AI技术支持方微瞰智能提供数据标注平台,由多位专业病理专家亲自标注,根据数据赞助方提供的病理切片图像样本,形成以下文件:一是2048×2048图片文件,二是生成覆盖在样本上的标记文件;
3)所有数据均按照国际通行的医疗信息脱敏标准进行脱敏处理,切实保障数据安全;
4)比赛不允许使用外部数据。
5)标注规则:本赛题不是辨识病理切片中的胃癌细胞,而是识别病理切片中的癌变区域(癌巢)。图像中癌细胞不仅限于标注区域,标注的是视野中典型癌变区域。无癌变区域样本,请参照非胃癌样本集。
6)数据约定:参赛者(或团队)同意必须仅以比赛为目的持有和使用数据,本次比赛数据仅限已报名选手下载,请勿向外传播;若私自传播(包括但不仅限于传输、复制、发布、再分发等在内的任何传播形式)数据,组委会有权追诉法律责任。

2.数据下载
文件名称 文件格式 文件大小 下载
初赛训练集标注文件 zip 3.97M 数据下载
初赛训练集图像文件 zip 6G 数据下载
初赛训练集数据说明 pdf 281.4k 数据下载
胃癌癌巢识别知识补充资料 pdf 288.7k 数据下载
比赛参考论文 rar 12.8M 数据下载
初赛测试集图像文件(切换数据) zip 2.48G 数据下载
初赛测试集数据说明 pdf 424K 数据下载
初赛提交错误原因说明 zip 0.99M 数据下载
决赛训练集标注文件 zip 7.97M 没有权限下载
决赛训练集图像文件 zip 15.2G 没有权限下载
决赛预测试集图像文件 zip 895.3M 没有权限下载
决赛测试集图像文件 zip 4.31G 没有权限下载
决赛提交结果格式检查脚本 zip 12k 没有权限下载
决赛图像分割任务提交PNG格式mask说明 zip 18k 没有权限下载
决赛提交结果说明文件 pdf 307k 没有权限下载
决赛验证环节数据集 zip 没有权限下载
3.数据下载说明

1)初赛数据 a.数据量
初赛选取100个病人案例(部分为癌症、部分为非癌症),共计1000张病理切片图片,训练集数量700张,测试集数量300张。
b.数据格式
病理切片格式:tiff 格式;
数据下载格式:zip;
c.数据标注
所有数据均由病理专家以“双盲评估+验证”的形式进行标记,数据标注为有无癌症,并用线条画出(双盲评估+验证)肿瘤区域轮廓;
d.数据获取
参赛者可下载数据,在本地调试算法,提交结果由机器自动评测成绩。初赛时间为2017年7月21日-2017年10月10日,训练集发布时间2017年7月7日,测试集发布时间2017年9月8日。
2)决赛数据 a.数据量
决赛选取200个病人案例(部分为癌症、部分为非癌症),2000张病理切片图片;训练集数量1400张,测试集数量600张(预测试集数量100张)。
b.数据格式
病理切片格式:tiff 格式;
数据下载格式:zip;
c.数据标注
所有数据均由病理专家以“双盲评估+验证”的形式进行标注,用线条画出肿瘤区域。
d.数据获取
参赛者可下载数据,在本地调试算法,提交结果由机器自动评测成绩。决赛比赛数据仅限晋级决赛参赛选手使用,请勿向外传播。决赛时间为2017年10月17日-2017年11月17日,决赛训练集发布2017年10月18日。决赛预测试集发布时间2017年10月31日,测试集发布时间2017年11月6日。

提交结果
1.提交结果

此处为原文件上传代码

初赛: 结果提交:1)要求参赛者给出定性结果,判断图像有无癌症。
2)初赛时间为2017年7月21日-2017年10月10日,9月8日测试集公布后每天可提交结果,10月10日24:00截止提交。每个提交日(0:00-24:00)可重复提交,重复提交的预测结果文件将会覆盖之前的版本,评测将以当日最后一次提交的文件为准;次日16:00更新排行榜。
3)仅参赛团队队长有提交权限。
4)系统将在9月12日12:00AM将进行数据切换,参赛队伍需以切换后的数据集为比赛数据,初赛成绩排行榜将以9月12日后产生的成绩作为排名依据。(旧数据集提交的成绩无效)
5)初赛阶段共有8次获取提交成绩排行机会(也即在初赛期间选手可以选择切换数据后的任意8天进行提交),选取其中最优成绩作为晋级标准。
评测标准: Evaluation of Cancerous Region Segmentation: Precision=(|TP|)/(|TP|+|FP|)
Recall=(|TP|)/(|TP|+|FN|)
F1 Score=(2∙Precision∙Recall)/(Precision+Reall)
●    TP:True Positive,被分类为属于癌变区域,但分类正确;
●    FP:False Positive,被分类为属于癌变区域,但分类错误;
●    FN:False Negative,被分类为属于非癌变区域,但分类错误。
要求参赛者给出定性结果,判断图像有无癌症(准确率达到85%及85%以上方可获得晋级资格)。参赛者在提交日当天不限定提交次数,但初赛阶段共有8次获取提交成绩排行机会,选取其中最优成绩作为晋级标准;若提交结果次数超过8次,将选取前8次提交结果作为晋级参评标准,其余提交无效。最终排行榜的TOP40团队进入决赛。
提交说明:每个图像给出专家意见吻合度,提交图像Tag文件。
每次提交共计要包含2个字段(图像名+tag),不需要列名,每列请以TAB作为分隔符。
示例(仅为示例,具体图像名称以大赛官网公布的测试集为准):
00DEC764417AA0CD7C188CA46B0FBC4E.tiff   P
02B955CA81B496D2255333666B5B7D2F.tiff   N
判断结果中,P为positive,N为negative。
初赛提交文件内应包含2列,300行。
提交格式为文本文件,后缀名为.txt,文件名以团队名命名(示例:团队名.TXT)。
决赛: 结果提交:1)要求参赛者给出svg/png坐标文件。
2)决赛比赛时间为2017年10月17日-2017年11月17日,每个提交日(0:00-24:00)可重复提交,重复提交的预测结果文件将会覆盖之前的版本,评测将以当日最后一次提交的文件为准;次日16:00更新排行榜。11月17日24:00截止提交。
3)为了参赛者更好地优化算法和模型,决赛测试集发布两批:预测试集和测试集。决赛预测试集数量100张,发布时间2017年10月31日,预测试集提交结果不计入成绩。决赛测试集数量500张,发布时间2017年11月6日,提交结果作为最终成绩评测依据。
4)提交完成后,选手将收到系统反馈,系统显示“提交成功”则本次提交完成;如系统检测上传有误,则本次提交失败,选手需自行检查上传问题,再次提交。
5)仅参赛团队队长有提交权限。
评测标准: 决赛需要标记图像中的所有癌症区域,以标记的癌症区域的准确度(标记癌症区域和Ground Truth标记的吻合度,具体评分计算具体参考如下公式)作为评判标准。最终选取TOP10获胜队伍。
评分方法请参考Kaggle以往的类似比赛:
https://www.kaggle.com/c/ultrasound-nerve-segmentation#evaluation
单张测试图片计算Dice coefficient的公式如下:
2*|X∩Y|/(|X|+|Y|)
上式中:X是提交的预测值,Y是Ground Truth
最终的得分为所有测试图片Dice coefficient的平均值(值域范围:0-1)
提交说明:提交svg或者png坐标文件集。
提交文件格式示例(仅为示例,具体图像名称以大赛官网公布的测试集为准):
测试集图像名称:00DEC764417AA0CD7C188CA46B0FBC4E.tiff
提交结果名称示例:
00DEC764417AA0CD7C188CA46B0FBC4E.svg
或者
00DEC764417AA0CD7C188CA46B0FBC4E.png
文件集共应包含文件500个,请将文件集打包为.zip格式,文件包以团队名命名(示例:团队名.zip )。

比赛环境

初赛和决赛均为离线比赛,对开发环境没有限制。