D·IF大赛:医疗大数据创新应用
招募中
参赛队伍
参赛人数
作品提交数

赛事介绍 Competition introduction

赛题背景:

在大数据人工智能与众多领域的结合中,医疗健康被认为是最先走向落地的应用领域之一。健康医疗大数据以其数据增长快、应用范围广、价值贡献大等特点尤其受人关注。规模巨大的诊疗数据、患者行为感官数据、研发数据和支付医保数据汇聚形成医疗大数据。目前,很多企业和研发机构在临床决策、慢病和健康管理、医疗器械研发、医疗管理、医保控费/保险开发等医疗大数据应用场景中不断尝试,探索出了一些切实可行的方案。麦肯锡在2013年报告中预测仅在美国,医疗大数据的应用有望减少3000亿-4500亿美元/年的医疗费用。我国存在人口基数巨大、医疗资源浪费严重、医疗资源紧缺和配置不合理、医疗支出增长过快、商保发展乏力等问题,医疗大数据的可应用场景丰富且能够深度挖掘。
中国(苏州)大数据应用创新创业大赛(D·IF大赛)特设“医疗大数据创新应用”赛题,旨在让参赛团队以解决医疗健康领域痛点为导向,打通数据、技术和应用场景,设计出切实可行的医疗大数据应用解决方案,推动医疗大数据在具体场景中的落地和转化。

赛题说明:

结合“医疗大数据应用”赛题,主办方给出几类实际应用场景,并就其中的一些场景提供原始数据集。此外,为促进大数据解决方案走向实际落地转化,大赛组委会特邀请中兴网信、海尔医疗两家企业提供贴近业务需求的真实应用场景。参赛团队可基于主办方、中兴网信、海尔医疗提供的数据和场景进行商业计划书的撰写和设计,也可自选创业方向。团队或个人提交商业计划书参赛,要求具有可操作的商业模式和切实可行的操作路径。优秀团队可实现与中兴网信、海尔医疗等知名医疗机构的资源快速对接及项目应用落地。

主办方提供场景:
场景1:医院病历结构化处理
我国医疗领域长期发展过程中,各地方医院缺乏统一规范的临床结构化病历模型;基层医疗卫生机构病历写作尤其缺乏规范性,并且存在医生直接复制粘贴病历内容的现象,造成病历重复率较高,使用价值很小。推进医院病历结构化进程,以挖掘更深层次的数据价值是目前医疗健康领域的一大需求。
需求:通过大数据及自然语言处理技术,使用大量无结构的病历数据,研发开放性的中文病历语义API,提供医院无缝对接的可插拔式模块,或为保险公司、医疗机构等提供智能病历分析服务。
数据开放:开放肺癌影像诊断数据,数据描述及数据下载详见“数据资源下载”页面。

场景2:识别医保欺诈
保险欺诈是当前金融业领域的一个巨大风险。在美国,保险公司每年要损失数十亿美元。在印度,仅仅是 2011 年的亏损总额就达到 3000 亿印度卢比。除了经济损失,保险公司还会失去一些业务,因为客户感到不满意。虽然许多保险监管机构已经定义了框架和流程来控制欺诈行为,但他们往往只是对欺诈做出反应,而不是采取主动措施来预防它们。传统的方法(如循环列入黑名单的客户、保险代理人和员工)并不能解决欺诈问题。
需求:结合用户的保费数据和支付数据,使用大数据方法构建模型,让相关人员可以方便查询保险公司给定的客户、区域、保险产品、代理或审批人员信息,以防止该期间内的整体欺诈风险。

场景3:语音电子病历
香港德信2016年的一项调查显示,中国50%以上的住院医生平均每天用于写病历的时间超过4小时,相当一部分医生写病历的时间超过7小时;国内部分放射科仍采用传统书写方式,有专门记录员记录医生主诉内容,而后转录入电脑中,效率低下。
需求:通过大数据技术智能语音技术以及自然语言理解技术,实现让医生的主诉内容可以实时转化为文本,录入到HIS、 PACS、 CIS等医院信息管理软件中。

场景4:智能问诊
很多三甲医院医生看病量很大,每天需要问诊120至180人,对医生和患者双方来说体验都不好。面对医患沟通效率低下与医生供给不足两大难题,智能问诊在解决这两大难题方面有巨大潜力。
需求:通过大数据技术、人工智能技术,建立智能问诊系统,实现“预问诊”和“自诊”两大功能,利用患者的基本信息、症状、既往病史、过敏史等信息,为患者形成初步的诊断报告,或让患者在手机或PC端通过人机交互完成智能问诊,提高患者就诊效率。

场景5:推荐用药
2010年至2015年,我国零售药店药品/非药品市场规模从1886亿元上升到了3092亿元,其中药品和非药品的平均增长率分别为11.2%和9.3% 。没有专业医药知识的患者面临众多的药品选择,往往无从下手。
需求:利用大数据人工智能等技术,结合患者患病的症状和程度,通过后台算法系统给出中药和西药的用药建议。

场景6:医疗大数据辅助诊疗
医疗大数据辅助诊疗,就是基于海量医疗数据与人工智能算法,发现病症规律,为医生诊断和安排治疗方案提供参考意见。但受限于传统医疗体系,医疗信息往往被封闭在一家医院的院墙之内,医院数据壁垒严重,使得医疗数据样本量小,成本高,实现医疗大数据辅助诊疗具有一定难度。
需求:期待参赛选手构思出如何打破目前的数据壁垒,并在数据共享后,通过海量数据给出医疗大数据辅助诊疗的方案。
数据开放:开放肺癌影像诊断数据,数据描述及数据下载详见“数据资源下载”页面。

场景7:疾病风险预测
疾病风险预测的实现,与精准医学的发展有着密不可分的联系。疾病风险预测是指通过基因测序与检测,提前预测疾病发生的风险。通过患者的基因数据,利用大数据人工智能技术进行基因测序,提前预测患者疾病,让患者早做预防。
需求:利用大数据以及基因测序等技术,使用大量基因数据,通过肿瘤基因检测、遗传基因检测以及传染病检测等程序,预测人类疾病风险的发生。

中兴网信给定场景
场景1:未来十年慢病发病风险评估
通过患者的身高体重、年龄、历史血压,血糖,血氧数据、低密度脂蛋白数据、高密度脂蛋白数据、甘油三酯数据、本人高血压糖尿病疾病历史、家族病史、生活习惯(烟酒、运动、饮食)等,对患者未来十年慢病发病风险进行评估,要求给出预测结果数据,并具有可行的商业模式以及切实可行的操作路径。
数据开放:开放体检样例数据(包括体温、血糖、血压、血氧数据等),数据描述及数据下载详见“数据资源下载”页面。

场景2:儿童未来十年身高预测
通过儿童的出生日期、顺产or剖腹产、出生身高体重、性别、目前身高体重、父母身高、0-6个月喂养方式、母乳时长、宝宝用药情况、饮食情况(鸡蛋、牛奶、)、锻炼情况、睡眠情况等,预测儿童未来十年身高,并根据预测结果为特定儿童提供身高诊断报告,要求给出预测结果数据,并具有可行的商业模式以及切实可行的操作路径。

场景3:骨质疏松型骨折发生概率(40岁以上)
通过患者的年龄、性别、低骨密度指数、BMI指数、既往脆性骨折史(尤其是髋部、尺桡骨远端及椎体骨折史)、抽烟饮酒、饮食习惯、运动习惯、父母骨密度、接受糖皮质激素治疗、是否有关节炎等数据预测40岁以上人群的骨质疏松型骨折发生概率,要求给出预测结果数据,并具有可行的商业模式以及切实可行的操作路径。

海尔医疗给定场景
场景1:探索大数据居家养老新模式
背景:数据显示,到2020年,我国老年人口数量将达2.6亿人。其中,失能和半失能老年人口将突破4600万。老年人在生活照料、医疗卫生、康复护理等方面需求正在不断增加。目前,国内主要的养老模式有三种,分别是机构养老、居家养老和社区养老,三种养老模式在国内的占比约为3%、96%和1%,居家养老绝对占据主流。在居家养老服务体系中,收集、分析和解决大量分散居住老年人群的养老需求是重要基础。
需求:针对目前国内居家养老存在的问题,研究设计关于居家养老服务的硬件或软件,利用大数据技术连接居家养老的各种服务,完善居家养老服务的信息化程度,建立医院、医疗机构、社区、家庭等于一体的合作交流平台。要求方案具备一定的创新性,并具有可操作的商业模式。

场景2:利用大数据调节睡眠,改善睡眠质量
背景:伴随着快节奏的生活和压力,居民“睡不好”、“睡不着”的问题存在普遍性。据世界卫生组织调查,在世界范围内约1/3的人有睡眠障碍,而在我国患有各类睡眠障碍的人的比例明显高于世界27%的水平,因睡眠障碍引发的睡眠健康等一系列问题正在吞噬人的精神和健康。伴随着人们对健康睡眠的愈加重视,如何利用大数据技术,布局“互联网”+“睡眠”市场,让智能睡眠监测快速走入大众生活,让睡眠真正成为一种享受,成为一个新的课题。
需求:针对居民的睡眠障碍问题,研发设计能够监测居民睡眠状况的硬件或软件,利用大数据技术连接与睡眠相关的硬件、软件、可穿戴设备等,打通各平台数据,更好地监测居民的睡眠状况和睡眠质量,通过对居民睡眠数据的分析,为其自动订制一套改善睡眠质量的解决方案,打造“睡眠+”的大健康生态生活圈。要求方案具备一定的创新性,并具有可操作的商业路径。

场景3:用大数据改善慢病管理,提高患者生活质量
背景:慢病已经成为21世纪危害人们健康的重要公共问题。根据国家卫生计生委疾控局2014年数据,我国现有确诊慢病患者近3亿人,而且发病率以每年8.7%的速率上升。具有病程长、流行广、费用贵、致残致死率高等特点。慢病对于患者的健康和生活往往会产生严重的影响,而且会给患者的家庭和社会带来严重的负担。因此,利用大数据技术科学而完善的慢病管理显得更加重要。
需求:针对目前我国慢病管理现状,研发设计可改善慢病管理的硬件、软件和智能可穿戴设备。并能够利用大数据技术科学而完善地改善慢病患者身体状况,包括:(1)实时跟踪用户身体状况。(2)根据检测数据为用户实施个性化的健康管理方案。(3)基于数据的健康管理能降低重病发病率,减少医疗支出。要求方案具有一定的创新性,并具备可操作的商业路径。

场景4:大数据助力优生优育,创建幸福家庭
背景:优生优育能够提高人口质量,控制人口增长。在实现优生优育的过程中,孕妇需要进行产前检查,重视宝宝是否有出生缺陷,关注孕期营养与妊娠期疾病。等孩子出生,准妈妈要关注孩子的饮食、身体状况,为宝宝营造一个良好的生活环境。实现优生优育过程中的每个环节,都可以利用大数据技术来提高效率,帮助母婴群体更好地了解自己的身体状况。
需求:针对优生优育的各个环节,研发设计能够实现优生优育的硬件、软件和智能可穿戴设备等。利用大数据技术优化产前诊断流程,提高医生诊断效率,降低胎儿出生缺陷率;研发设计适合孕妇的智能可穿戴设备,实时监测孕妇饮食、起居和身体状况,通过对孕妇健康状况的分析,针对性地对孕妇推荐孕期食谱和注意事项等。要求方案具备一定的创新型,并具有可操作的商业路径。

数据开放:

开放肺癌影像诊断数据、体检样例数据(包括体温、血糖、血压、血氧数据等)、舆情数据等,数据描述及数据下载详见“数据资源下载”页面。

比赛时间:

大赛发布:2017年11月10日
比赛报名:2017年11月10日
数据开放:2017年12月22日
主题沙龙:2017年12月01日
报名截止:2018年1月28日 
初赛评审时间:2018年1月31日至2月8日
决赛名单:2018年2月11日(20强)
决赛路演:2018年 3月15日
大赛峰会及颁奖仪式:暂定5月份 (具体时间待定)

合作机构:

海尔医疗、中兴网信、健盟、显生宙、生物谷、中国医疗产业联盟等

全球独家云技术企业:

腾讯云

技术支持:

华院数据

法律支持:

盈科律师事务所

投资机构:

多家知名投资机构,陆续揭秘中

合作创孵机构:

科沃斯蒲公英孵化器、XLAB创意创新创业孵化器、启迪之星(苏州)、复客中国、苏大天宫、北京大学创业训练营苏州中心、众创原力、中科院(昆山)众创空间、精工4.0创客工场、N度空间、思客入众创空间、中大创新谷等

合作媒体:

中国互联网新闻中心、创头条、中国网、江苏电视台、苏州电视台、数据猿、蒲公英创业吧、大数据文摘、36Kr、亿欧网、猎聘网、创客猫、创Talk、造奇智能、砍柴网 、刺猬公社、紫数网、中国首席数据官联盟、爱分析、36大数据、数据局等

大赛参赛选手官方交流群:

D·IF大赛医疗大数据参赛选手微信交流群(待公布)
报名完成后,欢迎即刻关注大赛公众号(datadreams)、加入官方交流群,此为赛期主办方与选手主要沟通渠道,后续将持续更新最新赛况、线下活动,并有专人解疑答惑;也可在群里交流组队,寻找志同道合的队友