赛题4:智能投顾技术挑战赛
招募中
参赛队伍
参赛人数
作品提交数

赛事介绍 Competition introduction

赛题背景:

“智能投顾”又称“机器人理财”,是虚拟机器人基于客户自身的理财需求,通过算法和产品来完成以往人工提供的理财顾问服务。用户无需掌握太多市场和金融产品知识就可以使用该服务。智能投顾依托大数据的计算系统,通过机器学习与用户友好型界面相结合,提供可以和专业投资管理专家媲美的投资顾问服务。近来,智能投顾在美国兴起,它提供全自动的、以算法为基础的投资组合管理建议。国内也越来越多的中产阶级将步入富裕人群行列,而智能投顾的低门槛,将让更多中低收入人群加入理财大军,个人财富的积累推动理财需求急剧膨胀。传统银行、互联网公司、第三方理财平台纷纷抢滩智能投顾。
与传统人才投顾相比,智能投顾具有服务面广、成本低、客观性、规范性、避免人工失误等诸多特点和优势。智能投顾的发展,将使“一对一”财富管理从高净值客户服务普及到一般客户,市场空间非常之大。机器人可以避免一些追涨杀跌的不理性行为,能坚守投资纪律,能减少决策失误的概率,并通过模型和机器算法加大正收益实现的可能性,还能提前预判一些风险和减少风险发生后的损失,并且实时监控仓位,这些都比人类本身更具有优势。把复杂的事情交给机器人,让理财重新回归简单,这也是智能时代的必然趋势。
2017大数据人工智能创新创业大赛承接2016上海BOT大数据应用大赛计算机视觉识别赛题,全新设立科技金融技术赛——BOT大赛系列之智能投顾技术挑战赛,聚焦智能投顾技术,运用自然语言理解等技术,加强智能投顾能力。比赛5月19日正式启动,分为初赛、复赛、决赛,比赛数据由choice数据提供,由复旦-中植大数据金融研究院提供技术指导。

赛题说明:
比赛赛题

新闻的蝴蝶效应——市场消息股价(三日内)影响评估 恐慌、贪婪、犹豫不决……这些人性的弱点是深度学习所没有的。投顾智能体透过机器视觉与阅读能力,察觉哪些消息面因素会影响股价变化;让人工智能协助我们客观地评估各种舆情因素对于股价的影响。

赛题设置

新闻的蝴蝶效应——市场消息股价(三日内)影响评估 数据集为沪深300股票(股票名称将不额外提供,参赛者须要自行透过实体识别)单日所有新闻(新闻将提供标题、第一段全文;提供各新闻发出时间,但不含明确日期),参赛者需要根据这些新闻语意特征来预测明天、后天、大后天三天的开盘股价涨跌幅。竞赛启动2周后,每周末会有一次提交机会,共计3次提交,初赛为限时提交,选手取得测试集解压缩密码6小时内必须完成提交。

评测标准

计分的原则是根据损益来评估选手们预测的结果的商业价值程度。但这仅是计分的指标,因此不会处理各个股票价格间的差异,因为选手未来在评测时也不会获得股票编号。收益率越大排名越高,初赛成绩排名前25名的参赛队伍将进入复赛。

计分模式详细说明

计分规则以选手答案作为交易决策基准,若是选手预测涨,则买入,选手预测跌,则放空,假设所有股票面额一样,计分时不考虑个别股票支票价值差异(因为选手在评测阶段不会知道对应之股票编号)。
因此根据选手答案与实际答案,将会产生以下三种情况:
1. 如果选手预测涨跌幅(涨、不变、跌)与答案一致,根据计分规则属于产生收益的情况,获利金额应该等于选手预测涨跌幅绝对值与实际涨跌幅绝对值取其小者;
2. 如果选手预测涨跌幅(涨、不变、跌)与答案不一致,根据计分规则属于产生损失的情况,损失金额应该等于选手预测涨跌幅绝对值与实际涨跌幅绝对值加总;
3. 如果选手预测不变(涨跌幅为零),除非答案也是不变,不然根据计分规则属于遭受未执行交易策略的期望收益损失或跌价风险。金额会等于实际涨跌幅绝对值。
根据上述描述,
预测的单日收益或损失=[涨跌幅一致收益]-[涨跌幅不一致损失]-[预测不变损失]
预期损益率=(第1天预测收益或损失/第1天实际答案的绝对值)+(第2天预测收益或损失/第2天实际答案的绝对值)+(第3天预测收益或损失/第3天实际答案的绝对值)
*计分公式可以参考工具包scoring.py中的expect_margin函数。
提交输出格式以及答案计算公式
uuid
Value1 (d1_open新闻事件发生次日开盘价/ d0_open 新闻事件发生当日开盘价)-100%
Value2 (d2_open新闻事件发生后日开盘价/d1_open新闻事件发生次日开盘价)-100%
Value3 (d3_open新闻事件发生大后日开盘价/d2_open新闻事件发生后日开盘价)-100%
因为开盘当日的价格涨跌(+-10%)是根据前一个交易日的收盘价决定的,此次比赛我们计算的是开盘价之间的涨跌幅,因此得出涨跌幅数值(value1,value2,value3)超过10%属于正常范围。(例如,第一个交易日的开盘价为9元,当天收盘价为10元,那么该股在下一个交易日的股价浮动在9-11元之间,假设第二日的开盘价为10.5元,那么两个开盘价之间的涨跌幅为(10.5-9)/9=16.77778%)。

复赛赛题
赛题描述

根据测试集图片,预测未来三日(相比于K线图基准日)的【收盘价涨跌幅】、【三日内最高价】、【三日内最低价】;

数据描述

训练集素材为jpg格式(通道数=3)的k线图文件,以及对应的标记档案(json格式),k线图主体可能是个股与大盘,皆为日k线图,范围为半年,k线图内包含以下图形指针:
1. 日线
2. 周线
3. 月线
4. 季线
5. 半年线
6. 年线
7. 成交量
8. KDJ指标(三条线)
图片中所有指针线都会用不同颜色,并在训练集文件中提供给选手相对应的像素BGR值。
标记档案中包含K线图指定日期当日以及后三日的开盘价、收盘价、成交量数值以及坐标轴信息包含K线图Y轴上下界、成交量Y轴上下界以及KDJ指标Y轴上下界。

评测方式

将根据各位团队的评测结果计算对应团队的收益率,详细评分公式代码将在Github上的大赛工具包中发布。

决赛赛题
中文视觉阅读智能问答+(CVRQA+)
赛题描述

与传统的视觉智能问答不同的是,除了以中文为基础外,还将是觉得定义延伸吗,扩展至阅读理解。
决赛训练集数据范围:基于初赛和复赛的数据
决赛测试集:沪深300以及上海深圳市场指数为基础,未必包含于训练集

评测标准

测试集总共包含1000道题目,一题一分(单词模式),提交日24小时内2小时限时回答。选手也可以挑战较为复杂的句子模式,此部分将交由人工阅卷,句子模式属于加分项目,只要语意符合答案,句子表达不通顺不会扣分,句子表达通顺完整且具有商业使用价值可基于原始分数,增加最高20%的分数。除去人工撰写润饰外,选择句子模式者需要依照大赛检核需求,说明句子构成方式。
答题形态
单词模式:单词回复(默认必答,答对一题的一分,答错不扣分)
会有提示(告诉大家答案为哪一类的单词,例如个股名称、人名、Yes/No.....)
句子模式:对话回复(基于单词回复,交由业内专家人工阅卷,一题一分,属于加分题,加分总额不会超过单词回复答对分数的20%)
决赛赛题每题都会给予相对应的上下文数据(投研报告、新闻、公告、K线图、知识图谱),其中知识图谱是由大会统一公布,可通用于训练集和测试集。
除去初赛、复赛的训练集以及测试集数据外,决赛训练集将只额外提供题型(包括对应上下文、范例例句以及答案),决赛赛题不会出超出示范题型之外的问句。测试集都会列出题型编号、答案提示以及分词过的问句(结巴分词加人工校验),有问题及答复提及公司名称或是个股名称一律以证券市场简称为标准答案,除类股推荐提醒外(回答3个以上算正确),不会有多选题,不会有开放式问题。题目内若涉及对于未来股价的推断,默认是基于上下文时间点三日内收盘价格为基础。

比赛时间:
比赛报名:2017年5月19日-8月27日
训练集发布:2017年7月14日
初赛:2017年7月21日-8月27日
初赛第一次提交:2017年7月30日
初赛第二次提交:2017年8月13日-14日
初赛第三次提交:2017年8月27日-28日
初赛排名公布:2017年8月31日(TOP25)
复赛:2017年8月31日-9月29日
复赛第一次提交:9月16日-18日
复赛第二次提交:9月22日-24日
复赛第三次提交:9月27日-29日
复赛排名:2017年9月30日(TOP10)
决赛:2017年9月30日-11月10日
自测集发布:10月20日
决赛提交:11月5日-6日
最终排名公布:11月10日
成果展示及颁奖:12月1日
*以上时间均为北京时间(GMT+8)
比赛奖项:
奖项设置:

一等奖(1名):5万现金+荣誉证书
二等奖(3名):1万现金+荣誉证书
三等奖(6名):3千现金+荣誉证书
最具潜力奖(6名):精美礼品+荣誉证书
*优秀技术团队有机会获得千万技术孵化投资。

奖项说明:

1.所有在决赛路演获胜的团队将得到相应比赛奖金(奖金以人民币计算),奖金个人所得税或其他形式税收将由获奖者承担,由大赛组委会代缴。
2.参赛者应自行负责在其成员之间分配和分发奖金与奖品,大赛组委会对此将不承担任何责任。

初赛提交礼:

参与初赛提交的团队,可获得由大赛战略合作伙伴AWS提供的AWS组合资源包。
AWS组合资源包专为所有初创公司或自主创业公司的企业家设计。通过加入亚马逊 AWS 云创计划,注册并获取以下优势。
价值3000 CNY的半年期 AWS 服务抵扣券(可使用于GPU资源等)*;
1 月期 AWS Support(商业计划);
AWS Business Essentials 在线培训(价值 3725 CNY 或 600 USD);
AWS Technical Essentials 在线培训(价值 3725 CNY 或 600 USD);
用于参加自主进度动手实验 的80 积分(价值 500 CNY 或 80 USD);
*资源下载及使用说明请前往数据下载处下载“AWS组合资源包申请及学习资源指南”
Amazon Web Services(AWS),是世界上服务和应用广泛的云服务平台,通过位于美国、澳大利亚、巴西、加拿大、中国、德国、印度、爱尔兰、日本、韩国、新加坡和英国等 16 个不同区域的44个可用区(AZ),向客户提供90多项功能全面的服务。通过AWS的服务,客户能够有效地强化自身基础设施,提高敏捷度,降低成本;获得全球数百万客户青睐,包括发展迅速的初创公司、大型企业和政府机构。大赛联合AWS为参赛选手们提供超值资源包,为广大选手们解决了资源等方面的后顾之忧,助力参赛选手们取得佳绩,并帮助创业团队实现梦想!

数据提供方:

Choice数据

技术指导:

复旦-中植大数据金融研究院

大赛官方交流平台:
科技金融官方QQ 群540818809

报名完成后,欢迎即刻关注大赛公众号(DataDreams)、加入官方QQ群,此为赛期主办方与选手主要沟通渠道,后续将持续更新最新赛况、线下活动,并有专人解疑答惑;也可在群里交流组队,寻找志同道合的队友。