随着云计算、移动互联网、物联网、人工智能等技术升级和应用普及,社会和行业信息化的不断发展,全球数据呈现爆发式增长,大数据所蕴含的价值也越发受到重视,被称作“新型的经济资产”。党的十八届五中全会公报提出要实施“国家大数据战略”,这标志着大数据战略正式上升为国家战略,推动我国从“数据大国”向“数据强国”转变。
从产业的角度分析,我国拥有硬件-软件-服务-安全-应用等全产业链环节,产业体系初具雏形;我国已设立8个国家大数据综合试验区,积极引领东部、中部、西部、东北“四大板块”带动相邻省份发展。大数据时代已向我们到来,各地区应根据本地产业基础积极布局,找准大数据产业的切入点和突破口,推动大数据产业特色化、集聚式发展。
大数据硬件是指数据的产生、采集、存储、计算处理、应用等一系列与大数据产业环节相关的硬件设备,包括传感器、移动终端、传输设备、存储设备、服务器、网络设备和安全设备等,其中存储设备、服务器是核心。随着云计算产业的发展,越来越多的企业选择使用云计算服务商提供的平台服务,这降低了整个行业在基础设施层面的成本,企业可以将更多的预算投入到应用层面。
数据中心事大数据领域的核心基建,需求旺盛,市场投资活跃。截至2017年底,我国在用IDC机架总体规模达166万架,总体数量达到1844个,规划在建IDC规模107万架,数量463个。同时,IDC总体布局也在逐步优化,新建大型、超大型数据中心逐步向中西部贵州、呼和浩特等条件适宜地区部署。
大数据软件是指数据采集、数据存储、信息挖掘、分析处理及数据交易的平台和工具,包括大数据计算软件、大数据存储软件、数据查询检索软件、基础平台软件、平台管理软件、系统工具软件和大数据应用软件等。根据赛迪研究院的统计,2015-2018年我国大数据软件行业的市场规模保持增长,2018年达到822.5亿元。
软件层面各细分领域的界线并不清晰,有能力的企业普遍选择多点布局,如阿里云提供数据采集、数据存储、分析处理、信息挖掘等多样化服务。经过多年的发展,各细分领域的市场格局基本形成,市场集中度不断提高,龙头企业出现。
大数据服务包括数据采集、交易、应用、标注、分析处理、增值服务等多种服务类型。其中数据标注属于新型行业,属于非寡头占据非充分竞争市场,但随着下游企业基础性需求被满足、存量市场下降,未来行业集中度将不断提高,挤压中小型企业的生存空间,在通用型数据标注领域更加明显。而在垂直行业数据标注服务领域,对行业专业性的要求更高,大型企业难以广泛布局,未来是中小企业进入和竞争的重点。
数据标注是典型的TO B业务,现阶段主要采用人工标注,通过自建生产(采集、标注)团队、搭建众包平台、采购外包服务等模式实现。随着行业数据积累和人工智能技术的发展,下游需求减少,数据标注企业需要向更高精度、更专业化的方向转型,需要研发基于人工智能的处理工具,降本增效,更好地把握客户的需求。
大数据安全的本质是隐私安全的保护,现阶段主流的商业模式是“安全即服务”,主要从环境安全、系统安全、数据安全、隐私安全四个层面提供咨询、实施、运维、培训服务。据美国投资咨询机构Cybersecurity Ventures相关调查表明,到2025年,全球网络及数据安全预算将达1万亿美元;随着中国网络安全标准的逐步健全,本土安全品牌在政策的驱使下得到了大力扶持,到2020年网络及数据安全行业市场规模将达到1024亿元。
我国大数据安全主要面对政府和企业等对安全产品在合规方面有刚性需求的群体,行业前列企业占据大部分市场份额,且分布较为集中,信息安全行业前50名企业市场规模占据行业总额的90%,前50名的企业主要分布在北京、上海、杭州、深圳等地。随着移动应用的普及个人及家庭对数据安全的需求增加,自发性需求被激活,行业细化成为主流,包括政府、电信、金融、军工、物流、能源、制造、教育、家庭等大数据安全领域,将吸引大量创业公司进入。
大数据产业的目标是通过数据分析处理完成商业化目标,经过多年的发展,大数据应用在金融、健康、政务、工业、电信、电商运营、物流等多个行业获得较好应用。
工业大数据:工业大数据是指在工业领域中,围绕智能制造模式,以数据采集集成、分析处理、服务应用为主的各类经济活动所产生的数据的总称,包括从客户需求到销售、订单、计划、研发、设计、制造、采购、供应、库存、售后服务、运维等整个产品全生命周期各个环节产生的数据,在设计、流程优化、需求预测、供应链优化和绿色发展等领域有广泛应用。
健康大数据:医疗健康大数据来源包括医院、第三方检测机构、体检中心、可穿戴医疗设备、移动互联网医疗企业、医学科研机构、药店、社保部门等,通过数据识别、清洗、融合等数据一次开发和医学自然语言处理、医学影像处理、医学数据治理及挖掘等数据二次开发,达到辅助临床决策、新型药物开发、流行病学调查、医保控费等效果。
金融大数据:金融大数据的来源有三类,分别为银行、证券、保险、基金等自有系统采集、舆情数据和个人数据的网络采集、政府侧企业数据的购买。大数据企业的核心在风控,风控的核心在数据的把握,通过大数据改造决策系统,降低坏账率、提高营收和利润,提升金融机构的竞争力。
以健康医疗大数据为例,健康医疗数据量每年增速达48%以上,是增速最快的行业之一。其主要应用领域包括虚拟助理、医学影像、辅助诊疗、医院管理、疾病风险预测、健康管理、药物挖掘、辅助医学研究平台等一系列领域,其中医学影像、疾病风险预测等为市场热门发展方向。
在医学影像方面,以三维重建、病灶识别与标注、靶区自动勾画与自适应放疗为服务重点,商业模式主要以影像识别与处理软件为主,通过CFDA检测后,向产业链上下游扩张。目前肺部、眼底两大类AI影像技术发展较快,涉及肺部疾病的AI影像企业有联影、推想、深睿、依图、科大讯飞等,眼底影像企业有体素科技、Airdoc、健培、爱尔眼科等。
在疾病风险预测方面,针对公共卫生管理部门,重点聚焦疾病预警领域。通过对互联网搜索、社交、LBS等数据,结合疾病、环境数据,采用机械学习和群智等技术,开展监测、传播动力学研究和风险评估,对公共流行疾病提前预警。百度通过医疗检索数据建立流感预测模型,辅助公共卫生管理部门预测流感在各流行区域间传播时空路线和规律,为靶向疫苗研制和使用提供建议。
在药物挖掘方面,以新药研发、药物筛选、跟踪研究为服务重点,商业模式主要为在药物研发和诊疗方面垂直纵深发展,如个性化药物诊断、新药临床研究等领域,提高研发效率,减少新药不良反应事件,麦肯锡估计医疗大数据为医药研发年均创造400-700亿美元的价值。国内提供药物挖掘服务的公司有思路迪、瑞博生物、吉凯基因、太美医疗等。
目前我国已经设立了8大国家大数据综合试验区,积极引领东部、中部、西部、东北“四大板块”发展,带动相邻省份加快建设。京、沪、粤等地依托本地信息产业基础和产业园发展大数据产业,具有良好的发展基础和优势。河南、重庆、辽宁、内蒙古、贵州等依托国家综合试验区的建设,加速推进辖区内大数据产业的发展。其他中部、西部地区也顺应产业发展趋势,积极布局大数据产业园,力促产业转型升级。
从大数据综合试验区分布。