O'Reilly、Cloudera 主办
Make Data Work
2017年7月12-13日:培训
2017年7月13-15日:会议
北京,中国

使用Spark/BigDL高级机器学习实现寿险业务再发现 (Reimplement life insurance services using Spark and BigDL advanced machine learning)

此演讲使用中文 (This will be presented in Chinese)

王玮 (中国人寿), Qinyan XU (中国人寿), 顾佳盛 (中国人寿), Pengfei Yue (Intel), Binggang Wo (Cloudera)
14:50–15:30 Friday, 2017-07-14
数据科学&高级分析 (Data science & advanced analytics)
地点: 报告厅(Auditorium) 观众水平 (Level): 中级 (Intermediate)
平均得分:: ***..
(3.33, 3 次得分)

必要预备知识 (Prerequisite Knowledge)

了解Spark基础知识,了解数据挖掘、机器学习概念

您将学到什么 (What you'll learn)

如何运用Spark以及Spark上的深度学习库BigDL构建针对保险业务场景的高级分析应用,以及机器学习系统的架构和应用构建的流程

描述 (Description)

中国人寿多年来积累了大量不同形式的数据,包括业务、管理、精算、影像等结构化和非结构化数据。如何深度挖掘这些数据的价值,用于业务推动、风险管理、客户服务等领域,是我们数据部门的主要目标。在过去的数据分析中我们发现,传统的分析方法并不能完全满足特定业务需求,效果也不够好。而目前,像神经网络深度学习之类的高级机器学习算法已经在若干领域得到了令人振奋的成果,也有类似Spark/BigDL这样的开源工具可以方便地融合多种数据处理和高级学习算法。因此,我们也开始在大数据分析中引入更高级的机器学习算法用于满足业务对于精细定制和性能精准度的要求。

在本次演讲中,我们将介绍中国人寿如何使用Spark以及Spark上的深度学习库BigDL构建针对保险业务场景的高级分析应用,所涉及的应用场景包括客户保险推荐和客户流失分析等。我们尝试了多种前沿的高级机器学习和深度学习技术,包括基于RNN(recurrent neural network)的时间序列分析和CNN(convolutional neural network)等。我们将分享我们的高级机器学习系统的架构,应用构建的流程,以及从中吸取到的经验和教训。


China Life Insurance has accumulated a vast amount of data in various formats, including services data, management data, actuary data, and image data. The primary goal of its data department is to figure out how to draw out value from this data for business improvement, risk management, customer service, and other domains. Past experience showed that traditional analysis methods could not fully support some specific business requirements (and the results were not good enough either). Nowadays, advanced machine learning algorithms, such as neural networks and deep learning, have achieved cutting-edge performance in some domains, and open source tools can easily and effectively integrate multiple data processing and advanced machine learning algorithms together. As a result, China Life Insurance started to apply more-advanced machine learning algorithms into its big data analysis to satisfy business requirements for fine-grained customization and high accuracy in performance.

王玮, Qinyan Xu, 顾佳盛, Pengfei Yue, and Binggang Wo explore how China Life Insurance uses Spark and BigDL, a deep learning library based on Spark, to build advanced analysis applications for insurance usage scenarios, such as customer insurance recommendations and customer chunk analysis, and share China Life Insurance’s advanced machine learning architecture, its procedure for building applications, and lessons learned along the way.

Photo of 王玮

王玮

中国人寿

中国人寿大数据项目负责人,有丰富的数据服务项目的实施经验

Photo of Qinyan XU

Qinyan XU

中国人寿

中国人寿大数据机器学习项目经理,专注于大数据分析和机器学习的研究与应用

Photo of 顾佳盛

顾佳盛

中国人寿

中国人寿数据科学家,专注于大数据分析领域, 主要研究高级数据分析方法和机器学习原理

Photo of Pengfei Yue

Pengfei Yue

Intel

英特尔大数据技术中心高级技术经理。在服务器软硬件行业十年以上行业经验,目前致力于大数据分析相关软件方案的推广工作。

Photo of Binggang Wo

Binggang Wo

Cloudera

具有四年Hadoop及其生态系统的项目经验,专注在大数据解决方案的设计、部署和实现,具有多个行业,例如电信、保险、制造业以及公共安全方面的项目经历。
擅长于通过高效的Hadoop架构设计和实现,结合运用多种大数据工具,帮助业务部门从大数据中获取最终价值。

联系OReillyData

关注OReillyData微信号获取最新会议信息并浏览前沿数据文章。

WeChat QRcode

 

Stay Connected Image 1
Stay Connected Image 3
Stay Connected Image 2

阅读关于大数据的最新理念。

ORB Data Site