O'Reilly、Cloudera 主办
Make Data Work
2017年7月12-13日:培训
2017年7月13-15日:会议
北京,中国
Daoyuan Wang

Daoyuan Wang
软件, Intel

王道远,英特尔亚太研发有限公司资深软件研发工程师,Apache Spark社区的活跃贡献者,自2014年起参与Spark SQL开发。在此之前,曾参与IDH版本Hive的开发工作。译有《Spark快速大数据分析》一书。

议题

09:00–17:00 Wednesday, 2017-07-12
地点: 多功能厅3B(Function Room 3B) 观众水平 (Level): 中级 (Intermediate)
Carson Wang (Intel), Yucai Yu (Intel), Zhichao Li (Intel), Yiheng Wang (Intel), Daoyuan Wang (Intel)
平均得分:: *****
(5.00, 1 次得分)
这几年随着大数据分析和机器学习等等在工业界中越来越广泛的应用,越来越多的人选择在大数据平台比如Apache Spark之上构建大规模数据处理、分析和机器学习,以便利用大量原始数据和扩展架构。如何深入理解大数据关键技术并更好的运用它们?本次课程将结合当前大数据技术的浪潮和趋势,为您介绍Apache Spark的高级实践和原理解析,帮助您加深领会Apache Spark的精华设计思想,以及如何与流式分析、机器学习,深度学习等紧密结合,在数据采集,分析处理,特征提取,机器学习等方面提供一致性和集成性的高级实践。 了解更多信息.
13:10–13:50 Friday, 2017-07-14
Spark及更多发展 (Spark & beyond)
地点: 紫金大厅B(Grand Hall B) 观众水平 (Level): 中级 (Intermediate)
Daoyuan Wang (Intel), 李元健 (百度)
平均得分:: ***..
(3.00, 1 次得分)
OAP是英特尔大数据团队和百度基础架构团队的开源合作项目,旨在针对在Spark SQL上进行的大规模数据即席查询进行优化,满足在百度线上业务中对于海量搜索日志进行秒级查询的需求。 OAP通过用户自定义的分布式索引和自动缓存等技术,极大地加速了一些特定场景下的SQL查询。OAP支持多种索引类型,可以让用户根据数据特征选择适当的索引,加速查询的同时,引入较少的额外存储开销。 在百度的生产环境中,OAP已经作为平台提供的查询加速方案,为部分实际查询带来5倍左右的性能提升,大大节约了查询的运行时间,丰富了Spark SQL的应用场景。 了解更多信息.

联系OReillyData

关注OReillyData微信号获取最新会议信息并浏览前沿数据文章。

WeChat QRcode

 

Stay Connected Image 1
Stay Connected Image 3
Stay Connected Image 2

阅读关于大数据的最新理念。

ORB Data Site