O'Reilly、Cloudera 主办
Make Data Work
2016年8月3-4日:培训
2016年8月4-6日:会议
北京,中国

Presto在优步:千万亿字节规模的交互式查询

17:10–17:50 2016年8月05日
Hadoop 应用案例
地点: 紫金大厅A(Grand Hall A)

必要预备知识

对大数据和Hadoop基本的理解。

描述

对于优步和其他大数据公司而言实时交互式分析正变得越来越重要。在这个讲话中会介绍我们是如何使用Presto来解决优步的特殊问题。

我们也会介绍优步的大数据架构,尤其是开发和部署Presto来实现秒级查询千万亿字节规模数据的部分。Presto是一个交互式的SQL引擎,专为超大数据集设计,已经广泛地被脸书(Facebook)、优步(Uber)、奈飞(Netflix)等公司使用。我们会先概括地介绍Presto是如何工作的,介绍它的列存储和执行机制。随后我们会介绍Presto的一些有趣的特性的设计和实现,比如列读取、预测存储和懒读取。这些特性让Presto更有百倍的速度提升。

最后,我们很高兴能演示我们在优步生产环境里部署和运行Presto的经验。

Photo of 罗震霄

罗震霄

Uber

Zhenxiao Luo is a senior software engineer at Uber working on Presto and Parquet. Before joining Uber, he led the development and operations of Presto at Netflix. Zhenxiao has big data experience at Facebook, Cloudera, and Vertica on Hadoop-related projects. He holds a master’s degree from the University of Wisconsin-Madison and a bachelor’s degree from Fudan University.

联系OReillyData

关注OReillyData微信号获取最新会议信息并浏览前沿数据文章。

WeChat QRcode

来自全球Strata+Hadoop 会议的照片。

Stay Connected Image 1

北京

Stay Connected Image 3

新加坡

Stay Connected Image 2

伦敦

阅读关于大数据的最新理念。

ORB Data Site