O'Reilly、Cloudera 主办
Make Data Work
2017年7月12-13日:培训
2017年7月13-15日:会议
北京,中国
 
报告厅(Auditorium)
多功能厅2(Function Room 2)
多功能厅8A+8B(Function Room 8A+8B)
Add 现代流计算架构 (Modern streaming architectures) to your personal schedule
13:30 现代流计算架构 (Modern streaming architectures) Sijie Guo (Streamlio), Maosong Fu (Twitter)
多功能厅5B+C(Function Room 5B+C)
Add 大数据的数据模型 (Big data modeling) to your personal schedule
09:00 大数据的数据模型 (Big data modeling) Ted Malaska (Blizzard Entertainment )
10:30 上午茶歇 (Morning Break) | Room: 待定(To Be Determined)
12:30 午餐 (Lunch) | Room: 待定(To Be Determined)
15:00 下午茶歇 (Afternoon Break) | Room: 待定(To Be Determined)
09:00-12:30 (3h 30m) AI应用 (AI applications) 人工智能 (Artificial intelligence), 深度学习 (Deep learning)
用TensorFlow进行深度学习 (Deep learning with TensorFlow)
Yufeng Guo (Google)
TensorFlow是一个流行的开源机器学习库,特别适合进行深度学习。本辅导课会通过实际的例子来介绍机器学习和深度学习。我们会指导参会者自己动手来使用TensorFlow和TensorBoard进行练习。
13:30-17:00 (3h 30m) Spark及更多发展 (Spark & beyond) 深度学习 (Deep learning)
使用Apache Spark和BigDL来构建深度学习驱动的大数据分析 (Building deep learning-powered big data analytics using Apache Spark and BigDL)
Yiheng Wang (Intel)
深度学习已经在很多的领域(例如计算机视觉、自然语言处理和语音识别等)取得了顶尖水准的表现,对工业界有极大的潜在应用价值。我们应该注意到深度学习和大数据的联系非常得紧密。首先,深度学习的模型需要使用大量的数据来训练,这就是为什么它直到大数据时代才开始蓬勃发展。其次,现在绝大部分的大数据都是视频、音频和文字数据,非常适合使用深度学习算法来处理。为了能释放深度学习的能力,我们就应该把它运用在大数据的环境里。
09:00-12:30 (3h 30m) 数据工程和架构 (Data engineering and architecture) 平台 (Platform), 架构 (Architecture)
使用Alluxio(前Tachyon)来加速大数据计算 (Using Alluxio (formerly Tachyon) to speed up big data analytics)
Bin Fan (Alluxio), Haoyuan Li (Alluxio)
在这个三个小时的教学课中, 我们将向参与者讲授Alluxio基础知识,演示Alluxio如何工作以及如何使用此系统帮助分布式计算引擎(如Spark或MapReduce)以内存速度共享数据。
13:30-17:00 (3h 30m) AI应用 (AI applications) 人工智能 (Artificial intelligence)
AWS上使用MXNet进行分布式深度学习 (Distributed deep learning on AWS using MXNet)
Damon Deng (AWS)
深度学习正持续地在诸如计算机视觉、自然语言处理和推荐引擎等领域引领最前沿的进步。带来这个进步的一个关键因素就是大量的高度灵活和对开发人员很友好的深度学习框架的出现。在本辅导课里,亚马逊机器学习团队的成员将会就深度学习的背景做一个简短的介绍,主要关注与其相关的应用领域。并会对强大和可扩展的深度学习框架——MXNet——做一个介绍。辅导课的最后,你可以获得上手的机会来获得针对多种应用的经验,包括计算机视觉和推荐引擎等。并可以看到如何使用预先配置好的深度学习AMI和CloudFormation模版来帮助加快开发速度。
09:00-12:30 (3h 30m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform), 架构 (Architecture)
从简单到复杂:Apache Kafka应用实例详解 (From simple to complex: A detailed explanation of Apache Kafka applications in practice)
Jiangjie Qin (LinkedIn)
Apache Kafka作为近年来最流行的消息系统之一,其使用场景已经从最初的集中系统消息队列发展到更为复杂的一系列使用场景,包括流处理,数据库复制,CDC等等。本次演讲将以Kafka在LinkedIn的实践为基础详细介绍Kafka的各种应用场景。
13:30-17:00 (3h 30m) 物联网&实时计算 (IoT & real-time) 流媒体 (Streaming), 物联网 (IoT)
现代流计算架构 (Modern streaming architectures)
Sijie Guo (Streamlio), Maosong Fu (Twitter)
The move to streaming architectures from batch processing is a revolution in how companies use data. But what is the state of the art for a real-time data stack? Sijie Guo and Maosong Fu explore the typical challenges in a modern real-time data stack and explain how the modern technology will impact streaming architecture and applications in the future.
09:00-12:30 (3h 30m) 数据工程和架构 (Data engineering and architecture), 英文讲话 (Presented in English) 架构 (Architecture)
大数据的数据模型 (Big data modeling)
Ted Malaska (Blizzard Entertainment )
The recent advancement in distributed processing engines, from Spark to Impala to Spark Streaming and Storm, has proved exciting. Ted Malaska explains why, if your design only focuses on the processing layer to get speed and power you may be missing half the story, leaving a significant amount of optimization untapped.
13:30-17:00 (3h 30m) Hadoop内核&发展 (Hadoop internals & development), 英文讲话 (Presented in English)
数据应用与数据产品架构 (Architecting data applications and data products)
Ted Malaska (Blizzard Entertainment )
Ted Malaska walks you through building a fraud-detection system, using an end-to-end case study to provide a concrete example of how to architect and implement real-time systems via Apache Hadoop components like Kafka, HBase, Impala, and Spark.
10:30-11:00 (30m)
上午茶歇 (Morning Break)
12:30-13:30 (1h)
午餐 (Lunch)
15:00-15:30 (30m)
下午茶歇 (Afternoon Break)

联系OReillyData

关注OReillyData微信号获取最新会议信息并浏览前沿数据文章。

WeChat QRcode

 

Stay Connected Image 1
Stay Connected Image 3
Stay Connected Image 2

阅读关于大数据的最新理念。

ORB Data Site