O'Reilly、Cloudera 主办
Make Data Work
2016年8月3-4日:培训
2016年8月4-6日:会议
北京,中国

Spark实时计算的开发平台RCS: 阿里流式分析实战

16:20–17:00 2016年8月05日
Spark及更多新发展
地点: 紫金大厅A(Grand Hall A)

必要预备知识

  • Spark的job开发经验即可
  • 对实时分析有了解

  • 描述

    Spark开发者会将自己的代码完成开发并提交到YARN集群,之后任务的监控、报警、性能优化等都依赖于开发者本身;为此我们为Spark开发者提供一套可以完成任务提交、数据接入、任务监控、任务报警、错误日志查看的一体化实时计算的开发平台real-time computing service。通过我们的平台可以:

    1. 自助本地提交任务;jar包版本维护在HDFS上
    2. 数据接入覆盖主流中间件:Kafka、MetaQ、TT和SLS
    3. 任务的监控、报警、日志处理
    4. Spark任务容灾
    5. Spark集群容灾

    jinqing zhu

    Alibaba

    朱金清(穆公) 阿里巴巴高级数据专家,目前在阿里从事infrastructure数据的分析和开发工作,专注于Spark的实时计算分析;最早加入阿里在淘宝/阿里数据库技术团队从事MySQL/HBase数据库的管理和数据开发;人大数据库方向硕士,毕业之后在百度从事凤巢等广告数据库的管理调优工作、曾主导过凤巢历史上最大的数据库拆分工作(1拆N)。

    联系OReillyData

    关注OReillyData微信号获取最新会议信息并浏览前沿数据文章。

    WeChat QRcode

    来自全球Strata+Hadoop 会议的照片。

    Stay Connected Image 1

    北京

    Stay Connected Image 3

    新加坡

    Stay Connected Image 2

    伦敦

    阅读关于大数据的最新理念。

    ORB Data Site