O'Reilly、Cloudera 主办
Make Data Work
2017年7月12-13日:培训
2017年7月13-15日:会议
北京,中国
 
紫金大厅B(Grand Hall B)
16:20 TBC
报告厅(Auditorium)
多功能厅2(Function Room 2)
Add HDFS纠删码最新探秘 (Demystifying erasure coding in HDFS) to your personal schedule
16:20 HDFS纠删码最新探秘 (Demystifying erasure coding in HDFS) Andrew Wang (Cloudera), 郑锴 (Intel)
多功能厅5B+C(Function Room 5B+C)
多功能厅6A+B(Function Room 6A+B)
Add Hyperledger与CDH大数据生态系统的融合以及应用实践 (Hyperledger’s integration with CDH's big data ecosystem and its real-world applications) to your personal schedule
13:10 Hyperledger与CDH大数据生态系统的融合以及应用实践 (Hyperledger’s integration with CDH's big data ecosystem and its real-world applications) 蒋守壮 (Shouzhuang Jiang) (万达网络科技集团有限公司), 丛宏雷 (万达网络科技集团有限公司)
多功能厅8A+8B(Function Room 8A+8B)
Add 云深度学习平台架构与实践 (Architecture and practices of a cloud-based deep learning platform) to your personal schedule
13:10 云深度学习平台架构与实践 (Architecture and practices of a cloud-based deep learning platform) Dihao Chen (第四范式技术有限公司), Jianwei Cui (小米)
16:20 TBC
10:45 上午茶歇 (Morning Break) | Room: 赞助商区域 (Sponsor Pavilion)
15:30 下午茶歇 (Afternoon Break) | Room: 赞助商区域 (Sponsor Pavilion)
Add 快速社交 (Speed Networking) to your personal schedule
08:15 Event 快速社交 (Speed Networking) | Room: 紫金大厅A序厅(Grand Hall A Foyer)
08:45 Filling in grey space TBC
11:15-11:55 (40m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform), 架构 (Architecture)
Apache Kylin 2.0:从Hadoop上的OLAP 引擎到实时数据仓库 (Apache Kylin 2.0: From an OLAP engine on Hadoop to a real-time data warehouse)
Dong Li (Kyligence)
Apache Kylin v2.0即将发布!作为领先的大数据OLAP分析引擎,现在的Apache Kylin羽翼更丰:支持雪花模型、更加全面的SQL语法、初出茅庐的Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin正逐渐从一个Hadoop上的传统OLAP平台,演变为一个Hadoop上的实时数据仓库。
13:10-13:50 (40m) AI应用 (AI applications) 人工智能 (Artificial intelligence), 深度学习 (Deep learning)
机器学习平台赋能企业创新应用 (A machine learning platform that enables enterprise innovation applications)
施兴 (阿里云)
过去的几年,人工智能最火热的主要还是深度学习技术在各个场景下的应用。 可以看到,深度学习基本上还是互联网企业的独享,传统的中小企业很难有专门的团队去研究深度学习,也很难获取大规模的数据和计算能力。可以想象,未来会有更大规模的人工智能的需求和领域,依托阿里云自主研发的分布式数据存储与计算平台,我们研发了人工智能平台PAI(Platform of AI),期望将人工智能的能力赋能给各个企业。同时,针对一些通用领域,比如身份证,行驶证的图片识别,我们也基于PAI开发了一些上层的服务输出。 我们将介绍PAI的一些功能基础能力和我们现有成熟服务能力的输出,以及如何基于PAI训练一个自定义的人工智能模型并提供服务的流程。
14:00-14:40 (40m) Spark及更多发展 (Spark & beyond) 云 (Cloud)
在Spark上使用Alluxio的最佳实践(Best practices for using Alluxio with Spark)
Yupeng Fu (Alluxio)
Alluxio (formerly Tachyon) is a memory-speed virtual distributed storage system that leverages memory for managing data across different storage. Many deployments use Alluxio with Spark. Yupeng Fu explains how Alluxio helps Spark be more effective and shares examples of production deployments of Alluxio and Spark working together.
14:50-15:30 (40m) 数据科学&高级分析 (Data science & advanced analytics) 金融服务 (Financial services), 顶级数据科学 (Hardcore Data Science)
大规模机器学习在PayPal风险控制部门的实践 (Large-scale machine learning in PayPal’s Risk Management department)
Pengshan Zhang (PayPal Shanghai)
PayPal风险控制部门一直致力于利用基于大数据的机器学习的模型检测欺诈交易以及欺诈用户。本次演讲主要分享PayPal风险控制部门内部如何利用Hadoop/YARN实现分布式的逻辑回归、神经网络以及梯度提升树等机器学习算法,以及如何针对不同的算法做特征工程,构建端到端的机器学习管道。最后分享如何将这些算法组合起来提升模型的性能和稳定性。
16:20-17:00 (40m) 数据科学&高级分析 (Data science & advanced analytics) 数据公益 (Data for good), 顶级数据科学 (Hardcore Data Science)
Session
To be confirmed
11:15-11:55 (40m) 英文讲话 (Presented in English) 深度学习 (Deep learning)
现实世界里的主动学习 (Active learning in the real world)
Lukas Biewald (Weights & Biases)
Training data collection strategies are often the most important and overlooked part of deploying real-world machine learning algorithms. Lukas Biewald explains why active learning is the best way to collect training data and can make the difference between a failed research project and a deployed production algorithm.
13:10-13:50 (40m) AI应用 (AI applications), 英文讲话 (Presented in English) 深度学习 (Deep learning), 移动 (Mobile)
终端设备上的机器学习: Android设备上的TensorFlow (On-device machine learning: TensorFlow on Android)
Yufeng Guo (Google)
Machine learning has traditionally been performed only on servers and high-performance machines, but on-device machine learning on mobile devices can be very valuable. Yufeng Guo uses TensorFlow to implement a deep learning model for image classification on an Android device, tailored to a custom dataset. You'll leave ready to get started on your own mobile deep learning solutions.
14:00-14:40 (40m) AI应用 (AI applications) 人工智能 (Artificial intelligence), 深度学习 (Deep learning)
基于深度学习的网络表示 (Network representations based on deep learning)
张铭 (北京大学)
网络结构在现实世界中无处不在(如航线网络、通信网络、论文引用网络、世界万维网和社交网络等),大规模的网络结构数据和丰富的网络节点信息对相关的研究方法提出了新的挑战,受到了学术界和工业界的广泛关注。本报告对基于神经网络的网络表示方法进行了详细的介绍,这些方法可以处理现实世界中拥有百万级节点和十亿级边的网络结构,主要考虑了网络结构信息和网络节点自身信息(如文本信息和属性信息等)。学习网络的低维网络表示,在不同应用领域中体现出很好的效率和效果。
14:50-15:30 (40m) AI应用 (AI applications) 云 (Cloud), 人工智能 (Artificial intelligence), 深度学习 (Deep learning)
使用Alluxio助力机器人云 (Powering robotics clouds with Alluxio)
Shaoshan Liu (PerceptIn)
The rise of robotics applications demands new cloud architectures that deliver high throughput and low latency. Shaoshan Liu explains how PerceptIn designed and implemented a cloud architecture to support these emerging user requirements using Alluxio.
16:20-17:00 (40m) AI应用 (AI applications) 人工智能 (Artificial intelligence), 深度学习 (Deep learning)
人工智能工业应用痛点及解决思路 (Pain points in AI industrial applications and solutions)
陈雨强 (第四范式)
AI的强大让各行各业纷纷侧目,未来对AI的应用情况将极大影响一家企业在市场中的位置。 然而, 在实验室叱咤风云的AI技术一旦应用到实际,难免水土不服。 那么,AI工业应用的必要条件是什么?痛点有哪些?如何解决?如何从系统层面、模型&特征层面、模型维度层面、实施上线层面实现突破?针对常见场景中的常见难点,有哪些黑科技正在起作用? 本演讲旨在分享演讲者在互联网、金融、电信等领域的人工智能工业应用实践中的痛点及解决思路。
11:15-11:55 (40m) 数据工程和架构 (Data engineering and architecture)
领英大数据平台--超过1万节点,每天15万个作业,智能连接5亿职场用户 (LinkedIn's big data platform: 10,000+ nodes and 150,000+ daily jobs connecting 500 million members)
Zhe Zhang (LinkedIn)
领英是全球最早应用大数据技术的公司之一。在过去9年的时间里,领英的大数据平台扩展了将近500倍,从20台节点支持10个用户运行MapReduce,到现在超过1万台节点支持几千名工程师和科学家运行从交互式Presto查询到TensorFlow深度学习的各种大规模数据分析。这个报告会分享领英的大数据平台团队怎样解决大规模和高速增长带来的各种挑战。
13:10-13:50 (40m) 物联网&实时计算 (IoT & real-time) 数据平台 (Data Platform), 流媒体 (Streaming)
使用Apache DistributedLog支持交易性的流计算 (Transactional streaming with Apache DistributedLog)
Sijie Guo (Streamlio)
Sijie Guo explores the technical challenges of exactly once delivery and transaction support in messaging and streaming storage systems and explains how Apache DistributedLog helps achieve transactional streaming.
14:00-14:40 (40m) Hadoop内核&发展 (Hadoop internals & development) 数据平台 (Data Platform), 架构 (Architecture)
HBase多数据中心方案及未来的增量备份功能介绍 (HBase as a multiple-data-center solution and its future incremental backup function)
Biao Chen (Cloudera)
多年来Hadoop技术无法进入核心业务系统,其中无成熟稳定的异地多数据中心方案是其中重要原因之一。由于灾备等原因,存储重要数据的HBase集群通常要求跨数据中心进行备份。国内银行业监管单位更是提出了异地多中心的硬性要求。而现在的HBase多为单数据中心部署,目前HBase提供的replica,快照拷贝或export的方式,皆不能满足监管和异地灾备要求。在本session将分享现有多中心部署要求下HBase所遇到的问题、解决办法。未来HBase将增加增量备份功能,其提供的增量备份方案,避免了现有技术对全表数据的扫描,大大提高了备份性能,同时又提供了repica不具备的一致性。在本session中也将详细描述此功能对于多数据方案的重要性、使用介绍以及内部原理刨析。
14:50-15:30 (40m) Spark及更多发展 (Spark & beyond) 平台 (Platform), 架构 (Architecture)
Alluxio缓存策略优化与大规模性能评测 (Optimizing Alluxio cache strategy and large-scale performance evaluation)
Rong Gu (南京大学)
Alluxio(原名Tachyon)是开源的、以内存为中心的统一分布式存储系统。它为上层计算框架和底层存储系统构建了桥梁。Alluxio还提供了分层存储机制,不仅可以管理内存,也可以统一管理SSD 和HDD等存储设备资源。为了使热数据尽量在更快的存储层上,我们在Alluxio中针对多种大数据的应用场景设计实现了众多高级的缓存替换策略包括LIRS、ARC、LRFU等。这些缓存策略已经被集成到Alluxio系统之中,并且可以很方便地用于上层应用性能调优。此外,为了对Alluxio上层的应用进行更大规模的性能评测和调优,我们还设计实现了针对的Alluxio大规模性能评测系统Alluxio-Perf。本演讲中,我将对针对Alluxio大数据的缓存策略与性能评测调优工具Alluxio-Perf的基本原理和使用方式进行详细的介绍。
16:20-17:00 (40m) Hadoop内核&发展 (Hadoop internals & development), 英文讲话 (Presented in English) 架构 (Architecture)
HDFS纠删码最新探秘 (Demystifying erasure coding in HDFS)
Andrew Wang (Cloudera), 郑锴 (Intel)
Hadoop3.0 引入了纠删码技术。在常见配置下,纠删码相对于传统数据3备份模式可以降低50%的存储成本,同时提高数据的可靠性。在本次演讲中,我们首先会简短的介绍HDFS纠删码技术, 然后深入了解在Hadoop 3.0 GA 前我们为保证纠删码功能稳定性做的工作,以及分享Hadoop生态系统中重要成员Spark, Hive,Impala, Kylin等等在HDFS 纠删码上的性能表现。最后,我们会给出在生产环境中部署使用纠删码技术的一些考虑和建议。
11:15-11:55 (40m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform), 架构 (Architecture)
Angel:面向高维度的机器学习计算框架 (Angel: A machine learning framework for high dimensionality)
ming huang (腾讯)
在机器学习和人工智能领域,为了让模型达到更好的线上效果,特征的维度往往会膨胀到千万和亿级别。在这种情况下,传统的分布式计算框架,很难有高的性能。为此,腾讯推出Angel机器学习框架,支持超大维度模型的高性能机器学习。该框架即支持自主的高性能机器学习算法开发,也能作为PS引擎,为其它框架(例如Spark……)提供PS支持,整体形成良好的PS生态圈。
13:10-13:50 (40m) 数据科学&高级分析 (Data science & advanced analytics) 人工智能 (Artificial intelligence), 电子商务 (ecommerce)
多视图建模与半监督学习:应用于海量用户数据挖掘与行为分析 (Multiview modeling and semisupervised learning applied to massive user data mining and behavior analysis)
杨帆 (Lenovo)
在无法直接收集个人信息的情况下,企业需要根据用户行为数据,来预测用户的特定属性(如性别、职业、学历、购买力、年龄以及其它个人生命周期的状态等)。(目标) 一些有监督机器学习算法被用来实现这一目标,但是,面对数千万甚至上亿的海量用户、数百亿甚至更多的行为数据,标注量需要达到一定规模,才能保障机器学习的效果,而为了获得标注数据,是成本非常巨大的工作。(难点) 在实践中,我们通过多个角度对用户进行建模,构造不同的用户数据视图,在每个视图下选择合适的机器学习算法,应用cotraining半监督学习算法,通过多个数据视图机器学习算法的协同训练(cotraining),在使用非常少量的标注数据的情况下,就能在用户属性预测方面达到良好的效果。(方法)
14:00-14:40 (40m) 安全 (Security) 人工智能 (Artificial intelligence), 顶级数据科学 (Hardcore Data Science)
欺诈的潜伏性: 如何利用大数据进行反欺诈检测 (The latency of fraud: How to use big data to detect fraud)
Zhong Wu (DataVisor)
你的用户中有多少是潜伏的欺诈者,等待发起攻击?所有线上用户社区都会存在隐藏群组、潜伏期账号欺诈的风险。根据DataVisor全球范围线上服务超过10亿用户和5千亿事件的分析数据,这个议题旨在详细阐述潜伏期欺诈账号存在的威胁性,探索欺诈者是如何应用复杂的攻击技术来逃避系统检测,以及Spark大数据安全分析的应用。
14:50-15:30 (40m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform), 顶级数据科学 (Hardcore Data Science)
GraphSQL: 崭新的游戏规则一个完整的高效图数据和分析平台 (GraphSQL is a game changer: A complete high performance graph data and analytics platform)
Mingxi Wu (TigerGraph), Yu Xu (TigerGraph)
Mingxi Wu and Yu Xu offer an overview of GraphSQL, a high-performance enterprise graph data platform for real-time graph analytics that enables businesses to transform structured, semistructured, and unstructured data and massive enterprise data silos into an intelligent interconnected data network, uncovering implicit patterns and critical insights to drive business growth.
16:20-17:00 (40m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform), 架构 (Architecture)
微软的通用异常检测平台 (The common anomaly detection platform at Microsoft)
Tony Xing (Microsoft)
Tony Xing offers an overview of Microsoft's common anomaly detection platform, an API service built internally to provide product teams the flexibility to plug in any anomaly detection algorithms to fit their own signal types.
11:15-11:55 (40m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform), 架构 (Architecture)
使用开源的Alluxio解耦计算与存储的架构 (The architecture of decoupling compute and storage with open source Alluxio)
Yupeng Fu (Alluxio)
Decoupling storage and computation is becoming increasingly popular for big data analytics platforms. Yupeng Fu shares production best practices and solutions to best utilize CPUs, memory, and different tiers of disaggregated compute and storage systems to build out a multitenant high-performance platform that addresses real-world business demands.
13:10-13:50 (40m) 企业应用 (Enterprise adoption) 数据平台 (Data Platform), 架构 (Architecture)
Hyperledger与CDH大数据生态系统的融合以及应用实践 (Hyperledger’s integration with CDH's big data ecosystem and its real-world applications)
蒋守壮 (Shouzhuang Jiang) (万达网络科技集团有限公司), 丛宏雷 (万达网络科技集团有限公司)
区块链,比特币背后的技术,是一个去中心的分布式账本技术。Hyperledger是一个开源,跨行业的区块链平台技术。它是一个由金融,银行,物联网,供应链,制造业的行业领袖协同组成的全球协作项目。我们将Hyperledger同CDH进行集成,以利用CDH的服务部署,监控,管理功能。通过这个项目,用户可以方便地在CDH托管的数据中心部署Hyperledger集群,而且便于利用CDH大数据平台分析Hyperledger的数据,提取更多的商业价值。在万达内部使用的项目包含:数字权益平台和共享商业平台。其中共享商业平台包含了金融和供应链等多个环节。我们相信这个项目对于Hyperledger开源社区将很有帮助。
14:00-14:40 (40m) 数据工程和架构 (Data engineering and architecture) 架构 (Architecture)
在领英搭建Hadoop和Kafka之间的桥梁——Hadoop团队的视角 (Building the bridge between Hadoop and Kafka at LinkedIn: A Hadoop team's perspective)
Fangshi Li (LinkedIn)
Kafka和Hadoop是LinkedIn数据基础设施online和offline部分的核心。Kafka是LinkedIn创造并且开源的,目前集群有超过一千台机器,每天收集并处理14万亿条消息。LinkedIn的Hadoop集群有超过1万台机器和50pb数据,每天处理20万个任务。在本议题中,我将会以一个Hadoop成员的角度讲解linkedin如何搭建Hadoop和Kafka的桥梁,让他们更好的一起工作。内容包括 1)讲解LinkedIn数据架构 dataset从产生到Kafka到Hadoop并且最终呈现给用户(数据分析师)的整个ETL流程 2)讲解我们的一个use case来使用Apache Flume和Kafka收集分析Hadoop集群的数据并且搭建实时分析程序 3)讲解我们最新的工作,提供统一的sql接口让用户可以同时处理Kafka数据流和hdfs的数据
14:50-15:30 (40m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform)
列式存储在Uber (Columnar storage at Uber)
Zhenxiao Luo (Uber)
As Uber continues to grow, its big data systems must also grow in scalability, reliability, and performance to help Uber make business decisions, give user recommendations, and analyze experiments across all data sources. Zhenxiao Luo shares his experience running columnar storage in production at Uber and discusses query optimization techniques in SQL engines.
16:20-17:00 (40m) 数据工程和架构 (Data engineering and architecture) 数据平台 (Data Platform), 架构 (Architecture)
为Hadoop上的大数据准备的统一的SQL (Unified SQL for big data on Hadoop)
Xuefu Zhang (Uber)
Xuefu Zhang offers an overview of U-SQL, which was developed internally by engineers at Uber and is envisioned as the future of SQL platforms. U-SQL enables automatic parsing, translation, optimization, and routing for user queries written in any supported query language and provides a unified SQL interface for SQL users who might not be familiar with the underlying SQL engines.
11:15-11:55 (40m) 赞助商赞助 (Sponsored)
Apache Kylin金融行业大数据分析的应用与实践 (Apache Kylin big data analysis: Application and practice in the financial industry)
周涛 (Kyligence)
长期以来,金融企业大多采用传统的DW/BI技术来构建数据分析平台,但传统DW/BI技术已经难以应对大数据时代带来的数据量爆发、分析需求倍增、业务急需创新等挑战。 我们将通过保险、证券等领先金融企业的实际案例,介绍Apache Kylin大数据分析平台,如何帮助这些企业突破传统技术的瓶颈,实现了海量数据、高并发、多维度下的极速分析和业务创新,释放大数据价值。
13:10-13:50 (40m) AI应用 (AI applications) 云 (Cloud), 深度学习 (Deep learning)
云深度学习平台架构与实践 (Architecture and practices of a cloud-based deep learning platform)
Dihao Chen (第四范式技术有限公司), Jianwei Cui (小米)
介绍小米内部应用的cloud machine learning平台,分析通用深度学习平台的架构设计和实现原理,还有在企业内部支持开发环境、模型训练以及模型服务的实践经验。
14:00-14:40 (40m) Spark及更多发展 (Spark & beyond) 人工智能 (Artificial intelligence), 深度学习 (Deep learning)
基于 Spark 的数据管理、探索、计算平台 (A Spark-based data management, exploration, and computing platform)
XueMin Zhang (TalkingData)
TalkingData于13年底开始引入Spark,目前数据中心所有数据处理都以迁至Spark计算平台。 随着业务的快速发展,数据源及数据量的大幅提升,数据资产管理和数据分析、挖掘工作日趋增多,慢慢的沉淀出了基于Spark、Alluxio、Jenkins等开源技术的数据管理、探索及计算平台。 演讲者主要介绍平台的背景及其技术架构演进,以及在使用过程中踩过的一些坑和后续规划。
14:50-15:30 (40m) AI应用 (AI applications) 人工智能 (Artificial intelligence), 深度学习 (Deep learning)
智能聊天机器人技术和应用 (Technologies and applications of intelligent chat robots)
李成华 (武汉泰迪智慧科技有限公司)
随着技术和市场的高歌猛进,人工智能正成为数据、服务、产品接入人类生活的重要入口。聊天机器人的演变与发展让它慢慢融入人们的日常生活,从手机上的虚拟助理到实际在线客服,聊天机器人的发展之路不算短。 传统的智能聊天机器人有一个比较大的痛点是交互体验不好,智能化程度低,而通过研究深度学习,自然语言处理,短文本处理,大数据等技术,改进智能聊天机器人的应答准确率,提高咨询效率。 这次演讲会与大家分享智能聊天机器人的核心设计思路,如何利用深度学习,自然语言处理,知识图谱,用户画像等技术进行实现,以及使用深度学习构建聊天机器人采用的主体技术框架以及面临的一些独特问题及相应的解决方案。
16:20-17:00 (40m)
Session
To be confirmed
09:00-09:05 (5m)
周六欢迎致辞 (Saturday opening welcome)
Jason (Jinquan) Dai (Intel), Doug Cutting (Cloudera), Ben Lorica (O'Reilly Media)
大会日程主席 Jason Dai、 Doug Cutting, 与 Ben Lorica致辞开始第二天主题演讲。
09:05-09:15 (10m) 英文讲话 (Presented in English)
在企业中实现数据科学(Enabling data science in the enterprise)
Amr Awadallah (Cloudera)
Amr Awadallah explains how data science and machine learning methods are evolving to bring a more comprehensive, secure, and enterprise-grade data science experience to the enterprise.
09:15-09:35 (20m)
揭秘互联网金融中的AI: 一个使命,两个循环,和六个机会 (Demystifying AI for internet finance: A tale of one mission, two cycles, and six opportunities)
Jike Chong (Tsinghua University | Acorns)
敬请期待更多细节。Details to come.
09:35-09:45 (10m) 赞助商赞助 主题演讲 (Sponsored Keynote)
释放大数据生产力 - Kyligence赞助主题演讲 (Release productivity of big data—sponsored by Kyligence)
Luke Han (Kyligence)
大数据已成企业的核心竞争力,在大数据技术及平台相对复杂,人才短缺的现状下,大数据生产力无法得以充分释放,过多的依赖于人,特别是专业培训过的工程师很难让企业可以快速构建大数据平台,快速相应业务变化。 本次主题演讲,将从一个新的角度去看待这个问题,介绍为什么将传统的DW/BI能力、理论、方法论等在大数据平台上进行使能是如此的重要,如何通过这种办法,充分发挥现有人才的能力,为企业提供释放大数据生产力的可能
09:45-10:05 (20m)
用于深度学习的异步计算(Heterogeneous computing for deep learning)
Ming Yang (Horizon Robotics)
Ming Yang offers a brief introduction to deep neural network computation as well as an overview and comparison of the competing heterogeneous computing options, such as DSP, GPU, TPU, FPGA, and ASIC.
10:05-10:20 (15m) 英文讲话 (Presented in English)
现实世界里的深度学习 (Deep learning in the real world)
Lukas Biewald (Weights & Biases)
As companies take machine learning out of R&D and into production, they face a whole new set of challenges. Lukas Biewald explains why human in the loop, active learning, and transfer learning are all essential design patterns for making deep learning real.
10:20-10:40 (20m)
DuFace:大规模人脸识别 (DuFace: Large-scale face recognition)
Yuanqing Lin (Baidu)
Yuanqing Lin explores Baidu’s progress in face recognition based on big data.
10:40-10:45 (5m)
结束致辞 (Closing remarks)
结束致辞 (Closing remarks)
10:45-11:15 (30m)
上午茶歇 (Morning Break)
15:30-16:20 (50m)
下午茶歇 (Afternoon Break)
11:55-13:10 (1h 15m)
周六午餐行业桌会及午餐,由Kyligence赞助 (Saturday Industry Tables and lunch—sponsored by Kyligence)
行业桌会是相似行业或对同一主题感兴趣的人们轻松交流的最佳方式。
08:15-08:45 (30m)
快速社交 (Speed Networking)
周五和周六主题演讲之前的快速社交活动。大家会见到与会同行并享受随意的交流。
08:45-09:00 (15m)
Plenary: Filling in grey space
To be confirmed

联系OReillyData

关注OReillyData微信号获取最新会议信息并浏览前沿数据文章。

WeChat QRcode

 

Stay Connected Image 1
Stay Connected Image 3
Stay Connected Image 2

阅读关于大数据的最新理念。

ORB Data Site