[关闭]
@nataliecai1988 2017-09-13T13:29:28.000000Z 字数 1076 阅读 635

2017上海QCon采访 王绍翾(大沙) 采访提纲

采访


采访目的:为QCon大会预热和了解更多关于阿里Blink的信息,给人工智能领域和大数据领域的技术人提供关于Blink的全面解读。

采访主题:这次的采访主题主要围绕Blink展开。

采访大纲
面向读者:AI领域开发者、大数据领域开发者、对Blink和Porsche感兴趣的人

回答问题:
1、为什么实时流式计算对机器学习平台如此重要?
2、Blink和Blink SQL的特性和亮点
3、Blink研发经验分享
4、Blink未来规划

问题

  1. 为什么说如今企业对实时流计算的需求已经从 nice to have 变成must to have?

  2. 看到您今年参加了第三届Flink Forward大会,能否跟我们分享一下会上对流计算的展望?随着人工智能技术的发展,对实时流式计算的需求会发生哪些变化?

  3. 未来批处理计算和实时流式计算在企业构建AI平台的基础架构中将分别起到什么作用(可以结合Blink和Porsche来谈)?实时流式计算对机器学习平台的重要性体现在哪里?如何将实时流式计算与机器学习、深度学习相结合,从数据中挖掘更有意义的价值?

  4. 相比Spark Stream、Kafka Stream、Storm等,为什么阿里会选择Flink作为新一代流式计算引擎?前期经过了哪些调研和对比?Blink与第一代自研流计算引擎iStream相比主要在哪些方面有所提升?

  5. Blink基于Flink进行了哪些优化和升级?优化过程中遇到过哪些难点?又是如何解决的?

  6. 流数据的SQL查询存在什么难点?Blink SQL/Table API是一套基于Blink引擎打造的可以同时支持流处理和批处理的统一的 API,那么它是否已经可以很好地解决流式数据的SQL查询问题?是怎么做到的?

  7. 对于两周前Confluent推出的用于Apache Kafka的流数据SQL引擎KSQL,您怎么看?KSQL实现流数据SQL的方式与Blink SQL有何不同?

  8. 阿里内部哪些业务和产品用到了Blink?在应用推广的过程中有遇到过什么问题吗?

  9. 您这次担任出品人的专题中也为大家带了阿里新一代实时机器学习平台Porsche,而Porsche的实时计算部分主要就是基于Blink,请介绍一下Porsche是如何基于Blink实现“在线机器学习”的?基于Blink为机器学习带来了哪些好处?实现中的难点又是什么?

  10. Blink目前还有哪些需要优化和改善的地方?未来有什么改进计划?

  11. 未来阿里在机器学习平台、深度学习平台和人工智能生态建设上还有哪些规划?是否会考虑向外界输出实时计算能力或推出开放的机器学习或深度学习平台?

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注