[关闭]
@Helene 2017-10-26T03:29:40.000000Z 字数 448 阅读 374

受访人: 吴惠君博士,现任Twitter工程师,致力于实时流处理引擎Heron的研究和开发,Apache Heron committer。
演讲主题:实时流系统Heron的异常检测和恢复
采访提纲:
当今时代,数据不再昂贵,但从海量数据中获取价值变得昂贵,而要及时获取价值则更加昂贵,这正是大数据实时计算越来越流行的原因。

  1. 你认为当下大数据实时计算方面面临哪些挑战?流计算在其中充当的角色?

  2. Twitter在实时数据处理的用例有哪些?

  3. 去年Twitter开源大数据实时分析系统Heron,今年在此基础上增加了哪些特性?

  4. 数据分析的前提是真实可靠的数据来源,在Twitter实时流数据的数据源有哪些?

  5. 对于现有实时数据的数据量大,属性不确定性强的特点,Twitter是如何实现高效准确的实时数据异常检测?

  6. 流式数据的实时分析,一定是有规则、模型的东西。Twitter在数据标准化和流处理模型的规范化上是如何调整的?

  7. 流式处理是一种成本和效费比都高的计算模式。企业要如何权衡成本与人员支出的?

  8. 对流处理引擎选型上有什么好的建议?

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注