[关闭]
@Lucien 2018-04-07T23:54:10.000000Z 字数 685 阅读 741

Kubeflow 在云原生 AI 平台中的最佳实践

彭靖田:才云科技 技术总监

才云科技技术总监,Kubeflow Core Maintainer,Google 机器学习开发专家(ML GDE)。

负责才云 AI 云平台 Clever,并带领团队和 Google 一起维护 Kubeflow 开源社区。加入才云前,曾任职于华为2012实验室 AI 部分,参与了华为深度学习平台的设计与实现。

TensorFlow 早期贡献者,一度成为社区 Top 40 Contributor。《深入理解 TensorFlow:架构设计与实现原理》第一作者。

加州大学圣迭戈分校(UCSD)访问学者,本科毕业于浙江大学竺可桢学院求是科学班。

工作年限:3年

演讲题目:Kubeflow 在云原生 AI 平台中的最佳实践

演讲摘要:随着 AI 技术的普及与应用,国内外各大厂商都在如火如荼地搭建 AI 平台。面对庞大的硬件资源,如何管理 GPU 集群和提升资源利用率成为了我们关注的首要问题。虽然 Kubernetes 是云原生时代资源管理系统的事实标准,但是原生的 Kubernetes 对 AI workload 的支持并不完美。 因此,才云与 Google 一起设计和推动了 Kubeflow 项目,旨在为云原生 AI 平台提供一套成熟的技术方案,并有效提升 GPU 集群资源利用率。

演讲提纲:

听众受益点:

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注