[关闭]
@sambodhi 2018-03-06T03:22:38.000000Z 字数 2149 阅读 900

如何成为一名厉害的数据科学家!

作者|Pascal Potvin
译者|Liu Zhiyong
编辑|Vincent Chen/Emily Chen

AI前线导读:眼下Data Scientist,数据科学家,实在太火了,已经成为新一代改变世界的职业,引得每一个人都想往这个方向转。学CS的觉得做码农太底层,给人打工,要转数据科学家,完美。学统计的觉得这个不需要过多的Coding,适合自己,要转数据科学家,完美。学商科的觉得终于自己也可以成为科学家了,要转数据科学家,完美。似乎每个人都觉得自己可以成为,应该成为,也一定能够成为一名数据科学家。然而现实呢?现在,我们就来分享一篇Pascal Potvin撰写的“How to be a bad data scientist!”,给大家上上课。Pascal Potvin是Ericsson公司的一名数据科学家,他给我们分享了如何成为一名厉害的数据科学家的经验,以及要避开那些坑,给那些有志于从事数据科学家的新人们提了醒,AI前线编译此文,以飨读者。
更多干货内容请关注微信公众号“AI 前线”,(ID:ai-front)

你想成为一名数据科学家,或者你根本认为你就是一名数据科学家,并且做好了初次应聘的准备,那么,你要确保你没有下面所列出的“想成为数据科学家”的刻板印象之一。不然,你可能会在面试中屡屡碰壁。本文只是罗列了我所见过的几类人留下的刻板印象,并不全面。然而很不幸的是,这些刻板印象,一次又一次地在面试中复蹈前辙。

我想成为一名数据科学家,因为很能挣大钱!

这类人听说搞数据科学能挣大钱,并希望能够分一杯羹,有这种想法的人,多数都不知道干这行需要在知识和技能上要付出多大的努力,而且他们也不知道数据科学是一项持续不断的长期研究工作,几乎不会有什么明晰的解决方案。特别是每天层出不穷的新技术和新想法,以及你不得不提出有关深度学习的新想法,情况更是如此。如果你要在社交媒体上发帖询问“我该从哪里开始?”之类的问题的话,那么你就不具备成为数据科学家的条件了,好好端正态度,有了创新意识再说吧!

我可以干数据科学,但请给我“干净”的数据。

如果你刚学完一门或者几门数据科学的相关课程,并参加过几次类似Kaggle的竞赛,你可能会觉得数据都是已经清理过的(或者大部分已经准备好),并且有几条语句或命令,这些都会为机器学习做很好的准备。但问题在于,这些课程和竞赛为你准备好数据,是为了让你更快找到问题的核心,并了解机器学习的主题。而在现实生活中就不是这样了,数据是杂乱无章的。数据难以驾驭,你必须自己准备数据。你可能需要自己收集数据。大多数数据科学家的工作中,很大一部分就是处理数据、准备数据、清理数据等等。如果你没有这样做的话,请找出你自己的问题,然后解决之,再说当数据科学家的事儿。

AI前线:Kaggle是由联合创始人、首席执行官Anthony Goldbloom 2010年在Melbourne创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的关注,这些用户资源或许正是吸引Google的主要因素。

我不懂数学,也不擅长数学,但人们却告诉我可以做数据科学。

不是这样的,这根本就是个谬论。如果你没有数学头脑的话,将来总有一天你会陷入无法更上一层楼的境地。好处是你可以学习数学。但首先你要打掉这种“数学太难了!”的念头。你要知道,数据科学可比这难多了。所以,你最好从学习数学这样简单的事开始。去学习微积分、统计学什么的,掌握数学语言和思维后再说数据科学的事儿。

只需给我一个定义“明确”的问题。

有些人,只是想要他们的小盒子里面有定义好的接口,输入什么样的数据,期望输出什么样的数据。我再强调一遍,这是患有综合征的人在作战中精心准备了罐头而已。事实上,不仅数据是混乱的,而且你要解决的问题也是混乱的、不确定的、模糊的……这点你可要搞清楚。有时你可以自己定义、完善问题,但有时你不得不接受这个混乱的状况并随时随地设法去解决。如果你不能通过思考、研究以及与利益相关者讨论来确定模糊、近似的目标,并提出解决方案来完善它们,你就不要想着成为一名数据科学家。这里有个很大的误解是,这并不是说如果你有博士学位就不会遇到这种问题的,根本不是这样的,我看到博士也一样深受困扰。因此,你要坚强,挺起脊梁,做好接受挑战的准备再说吧!

我学过数据科学,有博客/作品集……我觉得我可以胜任这一行。

可没那么快。这类人学习了数据科学,更加注重市场营销,知道它可以帮助建立个人品牌,构建他的投资组合,或者撰写博客、文章等,但就是从来没有在现实生活中实践过。那人自认为什么都懂,能够解决任何问题。这种人很可能对数据科学和机器学习所能达到的目标进行了过度的炒作,而这点对于该行业来说是有损无益的。要学会脚踏实地,诚实做人,再考虑当数据科学家的事儿吧!

如果你想成为一名数据科学家,最简单的就是:努力学习,努力工作。你必须充满激情地走自己的路。寻找你感兴趣的知识并学习、进行尝试。要不断学习新事物,而不是仅仅学习几门课程就完了。不要把自己限制在课程中,去找一些现实世界的例子来练习,要诚实面对你所能做的,孔子不是说过么:“知之为知之,不知为不知,是知也。”要做一个好学生!

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注