[关闭]
@dragonfive 2016-07-03T08:45:57.000000Z 字数 7799 阅读 1196

计算机视觉从入门到放弃

自我成长


目录

1.前言

这篇报告总结了关于个人计算机视觉发展的可能性。里面包含一些个人的想法,可能由于个人情感、视野局限和信息不足等而有失偏驳。但这些都是本人最真实的想法。

2.总结研究生第一年

科研方面困难重重(一个人做一个比较落后的方向),项目方面一塌糊涂(一个人写着莫名其妙的没有代码规范的项目)。

科研方面研究内容都被深度学习攻占了,但是实验室没有相关的平台和经验,所以用的是传统的方法,同时应用面其实不广,与互联网行业也没什么联系。所以只适合用来做研究生课题,不适合作为职业发展方向。
项目方面,做的不是做界面拖拽的工作就是一些莫名其妙的东西。并且毫无代码规范可言。

3.五个方向的对比

  1. 像腿哥一样,去知道优化的真相,了解一些真正有价值的东西,而不是花哨的技术性的东西。
  2. 像肖岩一样,去深入技术,去知道他是怎么做的,怎么发挥它的价值,怎么更好的解决一个问题
    我们肯定是选择做后者了,因为我个人是很不擅长去做一些抽象的东西。所以我们要去做工程,而且我们要做的不是那些随随便便就能做到的像个大作业似的东西。我要去别人有所区分。要做一点有附加值在里面。比如设计模式、大数据平台、视频浓缩里面的算法。

我选择的是走一条有附加值的工程路线,这个附加值不是我厉害的地方,只是我锦上添花的地方。

  1. 我不喜欢做研究,我喜欢解决实际的问题。我的本科怎么过的
  2. 我研一的时候所谓的研究就是调调别人的成果,我也没有认识到什么
  3. 实验室氛围也不适合
  4. 做研究做研究生来说也不是个好的选择

以下三项评分都是从1到5排序,某项序号越小,说明对这项越有利。

3.1.五个方向的对比

方向 实验室的投入产出 个人就业前景 个人意愿评分 对个人成长作用评分 对实验室影响评分 均权评分
传统CV方向硕士海上目标识别 与实验室项目契合,对实验室发展有利,实验室投入少。产出以实际项目和可能的水论文为主 对将来就业而言,海上背景的公司很少,传统方法在效果上也不如深度学习。项目方面可能需要做其他零碎的东西 5 5 1 11
进一步做深度学习研究——>就业 需要实验室投入一定的GPU平台建设和基础知识补充,但由于硕士时间有限,产出会以效果比较好的项目为主;论文可能受限于机器性能和经验薄弱,不会好;这一阶段积累的经验可以传递下去 这个方方向涉及的实用技术比较多,会锻炼GPU加速等有价值的技术,了解一些商业公司里面实用的深度学习工具和技术 3 4 2 9
进一步做深度学习研究——>智能实验室 自动化所 或清北博士 需要实验室投入一定的GPU平台建设和基础知识补充,产出会以论文为主;这一阶段积累的经验可以传递下去,不过培养的研究生结果去别的实验室读博,多少有点损失 这个方方向涉及的实用技术比较多,会锻炼GPU加速等有价值的技术,同时为了申请好的博士,需要发表好的论文,博士毕业从事研究工作大部分可以解决户口等 4 2 4 10
退一步做机器学习 基本上不需要实验室投入,并且可以偶尔参与实验室一些杂乱的项目,产出以项目为主。同时面临学生不做实事的风险 机器学习已有相应的基础,工业界应用方面比较广,而且适合自学。可以争取外出实习积累真实经验。当然作为实验室补偿,可上交一部分实习工资并取消RA 1 1 5 7
结合大数据平台做机器学习 基本上不需要实验室做额外投资,而能参与实验室的现有项目,论文方面可能欠缺 可以利用实验室已有经验,同时拜托长久的自学自助的尴尬处境,在机器学习下有大数据处理的背景,对找工作很有利 2 3 3 8

3.2.评分考察

一般情况下在考虑方向的时候实验室影响占的比重与其他两项不一样,因此这里我们用两个参数:分别表示实验室评分占的比重和其他两项的比重,从意义上我们把叫作牺牲参数,把叫作自由参数。越大,个人为实验室牺牲越多,自由越少。
我们设实验室影响评分为,个人方面我们假设两项评分和为
在确定一个比重分配的时候,就可以得到最终的各个方向的评分
根据评分排序我们也就能找到合适的选项了。

方向 个人意愿评分 对个人成长作用评分 对实验室影响评分 加权评分
1 传统CV方向硕士海上目标识别 5 5 1
2 进一步做深度学习研究——>就业 3 4 2
3 进一步做深度学习研究——>智能实验室 自动化所 或北清博士 4 2 4
4 退一步做机器学习 1 1 5
5 结合大数据平台做机器学习 2 3 3

作图得到:
untitled.jpg

由图可见在牺牲参数增长过程中,最优选择依次为:
机器学习自学()、
机器学习大数据()、
深度学习硕士()、
传统CV方向()。

4.关于个人在发展的可能性

4.1.实验室CV的发展

目前实验室计算机视觉发展还停留在理论层面,理论层面也仅限于基础的方面,项目积累其实不多。而视觉这个方面范畴还是很大的。未来可能还是从理论上先由几代学生在不同小方向做点积累。如果在某个方向上积累得好,就慢慢加大投入,争取产出一些水论文,建设该方向相关基础平台。这一阶段有论文输出和基础平台支撑,便有了做些普通项目的资质。做得不行的炮灰们就帮忙做点工程,可以毕业了。做得好的可以输出一些论文。而当第一阶段的方向积累到一定程度,这个方向就形成了实验室的特色方向。这时候就有了申请大型项目的资质,同时加大投入,接下来就慢慢进入到稳定发展阶段。

4.2.未来想象——能做什么

4.2.1.为实验室项目提供理论支撑——海上目标检测识别

这是实验室最希望学生做的方向。这里调研传统的计算机视觉的方法,论文的突破点在目标的特殊性上。可以辅助做海上的相关项目。但这个方向学生的主要任务是算法的实现和边角的打杂,更多时间花在项目而不是算法上,为了一个项目可能付出太多,学到的东西对将来的用处几乎没有。
原因有两点:
1. 目前有海上目标检测识别需求的公司较少,而做这些任务需要很多的背景信息,学生积累这些背景信息对于未来的工作没什么用。
2. 传统的方法在研究层面的效果上已经被深度学习取代,唯一存在的价值是基于成本的考虑。这对学生来说本身就是一种不符责任,少的投入却让学生做一个对将来基本没用的东西,这与空手套白狼没什么区别

4.2.2.跟进领域研究热点——深度学习

这是目前需要公司研究院和计算机视觉研究的前沿,需要公司都提出了自己的深度学习算法库。用深度学习做图像识别等工作的效果要比传统方法好得多。而目前工业界的很多大公司也都在这个方向跟进。
存在的问题:大部分都需要用到GPU加速,对电脑配置要求高。而且效果跟电脑配置直接相关,所以在效果方面做到最好很难。另外平台的基础建设也需要很多投入,而产出可能比较少。

4.2.3.自学机器学习的有工业应用的方向——自我救赎

这个方向不需要实验室有什么投入,当然产出就更少了,增加毕业难度。但将来就业很大可能会继续这个方向,有很大的延续性和积累。
具体项目可以结合大数据平台的方向做数据挖掘,也可以结合自主实习选择合适的方向,后者比较极端,也是无奈之举。

要想就业好就多做图像、视频处理以及人脸、手势识别这样的应用方向,而研究方向主要还是要看个人兴趣。对于科研来说,坚持任何一个领域深入做下去都是不错的。对于期望到工业界工作同学,推荐方向是有应用场景和前景的领域,比如自然语言处理、图像与视频检索、自然场景文字识别、人脸识别、手势识别(在自动化所没有专门的组搞这个方向,属于工程项目性质的研究)、推荐系统、机器学习、多媒体分析等。当然时代在变化,无比火热的自然语言处理风头逐渐被兴起的图像视频领域盖过,所以谁也不能确定现在所追求的热点在将来也是热点,不过机器学习确实在改造着信息科学技术的各个领域。

对于实验室导师对个人的影响知乎有相关讨论:
导师实验室对学生影响有多大? - 知乎
https://www.zhihu.com/question/36404881

有一天跟一个老师聊天,他说,如果一个学生很努力,但是不出成果,多半是老板不行。因为即使是phd,科研训练不够,还没有很开阔的视野

以自己和身边人的经历和经验而言,读研或者读博导师是十分重要的一环,你论文的多少 论文的级别 很大程度上取决于你导师的眼界、人脉以及给你定的研究方向。但记住一点导师的人品性格有时候比能力和声誉更重要(有时候声誉并不等于能力,国内很多奖项和荣誉的评选 人脉关系太重要了)。另外据我所知目前自动化所大导师直接指导学生的已经不是特别多了,要看小导师和组里的整体氛围和水平。
至于顶级研究,你慢慢得会发现有时候顶会并不一定等于顶级研究的说。
另外自动化所做图像和计算机视觉的大组每年应该都会有几篇cvpr的,十几篇PAMI的
利益相关 计算机视觉领域硕士(曾经的硕博) 题主问题中的中科院自动化所毕业
作者:steve tim
链接:https://www.zhihu.com/question/36404881/answer/67465737
来源:知乎

但实验室没那么牛的时候

遇到了好导师,那么恭喜你;遇到了别的,还是靠自己吧
本人老板属于后者,入学后2个月就发现了,于是我果断自己选择了方向,跟学校的另一位学术好的老师学习东西并讨论。我现在博二,今年三月进入某研究院实习,研究院老师是大牛,我做CV方向,现在正准备投稿CVPR。我不奢求老板给我学术指导,只希望他给我适当的自由。
我想说的是,如果感觉老板水,那么一定要利用好周围的资源,靠自己,尽量减少他的影响。
以上。
作者:匿名用户
链接:https://www.zhihu.com/question/36404881/answer/67519275
来源:知乎

4.3.对比就业好的实验室和不好的实验室

中科院范围内计算机方向每年就业最好的实验室有两个:一个是计算所的网络数据实验室、一个是软件所的软件工程中心。那么这两个实验室的学生在做什么就很有借鉴意义了。
作者虽然总结了很多方面资料,但仍然不免会附带个人感情色彩在里面

网络数据,除了信息检索、数据挖掘、网络舆情分析以外,还做各种应用开发项目,有些务虚,听起来很高大上,但是实际没那么有用,不少项目都以失败而告终,实际上也是目前大数据舆论热潮的结果,不过这样学生的成果比较多,简历比较好看。网络数据实验室在学术方面很能灌水,同时工程项目比较多,可以说是实验室里有中科院全院信息检索领域最大最强的团队,因此保研时生源很火,就业前景很棒,但是特别提醒,该实验室不是专门做信息检索方向的,做的东西有点杂,可以说是跟着项目走,而且硕士生做信息检索方向的机会比较小。

软件中心相对比较客观

软件工程技术研究开发中心的主要研究方向是大数据、云计算、分布式缓存、虚拟化(Docker)、移动与普适计算、车联网等。这个实验室是以导师组的方式进行培养,而且由于实验室主要是在做工程项目,导师组可以认为是完全意义上的项目组。软件工程技术研究开发中心整体偏向工程,同时因为研发方向很符合工业界需求,所以就业普遍很不错,从近10年的数据来看,就业在中科院甚至全国都是数一数二的,所以从实验室走出去很多牛人,大部分顶级公司都有实验室的学长学姐可以为大家内推。

那么我们再来看看中科院内两个理论做的比较好的实验室:计算所的智能信息和自动化所的模式识别实验室

视觉方面的研究方向

视觉信息处理与学习研究组:下设人脸识别研究组、多媒体分析与检索研究组、视觉建模与分析研究组、视觉
神经编码研究组、手势识别研究组

偏科研做科研需要时间长,编程训练不足。但即便如此也比我现在的处境强。

VIPL组的论文要求很高,国际学术交流很多,缺点是预期毕业时间偏长,因此读博要做好长期战的准备,总体是论文很强的一个组,另外博士生毕业去向以出国做博后为主,因为研究组工程性总体上还是很弱,最终的去向也都是去国内普通高校,鲜有工业界牛人,而对于硕士生来说,编程训练有些不足。
VIPL组并不像自动化所李子青团队和谭铁牛团队把自己的研究成果转化为上亿估值并能产生实际价值的公司,因为研究组不追求工程化应用研发,也不希望把研究生变成企业研发工程师,但研究组与企业的合作非常多,包括银晨科技、华为、百度、三星、欧姆龙等,学生主要为这些企业合作项目设计算法,具体实现是由企业研发力量完成的。通过这些企业合作,研究组的人脸识别技术被成功转化并广泛应用,包括上海世博会、百度寻人、多个国家和省部级身份证明查重系统(全球最大规模)等,华为也在手机等终端上采用了研究组的相关技术,手势识别组基于Kinect的手语识别系统,曾两次作为微软亚洲研究院代表性合作研究成果,赴微软总部进行全面展示。在学术研究方面,研究组在顶级论文(特别是会议论文如CVPR、ICCV)发表方面,虽然总量没有自动化所模式识别国家重点实验室多,但相比模式识别国家重点实验室的的大体量,VIPL组并不逊色,另外组内王瑞平副研究员获得过CVPR2008的Best Student Poster Award Runner-up奖(自动化所未获得过此级别奖励,另外清华艾海舟老师组比VIPL强,获得过CVPR的Best Student Paper Award)。蒋树强研究员负责的多媒体分析与检索研究组是研究方向比较独立的团队,实力同样不错,老师人品也不错。

关于自动化所的学生就业就更有说服性了

自动化所的硕士就业总体上比不上其他几个计算机类研究所,因为自动化所的研究方向肯定不是纯计算机,有很强的交叉学科性质,所以硕士毕业进入工业界没有特别的优势,整体不如做工程的研究所硕士出路好。自动化所整体上是一个偏学术的研究所,所涉及的科研领域大多都不是三年硕士能够搞定的,三年的时间过去了,可能都还没有在领域内达到入门水平,所以自动化所大部分学生都会选择硕博连读,在模式识别国家重点实验室中,读博比例会更高;博士如果搞得方向不是过于冷僻,就业会非常好,因为可以达到的高度是其他同类高校或科研机构的博士生不容易达到的,这是因为自动化所比其他计算机类研究所更重视科研,特别是在当今机器学习、模式识别、智能、大数据等概念被火热炒作的时代。自动化所有很多人在搞交叉学科,这也是自动化所的一个特色,好处是适合科研,坏处是不适合计算机专业的学生去就业,因为会跟各种学科去杂交。总之,要想好好做科研就要坚持下去.
博士就业与其他几个计算机类研究所的博士就业偏好相同,自动化所的博士更倾向于科研,如留所工作,或公费出国做一两年博士后,然后被引进回所,或去高校任教,其次是国有银行、航天、军工、部委下属研究部门等,最后是互联网企业或其他IT企业。造成这种现象的原因是北京户口越来越难解决,互联网公司的北京户口指标很少,而国企事业单位的户口指标要多很多,另外博士通常倾向于更稳定的生活。
在自动化所读研还是要做好心理准备,特别是去模识国重。即使现在机器学习、模式识别还有所谓的大数据很火,还是要想清楚自己是不是喜欢,自己到底合不合适搞这类方向。这个方向不只需要天赋、数学能力、编程能力,还需要超出常人的努力。这里可以举个例子,模识许多大boss晚上10点,办公室的灯都是亮的,刘成林老师是模式识别国家重点实验室主任,依然早上7点开始工作,晚上11点下班。因此,想来混文聘的同学先要考虑好自己有多少青春可以用来延期。

5.关于未来计算机视觉方向就业的可能性

也许老师们对学生将来的就业并不关心,但这却是学生最关心的。大家都想在当前阶段积累的东西在以后工作中能更多地用到。但同时也要考虑到毕业的难度,就需要做优化选择了。

5.1.纯的研究工作

纯的算法工程师职位。一般要求博士或者有顶级论文。详细信息可见参考资料。
以自动化所模式识别重点实验室为例,这个实验室偏向做研究。其硕士毕业生去向就没有计算所的普通实验室好,而博士去向却不错。计算机的只能信息实验室情况也类似。事实情况是本实验室的科研环境、基础平台和研究积累远不如这些实验室,而我又没有过人之处,所以不可能比别人做得更好。

所以这种工作对我来说不太适合
1. 因为我不是博士, 时间有限,研究能力不够,得到offer可能性低
2. 我本科一直在写程序 ,做的是实事 做纯的算法会让我感觉很不踏实,很浮夸

5.2.应用方向的工作

要求对一些库了解的多一些,比如深度学习的库,GPU加速的库等。这些都需要项目基础和平台投入的。
1. 首先我们没有项目需要,写个应用还要我自己编一个。在这样就因为个人能力有限在性能等方面打折扣,关于原理层面也理解不清楚;需要做的方面比较多,心理分散。 需要做算法实现,大多是也只是调用别人的库。而cv的产品需要包装算法,需要数据,需要界面。做一个cv项目,很大程度上实在做非cv的成分,而这些在公司面试算法实现的时候没什么吸引力。很可能面试算法时压倒我的最后一根稻草是数据预处理啊什么的,这些在目前任务都根本用不到的地方。
2. 我们没有平台。现在工业界用的多的是GPU加速技术如CUDA,深度学习需要大量好的显卡的投入。这些我们都没有。即便后面购入,首先把这些平台用起来我们需要大量的经验积累,现在基本上是从零学起。另外我们也没有项目支撑这些,买入的可能性也不大。

5.3.做一个普通软件开发

而我也实在不想读了三年研究生找了一个本科生就能做的传统开发岗位,因为这意味着我这三年的失败,但是从研一看三年,我也是在没闲着。研一跑来跑去累成狗做着乱七八糟莫名其妙的东西,找工作最后还是依靠的却是我本科学的东西,我觉得这对我来说研究生这三年价值很低,而这还不如我自己早点工作来得自在。

而所有的这一切只是因为没有机会。没有机会获得深度学习的平台和计算机视觉的科研环境,所以做不了纯算法工程师;没有机会接触cv的产品算法开发,做不了算法实现工程师;没有机会接触大数据等互联网方面的工作。而我所能做的,去看论文,做一些杂事多于算法的工作。如果这样能发出好的论文,或者找到好的工作,那不是空手套白狼?

6.参考资料

计算机视觉在国内已经研究几十年了,但把计算机视觉成功带入应用的大公司几乎没有。相比欧美的计算机视觉,中国计算机视觉的前途在哪?机器视觉工程师又何去何从?
计算机视觉的本博连读生,想退学工作或者重新考计算机的研究生

计算机视觉与机器学习工作
如何配一台深度学习工作站,主要用于CNN图像分类,预算2W以下

中科院计算所实验室情况简要介绍 - 中国科学院
中科院自动化所实验室情况介绍 - 中国科学院
中科院软件所各实验室情况简要介绍 - 中国科学院

中国科学院自然语言处理(NLP)方向大盘点 - 中国科学院

导师实验室对学生影响有多大? - 知乎

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注