@codejan
2019-12-26T15:58:15.000000Z
字数 3061
阅读 701
周志华 机器学习 PDF
简称"西瓜书", 出版于2016年, 内容全面, 讲解生动, 作者功力深厚, 是必读机器学习教材, 非常适合理工科高年级本科或研究生入门. 书前2章是对机器学习的概念介绍, 之后每一章以综述的形式介绍一个方向的内容, 不仅有线性模型, 决策树, 朴素贝叶斯, 聚类等经典的机器学习算法, 也包含了神经网络, 半监督学习, 概率图模型, 强化学习等前沿研究方向.
本书整体偏理论机器学习, 频率派和贝叶斯派都有涉及, 书中应用案例极少, 部分章节对工程应用帮助较小.
Deep Learning(Ian Goodfellow, Yoshua Bengio,Aaron Courville) 英文PDF 中文PDF
简称"花书", 或"圣经", 出版于2016年, 质量极高, 是深度学习入门必读教材. 作者都是深度学习的奠基人, 其中前两个已经获得图灵奖. 本书与西瓜书风格类似, 每一章都是按照一个方向的综述, 有助于对深度学习形成全面的了解, 同时也提供了大量参考文献, 用于该方向的进一步探究. 本书还提供了大量训练神经网络的实践经验和应用案例. 中文PDF由北大张志华老师团队翻译, 质量颇高.
Pattern Recognition and Machine Learning(模式识别与机器学习) PDF
简称"PRML", 出版于2006年, 机器学习领域公认的英文经典教材. 相比西瓜书视角更深刻, 讲解更加细致, 有助于加深理解, 但同时阅读难度也更大, 需要一定的数学和统计学背景.
Peter Harrington, Machine learning in Action(机器学习实战)
侧重实际应用的机器学习教材, 公式推导简明易懂, 每个章节都有具体案例和代码助于理解, 无论基础再差都可以用于无痛入门机器学习. 但本书理论部分浮于表面, 深度对于科研来说远远不够, 容易给读者已经熟练掌握的假象.
李航 统计学习方法
最早的中文机器学习教材, 偏向频率派的视角, 主要讲解了10个常用的机器学习模型(感K朴决逻, 支提E隐条), 侧重数学推导, 公式较多, 举例应用较少, 讲解较枯燥, 适合数学基础较好的读者.
Machine Learning A Probabilistic Perspective
简称"MSAPP", 以贝叶斯派视角为主, 书中内容极其丰富, 同时也极厚, 通常难以读完, 但可以作为参考用. 被称为机器学习的"百科全书".
Elements of Statistical Learning
简称"ESL", 以频率派视角为主, 同样是内容丰富也非常厚的一本书, 可以作为参考用.
林轩田 机器学习基石 网址 机器学习技法 网址
台湾大学林轩田老师的MOOC课程, 分为基石和技法两个部分, 基石部分以线性模型为例, 主要讲解机器学习中的优化迭代, 正则化等理论; 技法部分主要讲解SVM, 决策树, 神经网络等模型. 课程制作精良, 讲解生动, 通俗易懂, 深入浅出, 把理论和应用结合的很好, 是最推荐的中文课程. 课程配套书籍Learning from data从实际数据处理的视角讲解机器学习, 也非常值得一读.
李宏毅 机器学习 网址 机器学习前沿 网址
李宏毅同样是台湾大学的教授. 虽然课程标题为机器学习, 但实际内容主要以深度学习的BP神经网络为主. 课程内容丰富, 讲解娓娓道来, 举例非常有趣, 有助于对神经网络模型的形象理解. 前沿课程紧扣研究深度学习前沿, 系统讲解了现在的一些研究热点和神经网络的不足. 他的课程几乎每年都会更新, 不容易过时, 值得一看.
吴恩达 机器学习(Coursera 网址 / Stanford版CS229 网址 / 深度学习CS230 网址)
最著名的机器学习课程, 分为2个版本. Coursera版本主要面向已经工作者, 讲解简洁易懂, 视频制作精良, 实际案例丰富, 但不够深入, 缺乏数学推导. Stanford版包含完整的数学推导, 更加适合研究生学习, 但视频为2008年拍摄, 年代感强. 吴恩达于2018年于Stanford推出了深度学习课程(CS230), 值得一看.
李飞飞 计算机视觉(CS231-Convolutional Neural Networks for Visual Recognition) 网址
Stanford大学李飞飞教授开设的计算机视觉课程(然而基本都是她的学生再讲), 是最受欢迎的计算机视觉课程. 课程配套作业也非常有利于计算机视觉方向的入门.
Pytorch Official Toturial
Pytorch是学术界最受欢迎的深度学习框架, 具有容易上手, 功能强大等特点. Pytorch官方教程质量很高, 其中计算机视觉的部分从最基础的图片分类, 到进阶的目标检测, 迁移学习, 对抗生成均有具体的代码和注释讲解用来学习, 也有相关的数据集可供下载.
MINST, Cifar10, Cifar100, ImageNet, MS COCO, Pascal VOC
经典的计算机视觉数据集, 难度依次递增
KITTI
最经典的自动驾驶数据集, 标注准确, 容易上手. 包括深度估计, 视觉里程计, 目标检测, 三维检测, 道路跟踪等多个计算机视觉研究方向, 排行榜上大部分模型都有论文或者开源可供学习. KITTI主要的问题是数据量较小, 有些挑战只涉及到十几个场景, 不能完全覆盖自动驾驶中的各种情况.
Apollo, Nuscenes, Cityscapes, Mapillary Vistas, Berkeley Deep Drive
均为基于车载相机数据的自动驾驶数据集(部分包含其他数据), 主要用于检测, 分割等计算机视觉任务.
先通过课程和教材的学习, 对机器学习/深度学习/计算机视觉有一个全面的认识.
学会检索, 寻找自己感兴趣的论文阅读
实践出真知, 边做边学, 编写代码可以对算法和模型有更深入的理解
勤于思考, 拒绝盲目调参