@sambodhi 2018-09-04T22:40:30.000000Z 字数 3621 阅读 2254

对短期机器学习研究项目的建议

作者|Tim Rocktäschel
译者|Sambodhi
编辑|Vincent

AI前线导读： 美国的暑期实习短期项目能够为大学生及研究生开阔视野，增长知识，很多学习人工智能大学生都会利用这个机会去进行短期机器学习研究项目，为自己积累经验。那么，对这种短期机器学习项目而言，有什么好的建议吗？

每年都会有学生与我们联系，寻求从事短期机器学习研究项目的机会。到目前为止，我们已经监督了很多这样的短期研究项目，我们注意到，我们给出的一些建议遵循了一些重复的原则。在本文中，我们分享一些自认为对硕士论文项目或机器学习暑期研究实习的好建议。本文所提到的这些建议，肯定不会是全面的，而是强调了我们反复多次目睹的那些陷阱。例如，我们不会讨论如何选择一个好的项目，也不会讨论如何进行机器学习研究项目。我们给出的一些建议，通常是用于机器学习，特别是深度学习、强化学习的研究项目。然而，其中一些建议，只对那些只有三个月的短期项目才有重要的意义，而当你刚刚开始三到五年的博士学位之旅时，这些建议就没那么重要了。

1 主要陷阱：

1.1 假设你的代码没有bug

众所周知，机器学习，特别是深度学习和强化学习模型很难进行调试。为了让你了解无数的犯错方式，你可以看看Andrej Karpathy发的推文：https://twitter.com/karpathy/status/1013244313327681536 。我们所有人，哪怕是更资深的研究人员，总是会犯这样的错误。这些错误之所以难以察觉，是因为模型即使有缺陷也仍然可以进行学习并产生有意义的输出。bug可能会给你的模型带来微秒的变化，并且这些bug大多数只会在运行时才会显现。因此可以说，你所能做的最槽糕的事情就是假设你的代码不包含任何错误。区分一个机器学习研究者是高效的还是低效的，是要看他们对自己的代码持什么样的态度。如果你的默认假设是代码可能有问题，那么你将会更加仔细地检索bug。一行一行地检查代码，并仔细检查中间输出。如果可能的话，将它们进行可视化呈现。张量的形状是否合适？它们是否被正确地初始化、克隆或分离？在模型训练期间监控梯度并注意NaN。通过设置随机数生成的种子对编写单元测试并使实验结果复现可能有所帮助。有关神经网络调试的更多小贴士，请参阅Goodfellow等人所著的《Deep Learning》一书中第11.5章节：Debugging Strategies（调试策略）（http://www.deeplearningbook.org/contents/guidelines.html）

1.2 只看最终的评估指标

虽然你的项目的目标可能只是实现某些评估指标上的改进，但更重要的是，你应该充分了解模型的工作原理以及取得改进的原因。尤其是在项目的早期阶段，最终评估指标包含的信息很少，但这些信息对迭代和开发算法或者模型却非常有用。相反，要提出更为深入的问题，并开发出有用的信息诊断方法。如果你已经引入了门控（gating）或注意力机制（attention mechanism），你的模型是否真的利用了它？在你所提出的模型创新中，哪些实际上有助于整体性能的提高？你做过消融研究（ablation study）吗？你的模型需要多少训练样本或轮数（epoch）才能达到合理的性能？和你使用的基线有何区别？你的模型在哪些测试实例上表现良好或很差？它们是否存在系统差异？你的结果对于超参数的变化有多稳健？能够从模型的隐藏状态来预测重要特征吗？请牢记这一点：你的研究和项目报告并非是要让研究社区了解你所做的一切与先前最先进的技术相比的一些微小的改进，而是要帮助我们来理解这个领域。这个领域的其他人会想知道哪些是有效的，哪些是无效的，以及你的哪些发现可以应用于他们的问题。

1.3 尝试随机变化且无清晰的预期

在当前的深度学习库中，通过添加更多组件、层和优化技巧，很容易使模型变得更加复杂。但是，当你对代码或模型进行更改时，你至少应该对为何这些更改有用有一个直觉。同样，当你进行实验时，你也应该对这个实验结果有清晰的预期。你期望绘制的结果是什么样子的，它们会告诉你什么呢？当你发现自己的模型没有按照预期的方式进行时，这一点就显得尤为重要了。那么，你现在更有可能看到bug的症状，因此，扩展你的模型并不能有助于找到这个bug，甚至可能使隔离问题变得更加困难。在使你的模型变得更为复杂之前，请先深入了解它可能存在的问题。此外，请记住，在你的报告中必须证明你所做的是正确的。评估你的报告的人，对理解你的思考过程会有兴趣的。如果你不能制定一个研究假设，并向自己解释为何你做所的事情应该起作用，那么其他任何人很有可能也不能复现你的项目结果。

1.4 过于复杂

我们经常看到上进心强的学生在遇到难题时毫不退缩，马上尝试复杂的解决方案。可是这样子，如果出现问题的话，就很难进行分析。相反，应该要扪心自问：应该起作用的最小的东西是什么？模型能学会记住一个小数据集吗？如果只使用几个参数时，它能学到什么？在单个训练实例而不是批量实例进行训练时，代码是否有效？我们期望看到的最简单的泛化形式是什么？我们期望失败的简单基线是什么？什么是基线的最小扩展才能使它工作？

1.5 迭代太慢

实验可能需要很长时间。特别是深度学习和强化学习在积累大量随机种子时，可能会耗费大量的时间。因此，在短期项目的过程中，不要过早地陷入缓慢的迭代周期是很重要的。使用简单的环境来调试你的模型，并实现对你的想法进行概念验证，这些都可以在个人计算机上运行。有时一个简单的矩阵游戏或网格世界实验都可以提供有用的想法验证。有时你还可使用MDP的精确值函数来测试算法思想，而不必纠缠于梯度估计、Actor-Critic训练等等。在进行大规模实验时，要简化启动实验和检查结果的流程。在实验完成全部过程之前检查这些结果，看看性能是否平稳。在基础设施上投资，在开始时可能会耗费大量时间，但在项目结束时会有所回报。在分析结果时，要渴望得到有用的信息。

2 一些建议

2.1 在项目开始之前请先了解背景和相关工作

我们通常会在正式开始的日期前几个月就分发项目。其原因是：

三个月对于了解背景和相关工作而言是非常短的时间；
三个月对于项目的实施和实验而言也是非常短的时间；
三个月对于撰写一份好的报告而言也是非常短的时间。

另外还有一个原因是，我们通常会提出一些研究项目，如果这个项目取得成功，我们有可能会在机器学习领域发表相关论文。虽然我们知道学生在一个学期内会有很多事情要去做，但我们通常都会鼓励你们至少提前开始阅读相关文献。理想情况下，当你开始为项目全职工作时，你应该知道要做什么，它如何与现有方法相关联，并且知道如何做到这一点。这也是熟悉你所选择的机器学习框架的好时机！（我们推荐PyTorch！）

2.2 使用版本控制

你确实应该在研究代码和项目报告中使用版本控制。没有什么比在截止日期前丢掉繁忙工作日更糟糕的事儿了。如果你还没有使用版本控制，那就去GitHub注册账户吧。作为学生，你可以得到免费的私人存储库（https://education.github.com/pack）。如果你尚未了解版本控制，那么现在就去学习，你以后会感谢你自己现在的做法。

2.3 使用随机重复进行评估

在学术界，你不可能在项目期间访问多个GPU。然而，尤其是在深度强化学习中，重要的是不要从单个或几个实验中得出聒噪的结论。理想情况下，你希望多次进行实验，并如前所述，得到不同初始条件和超参数的健壮性的感觉。

2.4 在整个项目中尽早开始写作并始终如一

如果你正在进行一个硕士项目，你的工作将会基于你的书面报告进行评估，而不是基于你已做出但没有足够时间来写清楚的杰出工作。尽早开始写作，不要低估传播你的研究成果的努力。清晰的陈述你的目标、假设和贡献，让读者跟随你的思路。解释你设计选择并清晰地讨论你的发现。理想情况下，你应该在项目过程中始终如一地编写报告。这样，你就会强迫自己去考虑接下来的步骤，当截止日期临近时，你就不大可能会忘记项目中任何重要的信息。

2.5 当你需要帮助时，要积极主动寻求帮助

尽管你的老板都是大忙人，但要记住，他们来这里就是为了帮助你的。千万不要因为遇到问题，因为不敢寻求帮助而陷入困境，以致无法参加下次会议，记住，当你需要帮助的时候，请尽管找你的老板。你要积极、主动安排好会议并准备好你想要提前讨论的结果、代码或报告。好好利用你的老板，记得不要惊慌！作为过来人，我们都经历过这一切，我们深知这可能是一次令人生畏的经历，特别是如果你的工作前景或者你的博士申请的成功依赖于这个研究项目的话。我们真的希望你能够取得成功。

原文链接： ADVICE FOR SHORT-TERM MACHINE LEARNING RESEARCH PROJECTS
https://rockt.github.io/2018/08/29/msc-advice