更多数据科学速查表

更多数据科学速查表

源节点: 1792233

我们最近意识到我们已经有一段时间没有给您带来任何数据科学备忘单了。这并不是因为他们没有时间,而是因为他们没有时间。数据科学速查表无处不在,从入门到高级,涵盖从算法、统计到面试技巧等主题。

但是什么才是好的备忘单呢?是什么让备忘单值得被选为特别好的备忘单?很难把手指放在上面 恰恰 一份好的备忘单的要素是什么,但显然,它能够简洁地传达基本信息——无论该信息是特定的还是一般性的——绝对是一个好的开始。这就是我们今天的候选人值得注意的原因。因此,请继续阅读四个精选的补充备忘单,以帮助您进行数据科学学习或复习。

首先是 Aaron Wang 的数据科学速查表 2.0,统计抽象、基本机器学习算法以及深度学习主题和概念的四页汇编。它并不意味着详尽无遗,而是针对面试准备和考试复习以及其他需要类似复习深度的情况提供快速参考。作者指出,虽然那些对统计和线性代数有基本了解的人会发现这个资源最有用,但初学者也应该能够从其内容中收集有用的信息。

数字
截图来自Aaron Wang 数据科学速查表 2.0
 

我们今天提供的下一个备忘单是 Aaron Wang 的资源所基于的, Maverick Lin 的数据科学备忘单 (王将自己的版本称为 2.0,是对林的“原创”的直接认可)。我们可以认为林的备忘单比王的更深入(尽管王决定不那么深入,似乎是有意的,也是一个有用的替代方案),涵盖了更基本的数据科学概念,例如数据清理、建模的思想、“大数据”,包括 Hadoop、SQL,甚至 Python 基础知识。

显然,这将吸引那些更坚定地站在“初学者”阵营的人,并且能够很好地激发读者的兴趣,让读者了解数据科学的广阔领域以及它所包含的许多不同概念。这绝对是另一个可靠的资源,特别是如果读者是数据科学的新手。

数字
Maverick Lin 的屏幕截图 数据科学备忘单
 

当我们回到过去——寻找林备忘单的灵感——我们遇到了 威廉·陈(William Chen)的概率速查表2.0。多年来,陈的备忘单受到了广泛的关注和赞扬,因此您可能在某个时候遇到过它。显然,陈的备忘单有着不同的侧重点(鉴于其名称),它是概率概念的速成课程或深入回顾,包括各种分布、协方差和变换、条件期望、马尔可夫链、各种重要性公式以及多得多。

在 10 页的内容中,您应该能够想象本文涵盖的概率主题的广度。但不要让它阻止你;陈能够将概念归结为基本要点,并在不牺牲要点的情况下用简单的英语进行解释,这一点值得注意。它还具有丰富的解释性可视化功能,当空间有限且简洁的愿望强烈时,这非常有用。

Chen 的汇编不仅是高质量的,值得您花时间,作为初学者或有兴趣进行全面审查的人,我会按照这些资源呈现方式的相反顺序进行工作 - 从 Chen 的备忘单,到 Lin 的,最后到 Wang 的,边走边构建概念。

数字
截图来自William Chen 概率备忘单 2.0
 

我在这里包含的最后一个资源是,尽管从技术上讲不是备忘单 Rishabh Anand 的机器学习要点。 Anand 自称为“关于常见机器学习概念、最佳实践、定义和理论的面试指南”,他收集了广泛的知识“片段”,其用处绝对超出了最初预期的面试准备。其中涵盖的主题包括:

  • 模型评分指标
  • 参数共享
  • k 重交叉验证
  • Python数据类型
  • 提高模型性能
  • 计算机视觉模型
  • 注意力及其变体
  • 处理类别不平衡
  • 计算机视觉术语表
  • 普通反向传播
  • 正则化
  • 参考资料

数字
屏幕截图 机器学习要点
 

虽然正如资源描述中所承诺的那样,涉及机器学习“概念、最佳实践、定义和理论”,但这些“内容”绝对是面向实用的,这使得该网站对前面提到的三个备忘单。如果我想在这篇文章中涵盖所有四个资源中的所有材料,我肯定会在其他三个资源之后查看这个资源。

因此,您有四个备忘单(或三个备忘单和一个备忘单相邻资源)可用于您的学习或复习。希望这里的内容对您有用,我邀请任何人在下面的评论中分享他们认为有用的备忘单。

时间戳记:

更多来自 掘金队