在转行从事数据科学之前请阅读本文 - KDnuggets

在转行从事数据科学之前请阅读本文 – KDnuggets

源节点: 3078033

在转行从事数据科学之前请阅读本文
图片作者
 

您正在阅读本文,因为您正在考虑加入有抱负的数据科学家的行列。谁能责怪你呢?数据科学是一个不断发展的领域,即使在它获得《哈佛商业评论》现在臭名昭著的“最性感的工作”荣誉十年之后。目前美国劳工统计局 预测 从 35 年到 2022 年,数据科学家的就业率将增长 2032%。相比之下,平均就业增长率仅为 5%。

它还有其他好处:

  • 它的薪水很高(同样,劳工统计局 发现 103 年薪资中位数为 2022 美元)
  • 它伴随着高品质的生活(高于平均水平的与工作相关的幸福感) 根据 到职业探索者)
  • 尽管最近一轮经济衰退,但仍有工作保障 裁员 – 因为这个角色的需求量很大

因此,有很多理由想要进入这个领域。

 

在转行从事数据科学之前请阅读本文
资料来源:https://www.bls.gov/ooh/math/data-scientists.html
 

但数据科学是一个非常广泛的领域,在开始之前您需要了解许多不同的职位和技能。本文将引导您了解可以选择的各个方向,以及进入数据科学所需了解的每个方向。

成功转型为 数据科学生涯,您需要遵循结构化方法:

  • 评估你的 数据科学技能 并找出差距。
  • 在您薄弱的领域获得实践经验。
  • 网络。加入数据科学小组、参加聚会并为论坛做出贡献。

让我们更深入地学习。

评估你的起始位置

您已经知道什么以及如何将其应用到数据科学中?想一想:您拥有的任何编程知识、统计技能或数据分析经验。

接下来,确定您的技能差距,特别是数据科学必需的技能。 SQL 确实是必须的,但 Python 或 R 编程、高级统计、机器学习和数据可视化也非常有益。

一旦确定了这些差距,就可以寻求相关的教育或培训来填补它们。这可以通过在线课程、大学课程、训练营或自学的方式进行,重点是实践、动手学习。

亲身体验

您不应该只观看视频和阅读博客文章。实践经验在数据科学中至关重要。参与能让您在现实场景中应用新技能的项目。这可以是个人项目、对开源平台的贡献,或者参加 Kaggle 等数据竞赛。

如果您有一些基本的入门技能,您可能需要考虑寻求实习或自由职业来获得行业经验。

最重要的是, 在作品集中记录您的所有项目和经验,突出显示您解决问题的过程、您使用的技术以及您的工作的影响。

商业网络

进入数据科学领域通常取决于你所认识的人以及你所知道的内容。寻找导师,参加聚会、会议和研讨会以了解新趋势,并参与 Stack Overflow、GitHub 或 Reddit 等在线数据科学社区。这些平台使您可以向他人学习、分享您的知识并在数据科学社区中获得关注。

如果您想 从零开始成为一名数据科学家,将您需要发展的技能视为一棵树是有意义的。每个数据科学工作都有一些共同的“主干”技能,然后每个专业都有“分支”技能,这些技能会继续分支到越来越专业的角色。

每个数据科学家无论朝哪个方向发展都需要三项主要技能:

使用 SQL 进行数据操作/整理

数据科学基本上可以归结为处理和组织大型数据集。为此,您需要了解 SQL。这是 数据操作和争论的重要工具。

 

在转行从事数据科学之前请阅读本文
图片作者

软技能

数据科学并不是凭空发生的。你需要与他人相处融洽,这意味着要提高你的软技能。能够以清晰易懂的方式向非技术利益相关者传达复杂的数据发现与技术技能一样重要。其中包括有效沟通、解决问题和商业头脑。

解决问题有助于应对复杂的数据挑战,而商业头脑则确保数据驱动的解决方案与组织目标保持一致。

持续学习的态度

数据科学与五年前已经不同。只要看看我们今天的人工智能与 2018 年相比就知道了。新的工具、技术和理论不断涌现。这就是为什么您需要持续学习的心态,以跟上最新发展并适应该领域的新技术和方法。

您需要自我激励来学习和适应,以及积极主动地获取新知识和技能。

虽然有我上面概述的常见技能,但每个角色都需要自己的特定技能。 (还记得吗?分支。)例如,统计分析、Python/R 编程技能和数据可视化都特定于数据科学中更专业的工作。

 

在转行从事数据科学之前请阅读本文
图片作者
 

让我们分解每个与数据科学相关的角色,以便您了解自己的需求。

业务/数据分析师

是的,这是一个数据科学角色!即使反对者不同意,我仍然相信,如果你的目标是进入数据科学职业轨道,你至少可以将其视为踏脚石。

作为业务或数据分析师,您负责弥合数据洞察和业务策略之间的差距。对于那些善于理解业务需求并将其转化为数据驱动解决方案的人来说,它是完美的选择。

作为核心技能,您需要 商业智能——这并不奇怪——强大的分析能力,精通数据查询语言,主要是 SQL。在这个角色中,Python 和 R 是可选的,因为主要任务是数据整理。

有一个 可视化组件 但根据您的工作,这可能意味着在 Tableau 中创建仪表板或在 Excel 中创建图表。

数据分析

该角色的重点是解释数据以提供可行的见解。如果您喜欢将数字转化为故事和商业策略,那么这对您来说是一份很棒的工作。

你需要牢牢掌握 统计分析和数据可视化 – 不过,这些可以是表格仪表板和/或 Excel 图表)。您还需要熟练掌握 分析工具 喜欢 Excel、Tableau 和 SQL。 Python/R 再次成为可选的,但请记住它们确实可以帮助实现统计和自动化。

机器学习

机器学习科学家开发预测模型和算法来做出数据驱动的预测或决策。这些职位适合那些对人工智能和模型构建有浓厚兴趣的人。

核心技能不足为奇:您需要 对算法有深入的理解,有 TensorFlow 和 PyTorch 等机器学习框架的经验,以及较强的编程能力。 Python 和/或 R 不再是可选的,而是必须具备的。

数据工程

该角色让您专注于数据管道的架构、管理和维护。它非常适合那些喜欢管理和优化数据流和存储的技术挑战的个人。

要从事这份工作,您需要拥有数据库管理、ETL 流程方面的专业知识,并精通 Hadoop 和 Spark 等大数据技术。 您还需要 熟练掌握数据管道自动化 使用 Airflow 等技术。

商业智能

在商业智能中,一切都与构建可视化有关。这对于讲故事的人和具有强烈商业意识的人来说非常有用。

您需要精通 Tableau 和 Qlik 等仪表板技术,因为您将使用这些工具来构建可视化效果。您还需要数据操作技能(阅读:SQL 技能)来帮助优化数据查询,从而提高仪表板性能。

正如我在文章前面提到的,数据科学是一个快速发展的领域。新的工作和角色不断出现。回到我的树类比,我喜欢将其视为添加到主要数据科学主干上的新分支。现在有云工程师、SQL 专家、DevOps 角色等等——所有这些仍然与数据科学轨道相关。因此,本文仅简要介绍了数据科学的一些发展方向。

更重要的是,您还应该记住,数据科学伴随着六位数薪水带来的挑战。学习曲线非常陡峭,而且学习永远不会真正结束。新技术、趋势和工具来得又快又难——如果你想保住工作,就必须跟上。

话虽这么说,这是一个很好的职业选择。凭借我提到的三项主要能力,您将有能力承担任何任务 数据科学角色 这对你有吸引力。
 
 

内特·罗西迪 是一名数据科学家和产品战略。 他也是教授分析学的兼职教授,并且是 地层划痕,一个帮助数据科学家准备面试的平台,回答来自顶级公司的真实面试问题。 与他联系 推特:StrataScratch or LinkedIn.

时间戳记:

更多来自 掘金队