5 个要避免的数据科学职业错误
每个人都会犯错误,当它们随着时间的推移导致学习和改进时,这可能是一件好事。 但是,我们也可以尝试先向他人学习,以加快我们的个人成长。 要开始,请考虑这些以艰难方式学到的经验教训,因此您不必这样做。
By 谢莎,Cruise 的高级数据科学家
照片由 布鲁斯·马尔斯 on Unsplash.
当我第一次从金融过渡到数据科学的时候,我感觉自己站在了世界之巅——我在我梦想的领域找到了一份工作,我的职业轨道已经确定,我会低头努力工作,会出什么问题? 嗯,有几件事......作为数据科学家的第二年,我很高兴我在职业生涯的早期发现了自己犯的几个错误。 这样,我就有时间反思和纠正路线,以免为时已晚。 一段时间后,我意识到这些错误很常见。 事实上,我观察到我周围的很多 DS 仍然在犯这些错误,没有意识到从长远来看它们会损害他们的数据职业。
如果我的 麦肯锡教给我的 5 个让你成为更好数据科学家的课程 是我从最好的人那里学到的东西,这篇文章中的教训是我艰难地学到的,我希望我能帮助你避免犯同样的错误。
错误 1:将自己视为步兵而不是思想伙伴
在成长过程中,我们总是根据我们遵守规则和命令的程度来评估我们,尤其是在学校里。 如果您按照教科书和练习考试并努力学习,您将成为最优秀的学生。 很多人似乎将这种“步兵”心态带入了他们的工作环境。 在我看来,正是这种心态阻碍了许多数据科学家最大限度地发挥他们的影响并从同行中脱颖而出。 我观察到很多DS,尤其是初级的,认为他们对决策过程没有任何贡献,宁愿退居幕后被动地执行为他们所做的决定。 这开始了一个恶性循环——你对这些讨论的贡献越少,利益相关者就越不可能让你参与未来的会议,你将来做出贡献的机会就越少。
让我举一个具体的例子来说明在模型开发的情况下步兵和思想伙伴之间的区别。 在数据收集和专题头脑风暴会议中,老我过去常常被动地记录利益相关者的建议,以便我以后“完美”实施。 当有人提出一个我知道我们没有数据的功能时,我不会说任何基于他们更高级并且他们必须知道我忽略的东西的假设。 但是你猜怎么着,他们没有。 我后来面临的情况是,我们集思广益的 50% 的功能需要额外的数据收集,这会使我们的项目截止日期处于危险之中。 结果,我经常发现自己最终处于坏消息使者的不利位置。 如今,我努力成为思想伙伴,我会尽早参与对话,并利用我作为最接近数据的人的独特地位。 这样,我可以尽早管理利益相关者的期望,并提出建议以帮助团队前进。
如何避免这种情况:
- 确保您不会在可以从数据角度做出贡献的会议上退缩:利益相关者对指标的定义是否足以满足他们想要衡量的内容? 数据是否可用于衡量指标集? 如果没有,我们可以为我们拥有的数据找到代理吗?
- 冒名顶替综合症 是真实的,尤其是在初级 DS 中。 确保您意识到这一点,每当您质疑是否应该说“其他人可能已经想到的”或“愚蠢的澄清问题”时,您都应该。
- 对其他人的工作保持一定的好奇心。 在很多情况下,我发现我可以通过注意到其他人由于缺乏对公司数据的了解而可能忽略的差距来增加价值。
错误 2:将自己纳入数据科学的特定领域
我想成为数据工程师还是数据科学家? 我想处理营销和销售数据还是进行地理空间分析? 您可能已经注意到,到目前为止,我在本文中一直使用术语 DS 作为许多术语的通用术语。 数据相关的职业道路 (例如,数据工程师、数据科学家、数据分析师等)。 那是因为如今在数据世界中,尤其是在较小的公司中,这些头衔之间的界限非常模糊。 我观察到很多数据科学家认为自己只是构建模型的数据科学家,不关注任何业务方面或数据工程师,他们只关注数据流水线,不想了解正在进行的建模的任何事情公司。
最好的数据人才是那些可以戴多种帽子的人,或者至少能够理解其他数据角色的流程。 如果您想在早期或成长阶段的初创公司工作,这会特别方便,因为那里的功能可能还没有那么专业,而且您需要灵活并承担各种与数据相关的职责。 即使您处于明确定义的工作档案中,随着时间的推移,您会获得更多经验,您可能会发现自己有兴趣过渡到不同类型的数据角色。 如果您没有将自己和您的技能组合到一个特定角色的狭窄焦点中,那么这种转变会容易得多。
如何避免这种情况:
- 同样,对其他数据角色正在开展的项目感到好奇。 与同事安排定期会议,互相讨论有趣的项目,或者让不同的数据团队定期相互分享他们的工作/项目。
- 如果您无法在工作中接触其他数据角色,请尝试在空闲时间保持/练习您不使用的数据技能。 例如,如果您是一名数据分析师并且有一段时间没有接触建模,请考虑通过 Kaggle 竞赛等外部项目练习技能。
误区三:跟不上领域发展
自满害死人
每个士兵都知道这一点,每个 DS 也应该知道。 对自己的数据技能自满而不花时间学习新技能是一个常见的错误。 在数据领域这样做比在其他一些领域更危险,因为数据科学是一个相对较新的领域,仍在经历剧烈的变化和发展。 不断有新算法、新工具甚至新编程语言被引入。
如果你不想成为 2021 年仍然只知道如何使用 STATA 的数据科学家(他存在,我和他一起工作过),那么你需要跟上该领域的发展。
不要让这成为你(的GIF 通过 GIPHY)
如何避免这种情况:
- 注册在线课程以了解新概念和算法,或者复习您已经知道但在工作中一段时间未使用的概念和算法。 学习能力是每个人都应该不断练习的肌肉,成为终身学习者可能是你能给自己最好的礼物。
- 注册 DS 时事通讯或关注媒体上的 DS 博主/出版物,并养成关注 DS“新闻”的习惯。
错误 4:过度弯曲你的分析能力
如果你只有一把锤子,那么一切看起来都像钉子。 不要成为试图在所有事情上使用 ML 的 DS。 当我第一次进入数据科学世界时,我对我在学校学到的所有奇特模型感到非常兴奋,迫不及待地想在现实世界的问题上尝试所有这些模型。 但现实世界与学术研究不同, 80 / 20规则 总是在玩。
在我之前关于“麦肯锡教给我的 5 个教训,”我写道,业务影响和可解释性有时比模型准确性的额外几个百分点更重要。 有时,假设驱动的 Excel 模型可能比多层神经网络更有意义。 在这些情况下,不要过度展示你的分析能力,让你的方法矫枉过正。 相反,发挥您的业务实力,成为同样具有商业头脑的 DS。
如何避免这种情况:
- 在您的军械库中拥有全方位的分析技能/工具,从简单的 Excel 到高级的 ML 建模技能,因此您始终可以评估哪种工具最适合在这种情况下使用,而不是带着枪去打刀。
- 在深入分析之前了解业务需求。 有时利益相关者会要求一个 ML 模型,因为它是一个流行的概念,并且他们对 ML 模型可以做什么抱有不切实际的期望。 作为 DS,您的工作是管理期望并帮助他们找到更好、更简单的方法来实现他们的目标。 记住? 成为思想伙伴,而不是步兵。
错误 5:认为建立数据文化是别人的工作
在我的文章中,构建卓越数据文化的 6 个基本步骤,”我写道,如果公司没有良好的数据文化,数据科学家的生活会变得多么可怕和低效。 事实上,我听到很多 DS 抱怨非生产性的临时数据请求,这些请求应该由利益相关者以自给自足的方式轻松处理(例如,在 Looker 中将聚合从每月更改为每天,这实际上由两次单击组成)。 不要认为改变这种文化是别人的工作。 如果您想看到更改,请进行更改。 毕竟,与数据科学家本身相比,谁能更好地建立数据文化和教育利益相关者有关数据的知识? 帮助在公司建立数据文化将使您和利益相关者的生活更加轻松。
如何避免这种情况:
- 让您有责任为非分析利益相关者进行培训并开发自助资源。
- 确保您开始实践您所宣扬的内容,开始将查询链接到幻灯片,将真实数据源链接到文档,并开始记录您的代码和数据库。 您无法在一夜之间建立数据文化,因此这绝对需要耐心。
我确实想指出,在你的职业生涯中犯错是可以的。 最重要的是从这些错误中吸取教训,并在未来避免它们。 或者更好的是,将它们写下来以帮助其他人避免犯同样的错误。
原版。 经许可重新发布。
简介: 谢莎 是一位经验丰富的高级分析顾问,精通数据科学、SQL、R、Python、消费者研究和经济研究,拥有强大的工程背景,拥有麻省理工学院金融工程硕士学位。
相关新闻:
资料来源:https://www.kdnuggets.com/2021/08/5-data-science-career-mistakes-avoid.html
- "
- &
- 2021
- Ad
- 额外
- 算法
- 所有类型
- 其中
- 分析
- 分析人士
- 分析
- 国家 / 地区
- 围绕
- 刊文
- 最佳
- 建立
- 建筑物
- 商业
- 商业冲击
- 寻找工作
- 例
- 抓
- 码
- 相当常见
- 公司
- 公司
- 竞争
- 顾问
- 消费者
- 谈话
- 情侣
- 文化塑造
- 好奇心
- data
- 数据科学
- 数据科学家
- 数据库
- 深入学习
- 开发
- 研发支持
- DID
- 副总经理
- 文件
- 早
- 早期
- 经济
- 工程师
- 工程师
- 工程师
- 环境
- 等
- Excel
- 体验
- 面部彩妆
- 时尚
- 专栏
- 特征
- 数字
- 金融
- 金融
- 姓氏:
- 专注焦点
- 遵循
- 向前
- Free
- ,
- 未来
- 其他咨询
- 理想中
- 非常好
- 图形处理器
- 大
- 成长
- 事业发展
- 便利
- 头
- 举行
- 创新中心
- How To
- HTTPS
- 影响力故事
- 专属采访
- IT
- 工作
- 保持
- 语言
- 铅
- 学习用品
- 知道
- 学习者
- 学习
- Level
- 杠杆作用
- 友情链接
- 长
- 制作
- 营销
- 衡量
- 中等
- 会议
- 信使
- 指标
- 麻省理工学院简介
- ML
- 模型
- 造型
- 移动
- 净
- 神经
- 订阅电子邮件
- 好
- 在线
- 打开
- 开放源码
- 检讨
- ZAP优势
- 订单
- 其他名称
- 其它
- 合伙人
- 员工
- 透视
- 枢
- 热门
- 本人简介
- 代码编程
- 编程语言
- 项目
- 项目
- 蟒蛇
- 范围
- 原因
- 回归
- 研究
- 资源
- 风险
- 定位、竞价/采购和分析/优化数字媒体采购,但算法只不过是解决问题的操作和规则。
- 运行
- 销售
- 学校
- 科学
- 科学家
- 感
- 集
- Share
- 简易
- 技能
- So
- SQL
- 阶段
- 开始
- 开始
- 启动
- 故事
- 学生
- 人才
- 未来
- 项目
- 次
- 最佳
- 跟踪时
- 产品培训
- 折扣值
- 等待
- WHO
- 维基百科上的数据
- 工作
- 世界
- X
- 年
- 年