初学者如何建立强大的数据科学投资组合
在学习了数据科学的基础知识后,您就可以开始处理现实世界的问题了。 但是你如何展示你的作品呢? 在本文中,我们将学习一种创建数据科学投资组合的独特方法。
By 阿比德·阿里·阿万, 认证数据科学家.
作者图片 | 元素由 免费矢量 | 统计概念图
作为初学者,我有很多关于如何开始的问题? 我如何学习,或者我从哪里获得有关项目的想法。 所以,经过长时间的搜索,我找到了一个关于数据分析的项目。 仅仅写代码就花了我 3 天,我对我的第一次尝试很满意,但后来出现了一个很大的问题,我如何与全世界分享它? 我只是没有很好的编码技能或文档技能来展示我的工作,所以我将它存储在云中并忘记了它。 一个月后,我在GitHub上随机找了更多的项目,发现这个很神奇 轮廓 这激励我创建我的投资组合。 这是我做出的最好的决定,因为它让我登上了开发者社区的地图,不久之后,我开始收到招聘人员和初学者关于我的项目的电子邮件。
得到一份工作 通常是建立投资组合的主要原因。 有时,如果我们没有相关的教育或经验(尤金彦网)。 在这个现代世界中,雇主对招聘应届毕业生持怀疑态度,那么您如何让他们相信您最适合这份工作呢? 您通过展示您在以前的项目中所做的工作来展示您的技能。 您的在线投资组合越强大,您获得理想工作的机会就越大。
“作品集非常重要,因为当你在面试时,它展示了你的真实世界经验,所以你可以从头到尾向雇主解释整个数据科学工作流程。” — 大卫·雅可波维奇(David Yakobovitch).
另一个动机是创造你的 个人项目 满足你对学习新事物的好奇心。 当我们学习一项新技能时,我们希望进行实验并最终构建一个可以在现实世界中使用的工作产品。
在本文中,我们将学习作为数据科学初学者展示您的工作的方式。 您将了解一些使您的生活变得轻松的新平台以及构建强大投资组合的技巧。
GitHub上
让我澄清一下数据科学家之间的误解。 是的, GitHub上 是必要的,我们都应该学习 混帐. 作为一名数据科学家,我每天都使用 Github,在那里我寻找有趣的数据集和项目。 这是开发人员中最受欢迎的平台,老实说,招聘人员在打电话给您面试之前确实会检查您的 GitHub 个人资料。
图片作者 | github上
GitHub 是一个全球协作平台,人们可以在其中共享和协作进行项目。 正如您在下面的我的个人资料中所看到的,我是如何为其他人的项目做出贡献的,也是如何为我自己的项目工作的。
作者图片 | Kingabzpro
创建实体轮廓的提示:
- 创建您的个人资料页面,有关完整教程,请查看 莎拉·哈特 博客。
- 用链接、封面图片和详细描述记录每个项目。
- Fork 你最喜欢的项目并发送你的第一个 pull request (freecodecamp.org 网站).
- 通过贡献、错误报告和推动您当前的项目来活跃在这个平台上。
深注
深注 比 GitHub 简单得多,而且对初学者也很友好。如果您熟悉 Jupyter笔记本 那么发布你的第一个项目对你来说将是小菜一碟。 我对 Deepnote 的体验绝对令人惊叹,因为该平台为您提供了 GitHub 的所有品质,但更简单,并且专注于数据科学家社区。
作者图片 | 巴基斯坦疫苗接种进展
最近,他们推出了一个 Deepnote 个人资料,该个人资料将展示您发布的所有笔记本以及您的信息和个人资料图片。
作者图片 | 深注
就像 GitHub 要点,您可以与您的团队或一般公众共享您的代码片段。 我在所有媒体出版物和社交媒体平台上使用了 Deepnote cell。 你可以查看我以前的 刊文 了解如何实现 Deepnote 单元。 使用带有输出的代码片段使您能够在多个平台上共享您的项目。
我更喜欢 Deepnote 嵌入式单元而不是 GitHub Gist 的原因是它带有输出,不仅仅是静态输出,还有交互功能。
您可以使用 Plotly 并在 Medium 文章中显示您的图表:
创建实体轮廓的提示:
- 更新您的个人简介、个人资料照片和联系信息。
- 始终使用 Markdown 单元格添加有关您的项目的详细说明。
- 使用封面照片使您的项目脱颖而出。
- 使用 Deepnote 中的 App 功能创建交互式 web 应用程序。
- 继续发布您的旧项目,甚至从 GitHub 重新发布笔记本。
DAGs集线器
DAGs集线器 它是这个世界的新手,它通过为机器学习从业者和数据工程师提供一站式解决方案而迅速成名。 DAGsHub 带有一个 DVC 服务器, 流量、可视化管道和 GitHub 同步。 我们不会深入研究功能,而是专注于使其脱颖而出的功能。
DAGsHub 允许您共享您的 GitHub 存储库并创建您的数据科学项目,并具有可视化机器学习和数据管道的能力。 它还有一个隐藏功能 README.ipynb 作为你的项目描述文件,最适合不习惯 Markdown 的初学者和喜欢在 Jupyter Notebook 上工作的数据科学家。 它类似于 GitHub,这意味着您需要同时学习 Git 和 DVC 才能正确使用该平台。
我看到其他用户喜欢的是通过管道可视化他们的项目结构的能力,以及将他们的数据和模型视为项目不可或缺的一部分的能力。 此外,我们基于开源工具而不是重新发明现有解决方案这一事实是人们喜欢的。 — 院长
图片由院长 | 达格舒布
我的个人资料很新,但我喜欢这个平台,因为它们为我提供了完整的机器学习生态系统。 我认为在功能和 UI 简单性方面,我更喜欢它而不是 GitHub。
作者图片 | DAGs集线器
创建实体轮廓的提示:
- 了解 DVC, 混帐及 流量 充分利用。
- 将项目描述添加到您的笔记本和 README。
- 通过添加个人简介、头像和联系信息来更新您的个人资料。
- 尝试添加 dvc.yaml文件 和 dvc锁 在您的项目中显示数据管道。 欲了解更多信息,请查看 定义管道.
- 通过为开源项目做出贡献和推动您的个人项目来保持活跃的形象。 您可以使用 FDS cli 使您的生活更轻松并避免错误。
- 通过在远程服务器上上传您的数据和模型来充分利用 DVC。 招聘人员对了解从数据摄取到仪表板的完整数据科学周期的候选人感兴趣。
Kaggle
如果你想在数据科学领域更快地获得关注,你应该创建一个 Kaggle 帐户并开始为竞赛、数据集、笔记本和讨论做出贡献。 当您成为特级大师时,人们会尊重您并为您提供更好的职业机会。 如果你问我,我建议你在学习基础知识的同时创建一个 Kaggle 个人资料。 向专家学习并发现您的利基市场。 我是这个平台的忠实粉丝,因为它为初学者提供支持,以便为各个行业竞争和开发创新解决方案。 它是人工智能研究的支柱。
作者图片 | Kaggle
您可以在下面查看我的个人资料,因为从一开始,我就一直在为各种类别做出贡献以获得排名。 目前,我是专家,但在比赛中获得一枚金牌和银牌,我将成为大师,这并不容易,老实说,我尊重大师,因为他们已经证明了他们是其他数据从业者中最好的。
作者图片 | Kaggle
创建实体轮廓的提示:
- 通过使用新数据集并创建数据分析或机器学习模型,在平台上保持活跃。
- 参与讨论,向专家学习,寻求帮助。
- 使用网络抓取来发布新的数据集。
- 参加大多数比赛以学习多种类型的机器学习问题并获得徽章。
- 专注于发布具有详细描述和高质量代码的最佳作品。
- 在 bio 中写下您自己并添加联系方式。
博客
在上述平台上创建项目后,下一步是编写博客。 如果你想扩大你的受众,我强烈建议你从 中. 没有必要写博客,但您可以从各个领域获得更多的关注。 Medium 平台允许您创建您的个人资料,并让您在各种出版物下发布您的文章,例如 走向数据科学 和 迈向AI. 您可以开发您的博客网站或使用其他类似的平台,例如 分析维迪亚.
作者图片 | 中
创建实体轮廓的提示:
- 撰写有关您个人参与的项目的博客。
- 创建有关新兴技术或新数据科学应用程序的博客。
- 在撰写博客时进行适当的研究并添加引文以避免违反平台规则。
- 为每个博客使用有吸引力的封面照片。
- 在开发数据科学项目时,一定要写下你从经验中学到的东西。
- 不要随波逐流,专注于自己擅长的事情。
投资组合网站
您还可以在个人网站上展示您的项目,如果您不是 Web 开发人员,可以使用一些简单的工具来简化该过程。 你可以退房 如何使用 Hugo 和 GitHub Pages 构建数据科学投资组合网站 和 雨果 用于各种模板。
我的作品集网站有一个来自所有平台的项目,带有简短的描述和子类别。 我花了三天时间创建了整个网站并将其部署在 GitHub 页面上。
作者图片 | 文件夹
创建可靠的投资组合网站的提示:
- 添加您的技能、简历和简历。
- 展示您的经验和
- 通过指向 GitHub 或 Deepnote 项目的链接展示您的项目。
- 使您的网站最小化且具有交互性,以便招聘人员可以轻松浏览您的整个投资组合。
- 使您的投资组合网站与您正在进行的最新项目保持同步。
权重和偏差
我经常使用 权重和偏差 用于机器学习实验和我的模型的记录性能指标,但随着 W&B 配置文件的引入,情况发生了变化。 您可以使用嵌入式链接和图形集成来撰写有关当前项目的博客。 它与我提到的其他投资组合平台非常相似,但它具有与 Python 库直接集成的优势。
AYUSH profile 给我留下了最深刻的印象,因为他在撰写有关机器学习的博客时一直在为其他组织做出贡献。
图像由 Ayush | 权重和偏差
W&B 项目具有模型性能指标,如下所示。
作者图片 | 卡格勒-塞蒂
创建实体轮廓的提示:
- 加入其他数据科学组织并参与小组项目。
- 使用 W&B API 显示您的机器学习项目结果。
- 使用 W&B 指标集成撰写博客。
- 添加个人简介、个人资料图片、联系信息。
- 尝试参与社区讨论并始终寻找新的有趣项目。
结论
W&B 是一个通配符,因为它以记录实验而不是投资组合而闻名,但交互式博客的引入为我们提供了展示您的项目和创建强大投资组合的独特优势。
如果您是初学者,我建议您从 Deepnote 开始,因为它对团队免费,并提供适合初学者的入门工具。 如果您希望获得数据科学社区的关注,请尝试在 GitHub 和 Kaggle 上创建您的个人资料。 如果您想创建自己的品牌,请从博客网站开始或创建您的网站。
最后,我希望你们都能在我上面提到的所有平台上创建自己的个人资料,因为它们都具有给潜在雇主留下深刻印象的独特优势。 我知道一开始会让人不知所措,但是一旦你习惯了记录和展示你的项目,它就会变得容易。
简介: 阿比德·阿里·阿万 (@1abidaliawan) 是一位经过认证的数据科学家专业人士,他喜欢构建机器学习模型和研究最新的 AI 技术。 目前正在 PEC-PITC 测试 AI 产品,他们的工作后来被批准用于人体试验,例如乳腺癌分类器。
相关新闻:
资料来源:https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- 账号管理
- 要积极。
- 优点
- AI
- 研究
- 所有类型
- 其中
- 分析
- API
- 应用
- 应用领域
- 应用
- 刊文
- 刊文
- 听众
- 头像
- 徽章
- 基础
- 最佳
- 博客
- 博客
- 博客
- 乳腺癌
- 问题
- 建立
- 建筑物
- 癌症预防
- 寻找工作
- 云端技术
- 码
- 编码
- 共同
- 社体的一部分
- 竞争
- 比赛
- 贡献
- 创造
- 好奇心
- 电流
- data
- 数据分析
- 数据科学
- 数据科学家
- 深入学习
- 开发
- 开发商
- 开发
- DID
- 生态系统
- 教育
- 雇主
- 工程师
- 工程师
- Excel
- 扩大
- 体验
- 实验
- 专家
- 面部彩妆
- 专栏
- 特征
- 字段
- 姓氏:
- 专注焦点
- 遵循
- Free
- ,
- 其他咨询
- 混帐
- GitHub上
- 全球
- 黄金
- 非常好
- 团队
- 指南
- 招聘
- 创新中心
- How To
- HTTPS
- 巨大
- 行业
- 信息
- 创新
- 积分
- 积分
- 互动
- 专属采访
- IT
- 工作
- Jupyter笔记本
- 最新
- 学习用品
- 学习
- 长
- 爱
- 机器学习
- 制作
- 地图
- 媒体
- 中等
- 指标
- 模型
- 最受欢迎的产品
- 新平台
- 笔记本电脑
- 提供
- 在线
- 打开
- 机会
- 组织
- 其他名称
- 员工
- 性能
- 图片
- 平台
- 平台
- 热门
- 个人档案
- 产品
- 热销产品
- 本人简介
- 项目
- 项目
- 国家
- 出版物
- 发布
- 出版
- 蟒蛇
- 真实的世界
- 研究
- 成果
- 定位、竞价/采购和分析/优化数字媒体采购,但算法只不过是解决问题的操作和规则。
- 科学
- 科学家
- 刮
- 搜索
- Share
- 短
- 白银
- 简易
- 网站
- 技能
- So
- 社会
- 社会化媒体
- 社会化媒体平台
- 解决方案
- 开始
- 开始
- 统计
- 故事
- SUPPORT
- 技术
- 专业技术
- 测试
- 基础知识
- 世界
- 次
- 秘诀
- 最佳
- 教程
- ui
- us
- 用户
- 卷筒纸
- 网络抓取
- 您的网站
- WHO
- 工作
- 工作流程
- 世界
- 写作
- X
- YouTube的