Как создать сильное портфолио в области науки о данных, будучи новичком
Изучив основы науки о данных, вы можете приступить к работе над проблемами реального мира. Но как вы демонстрируете свою работу? В этой статье мы узнаем об уникальном способе создания портфолио по науке о данных.
By Абид Али Аван, Сертифицированный специалист по данным.
Изображение автора | Элементы по Бесплатный вектор | Иллюстрация концепции статистики
Как новичок, у меня было много вопросов о том, как мне начать? Как мне учиться или где взять идеи для работы над проектами. Итак, после долгих поисков я нашел проект по анализу данных. Мне потребовалось 3 дня только на то, чтобы написать код, и я был доволен своей первой попыткой, но затем возник большой вопрос: как мне поделиться им со всем миром? У меня просто не было хороших навыков программирования или документации, чтобы продемонстрировать свою работу, поэтому я сохранил ее в облаке и забыл о ней. Через месяц я случайно искал другие проекты на GitHub и нашел этот потрясающий профиль это побудило меня создать свое портфолио. Это было лучшее решение, которое я принял, поскольку оно внесло меня в карту сообщества разработчиков, и вскоре после этого я начал получать электронные письма от рекрутеров и новичков о моих проектах.
Получить работу обычно является основной причиной создания портфолио. Иногда это необходимо, если у нас нет соответствующего образования или опыта (eugenyan.com). В современном мире работодатели скептически относятся к найму новых выпускников, так как же убедить их, что вы лучше всего подходите для этой работы? Вы демонстрируете свои навыки, показывая работу, которую вы проделали в предыдущем проекте. Чем сильнее ваше онлайн-портфолио, тем выше ваши шансы получить работу своей мечты.
«Портфолио чрезвычайно важно иметь, потому что, когда вы находитесь на собеседовании, оно показывает ваш реальный опыт, поэтому вы можете объяснить работодателю от А до Я весь рабочий процесс в области науки о данных». - Давид Якобович.
Другая мотивация - создать свой личный проект это удовлетворяет ваше любопытство к изучению нового. Когда мы изучаем новый навык, мы хотим поэкспериментировать и в конечном итоге создать рабочий продукт, который можно будет использовать в реальном мире.
В этой статье мы узнаем, как вы можете продемонстрировать свою работу как новичок в области науки о данных. Вы узнаете о новой платформе, которая облегчит вашу жизнь, и узнаете о том, как создавать сильные портфели.
GitHub
Позвольте мне развеять заблуждение среди специалистов по анализу данных. Да, GitHub необходимо, и мы все должны учиться мерзавец. Как специалист по данным, я ежедневно использую Github, где ищу интересные наборы данных и проекты. Это самая популярная платформа среди разработчиков, и, честно говоря, рекрутер проверяет ваш профиль на GitHub, прежде чем позвонить вам на собеседование.
Изображение Автор | GitHub
GitHub - это глобальная платформа для совместной работы, где люди делятся проектами и совместно работают над ними. Как вы можете видеть в моем профиле ниже, я внес свой вклад в проекты других людей, а также работал над своими собственными проектами.
Изображение автора | Kingabzpro
Советы по созданию прочного профиля:
- Создайте страницу своего профиля и ознакомьтесь с полным руководством по ссылке Сары Харт блог.
- Документируйте каждый проект со ссылками, изображениями обложек и подробными описаниями.
- Создайте вилку проекта, который вам больше всего нравится, и отправьте свой первый пул-реквест (freecodecamp.org).
- Будьте активны на этой платформе, участвуя, сообщая об ошибках и продвигая свои текущие проекты.
Глубокая заметка
Глубокая заметка намного проще, чем GitHub, и удобен для новичков. Если вы знакомы с Блокнот Jupyter тогда для вас будет совсем несложно опубликовать свой первый проект. Мой опыт работы с Deepnote просто потрясающий, поскольку платформа предоставляет вам все качества GitHub, но намного проще и ориентирована на сообщество специалистов по данным.
Изображение автора | Прогресс вакцинации в Пакистане
Недавно они представили профиль Deepnote, в котором будут представлены все публикуемые вами записные книжки с вашей информацией и изображением профиля.
Изображение автора | Глубокая заметка
Так же, как GitHub Gist, вы можете поделиться фрагментом кода со своей командой или широкой публикой. Я использовал Deepnote cell на всех платформах Medium Publication и социальных сетях. Вы можете проверить мои предыдущие гайд чтобы понять, как реализовать ячейку Deepnote. Использование фрагментов кода с выводом дает вам возможность делиться своими проектами на нескольких платформах.
Причина, по которой я предпочитаю встроенную ячейку Deepnote, а не GitHub Gist, заключается в том, что она имеет вывод, а не только статический вывод, но и интерактивные функции.
Вы можете использовать Plotly и отобразить свою диаграмму в статье Medium:
Советы по созданию прочного профиля:
- Обновите свою биографию, фото профиля и контактную информацию.
- Всегда добавляйте подробные описания вашего проекта, используя ячейку уценки.
- Используйте фото на обложке, чтобы выделить свой проект.
- Используйте функции приложения в Deepnote для создания интерактивного веб-приложения.
- Продолжайте публиковать свой старый проект или даже репостить записные книжки с GitHub.
DAGsHub
DAGsHub является новинкой в этом мире, и она быстро завоевывает популярность, предоставляя универсальное решение для практиков машинного обучения и инженеров по обработке данных. DAGsHub поставляется с DVC сервер, Млфлоу, Визуализация конвейера и Синхронизация с GitHub. Мы не будем углубляться в особенности, а сосредоточимся на особенностях, которые выделяют его.
DAGsHub позволяет вам поделиться своим репозиторием GitHub и создать свой проект по науке о данных с возможностью визуализации машинного обучения и конвейеров данных. Он также имеет скрытую функцию README.ipynb в качестве файла описания вашего проекта, который лучше всего подходит для новичков, которые не привыкли к разметке, и специалистов по данным, которым нравится работать с Jupyter Notebook. Он похож на GitHub, а это значит, что вам нужно изучить как Git, так и DVC, чтобы правильно использовать эту платформу.
То, что я видел, нравится другим пользователям, так это возможность визуализировать структуру своего проекта через конвейер, а также возможность видеть свои данные и модели как неотъемлемую часть проекта. Кроме того, людям нравится тот факт, что мы основываемся на инструментах с открытым исходным кодом, а не заново изобретаем существующие решения. - Дин
Изображение Дина | Dagshub
Мой профиль довольно новый, но мне нравится эта платформа, поскольку они предоставляют мне полную экосистему машинного обучения. Я думаю, что предпочитаю его больше, чем GitHub, с точки зрения возможностей и простоты пользовательского интерфейса.
Изображение автора | DAGsHub
Советы по созданию прочного профиля:
- Изучай DVC, идтии Млфлоу в полной мере воспользоваться.
- Добавьте описание проекта в свой блокнот и README.
- Обновите свой профиль, добавив биографию, аватар и контактную информацию.
- Попробуй добавить dvc.yaml и dvc.lock в вашем проекте для отображения конвейеров данных. Для получения дополнительной информации ознакомьтесь с Определение конвейера.
- Сохраняйте активный профиль, участвуя в проектах с открытым исходным кодом и продвигая свой личный проект. Вы можете использовать FDS cli, чтобы упростить вашу жизнь и избежать ошибок.
- Полностью использует DVC, загружая ваши данные и модель на удаленный сервер. Рекрутеров интересуют кандидаты, которые знают полный цикл науки о данных от приема данных до информационных панелей.
Kaggle
Если вы хотите, чтобы вас быстрее заметили в мире науки о данных, вам следует создать Kaggle аккаунт и начните участвовать в соревнованиях, наборах данных, записных книжках и обсуждениях. Когда ты становишься гроссмейстером, люди уважают тебя и предлагают лучшие карьерные возможности. Если вы спросите меня, я предлагаю вам создать профиль Kaggle, пока вы изучаете основы. Учитесь у экспертов и откройте свою нишу. Я большой поклонник этой платформы, поскольку она обеспечивает поддержку новичков в конкуренции и разработке инновационных решений для различных отраслей. Это основа исследований ИИ.
Изображение автора | Kaggle
Вы можете проверить мой профиль ниже, так как с самого начала я участвовал в различных категориях, чтобы получить ранги. В настоящее время я эксперт, но с одной золотой и серебряной медалями на соревнованиях я стану мастером, что непросто, и, честно говоря, я уважаю гроссмейстеров, поскольку они доказали, что они лучшие среди других практиков данных.
Изображение автора | Kaggle
Советы по созданию прочного профиля:
- Будьте активны на платформе, используя новые наборы данных и создавая модели анализа данных или машинного обучения.
- Участвуйте в обсуждениях, учитесь у экспертов и обращайтесь за помощью.
- Используйте парсинг веб-страниц, чтобы опубликовать новый набор данных.
- Участвуйте в большинстве соревнований, чтобы изучить несколько типов задач машинного обучения и заработать значки.
- Сосредоточьтесь на публикации своих лучших работ с подробным описанием и высококачественным кодом.
- Напишите о себе в биографии и укажите контактные данные.
Блог
Написание блогов - это следующий шаг после создания вашего проекта на вышеуказанных платформах. Если вы хотите расширить свою аудиторию, я настоятельно рекомендую вам начать с Medium. Вести блог не обязательно, но вы получите больше поддержки в различных областях. Платформа Medium позволяет вам создавать свой профиль и публиковать свои статьи в различных публикациях, таких как На пути к науке о данных и К ИИ. Вы можете разработать свой сайт для ведения блога или использовать другую аналогичную платформу, например Аналитика Видхья.
Изображение автора | Medium
Советы по созданию прочного профиля:
- Пишите в блогах о проекте, над которым вы работали лично.
- Создавайте блоги о новых технологиях или новых приложениях для обработки данных.
- Проводите надлежащие исследования во время написания блогов и добавляйте ссылки, чтобы избежать нарушений правил платформы.
- Используйте привлекательные обложки для каждого блога.
- Всегда пишите о том, что вы узнали из своего опыта при разработке проектов в области науки о данных.
- Не следуйте трендам и сосредоточьтесь на том, что у вас хорошо получается.
Портфолио Сайт
Вы также можете отобразить свой проект на личном веб-сайте, и если вы не являетесь веб-разработчиком, есть несколько простых инструментов, которые сделают этот процесс довольно простым. Вы можете проверить Как создать веб-сайт с портфолио Data Science с помощью Hugo и GitHub Pages и Хьюго для различных шаблонов.
На сайте моего портфолио есть проекты со всех платформ с краткими описаниями и подкатегориями. Мне потребовалось три дня, чтобы создать весь веб-сайт и развернуть его на страницах GitHub.
Изображение автора | Портфолио
Советы по созданию надежного веб-сайта-портфолио:
- Добавьте свои навыки, биографию и резюме.
- Покажите свой опыт и
- Продемонстрируйте свои проекты со ссылками на ваши проекты GitHub или Deepnote.
- Сделайте свой веб-сайт минималистичным и интерактивным, чтобы рекрутер мог легко прокручивать все ваше портфолио.
- Своевременно обновляйте веб-сайт своего портфолио, добавляя последний проект, над которым вы работаете.
Вес и предубеждения
Обычно я использую Вес и предубеждения для экспериментов с машинным обучением и регистрации показателей производительности моих моделей, но это изменилось с появлением профиля W&B. Вы можете написать блог о своем текущем проекте, используя встроенные ссылки и интеграцию графов. Он очень похож на другие платформы портфолио, о которых я упоминал, но имеет преимущество прямой интеграции с библиотеками Python.
Ассоциация Ayush Профиль произвел на меня наибольшее впечатление, поскольку он вносил свой вклад в другие организации, пока писал блоги о машинном обучении.
Изображение Аюш | Веса и отклонения
У проекта W&B есть показатели производительности модели, как показано ниже.
Изображение автора | каггл-сети
Советы по созданию прочного профиля:
- Присоединяйтесь к другим организациям, занимающимся наукой о данных, и участвуйте в групповых проектах.
- Используйте W&B API для отображения результатов проекта машинного обучения.
- Напишите блог, используя интеграцию показателей W&B.
- Добавьте биографию, изображение профиля, контактную информацию.
- Старайтесь участвовать в обсуждениях сообщества и всегда ищите новый интересный проект.
Заключение
W&B - это подстановочный знак, поскольку он известен экспериментами по ведению журналов, а не портфолио, но внедрение интерактивных блогов дало нам уникальное преимущество в виде демонстрации вашего проекта и создания сильного портфолио.
Если вы новичок, я предлагаю вам начать с Deepnote, так как это бесплатно для команд и дает вам удобные для новичков инструменты, чтобы начать работу. Если вы хотите, чтобы вас заметило сообщество специалистов по науке о данных, попробуйте создать свой профиль на GitHub и Kaggle. Если вы хотите создать свой бренд, начните с блогов или создайте свой веб-сайт.
В конце концов, я хочу, чтобы вы все создали свой профиль на всех платформах, о которых я упоминал выше, поскольку все они обладают уникальными преимуществами, позволяющими произвести впечатление на вашего потенциального работодателя. Я знаю, что вначале это довольно сложно, но как только вы привыкнете к документированию и демонстрации своих проектов, это станет легко.
Bio: Абид Али Аван (@ 1abidaliawan) - сертифицированный специалист по данным, который любит создавать модели машинного обучения и исследовать новейшие технологии искусственного интеллекта. В настоящее время тестируются продукты искусственного интеллекта в PEC-PITC, их работа позже одобряется для испытаний на людях, таких как классификатор рака молочной железы.
Связанный:
Источник: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- Учетная запись
- активный
- плюс
- AI
- ай исследование
- Все
- среди
- анализ
- API
- приложение
- Приложения
- Программы
- гайд
- статьи
- аудитория
- аватар
- значки
- Основы
- ЛУЧШЕЕ
- Блог
- Блоги
- блоги
- Рак молочной железы
- Ошибка
- строить
- Строительство
- рак
- Карьера
- облако
- код
- Кодирование
- совместный
- сообщество
- конкурс
- Соревнования
- способствовало
- Создающий
- любопытство
- Текущий
- данным
- анализ данных
- наука о данных
- ученый данных
- глубокое обучение
- развивать
- Застройщик
- застройщиков
- DID
- экосистема
- Обучение
- работодателей
- Проект и
- Инженеры
- Excel
- Расширьте
- опыт
- эксперимент
- эксперты
- Face
- Особенность
- Особенности
- Поля
- First
- Фокус
- следовать
- Бесплатно
- полный
- Общие
- идти
- GitHub
- Глобальный
- Золото
- хорошо
- группы
- инструкция
- Наем
- Как
- How To
- HTTPS
- огромный
- промышленности
- информация
- инновационный
- рефлексологии
- интеграции.
- интерактивный
- Интервью
- IT
- работа
- Jupyter Notebook
- последний
- УЧИТЬСЯ
- изучение
- Длинное
- любят
- обучение с помощью машины
- Создание
- карта
- Медиа
- средний
- Метрика
- модель
- Самые популярные
- Новая Платформа
- ноутбуки
- предлагают
- онлайн
- открытый
- Возможности
- организации
- Другое
- Люди
- производительность
- картина
- Платформа
- Платформы
- Популярное
- «портфель»
- Продукт
- Продукция
- Профиль
- Проект
- проектов
- что такое варган?
- публикациям
- публиковать
- Издательство
- Питон
- реальный мир
- исследованиям
- Итоги
- условиями,
- Наука
- Ученые
- выскабливание
- Поиск
- Поделиться
- Короткое
- Серебро
- просто
- Сайтов
- навыки
- So
- Соцсети
- социальные сети
- социальные медиа-платформы
- Решения
- Начало
- и политические лидеры
- статистика
- Истории
- поддержка
- технологии
- Технологии
- Тестирование
- Основы
- мир
- время
- Советы
- топ
- учебник
- ui
- us
- пользователей
- Web
- соскоб
- Вебсайт
- КТО
- Работа
- рабочий
- Мир
- письмо
- X
- YouTube