초보자로서 강력한 데이터 과학 포트폴리오를 구축하는 방법
데이터 과학의 기초를 배운 후에는 실제 문제에 대한 작업을 시작할 수 있습니다. 하지만 어떻게 작품을 선보일 수 있습니까? 이 기사에서 우리는 데이터 과학 포트폴리오를 만드는 독특한 방법을 배울 것입니다.
By 아비드 알리 아완, 공인 데이터 과학자.
작성자의 이미지 | 요소 기준 무료 벡터 | 통계 개념 그림
초보자로서 어떻게 시작해야 하는지에 대해 많은 질문을 받았습니다. 어떻게 배우거나 프로젝트 작업을 위한 아이디어를 어디서 얻습니까? 그래서 오랜 검색 끝에 데이터 분석에 관한 프로젝트를 찾았습니다. 코드를 작성하는 데만 3일이 걸렸고 첫 번째 시도에는 만족했지만 그 다음에는 코드를 어떻게 세계와 공유할 수 있을까에 대한 큰 질문이 있었습니다. 단순히 내 작업을 보여줄 좋은 코딩 기술이나 문서화 기술이 없었기 때문에 클라우드에 저장하고 잊어 버렸습니다. 한 달 후, GitHub에서 무작위로 더 많은 프로젝트를 찾고 있었고 이것이 놀라운 것을 발견했습니다. 윤곽 포트폴리오를 만들게 된 동기입니다. 그것이 내가 개발자 커뮤니티의 지도에 오르게 한 최고의 결정이었고, 얼마 지나지 않아 채용 담당자와 초보자로부터 내 프로젝트에 대한 이메일을 받기 시작했습니다.
취업 일반적으로 포트폴리오를 구축하는 주요 이유입니다. 관련 교육이나 경험이 없는 경우(eugeneyan.com). 이 현대 사회에서 고용주는 새로운 졸업생을 고용하는 것에 대해 회의적입니다. 그렇다면 귀하가 해당 직무에 가장 적합하다고 어떻게 확신시킬 수 있습니까? 이전 프로젝트에서 수행한 작업을 표시하여 기술을 표시합니다. 온라인 포트폴리오가 강력할수록 꿈의 직업에 고용될 가능성이 높아집니다.
"포트폴리오는 인터뷰할 때 실제 경험을 보여주므로 고용주에게 전체 데이터 과학 워크플로를 A부터 Z까지 설명할 수 있기 때문에 매우 중요합니다." — 데이비드 야코 보비치.
또 다른 동기는 개인 프로젝트 새로운 것을 배우는 것에 대한 당신의 호기심을 충족시켜줍니다. 우리가 새로운 기술을 배울 때 우리는 실험하고 궁극적으로 실제 세계에서 사용할 수 있는 작동하는 제품을 만들고 싶어합니다.
이 기사에서는 데이터 과학 초보자로서 작업을 선보일 수 있는 방법을 배웁니다. 당신은 당신의 삶을 쉽게 만들어주는 새로운 플랫폼과 강력한 포트폴리오를 구축하는 방법에 대해 배우게 될 것입니다.
GitHub의
데이터 과학자들 사이의 오해를 풀어 보겠습니다. 예, GitHub의 필요하며 우리 모두는 배워야 합니다 자식. 데이터 과학자로서 저는 매일 Github을 사용하여 흥미로운 데이터 세트와 프로젝트를 찾습니다. 이것은 개발자들 사이에서 가장 인기 있는 플랫폼이며, 솔직히 말하면 채용 담당자는 인터뷰를 요청하기 전에 GitHub 프로필을 확인합니다.
작성자의 이미지 | github
GitHub는 사람들이 프로젝트를 공유하고 협업하는 글로벌 협업 플랫폼입니다. 아래 내 프로필에서 볼 수 있듯이 내가 다른 사람들의 프로젝트에 어떻게 기여했으며 내 프로젝트에도 참여했습니다.
작성자의 이미지 | 킹가브즈프로
솔리드 프로파일 생성을 위한 팁:
- 프로필 페이지를 만들고 전체 자습서를 보려면 다음을 확인하십시오. 사라 하트 블로그.
- 링크, 표지 이미지 및 자세한 설명으로 모든 프로젝트를 문서화하십시오.
- 가장 마음에 드는 프로젝트를 포크하고 첫 번째 풀 리퀘스트(freecodecamp.org).
- 기여하고 버그를 보고하고 현재 프로젝트를 푸시하여 이 플랫폼에서 활발하게 활동하십시오.
딥노트
딥노트 GitHub보다 훨씬 간단하고 초보자에게도 친숙합니다. 당신이 익숙한 경우 주피터 노트 그러면 첫 번째 프로젝트를 게시할 수 있습니다. 플랫폼이 GitHub의 모든 품질을 제공하지만 훨씬 간단하고 데이터 과학자 커뮤니티에 집중하기 때문에 Deepnote에 대한 제 경험은 절대적으로 놀랍습니다.
작성자의 이미지 | 파키스탄 예방 접종 진행 상황
최근에 그들은 귀하가 귀하의 정보 및 프로필 사진과 함께 게시하는 모든 노트북을 보여줄 Deepnote 프로필을 도입했습니다.
작성자의 이미지 | 딥노트
처럼 GitHub 요지, 팀 또는 일반 대중과 코드 스니펫을 공유할 수 있습니다. 저는 모든 Medium Publication 및 소셜 미디어 플랫폼에서 Deepnote 셀을 사용했습니다. 내 이전을 확인할 수 있습니다 기사 Deepnote 셀을 구현하는 방법을 이해합니다. 출력과 함께 코드 조각을 사용하면 여러 플랫폼에서 프로젝트를 공유할 수 있습니다.
내가 GitHub Gist보다 Deepnote 임베디드 셀을 선호하는 이유는 정적 출력뿐만 아니라 대화형 기능도 함께 제공되기 때문입니다.
Plotly를 사용하여 Medium 기사에 차트를 표시할 수 있습니다.
솔리드 프로파일 생성을 위한 팁:
- 약력, 프로필 사진, 연락처를 업데이트하세요.
- 항상 마크다운 셀을 사용하여 프로젝트에 대한 자세한 설명을 추가하세요.
- 표지 사진을 사용하여 프로젝트를 돋보이게 만드십시오.
- Deepnote의 앱 기능을 사용하여 대화형 웹앱을 만듭니다.
- 이전 프로젝트를 계속 게시하거나 GitHub에서 노트북을 다시 게시하세요.
DAG 허브
DAG 허브 는 이 세상에 처음 등장했으며 기계 학습 실무자와 데이터 엔지니어를 위한 원스톱 솔루션을 제공하여 빠르게 이름을 알리고 있습니다. DAGsHub는 DVC 섬기는 사람, ML플로우, 파이프라인 시각화 및 GitHub 동기화. 우리는 기능에 대해 깊이 들어가지 않고 눈에 띄게 만드는 기능에 초점을 맞출 것입니다.
DAGsHub를 사용하면 GitHub 리포지토리를 공유하고 기계 학습 및 데이터 파이프라인을 시각화하는 기능으로 데이터 과학 프로젝트를 생성할 수 있습니다. 또한 프로젝트 설명 파일로 숨겨진 기능인 README.ipynb가 있습니다. 이는 마크다운에 익숙하지 않은 초보자와 Jupyter Notebook 작업을 좋아하는 데이터 과학자에게 가장 적합합니다. GitHub와 유사하므로 이 플랫폼을 올바르게 사용하려면 Git과 DVC를 모두 배워야 합니다.
다른 사용자들이 좋아하는 것은 파이프라인을 통해 프로젝트 구조를 시각화할 수 있는 기능과 자신의 데이터와 모델을 프로젝트의 필수적인 부분으로 볼 수 있는 기능입니다. 또한 우리가 기존 솔루션을 재창조하는 대신 오픈 소스 도구를 기반으로 한다는 사실이 사람들이 좋아하는 것입니다. — 학장
딘의 이미지 | 닥스허브
내 프로필은 아주 새롭지만 완전한 기계 학습 생태계를 제공하는 이 플랫폼이 마음에 듭니다. 기능과 UI 단순성 측면에서 GitHub보다 더 선호한다고 생각합니다.
작성자의 이미지 | DAG 허브
솔리드 프로파일 생성을 위한 팁:
- 자료실 DVC, 힘내및 ML플로우 최대한 활용합니다.
- 노트북과 README에 프로젝트 설명을 추가합니다.
- 약력, 아바타 및 연락처 정보를 추가하여 프로필을 업데이트하세요.
- 추가하려고 dvc.yaml 및 dvc.잠금 프로젝트에서 데이터 파이프라인을 표시합니다. 자세한 내용은 다음을 확인하세요. 파이프라인 정의.
- 오픈 소스 프로젝트에 기여하고 개인 프로젝트를 추진하여 활성 프로필을 유지하십시오. 당신이 사용할 수있는 FDS 당신의 인생을 쉽게 만들고 실수를 피하기 위해 cli.
- 원격 서버에 데이터와 모델을 업로드하여 DVC를 최대한 활용합니다. 채용 담당자는 데이터 수집에서 대시보드에 이르는 전체 데이터 과학 주기를 알고 있는 후보자에 관심이 있습니다.
카글
데이터 과학의 세계에서 더 빨리 주목받고 싶다면 카글 계정을 만들고 대회, 데이터 세트, 노트북 및 토론에 기여하기 시작합니다. 당신이 그랜드마스터가 되면 사람들은 당신을 존경하고 더 나은 경력 기회를 제공합니다. 나에게 묻는다면 기본을 배우면서 Kaggle 프로필을 만드는 것이 좋습니다. 전문가로부터 배우고 틈새 시장을 찾으십시오. 저는 초보자가 다양한 산업 분야에서 경쟁하고 혁신적인 솔루션을 개발할 수 있도록 지원하기 때문에 이 플랫폼의 열렬한 팬입니다. AI 연구의 근간입니다.
작성자의 이미지 | 카글
아래에서 내 프로필을 확인하실 수 있습니다. 저는 처음부터 순위를 얻기 위해 다양한 범주에서 기여해 왔습니다. 현재는 Expert지만 이번 대회에서 금, 은메달 XNUMX개로 마스터가 되는 것은 쉽지 않은 일이고, 다른 데이터 종사자들 중에서 최고임을 증명한 그랜드마스터들을 솔직히 존경합니다.
작성자의 이미지 | 카글
솔리드 프로파일 생성을 위한 팁:
- 새로운 데이터 세트를 사용하고 데이터 분석 또는 기계 학습 모델을 생성하여 플랫폼에서 활동하십시오.
- 토론에 참여하고 전문가에게 배우고 도움을 요청하십시오.
- 웹 스크래핑을 사용하여 새 데이터세트를 게시합니다.
- 대부분의 대회에 참가하여 여러 유형의 기계 학습 문제를 배우고 배지를 획득하세요.
- 자세한 설명과 고품질 코드로 최고의 작품을 게시하는 데 집중하세요.
- 자기소개서를 작성하고 연락처를 추가하세요.
블로그
블로그 작성은 위의 플랫폼에서 프로젝트를 만든 후의 다음 단계입니다. 잠재고객을 확장하려면 다음으로 시작하는 것이 좋습니다. 중급. 블로그 작성은 필수는 아니지만 다양한 분야에서 더 많은 관심을 받고 있습니다. Medium 플랫폼을 사용하면 프로필을 만들고 다음과 같은 다양한 출판물에 기사를 게시할 수 있습니다. 데이터 과학을 향해 및 AI를 향하여. 블로그 사이트를 개발하거나 다음과 같은 다른 유사한 플랫폼을 사용할 수 있습니다. 분석 Vidhya.
작성자의 이미지 | 중급
솔리드 프로파일 생성을 위한 팁:
- 개인적으로 작업한 프로젝트에 대한 블로그를 작성하십시오.
- 새로운 기술 또는 새로운 데이터 과학 응용 프로그램에 대한 블로그를 만드십시오.
- 블로그를 작성하는 동안 적절한 조사를 수행하고 플랫폼 규칙 위반을 피하기 위해 인용을 추가하십시오.
- 모든 블로그에 매력적인 표지 사진을 사용하십시오.
- 항상 데이터 과학 프로젝트를 개발하는 동안 경험에서 배운 내용을 작성하십시오.
- 유행을 따르지 말고 잘하는 일에 집중하세요.
포트폴리오 웹 사이트
개인 웹사이트에 프로젝트를 표시할 수도 있으며 웹 개발자가 아닌 경우 프로세스를 매우 쉽게 만들 수 있는 몇 가지 간단한 도구가 있습니다. 당신은 체크 아웃 할 수 있습니다 Hugo 및 GitHub 페이지로 데이터 과학 포트폴리오 웹사이트를 구축하는 방법 및 휴고 다양한 템플릿용.
내 포트폴리오 웹사이트에는 짧은 설명과 하위 카테고리가 있는 모든 플랫폼의 프로젝트가 있습니다. 전체 웹 사이트를 만들고 GitHub 페이지에 배포하는 데 XNUMX일이 걸렸습니다.
작성자의 이미지 | 포트폴리오
견고한 포트폴리오 웹사이트를 만들기 위한 팁:
- 기술, 약력 및 이력서를 추가하십시오.
- 당신의 경험과
- GitHub 또는 Deepnote 프로젝트에 대한 링크를 사용하여 프로젝트를 선보입니다.
- 채용 담당자가 전체 포트폴리오를 쉽게 스크롤할 수 있도록 웹 사이트를 최소화하고 대화형으로 만드십시오.
- 작업 중인 최신 프로젝트로 포트폴리오 웹사이트를 최신 상태로 유지하십시오.
가중치 및 편향
나는 보통 사용한다. 가중치 및 편향 내 모델의 기계 학습 실험 및 로깅 성능 메트릭에 대한 것이지만 W&B 프로필의 도입으로 변경되었습니다. 포함된 링크 및 그래프 통합을 사용하여 현재 프로젝트에 대한 블로그를 작성할 수 있습니다. 내가 언급한 다른 포트폴리오 플랫폼과 매우 유사하지만 Python 라이브러리와 직접 통합할 수 있는 특혜가 있습니다.
XNUMXD덴탈의 Ayush 프로필은 기계 학습에 대한 블로그를 작성하면서 다른 조직에 기여했기 때문에 가장 인상 깊었습니다.
Ayush의 이미지 | 가중치 및 편향
W&B 프로젝트에는 아래와 같이 모델 성능 메트릭이 있습니다.
작성자의 이미지 | 캐글세티
솔리드 프로파일 생성을 위한 팁:
- 다른 데이터 과학 조직에 가입하고 그룹 프로젝트에 참여하십시오.
- W&B API를 사용하여 기계 학습 프로젝트 결과를 표시합니다.
- W&B 메트릭 통합을 사용하여 블로그를 작성하십시오.
- 약력, 프로필 사진, 연락처 정보를 추가합니다.
- 커뮤니티 토론에 참여하고 항상 새롭고 흥미로운 프로젝트를 찾으십시오.
결론
W&B는 포트폴리오가 아닌 로깅 실험으로 유명하기 때문에 와일드카드이지만 인터랙티브한 블로그의 도입으로 프로젝트를 표시하고 강력한 포트폴리오를 만들 수 있는 고유한 이점이 있습니다.
초보자인 경우 Deepnote로 시작하는 것이 좋습니다. 팀은 무료로 시작할 수 있고 초보자에게 친숙한 도구를 제공하기 때문입니다. 데이터 과학 커뮤니티의 주목을 받고 싶다면 GitHub 및 Kaggle에서 프로필을 만들어 보세요. 브랜드를 만들고 싶다면 블로그 사이트로 시작하거나 웹사이트를 만드십시오.
결국, 저는 여러분 모두가 제가 위에서 언급한 모든 플랫폼에서 귀하의 프로필을 작성하기를 바랍니다. 모두 잠재적인 고용주에게 깊은 인상을 주는 데 고유한 이점이 있기 때문입니다. 처음에는 상당히 압도적이라는 것을 압니다. 하지만 일단 문서화하고 프로젝트를 보여주는 데 익숙해지면 쉬워질 것입니다.
바이오 : 아비드 알리 아완 (@1abidaliawan)은 머신 러닝 모델 구축과 최신 AI 기술 연구를 좋아하는 공인 데이터 과학자 전문가입니다. 현재 PEC-PITC에서 AI 제품을 테스트하고 있으며, 나중에 유방암 분류기와 같은 인간 실험용으로 승인됩니다.
관련 :
지난 30 일 동안의 주요 기사 | |||||
---|---|---|---|---|---|
|
|
출처: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- 계정
- 활동적인
- 이점
- AI
- 인공 지능 연구
- All
- 중
- 분석
- API를
- 앱
- 어플리케이션
- 앱
- 기사
- 기사
- 청중
- 화신
- 배지
- 기초
- BEST
- 블로그
- 블로깅
- 블로그
- 유방암
- 곤충
- 빌드
- 건물
- 게자리
- 채용
- 클라우드
- 암호
- 코딩
- 협력
- 커뮤니티
- 경쟁
- 경기
- 기여
- 만들기
- 호기심
- Current
- 데이터
- 데이터 분석
- 데이터 과학
- 데이터 과학자
- 깊은 학습
- 개발
- 개발자
- 개발자
- DID
- 생태계
- 교육
- 고용주
- 엔지니어링
- 엔지니어
- 뛰어나다
- 펼치기
- 경험
- 실험
- 전문가
- 페이스메이크업
- 특색
- 특징
- Fields
- 먼저,
- 초점
- 따라
- 무료
- 가득 찬
- 일반
- 힘내
- GitHub의
- 글로벌
- 덴탈
- 좋은
- 그룹
- 안내
- 채용
- 방법
- How To
- HTTPS
- 거대한
- 산업
- 정보
- 혁신적인
- 완전한
- 완성
- 대화형
- 인터뷰
- IT
- 일
- 주피터 수첩
- 최근
- 배우다
- 배우기
- 링크드인
- 긴
- 애정
- 기계 학습
- 유튜브 영상을 만드는 것은
- 지도
- 미디어
- 매질
- 통계
- 모델
- 가장 인기 많은
- 새로운 플랫폼
- 노트북
- 제공
- 온라인
- 열 수
- 기회
- 조직
- 기타
- 사람들
- 성능
- .
- 플랫폼
- 플랫폼
- 인기 문서
- 유가 증권
- 프로덕트
- 제품
- 프로필
- 프로젝트
- 프로젝트
- 공개
- 출판물
- 게시
- 출판
- Python
- 현실 세계
- 연구
- 결과
- 규칙
- 과학
- 과학자
- 스크 레이 핑
- 검색
- 공유
- 짧은
- 은
- 단순, 간단, 편리
- 사이트
- 기술
- So
- 사회적
- 소셜 미디어
- 소셜 미디어 플랫폼
- 솔루션
- 스타트
- 시작
- 통계
- 이야기
- SUPPORT
- 기술
- Technology
- 지원
- 기초
- 세계
- 시간
- 도움말
- 상단
- 지도 시간
- ui
- us
- 사용자
- 웹
- 웹 스크래핑
- 웹 사이트
- 누구
- 작업
- 워크플로우
- 세계
- 쓰기
- X
- 유튜브