Cách xây dựng danh mục khoa học dữ liệu mạnh mẽ khi mới bắt đầu
Sau khi học những kiến thức cơ bản về khoa học dữ liệu, bạn có thể bắt đầu làm việc với các vấn đề trong thế giới thực. Nhưng làm thế nào để bạn trưng bày tác phẩm của mình? Trong bài viết này, chúng ta sẽ tìm hiểu một cách độc đáo để tạo một danh mục đầu tư khoa học dữ liệu.
By Abid Ali Awan, Nhà khoa học dữ liệu được chứng nhận.
Hình ảnh của Tác giả | Các yếu tố của Véc tơ miễn phí | Minh họa khái niệm thống kê
Là một người mới bắt đầu, tôi đã có nhiều câu hỏi về việc làm thế nào để bắt đầu? Tôi học như thế nào hoặc lấy ý tưởng từ đâu để thực hiện các dự án. Vì vậy, sau một thời gian dài tìm kiếm, tôi đã tìm thấy một dự án về phân tích dữ liệu. Tôi đã mất 3 ngày chỉ để viết mã và tôi rất vui với lần thử đầu tiên của mình, nhưng sau đó có một câu hỏi lớn là làm cách nào để chia sẻ nó với mọi người? Tôi chỉ đơn giản là không có kỹ năng viết mã hoặc tài liệu tốt để giới thiệu tác phẩm của mình, vì vậy tôi đã lưu trữ nó trên đám mây và quên mất nó. Sau một tháng, tôi ngẫu nhiên tìm kiếm các dự án khác trên GitHub và thấy điều này thật tuyệt vời Hồ sơ điều đó đã thúc đẩy tôi tạo danh mục đầu tư của mình. Đó là quyết định tốt nhất mà tôi đưa ra vì nó đưa tôi lên bản đồ của cộng đồng nhà phát triển và ngay sau đó, tôi bắt đầu nhận được email từ những người tuyển dụng và người mới bắt đầu về các dự án của mình.
Co một công việc thường là lý do chính để xây dựng danh mục đầu tư. Đôi khi, điều đó là cần thiết nếu chúng ta không có trình độ học vấn hoặc kinh nghiệm phù hợp (eugeneyan.com). Trong thế giới hiện đại này, các nhà tuyển dụng luôn nghi ngờ về việc tuyển dụng sinh viên mới ra trường, vậy làm thế nào để bạn thuyết phục họ rằng bạn là người tốt nhất cho công việc? Bạn thể hiện kỹ năng của mình bằng cách hiển thị công việc bạn đã làm trong một dự án trước đó. Danh mục đầu tư trực tuyến của bạn càng mạnh, bạn càng có cơ hội được tuyển dụng cho công việc mơ ước của mình.
“Các danh mục đầu tư là cực kỳ quan trọng cần phải có vì khi bạn tham gia phỏng vấn, nó cho thấy kinh nghiệm thực tế của bạn, vì vậy bạn có thể giải thích cho nhà tuyển dụng từ A đến Z toàn bộ quy trình làm việc của khoa học dữ liệu”. - David Yakobovitch.
Động lực khác là tạo ra dự án cá nhân điều đó thỏa mãn sự tò mò của bạn về việc học những điều mới. Khi chúng ta học một kỹ năng mới, chúng ta muốn thử nghiệm và cuối cùng tạo ra một sản phẩm hoạt động có thể được sử dụng trong thế giới thực.
Trong bài viết này, chúng ta sẽ tìm hiểu các cách bạn có thể giới thiệu công việc của mình với tư cách là người mới bắt đầu về khoa học dữ liệu. Bạn sẽ tìm hiểu về một số nền tảng mới giúp cuộc sống của bạn trở nên dễ dàng và các mẹo xây dựng danh mục đầu tư mạnh mẽ.
GitHub
Hãy để tôi xóa bỏ quan niệm sai lầm giữa các nhà khoa học dữ liệu. Đúng, GitHub là cần thiết và tất cả chúng ta nên học git. Là một nhà khoa học dữ liệu, tôi sử dụng Github hàng ngày, nơi tôi tìm kiếm các tập dữ liệu và dự án thú vị. Đây là nền tảng phổ biến nhất trong số các nhà phát triển và thành thật mà nói, nhà tuyển dụng có kiểm tra hồ sơ GitHub của bạn trước khi gọi cho bạn để phỏng vấn.
Hình ảnh của Tác giả | github
GitHub là một nền tảng hợp tác toàn cầu, nơi mọi người chia sẻ và cộng tác trong các dự án. Như bạn có thể thấy trong hồ sơ của tôi bên dưới cách tôi đã đóng góp cho các dự án của người khác và cũng làm việc cho các dự án của riêng tôi.
Hình ảnh của Tác giả | kingabzpro
Mẹo để tạo một hồ sơ chắc chắn:
- Tạo trang hồ sơ của bạn và để có hướng dẫn hoàn chỉnh, hãy xem Sarah Hart's blog.
- Ghi lại mọi dự án bằng các liên kết, ảnh bìa và mô tả chi tiết.
- Fork dự án mà bạn thích nhất và gửi yêu cầu kéo đầu tiên của bạn (freecodecamp.org).
- Hãy hoạt động tích cực trên nền tảng này bằng cách đóng góp, báo cáo lỗi và thúc đẩy các dự án hiện tại của bạn.
Ghi chú sâu
Ghi chú sâu đơn giản hơn nhiều so với GitHub và nó cũng thân thiện với người mới bắt đầu. Nếu bạn quen thuộc với Máy tính xách tay Jupyter thì nó sẽ là một miếng bánh để bạn xuất bản dự án đầu tiên của mình. Trải nghiệm của tôi với Deepnote là hoàn toàn tuyệt vời vì nền tảng cung cấp cho bạn tất cả các phẩm chất của GitHub nhưng đơn giản hơn nhiều và tập trung vào cộng đồng các nhà khoa học dữ liệu.
Hình ảnh của Tác giả | Tiến bộ tiêm chủng ở Pakistan
Gần đây, họ đã giới thiệu một hồ sơ Deepnote sẽ giới thiệu tất cả các sổ ghi chép mà bạn xuất bản cùng với thông tin và ảnh hồ sơ của bạn.
Hình ảnh của Tác giả | Ghi chú sâu
Giống như GitHub, bạn có thể chia sẻ một đoạn mã của mình với nhóm của bạn hoặc công chúng nói chung. Tôi đã sử dụng ô Deepnote trên tất cả các nền tảng Phương tiện xuất bản và mạng xã hội. Bạn có thể kiểm tra trước đây của tôi bài viết để hiểu cách triển khai một ô Deepnote. Sử dụng các đoạn mã có đầu ra cho phép bạn chia sẻ các dự án của mình trên nhiều nền tảng.
Lý do tôi thích ô nhúng Deepnote hơn GitHub Gist là nó đi kèm với đầu ra, không chỉ là đầu ra tĩnh mà còn có các tính năng tương tác.
Bạn có thể sử dụng Plotly và hiển thị biểu đồ của mình trong một bài báo trên Phương tiện:
Mẹo để tạo một hồ sơ chắc chắn:
- Cập nhật tiểu sử, ảnh hồ sơ và thông tin liên hệ của bạn.
- Luôn thêm mô tả chi tiết về dự án của bạn bằng cách sử dụng ô đánh dấu.
- Sử dụng ảnh bìa để làm cho dự án của bạn nổi bật.
- Sử dụng các tính năng của Ứng dụng trong Deepnote để tạo ứng dụng web Tương tác.
- Tiếp tục đăng dự án cũ của bạn hoặc thậm chí đăng lại sổ ghi chép từ GitHub.
DAGsHub
DAGsHub mới đối với thế giới này và nó tạo nên tên tuổi của mình một cách nhanh chóng bằng cách cung cấp giải pháp một cửa cho những người thực hành máy học và kỹ sư dữ liệu. DAGsHub đi kèm với một mở rộng DVC máy chủ, Dòng chảy ML, Trực quan hóa đường ống và Đồng bộ hóa GitHub. Chúng tôi sẽ không đi sâu vào các tính năng mà sẽ tập trung vào các tính năng làm cho nó nổi bật.
DAGsHub cho phép bạn chia sẻ kho lưu trữ GitHub và tạo dự án khoa học dữ liệu của bạn với khả năng trực quan hóa máy học và đường ống dữ liệu. Nó cũng có một tính năng ẩn README.ipynb dưới dạng tệp mô tả dự án của bạn, điều này tốt nhất cho người mới bắt đầu không sử dụng để đánh dấu và các nhà khoa học dữ liệu yêu thích làm việc trên Máy tính xách tay Jupyter. Nó tương tự như GitHub, có nghĩa là bạn cần học cả Git và DVC để sử dụng nền tảng này đúng cách.
Những gì tôi đã thấy những người dùng khác thích thú là khả năng hình dung cấu trúc dự án của họ thông qua đường ống, cũng như khả năng xem dữ liệu và mô hình của họ như một phần không thể thiếu của dự án. Ngoài ra, thực tế là chúng tôi dựa trên các công cụ mã nguồn mở thay vì phát minh lại các giải pháp hiện có là điều mà mọi người thích. - Dean
Hình ảnh của Dean | dagshub
Hồ sơ của tôi còn khá mới, nhưng tôi yêu thích nền tảng này vì chúng cung cấp cho tôi một hệ sinh thái học máy hoàn chỉnh. Tôi nghĩ tôi thích nó hơn GitHub về các tính năng và sự đơn giản của giao diện người dùng.
Hình ảnh của Tác giả | DAGsHub
Mẹo để tạo một hồ sơ chắc chắn:
- Tìm hiểu mở rộng DVC, đivà Dòng chảy ML để tận dụng tối đa.
- Thêm mô tả dự án vào sổ ghi chép của bạn và README.
- Cập nhật hồ sơ của bạn bằng cách thêm tiểu sử, hình đại diện và thông tin liên hệ.
- Cố gắng thêm dvc.yaml và dvc.lock trong dự án của bạn để hiển thị các đường ống dẫn dữ liệu. Để biết thêm thông tin, hãy kiểm tra Xác định đường ống.
- Giữ một hồ sơ hoạt động bằng cách đóng góp cho các dự án nguồn mở và bằng cách thúc đẩy dự án cá nhân của bạn. Bạn có thể dùng FDS cli để làm cho cuộc sống của bạn dễ dàng và tránh những sai lầm.
- Sử dụng đầy đủ DVC bằng cách tải lên dữ liệu và mô hình của bạn trên một máy chủ từ xa. Các nhà tuyển dụng quan tâm đến những ứng viên biết chu trình khoa học dữ liệu hoàn chỉnh từ quá trình nhập dữ liệu đến trang tổng quan.
Kaggle
Nếu bạn muốn được chú ý nhanh hơn trong thế giới khoa học dữ liệu, bạn nên tạo Kaggle tài khoản và bắt đầu đóng góp cho các cuộc thi, tập dữ liệu, sổ ghi chép và các cuộc thảo luận. Khi bạn trở thành một kiện tướng, mọi người tôn trọng bạn và mang đến cho bạn những cơ hội nghề nghiệp tốt hơn. Nếu bạn hỏi tôi, tôi khuyên bạn nên tạo một hồ sơ Kaggle trong khi tìm hiểu những điều cơ bản. Học hỏi từ các chuyên gia và khám phá thị trường ngách của bạn. Tôi rất hâm mộ nền tảng này vì nó cung cấp hỗ trợ cho người mới bắt đầu cạnh tranh và phát triển các giải pháp sáng tạo cho các ngành công nghiệp khác nhau. Nó là xương sống của nghiên cứu AI.
Hình ảnh của Tác giả | Kaggle
Bạn có thể xem hồ sơ của tôi bên dưới, vì ngay từ đầu, tôi đã đóng góp trong nhiều hạng mục khác nhau để đạt được thứ hạng. Hiện tại, tôi là một Chuyên gia, nhưng với một huy chương vàng và bạc trong cuộc thi, tôi sẽ trở thành một Cao thủ, một điều không dễ dàng và thành thật mà nói, tôi tôn trọng các Kiện tướng vì họ đã chứng minh rằng họ là người giỏi nhất trong số các học viên dữ liệu khác.
Hình ảnh của Tác giả | Kaggle
Mẹo để tạo một hồ sơ chắc chắn:
- Hoạt động trên nền tảng bằng cách sử dụng bộ dữ liệu mới và tạo mô hình phân tích dữ liệu hoặc máy học.
- Tham gia thảo luận, học hỏi từ các chuyên gia và yêu cầu sự giúp đỡ.
- Sử dụng tính năng tìm kiếm trên web để xuất bản một tập dữ liệu mới.
- Tham gia hầu hết các cuộc thi để tìm hiểu một số loại vấn đề về máy học và kiếm huy hiệu.
- Tập trung vào việc xuất bản tác phẩm hay nhất của bạn với mô tả chi tiết và mã chất lượng cao.
- Viết về bản thân trong tiểu sử và thêm chi tiết liên hệ.
Blog
Viết blog là bước tiếp theo sau khi tạo dự án của bạn trên các nền tảng trên. Nếu bạn muốn mở rộng đối tượng của mình, tôi thực sự khuyên bạn nên bắt đầu với Trung bình. Viết blog là không cần thiết, nhưng bạn sẽ nhận được nhiều sức hút hơn từ nhiều lĩnh vực khác nhau. Nền tảng Phương tiện cho phép bạn tạo hồ sơ của mình và cho phép bạn xuất bản các bài báo của mình dưới nhiều ấn phẩm khác nhau, chẳng hạn như Hướng tới khoa học dữ liệu và Hướng tới AI. Bạn có thể phát triển trang blog của mình hoặc sử dụng một nền tảng tương tự khác như Phân tích Vidhya.
Hình ảnh của Tác giả | Trung bình
Mẹo để tạo một hồ sơ chắc chắn:
- Viết blog về dự án cá nhân bạn đã làm việc.
- Tạo blog trên một công nghệ mới nổi hoặc trên các ứng dụng khoa học dữ liệu mới.
- Thực hiện nghiên cứu thích hợp trong khi viết blog và thêm trích dẫn để tránh vi phạm quy tắc nền tảng.
- Sử dụng ảnh bìa hấp dẫn cho mọi blog.
- Luôn viết về những gì bạn học được từ kinh nghiệm của mình trong khi phát triển các dự án khoa học dữ liệu.
- Đừng chạy theo xu hướng, và hãy tập trung vào những thứ bạn giỏi.
Trang web danh mục đầu tư
Bạn cũng có thể hiển thị dự án của mình trên một trang web cá nhân và nếu bạn không phải là nhà phát triển web, có một số công cụ đơn giản có sẵn để thực hiện quá trình này khá dễ dàng. Bạn có thể kiểm tra Cách xây dựng trang web danh mục khoa học dữ liệu với các trang Hugo & GitHub và Hugo cho các mẫu khác nhau.
Trang web danh mục đầu tư của tôi có một dự án từ tất cả các nền tảng với các mô tả ngắn và các danh mục phụ. Tôi mất ba ngày để tạo toàn bộ trang web và triển khai nó trên các trang GitHub.
Hình ảnh của Tác giả | danh mục đầu tư
Mẹo để tạo một trang web danh mục đầu tư vững chắc:
- Thêm kỹ năng, tiểu sử và CV của bạn.
- Hiển thị trải nghiệm của bạn và
- Giới thiệu các dự án của bạn với các liên kết đến các dự án GitHub hoặc Deepnote của bạn.
- Làm cho trang web của bạn tối thiểu và tương tác để nhà tuyển dụng có thời gian dễ dàng cuộn qua toàn bộ danh mục đầu tư của bạn.
- Luôn cập nhật trang web danh mục đầu tư của bạn với dự án mới nhất mà bạn đang thực hiện.
Trọng lượng & Thành kiến
Tôi thường sử dụng Trọng lượng & Thành kiến cho thử nghiệm máy học và ghi nhật ký số liệu hiệu suất của các mô hình của tôi, nhưng điều đó đã thay đổi với sự ra đời của hồ sơ W&B. Bạn có thể viết blog về dự án hiện tại của mình bằng cách sử dụng các liên kết được nhúng và tích hợp đồ thị. Nó khá giống với các nền tảng danh mục đầu tư khác mà tôi đã đề cập, nhưng nó đi kèm với lợi ích của việc tích hợp trực tiếp với các thư viện Python.
Sản phẩm Ayush hồ sơ đã gây ấn tượng với tôi nhất vì anh ấy đã đóng góp cho các tổ chức khác trong khi viết blog về máy học.
Hình ảnh của Ayush | Trọng số & Thành kiến
Dự án W & B có các chỉ số đo lường hiệu suất mô hình, như được hiển thị bên dưới.
Hình ảnh của Tác giả | kaggle-seti
Mẹo để tạo một hồ sơ chắc chắn:
- Tham gia các tổ chức khoa học dữ liệu khác và tham gia vào các dự án nhóm.
- Sử dụng W&B API để hiển thị kết quả dự án máy học của bạn.
- Viết blog bằng tích hợp số liệu W & B.
- Thêm tiểu sử, ảnh hồ sơ, thông tin liên hệ.
- Cố gắng tham gia vào cuộc thảo luận của cộng đồng và luôn tìm kiếm một dự án thú vị mới.
Kết luận
W&B là một ký tự đại diện vì nó nổi tiếng với các thử nghiệm ghi nhật ký chứ không phải cho danh mục đầu tư, nhưng sự ra đời của các blog tương tác đã mang lại cho chúng tôi lợi thế duy nhất là hiển thị dự án của bạn và tạo ra một danh mục đầu tư mạnh mẽ.
Nếu bạn là người mới bắt đầu, tôi sẽ khuyên bạn nên bắt đầu với Deepnote, vì nó miễn phí cho các nhóm và cung cấp các công cụ thân thiện với người mới bắt đầu của bạn để bắt đầu. Nếu bạn đang muốn được cộng đồng khoa học dữ liệu chú ý, hãy thử tạo hồ sơ của bạn trên GitHub và Kaggle. Nếu bạn muốn tạo thương hiệu của mình, thì hãy bắt đầu với các trang blog hoặc tạo trang web của bạn.
Cuối cùng, tôi muốn tất cả các bạn tạo hồ sơ của mình trên tất cả các nền tảng mà tôi đã đề cập ở trên, vì chúng đều có những lợi thế riêng trong việc gây ấn tượng với nhà tuyển dụng tiềm năng của bạn. Tôi biết nó khá choáng ngợp khi bắt đầu, nhưng một khi bạn đã quen với việc ghi chép và giới thiệu các dự án của mình, mọi việc sẽ trở nên dễ dàng.
Tiểu sử: Abid Ali Awan (@ 1abidaliawan) là một nhà khoa học dữ liệu chuyên nghiệp được chứng nhận, người yêu thích việc xây dựng các mô hình học máy và nghiên cứu về các công nghệ AI mới nhất. Hiện đang thử nghiệm các Sản phẩm AI tại PEC-PITC, công việc của họ sau đó được chấp thuận để thử nghiệm trên người, chẳng hạn như Máy phân loại ung thư vú.
Liên quan:
Nguồn: https://www.kdnuggets.com/2021/10/strong-data-science-portfolio-as-beginner.html
- "
- &
- Tài khoản
- hoạt động
- Lợi thế
- AI
- ai nghiên cứu
- Tất cả
- trong số
- phân tích
- api
- ứng dụng
- các ứng dụng
- ứng dụng
- bài viết
- bài viết
- khán giả
- hình đại diện
- phù hiệu
- Khái niệm cơ bản
- BEST
- Blog
- Blogging
- blog
- Ung thư vú
- Bug
- xây dựng
- Xây dựng
- Ung thư
- Tuyển Dụng
- đám mây
- mã
- Lập trình
- hợp tác
- cộng đồng
- cạnh tranh
- Cuộc thi
- đóng góp
- Tạo
- sự tò mò
- Current
- dữ liệu
- phân tích dữ liệu
- khoa học dữ liệu
- nhà khoa học dữ liệu
- học kĩ càng
- phát triển
- Nhà phát triển
- phát triển
- ĐÃ LÀM
- hệ sinh thái
- Đào tạo
- sử dụng lao động
- Kỹ Sư
- Kỹ sư
- Excel
- Mở rộng
- kinh nghiệm
- thử nghiệm
- các chuyên gia
- Đối mặt
- Đặc tính
- Tính năng
- Lĩnh vực
- Tên
- Tập trung
- theo
- Miễn phí
- Full
- Tổng Quát
- đi
- GitHub
- Toàn cầu
- Gói Vàng
- tốt
- Nhóm
- hướng dẫn
- Thuê
- Độ đáng tin của
- Hướng dẫn
- HTTPS
- lớn
- các ngành công nghiệp
- thông tin
- sáng tạo
- thiếu
- hội nhập
- tương tác
- Phỏng vấn
- IT
- Việc làm
- Máy tính xách tay Jupyter
- mới nhất
- LEARN
- học tập
- dài
- yêu
- học máy
- Làm
- bản đồ
- Phương tiện truyền thông
- trung bình
- Metrics
- kiểu mẫu
- Phổ biến nhất
- Nền tảng mới
- máy tính xách tay
- cung cấp
- Trực tuyến
- mở
- Cơ hội
- tổ chức
- Nền tảng khác
- người
- hiệu suất
- hình ảnh
- nền tảng
- Nền tảng
- Phổ biến
- danh mục đầu tư
- Sản phẩm
- Sản phẩm
- Hồ sơ
- dự án
- dự án
- công khai
- ấn phẩm
- xuất bản
- Xuất bản
- Python
- thế giới thực
- nghiên cứu
- Kết quả
- quy tắc
- Khoa học
- các nhà khoa học
- cào
- Tìm kiếm
- Chia sẻ
- ngắn
- Gói Bạc
- Đơn giản
- Các trang web
- kỹ năng
- So
- Mạng xã hội
- truyền thông xã hội
- phương tiện truyền thông xã hội nền tảng
- Giải pháp
- Bắt đầu
- bắt đầu
- số liệu thống kê
- Những câu chuyện
- hỗ trợ
- Công nghệ
- Công nghệ
- Kiểm tra
- Khái niệm cơ bản
- thế giới
- thời gian
- lời khuyên
- hàng đầu
- hướng dẫn
- ui
- us
- Người sử dụng
- web
- rút trích nội dung trang web
- Website
- CHÚNG TÔI LÀ
- Công việc
- quy trình làm việc
- thế giới
- viết
- X
- youtube