Hãy đọc phần này trước khi chuyển nghề sang khoa học dữ liệu - KDnuggets

Hãy đọc phần này trước khi chuyển nghề sang khoa học dữ liệu – KDnuggets

Nút nguồn: 3078033

Hãy đọc phần này trước khi chuyển nghề sang khoa học dữ liệu
Hình ảnh của Tác giả
 

Bạn đang đọc bài này vì bạn đang nghĩ đến việc gia nhập hàng ngũ các nhà khoa học dữ liệu đầy tham vọng. Và ai có thể đổ lỗi cho bạn? Khoa học dữ liệu là một lĩnh vực đang phát triển, thậm chí một thập kỷ sau khi được Harvard Business Review vinh danh là “công việc quyến rũ nhất” khét tiếng hiện nay. Cục Thống kê Lao động Hoa Kỳ hiện dự đoán tỷ lệ việc làm cho các nhà khoa học dữ liệu sẽ tăng 35% từ năm 2022 đến năm 2032. So sánh con số đó với tốc độ tăng trưởng việc làm trung bình chỉ là 5%.

Nó có những thứ khác dành cho nó:

  • Nó được trả lương cao (một lần nữa, BLS tìm thấy mức lương trung bình là $103k vào năm 2022)
  • Nó đi kèm với chất lượng cuộc sống cao (mức độ hạnh phúc liên quan đến công việc cao hơn mức trung bình). theo tới Nhà thám hiểm nghề nghiệp)
  • Có sự đảm bảo về công việc mặc dù đợt điều tra gần đây sa thải – bởi vì có rất nhiều nhu cầu cho vai trò này

Vì thế có rất nhiều lý do để muốn lấn sân sang lĩnh vực này.

 

Hãy đọc phần này trước khi chuyển nghề sang khoa học dữ liệu
Nguồn: https://www.bls.gov/ooh/math/data-scientists.html
 

Nhưng khoa học dữ liệu là một lĩnh vực rất rộng, với nhiều chức danh công việc và bộ kỹ năng khác nhau mà bạn cần biết trước khi bắt đầu. Bài viết này sẽ hướng dẫn bạn các hướng khác nhau mà bạn có thể đi và những điều bạn cần biết đối với từng hướng để tiếp cận khoa học dữ liệu.

Để thực hiện thành công quá trình chuyển đổi sang sự nghiệp khoa học dữ liệu, bạn sẽ cần phải thực hiện theo cách tiếp cận có cấu trúc:

  • Đánh giá của bạn kỹ năng khoa học dữ liệu và xác định những khoảng trống.
  • Có được kinh nghiệm thực tế ở những lĩnh vực mà bạn còn yếu.
  • Mạng. Tham gia các nhóm khoa học dữ liệu, tham dự các buổi gặp mặt và đóng góp cho các diễn đàn.

Hãy đi sâu hơn.

Đánh giá vị trí bắt đầu của bạn

Bạn đã biết gì và làm thế nào để áp dụng nó vào khoa học dữ liệu? Hãy suy nghĩ về: bất kỳ kiến ​​thức lập trình, kỹ năng thống kê hoặc kinh nghiệm phân tích dữ liệu nào bạn có.

Tiếp theo, xác định những lỗ hổng trong kỹ năng của bạn, đặc biệt là những lỗ hổng cần thiết cho khoa học dữ liệu. SQL là điều thực sự cần thiết, nhưng lập trình Python hoặc R, thống kê nâng cao, học máy và trực quan hóa dữ liệu cũng cực kỳ có lợi.

Khi bạn đã xác định được những khoảng trống này, hãy tìm kiếm sự giáo dục hoặc đào tạo phù hợp để lấp đầy chúng. Điều này có thể thông qua các khóa học trực tuyến, chương trình đại học, chương trình đào tạo hoặc tự học, tập trung vào học tập thực hành, thực hành.

Kinh nghiệm thực hành

Bạn không nên chỉ xem video và đọc bài viết trên blog. Kinh nghiệm thực hành là rất quan trọng trong khoa học dữ liệu. Tham gia vào các dự án cho phép bạn áp dụng các kỹ năng mới của mình vào các tình huống thực tế. Đây có thể là các dự án cá nhân, đóng góp cho nền tảng nguồn mở hoặc tham gia vào các cuộc thi dữ liệu như cuộc thi trên Kaggle.

Nếu bạn có một số kỹ năng khởi đầu cơ bản, bạn có thể cân nhắc tìm kiếm cơ hội thực tập hoặc làm việc tự do để tích lũy kinh nghiệm trong ngành.

Quan trọng nhất, ghi lại tất cả các dự án và kinh nghiệm của bạn trong một danh mục đầu tư, nêu bật quá trình giải quyết vấn đề của bạn, các kỹ thuật bạn đã sử dụng và tác động của công việc của bạn.

mạng

Việc đột nhập vào khoa học dữ liệu thường phụ thuộc vào những người bạn biết, ngoài những gì bạn biết. Tìm người cố vấn, tham gia các cuộc gặp gỡ, hội nghị và hội thảo để tìm hiểu về các xu hướng mới và tham gia vào các cộng đồng khoa học dữ liệu trực tuyến như Stack Overflow, GitHub hoặc Reddit. Những nền tảng này cho phép bạn học hỏi từ người khác, chia sẻ kiến ​​thức của mình và được chú ý trong cộng đồng khoa học dữ liệu.

Nếu bạn là trở thành nhà khoa học dữ liệu từ đầu, thật hợp lý khi nghĩ đến những kỹ năng bạn sẽ cần để phát triển với tư cách là một cái cây. Có những kỹ năng “thân cây” phổ biến cho mọi công việc khoa học dữ liệu và sau đó mỗi chuyên ngành lại có các kỹ năng “phân nhánh” tiếp tục phân nhánh thành các vai trò ngày càng chuyên biệt hơn.

Có ba kỹ năng chính mà mọi nhà khoa học dữ liệu đều cần, bất kể họ đi theo hướng nào:

Thao tác / Sắp xếp dữ liệu bằng SQL

Khoa học dữ liệu về cơ bản tập trung vào việc xử lý và tổ chức các bộ dữ liệu lớn. Để làm được điều đó, bạn cần biết SQL. Nó là các công cụ cần thiết để thao tác và sắp xếp dữ liệu.

 

Hãy đọc phần này trước khi chuyển nghề sang khoa học dữ liệu
Hình ảnh của Tác giả

Các kĩ năng mềm

Khoa học dữ liệu không xảy ra trong chân không. Bạn cần phải cư xử tử tế với người khác, điều đó có nghĩa là bạn phải nâng cao các kỹ năng mềm của mình. Có thể truyền đạt các phát hiện dữ liệu phức tạp một cách rõ ràng và dễ hiểu cho các bên liên quan phi kỹ thuật cũng quan trọng như kỹ năng kỹ thuật. Chúng bao gồm giao tiếp hiệu quả, giải quyết vấn đề và sự nhạy bén trong kinh doanh.

Giải quyết vấn đề giúp giải quyết các thách thức dữ liệu phức tạp, trong khi sự nhạy bén trong kinh doanh đảm bảo rằng các giải pháp dựa trên dữ liệu phù hợp với mục tiêu của tổ chức.

Thái độ học tập không ngừng

Khoa học dữ liệu đã khác so với cách đây 2018 năm. Chỉ cần nhìn vào vị thế của chúng ta ngày nay với AI so với năm XNUMX. Có những công cụ, kỹ thuật và lý thuyết mới liên tục xuất hiện. Đó là lý do tại sao bạn cần có tư duy học hỏi liên tục để cập nhật những phát triển mới nhất và thích ứng với các công nghệ và phương pháp mới trong lĩnh vực này.

Bạn sẽ cần có động lực để học hỏi và thích nghi, cũng như cách tiếp cận chủ động để tiếp thu kiến ​​thức và kỹ năng mới.

Mặc dù có những kỹ năng chung như tôi đã nêu ở trên, nhưng mỗi vai trò đều yêu cầu bộ kỹ năng cụ thể của riêng mình. (Bạn có nhớ không? Các nhánh.) Ví dụ: phân tích thống kê, kỹ năng lập trình bằng Python/R và trực quan hóa dữ liệu đều dành riêng cho các công việc chuyên môn hơn trong khoa học dữ liệu.

 

Hãy đọc phần này trước khi chuyển nghề sang khoa học dữ liệu
Hình ảnh của Tác giả
 

Hãy chia nhỏ từng vai trò liên quan đến khoa học dữ liệu để bạn có thể thấy những gì mình cần.

Nhà phân tích kinh doanh/dữ liệu

Vâng, đây là vai trò của khoa học dữ liệu! Ngay cả khi những người phản đối không đồng ý, tôi vẫn tin rằng ít nhất bạn có thể coi đó như một bước đệm nếu bạn đang có mục tiêu bước vào con đường sự nghiệp khoa học dữ liệu.

Với tư cách là nhà phân tích dữ liệu hoặc doanh nghiệp, bạn chịu trách nhiệm thu hẹp khoảng cách giữa hiểu biết về dữ liệu và chiến lược kinh doanh. Nó hoàn hảo cho những người có khả năng hiểu nhu cầu kinh doanh và chuyển chúng thành các giải pháp dựa trên dữ liệu.

Là những kỹ năng cốt lõi, bạn sẽ cần trí tuệ kinh doanh – không có gì ngạc nhiên –, kỹ năng phân tích mạnh mẽ, thành thạo các ngôn ngữ truy vấn dữ liệu, chủ yếu là SQL. Trong vai trò này, Python và R là tùy chọn vì nhiệm vụ chính là sắp xếp dữ liệu.

Có một thành phần trực quan nhưng tùy thuộc vào công việc của bạn, điều đó có thể có nghĩa là tạo bảng thông tin trong Tableau hoặc biểu đồ trong Excel.

Phân tích dữ liệu

Vai trò này tập trung vào việc diễn giải dữ liệu để cung cấp những hiểu biết sâu sắc có thể hành động. Đó là một công việc tuyệt vời cho bạn nếu bạn thích chuyển các con số thành những câu chuyện và chiến lược kinh doanh.

Bạn sẽ cần xử lý chắc chắn phân tích thống kê và trực quan hóa dữ liệu – mặc dù một lần nữa, đây có thể là bảng điều khiển hoạt cảnh và/hoặc biểu đồ Excel). Bạn cũng sẽ cần phải thành thạo trong công cụ phân tích Lượt thích Excel, Tableau và SQL. Python/R một lần nữa là tùy chọn, nhưng hãy nhớ rằng chúng thực sự có thể giúp triển khai thống kê và tự động hóa.

Machine Learning

Các nhà khoa học của Machine Learning phát triển các mô hình và thuật toán dự đoán để đưa ra dự đoán hoặc quyết định dựa trên dữ liệu. Những vai trò này phù hợp với những người có niềm yêu thích sâu sắc với AI và xây dựng mô hình.

Không có gì ngạc nhiên về các kỹ năng cốt lõi: bạn sẽ cần một hiểu biết sâu sắc về các thuật toán, kinh nghiệm với các khung máy học như TensorFlow và PyTorch cũng như kỹ năng lập trình vững vàng. Python và/hoặc R không còn là tùy chọn nữa mà là thứ bắt buộc phải có.

Kỹ thuật dữ liệu

Vai trò này yêu cầu bạn tập trung vào kiến ​​trúc, quản lý và bảo trì đường ống dữ liệu. Nó phù hợp với những cá nhân thích những thách thức kỹ thuật trong việc quản lý và tối ưu hóa luồng và lưu trữ dữ liệu.

Để làm được công việc này, bạn sẽ cần ecó chuyên môn về quản lý cơ sở dữ liệu, quy trình ETL và thành thạo các công nghệ dữ liệu lớn như Hadoop và Spark. Bạn cũng sẽ cần thành thạo tự động hóa đường ống dữ liệu sử dụng các công nghệ như Airflow.

Kinh doanh thông minh

Trong kinh doanh thông minh, tất cả đều xoay quanh việc xây dựng hình ảnh trực quan. Thật tuyệt vời cho những người kể chuyện và những người có ý thức kinh doanh mạnh mẽ.

Bạn sẽ cần phải là người chuyên nghiệp với các công nghệ bảng thông tin như Tableau và Qlik vì đó là những công cụ bạn sẽ sử dụng để xây dựng hình ảnh trực quan của mình. Bạn cũng sẽ cần các kỹ năng thao tác dữ liệu (đọc: kỹ năng SQL) để giúp tối ưu hóa các truy vấn dữ liệu giúp trang tổng quan hoạt động nhanh chóng.

Như tôi đã đề cập trước đó trong bài viết, khoa học dữ liệu là một lĩnh vực đang phát triển nhanh chóng. Những công việc và vai trò mới luôn mở ra. Quay trở lại với sự tương tự về cây của tôi, tôi thích coi nó như những nhánh mới được thêm vào thân khoa học dữ liệu chính. Hiện có các kỹ sư đám mây, chuyên gia SQL, vai trò DevOps, v.v. – tất cả vẫn được kết nối với lộ trình khoa học dữ liệu đó. Vì vậy, bài viết này chỉ cung cấp một số hướng ngắn gọn mà bạn có thể thực hiện với khoa học dữ liệu.

Hơn thế nữa, bạn cũng nên nhớ rằng khoa học dữ liệu đi kèm với những thách thức gắn liền với mức lương sáu con số đó. Có một chặng đường học tập rất dốc và quá trình học tập không bao giờ thực sự kết thúc. Các công nghệ, xu hướng và công cụ mới đều xuất hiện nhanh chóng và khó khăn – và nếu bạn muốn giữ được công việc của mình, bạn phải theo kịp.

Tất cả những gì đang được nói, đó là một lựa chọn nghề nghiệp tuyệt vời. Với ba năng lực chính mà tôi đã đề cập, bạn sẽ được trang bị tốt để đảm nhận bất kỳ công việc nào. vai trò khoa học dữ liệu hấp dẫn bạn.
 
 

Nate Rosidi là một nhà khoa học dữ liệu và trong chiến lược sản phẩm. Anh ấy cũng là một giáo sư trợ giảng dạy phân tích và là người sáng lập StrataScratch, một nền tảng giúp các nhà khoa học dữ liệu chuẩn bị cho cuộc phỏng vấn của họ với các câu hỏi phỏng vấn thực tế từ các công ty hàng đầu. Kết nối với anh ấy trên Twitter: StrataScratch or LinkedIn.

Dấu thời gian:

Thêm từ Xe đẩy