7 lý do tại sao bạn không nên trở thành nhà khoa học dữ liệu - KDnuggets

7 lý do tại sao bạn không nên trở thành nhà khoa học dữ liệu – KDnuggets

Nút nguồn: 2994981

7 lý do tại sao bạn không nên trở thành nhà khoa học dữ liệu
Hình ảnh của Editor
 

Bạn có phải là một nhà khoa học dữ liệu đầy tham vọng? Nếu vậy, rất có thể bạn đã thấy hoặc nghe nói về nhiều người đã thành công trong sự nghiệp khoa học dữ liệu. Và bạn cũng đang hy vọng một ngày nào đó sẽ thực hiện chuyển đổi.

Có một số điều thú vị khi làm việc như một nhà khoa học dữ liệu. Bạn có thể:

  • Xây dựng các kỹ năng cứng và mềm có thể chuyển giao giữa các lĩnh vực 
  • Kể chuyện bằng dữ liệu 
  • Trả lời các câu hỏi kinh doanh bằng dữ liệu
  • Xây dựng các giải pháp hiệu quả cho các vấn đề kinh doanh 

Và nhiều hơn nữa. Nghe có vẻ thú vị như tất cả những điều này, việc trở thành một nhà khoa học dữ liệu cũng không kém phần thách thức nếu không muốn nói là hơn. Nhưng một số thách thức đó là gì? 

Hãy lặn xuống.

Khi bạn rèn luyện các kỹ năng viết mã và kỹ thuật, có thể bạn sẽ cảm thấy thoải mái khi tự mình làm việc. Nhưng là một nhà khoa học dữ liệu, bạn nên ưu tiên cộng tác và giao tiếp. Bởi vì khoa học dữ liệu không phải là việc sắp xếp dữ liệu và xử lý các con số một cách riêng biệt. 

Bạn cần cộng tác với các chuyên gia khác—không chỉ trong cùng một nhóm mà thường là giữa nhiều nhóm. Vì vậy, khả năng cộng tác với các nhóm và bên liên quan khác nhau cũng quan trọng như kỹ năng kỹ thuật của bạn. 

Hơn nữa, bạn cũng có thể truyền đạt những phát hiện và hiểu biết của mình cho các bên liên quan phi kỹ thuật, bao gồm cả các nhà lãnh đạo doanh nghiệp.

Nisha Arya Ahmed, một nhà khoa học dữ liệu và nhà văn kỹ thuật, chia sẻ:

“Trong nhóm khoa học dữ liệu, bạn sẽ cộng tác với các chuyên gia khoa học dữ liệu khác về từng nhiệm vụ, trách nhiệm của họ và cách tất cả hoạt động song song. Điều này rất quan trọng vì bạn không muốn lặp lại công việc đã hoàn thành và sử dụng nhiều thời gian và nguồn lực hơn. Ngoài ra, các chuyên gia dữ liệu không phải là những người duy nhất bạn phải cộng tác cùng, bạn sẽ là thành viên của một nhóm đa chức năng bao gồm sản phẩm, tiếp thị và các bên liên quan khác.”

– Nisha Arya Ahmed, Nhà khoa học dữ liệu và nhà văn kỹ thuật

Nếu bạn là người thích làm việc trên các dự án, hoàn thành chúng và đưa chúng vào sản xuất, bạn có thể không thấy khoa học dữ liệu là một nghề nghiệp bổ ích.

Mặc dù bạn bắt đầu một dự án với một loạt mục tiêu—được tinh chỉnh và cải tiến nhiều lần—bạn sẽ thường phải thay đổi phạm vi của dự án khi mục tiêu kinh doanh của tổ chức thay đổi. Có lẽ, các bên liên quan nhìn thấy một hướng đi mới đầy hứa hẹn.

Vì vậy, bạn sẽ phải sắp xếp lại thứ tự ưu tiên và sửa đổi phạm vi dự án một cách hiệu quả. Và trong trường hợp xấu nhất, hãy từ bỏ dự án của bạn nếu cần. 

Ngoài ra, ở giai đoạn đầu khởi nghiệp, bạn thường phải đội nhiều vai trò. Vì vậy, công việc của bạn không kết thúc với việc xây dựng mô hình. Ngay cả khi bạn quản lý để triển khai mô hình học máy vào sản xuất, bạn vẫn phải theo dõi hiệu suất của mô hình, chú ý đến sự sai lệch, thoái lui và đào tạo lại mô hình nếu cần.

Abid Ali Awan, Nhà văn, Biên tập viên và Nhà khoa học dữ liệu tại KDnuggets, chia sẻ:

“Nếu bạn làm việc tại một công ty, bạn có thể thường xuyên phải chuyển đổi giữa nhiều nhóm và làm việc trên các dự án khác nhau cùng một lúc. Tuy nhiên, hầu hết các dự án bạn thực hiện thậm chí có thể không được đưa vào sản xuất. 

Bởi vì các ưu tiên của công ty có thể thay đổi hoặc tác động của các dự án có thể không đủ lớn. Việc chuyển đổi liên tục giữa các nhóm và dự án có thể khiến bạn mệt mỏi và bạn có thể cảm thấy không biết mình đang đóng góp gì.”

– Abid Ali Awan, Nhà văn, Biên tập viên và Nhà khoa học dữ liệu tại KDnuggets

Vì vậy, làm việc trên các dự án khoa học dữ liệu không phải là một quá trình tuyến tính từ đầu đến cuối, nơi bạn hoàn thành một dự án và chuyển sang dự án tiếp theo. 

Một ngày trong cuộc đời của một nhà khoa học dữ liệu ở hai tổ chức khác nhau có thể hoàn toàn khác nhau. Vai trò của nhà khoa học dữ liệu, kỹ sư máy học và kỹ sư MLOps thường có nhiều chức năng chồng chéo.

Giả sử bạn là nhà khoa học dữ liệu rất quan tâm đến việc xây dựng các mô hình dự đoán. Và bạn đã đảm nhận vai trò nhà khoa học dữ liệu trong một tổ chức mà bạn quan tâm. 

Tuy nhiên, đừng ngạc nhiên nếu bạn dành cả ngày để xử lý các con số trong bảng tính và lập báo cáo. Hoặc lấy dữ liệu từ cơ sở dữ liệu bằng SQL. Bạn có thể nghĩ rằng việc sắp xếp dữ liệu bằng SQL và tìm câu trả lời cho các câu hỏi kinh doanh sẽ phù hợp hơn với vai trò của nhà phân tích dữ liệu.

Trong khi trong một số trường hợp khác, bạn có thể chịu trách nhiệm xây dựng và triển khai các mô hình vào sản xuất, theo dõi sự trôi dạt và đào tạo lại mô hình nếu cần. Trong trường hợp này, bạn là một nhà khoa học dữ liệu, người cũng đội mũ của một nhà khoa học dữ liệu. Kỹ sư MLOps

Hãy cùng nghe Abid nói gì về tính linh hoạt của vai trò trong sự nghiệp dữ liệu:

“Tôi luôn bối rối khi được gọi là “Nhà khoa học dữ liệu”. nó thậm chí còn có ý nghĩa gì? Tôi có phải là Nhà phân tích dữ liệu, Kỹ sư thông minh doanh nghiệp, Kỹ sư máy học, Kỹ sư MLOps hay tất cả những người ở trên không? Vai trò của bạn trong công ty rất linh hoạt nếu bạn đang làm việc tại một công ty nhỏ hơn hoặc một công ty khởi nghiệp. Tuy nhiên, các tổ chức lớn hơn có thể có sự phân biệt rõ ràng hơn giữa các vai trò. Nhưng điều đó không đảm bảo rằng vai trò đã được xác định hoàn toàn. Bạn có thể là một nhà khoa học dữ liệu; nhưng phần lớn công việc bạn làm có lẽ sẽ là tạo ra các báo cáo phân tích phù hợp với mục tiêu kinh doanh.”

– Abid Ali Awan, Nhà văn, Biên tập viên và Nhà khoa học dữ liệu tại KDnuggets

Là một nhà khoa học dữ liệu, bạn nên hướng nỗ lực vào các dự án có tác động đáng kể nhất đến doanh nghiệp thay vì theo đuổi các dự án thú vị về mặt kỹ thuật nhưng ít liên quan hơn. Để đạt được mục tiêu này, việc hiểu rõ mục tiêu kinh doanh là chìa khóa vì những lý do sau:

  • Hiểu được mục tiêu kinh doanh cho phép bạn điều chỉnh và sắp xếp lại các dự án của mình dựa trên nhu cầu thay đổi của tổ chức.
  • Sự thành công của một dự án khoa học dữ liệu thường được đo lường bằng tác động của nó đối với doanh nghiệp. Vì vậy, sự hiểu biết tốt về các mục tiêu kinh doanh sẽ cung cấp một khuôn khổ rõ ràng để đánh giá sự thành công của dự án, liên kết các khía cạnh kỹ thuật với kết quả kinh doanh hữu hình.

Matthew Mayo, Tổng biên tập và Nhà khoa học dữ liệu tại KDnuggets, chia sẻ cái giá phải trả của việc thờ ơ với kết quả kinh doanh:

“Là một nhà khoa học dữ liệu, nếu bạn thờ ơ với các mục tiêu kinh doanh thì bạn cũng có thể trở thành một con mèo đuổi theo con trỏ laser — bạn sẽ thấy mình hoạt động quá mức và không có mục đích, có khả năng không đạt được gì có giá trị nhiều. Hiểu các mục tiêu kinh doanh và có thể chuyển chúng từ hoạt động kinh doanh sang dữ liệu là những kỹ năng quan trọng mà nếu không có chúng, bạn có thể thấy mình đang đầu tư thời gian vào việc xây dựng các mô hình phức tạp nhất, không liên quan. Một cây quyết định hoạt động hiệu quả sẽ đánh bại những thất bại hiện đại hàng ngày!”

– Matthew Mayo, Tổng biên tập và Nhà khoa học dữ liệu, KDnuggets

Đây là những gì Nisha nói về vấn đề này:

“Làm việc gì cũng cần có lý do. Đây là ý định của bạn, nó đến trước hành động của bạn. Khi nói đến thế giới dữ liệu, việc hiểu rõ hoạt động kinh doanh và những thách thức là điều bắt buộc. Nếu không có điều này, bạn sẽ chỉ bối rối trong suốt quá trình. Với mỗi bước bạn thực hiện trong một dự án khoa học dữ liệu, bạn sẽ muốn đề cập đến các mục tiêu thúc đẩy dự án.” 

– Nisha Arya Ahmed, Nhà khoa học dữ liệu và nhà văn kỹ thuật

Do đó, khoa học dữ liệu không chỉ là xử lý các con số và xây dựng các mô hình phức tạp. Đó là nhiều hơn về việc tận dụng dữ liệu để thúc đẩy thành công kinh doanh. 

Nếu không có sự hiểu biết vững chắc về các mục tiêu kinh doanh, các dự án của bạn có thể đi chệch khỏi các vấn đề kinh doanh mà chúng cần giải quyết—làm giảm cả giá trị và tác động của chúng.

Xây dựng mô hình là thú vị. Tuy nhiên, con đường dẫn đến đó có thể không thú vị bằng. 

Bạn có thể mong đợi dành phần lớn thời gian của mình:

  • Thu thập dữ liệu 
  • Xác định tập hợp con dữ liệu phù hợp nhất để sử dụng
  • Làm sạch dữ liệu để phù hợp cho việc phân tích 

Bây giờ đây là công việc không mấy thú vị. Thông thường, bạn thậm chí không cần xây dựng các mô hình học máy. Sau khi có dữ liệu trong cơ sở dữ liệu, bạn có thể sử dụng SQL để trả lời các câu hỏi. Trong trường hợp đó, bạn thậm chí không cần xây dựng mô hình học máy.

Dưới đây là Abid chia sẻ quan điểm của mình về tầm quan trọng của công việc thường không thú vị:

“Có thể rất tẻ nhạt nếu làm đi làm lại cùng một việc. Thông thường, bạn có thể được giao nhiệm vụ làm sạch dữ liệu, công việc này có thể khá khó khăn, đặc biệt khi làm việc với nhiều bộ dữ liệu khác nhau. Ngoài ra, các nhiệm vụ như xác thực dữ liệu và viết bài kiểm tra đơn vị có thể không thú vị bằng nhưng lại cần thiết.”

– Abid Ali Awan, Nhà văn, Biên tập viên và Nhà khoa học dữ liệu tại KDnuggets

Vì vậy, bạn phải tận hưởng quá trình làm việc với dữ liệu — bao gồm dữ liệu tốt, dữ liệu xấu và dữ liệu xấu — để có được sự nghiệp khoa học dữ liệu thành công. Bởi vì khoa học dữ liệu chủ yếu là lấy giá trị từ dữ liệu. Điều này thường không liên quan đến việc xây dựng những mô hình đẹp nhất.

Là một nhà khoa học dữ liệu, bạn (có thể) sẽ không bao giờ đạt đến mức có thể nói rằng mình đã học được tất cả. Những gì bạn cần học và bao nhiêu tùy thuộc vào những gì bạn đang làm.

Nó có thể là một nhiệm vụ khá đơn giản như học và sử dụng một khuôn khổ mới trong tương lai. Hoặc điều gì đó tẻ nhạt hơn như di chuyển cơ sở mã hiện có sang một ngôn ngữ như Rust để nâng cao hiệu suất và bảo mật. Bên cạnh việc giỏi về mặt kỹ thuật, bạn phải có khả năng học hỏi và nâng cao nhanh chóng về các framework, công cụ và ngôn ngữ lập trình nếu cần. 

Ngoài ra, bạn nên sẵn sàng tìm hiểu thêm về tên miền và doanh nghiệp nếu được yêu cầu. Khó có khả năng bạn sẽ làm việc trong một lĩnh vực duy nhất trong suốt sự nghiệp khoa học dữ liệu của mình. Ví dụ: bạn có thể bắt đầu với tư cách là nhà khoa học dữ liệu trong lĩnh vực chăm sóc sức khỏe, sau đó chuyển sang lĩnh vực công nghệ tài chính, hậu cần, v.v.

Trong thời gian học cao học, tôi có cơ hội nghiên cứu về máy học trong lĩnh vực chăm sóc sức khỏe—trong một dự án tiên lượng bệnh tật. Tôi chưa bao giờ đọc Sinh học ngoài cấp ba. Vì vậy, vài tuần đầu tiên chủ yếu là khám phá các tính chất kỹ thuật của các tín hiệu y sinh cụ thể—các đặc tính, đặc điểm của chúng và nhiều hơn thế nữa. Đây là những điều cực kỳ quan trọng trước khi tôi có thể tiến hành xử lý trước hồ sơ.

Kanwal Mehreen, một nhà văn kỹ thuật chia sẻ kinh nghiệm của cô ấy với chúng tôi:

“Bạn có biết cảm giác đó khi cuối cùng bạn cũng học được một kỹ năng mới và nghĩ, “À, thế là xong, mình ổn”? Chà, trong khoa học dữ liệu, khoảnh khắc đó không bao giờ thực sự đến. Lĩnh vực này không ngừng phát triển với các công nghệ, công cụ và phương pháp mới xuất hiện thường xuyên. Vì vậy, nếu bạn là người muốn đạt đến một mức độ nhất định mà việc học tập chỉ xếp sau, thì nghề khoa học dữ liệu có thể không phải là sự lựa chọn phù hợp nhất. 

Hơn nữa, khoa học dữ liệu là sự kết hợp tuyệt vời giữa thống kê, lập trình, học máy và kiến ​​thức miền. Nếu ý tưởng khám phá các lĩnh vực khác nhau, từ chăm sóc sức khoẻ, tài chính đến tiếp thị, không làm bạn hứng thú, bạn có thể cảm thấy lạc lõng trong sự nghiệp của mình.”

– Kanwal Mehreen, Người viết kỹ thuật

Vì vậy, với tư cách là một nhà khoa học dữ liệu, bạn không bao giờ nên ngại học hỏi và nâng cao kỹ năng không ngừng.

Chúng tôi đã vạch ra một số thách thức khi trở thành nhà khoa học dữ liệu, bao gồm:

  • Vượt xa các kỹ năng kỹ thuật về mã hóa và xây dựng mô hình
  • Hiểu tên miền và mục tiêu kinh doanh 
  • Không ngừng học hỏi và nâng cao kỹ năng để luôn phù hợp 
  • Chủ động mà không cần lo lắng về việc hoàn thành dự án theo đúng nghĩa đen 
  • Sẵn sàng sắp xếp lại thứ tự ưu tiên, thoái lui và thực hiện thay đổi
  • Làm công việc nhàm chán nhưng cần thiết 

Giống như bất kỳ vai trò công nghệ nào khác, phần khó khăn là không tìm được công việc như một nhà khoa học dữ liệu. Đó là xây dựng sự nghiệp khoa học dữ liệu thành công.

Mathew Mayo tóm tắt một cách khéo léo cách bạn nên đón nhận những thách thức này với tư cách là một nhà khoa học dữ liệu:

“Bạn đang tìm kiếm một công việc thoải mái, nơi bạn có thể ngừng học tập ngay khi bắt đầu công việc và không bao giờ phải lo lắng về các công cụ, thủ thuật và kỹ thuật mới nhất? Chà, hãy quên khoa học dữ liệu đi! Mong đợi một sự nghiệp yên tĩnh với tư cách là một chuyên gia dữ liệu cũng giống như mong đợi một chuyến đi dạo khô ráo trong gió mùa, chỉ được trang bị một chiếc ô đựng cocktail và một thái độ lạc quan. 

Lĩnh vực này là một chuyến tàu lượn siêu tốc không ngừng nghỉ với các câu đố kỹ thuật và những điều bí ẩn phi kỹ thuật: một ngày nào đó bạn đang đi sâu vào các thuật toán và ngày tiếp theo bạn đang cố gắng giải thích những phát hiện của mình cho một người cho rằng hồi quy là một sự rút lui khỏi một trạng thái hành vi giống như trẻ em. Nhưng cảm giác hồi hộp nằm ở những thử thách này và đó là điều khiến bộ não nghiện caffeine của chúng ta luôn được giải trí. 

Nếu bạn dị ứng với những thử thách, bạn có thể tìm thấy niềm an ủi hơn khi đan len. Nhưng nếu bạn vẫn chưa thoát khỏi cuộc đối đầu với cơn lũ dữ liệu, thì khoa học dữ liệu có thể chính là tách… cà phê của bạn.”

– Matthew Mayo, Tổng biên tập và Nhà khoa học dữ liệu, KDnuggets

Hãy cùng nghe suy nghĩ của Kanwal về điều này:

“Hãy đối mặt với thực tế này: khoa học dữ liệu không phải lúc nào cũng thuận buồm xuôi gió. Dữ liệu không phải lúc nào cũng ở dạng gọn gàng và có tổ chức. Dữ liệu của bạn có thể trông như vừa trải qua một cơn bão, có thể không đầy đủ, không nhất quán hoặc thậm chí không chính xác. Việc làm sạch và xử lý trước dữ liệu này để đảm bảo tính phù hợp của nó cho việc phân tích có thể là một thách thức.

Khi làm việc trong lĩnh vực đa ngành, bạn có thể phải tương tác với các bên liên quan phi kỹ thuật. Giải thích các khái niệm kỹ thuật cho họ và cách chúng phù hợp với mục tiêu của họ có thể thực sự là một thách thức.

Do đó, nếu bạn là người thích một con đường sự nghiệp rõ ràng, đơn giản thì sự nghiệp khoa học dữ liệu có thể có nhiều rào cản đối với bạn.”

– Kanwal Mehreen, Người viết kỹ thuật

Vì vậy, khoa học dữ liệu không chỉ có toán học và mô hình; đó là về việc đi từ dữ liệu đến quyết định. Và trong quá trình này, bạn phải luôn sẵn sàng học hỏi và nâng cao kỹ năng, hiểu mục tiêu kinh doanh và động lực thị trường, v.v.

Nếu bạn đang tìm kiếm một nghề nghiệp đầy thử thách và muốn hướng tới sự kiên cường, khoa học dữ liệu thực sự là một lựa chọn nghề nghiệp tốt cho bạn. Chúc bạn khám phá vui vẻ!

Tôi cảm ơn Matthew, Abid, Nisha và Kanwal vì đã chia sẻ những hiểu biết sâu sắc của họ về một số khía cạnh của sự nghiệp khoa học dữ liệu. Và để làm cho bài viết này trở nên thú vị và hấp dẫn hơn nhiều khi đọc!
 
 

Bala Priya C là một nhà phát triển và nhà văn kỹ thuật đến từ Ấn Độ. Cô ấy thích làm việc ở nơi giao thoa giữa toán học, lập trình, khoa học dữ liệu và sáng tạo nội dung. Các lĩnh vực chuyên môn và sở thích của cô bao gồm DevOps, khoa học dữ liệu và xử lý ngôn ngữ tự nhiên. Cô ấy thích đọc, viết, mã hóa và cà phê! Hiện tại, cô ấy đang nỗ lực học hỏi và chia sẻ kiến ​​thức của mình với cộng đồng nhà phát triển bằng cách viết các hướng dẫn, hướng dẫn cách thực hiện, các ý kiến, v.v.

Dấu thời gian:

Thêm từ Xe đẩy