Điểm nổi bật về Khoa học Dữ liệu Khảo sát Tràn chồng

Nút nguồn: 1865102

Điểm nổi bật về Khoa học Dữ liệu Khảo sát Tràn chồng

Kết quả của Khảo sát nhà phát triển Stack Overflow năm 2021 đã được công bố gần đây, đây là một bức tranh tổng quan hấp dẫn về các nhà phát triển ngày nay và các công cụ họ đang sử dụng. Hãy xem một số lựa chọn từ báo cáo, đặc biệt là những lựa chọn có thể được các chuyên gia dữ liệu quan tâm.


Khảo sát Tràn ngăn xếp năm 2021
 

Hàng năm, Stack Overflow tiến hành một cuộc khảo sát người dùng để giúp cung cấp thông tin cho sự phát triển của cộng đồng và nền tảng của nó. Năm nay, hơn 80,000 nhà phát triển đã chia sẻ cách họ học, các công cụ và ngôn ngữ họ sử dụng, đồng thời cung cấp tất cả các loại phản hồi có giá trị cho định hướng của Stack Overflow. Kết quả cũng trình bày tổng quan về các nhà phát triển và quá trình phát triển tính đến thời điểm cuộc khảo sát được thực hiện.

Kết quả của Khảo sát Tràn ngăn xếp năm 2021 gần đây đã được chia sẻ công khai, cùng với bình luận và thông tin chi tiết do Stack Overflow cung cấp. Chúng ta sẽ xem xét một số điểm dữ liệu thú vị hơn vì chúng liên quan đến khoa học dữ liệu, nhà khoa học dữ liệu và tất cả các vị trí liên quan đến dữ liệu và những chuyên gia điền vào chúng.

Hồ sơ nhà phát triển

 
 
Phần đầu tiên của cuộc khảo sát tập trung vào các đặc điểm của chính các nhà phát triển trả lời: thông tin nhân khẩu học như tuổi và vị trí địa lý; họ đã viết mã bao lâu rồi; cách họ học viết mã; và hơn thế nữa.

Dưới đây là một số trích dẫn nhanh và thú vị liên quan cụ thể đến việc học viết mã, cũng như việc làm của nhà phát triển, trực tiếp tạo nên tổng quan của cuộc khảo sát, cùng với một số biểu đồ tóm tắt tần suất phản hồi cho các câu hỏi chính về hồ sơ nhà phát triển.

Ví dụ, trong năm nay, chúng tôi đã quan sát thấy một sự tiến hóa đáng kể trong cách các nhà phát triển tự đào tạo. Đối với nhóm lập trình viên dưới 18 tuổi ngày càng tăng, các tài nguyên trực tuyến như video và blog phổ biến hơn cả sách và trường học cộng lại, một thống kê không phù hợp với bất kỳ nhóm thuần tập ở độ tuổi nào khác của chúng tôi. Nhìn chung, nghề này có đầy rẫy những người mới tham gia, với hơn 50% cho biết họ đã viết mã trong vòng chưa đầy một thập kỷ và hơn 35% có ít hơn năm năm trong nghề.

Hình
Hình 1. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã học viết mã như thế nào?"

 

Không có gì ngạc nhiên khi gần 60% người được hỏi đã học cách viết mã từ các nguồn trực tuyến. Những người trả lời trẻ hơn có xu hướng học hỏi từ các khóa học trực tuyến, diễn đàn và các nguồn trực tuyến khác. Mặt khác, những người trả lời lớn tuổi đã học hỏi từ các phương tiện truyền thống hơn như trường học và sách.

81% nhà phát triển chuyên nghiệp được tuyển dụng toàn thời gian, giảm từ 83% vào năm 2020. Tỷ lệ nhà phát triển chuyên nghiệp cho biết họ là nhà thầu độc lập, người làm việc tự do hoặc tự kinh doanh tăng từ 9.5% năm 2020 lên 11.2% vào năm 2021 - cho thấy tiềm năng tình trạng bất ổn trong công việc hoặc chuyển sang sắp xếp công việc linh hoạt hơn.

Giờ đây, chúng tôi chuyển sự chú ý sang các cấp độ giáo dục của nhà phát triển trong giây lát.

Hình
Hình 2. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Điều nào sau đây mô tả chính xác nhất cấp độ giáo dục chính quy cao nhất mà bạn đã hoàn thành?"

 

70% tất cả những người được hỏi và 80% các nhà phát triển chuyên nghiệp đã hoàn thành một số hình thức giáo dục đại học, bằng cử nhân là phổ biến nhất.

Các chủ đề khác được thảo luận trong phần Hồ sơ nhà phát triển bao gồm dữ liệu nhân khẩu học như chủng tộc, khuynh hướng tình dục, vị trí địa lý,

Công nghệ

 
 
Bây giờ chúng ta chuyển sang phần bánh và bơ của cuộc khảo sát, câu trả lời cho các câu hỏi liên quan đến ngôn ngữ và công nghệ mà các nhà phát triển đang sử dụng ngay bây giờ.

Ngôn ngữ

 
Đầu tiên, ngôn ngữ, câu hỏi số một không thể tranh cãi mà mọi người muốn xem câu trả lời khi họ nhận được bản báo cáo này.

Vậy, những ngôn ngữ lập trình, kịch bản và đánh dấu nào được người trả lời sử dụng để phát triển trong năm qua?

Hình
Hình 3. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã thực hiện công việc phát triển rộng rãi trong năm qua ngôn ngữ lập trình, kịch bản và đánh dấu nào và bạn muốn làm việc trong lĩnh vực nào trong năm tới?"

 

Đặc biệt lưu ý đối với các loại khoa học dữ liệu, Python được bao gồm trong 48.24% phản hồi và hiện là một trong những ngôn ngữ được các nhà phát triển sử dụng nhiều nhất.

Lưu ý rằng, trong khi ngôn ngữ khoa học dữ liệu quan tâm R không xuất hiện trong các câu trả lời hàng đầu trong Hình 3 (bị cắt do phần đuôi dài của các câu trả lời), R lại được đưa vào 5.07% số câu trả lời.

Chúng tôi đã biết các nhà phát triển ngôn ngữ đang sử dụng nhưng muốn biết về các nhà phát triển ngôn ngữ muốn để sử dụng? Tỷ lệ phần trăm các nhà phát triển không phát triển bằng ngôn ngữ hoặc công nghệ nhưng đã bày tỏ sự quan tâm đến việc phát triển bằng ngôn ngữ hoặc công nghệ đó.

Hình
Hình 4. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã thực hiện công việc phát triển rộng rãi trong năm qua ngôn ngữ lập trình, kịch bản và đánh dấu nào và bạn muốn làm việc trong lĩnh vực nào trong năm tới?"

 

Một lần nữa, vì R không xuất hiện trong các câu trả lời hàng đầu trong Hình 4, nó được bao gồm trong 2.82% câu trả lời.

Và còn cái sâu sắc hơn thì sao “làm việc với vs muốn làm việc với?"

Có rất nhiều thứ để giải nén ở đây, nhưng đây là một số xu hướng đáng chú ý nhất mà chúng tôi đã phát hiện ra. Có hơn 10k nhà phát triển Javascript muốn bắt đầu hoặc tiếp tục phát triển trong Go hoặc Rust. Phần lớn các nhà phát triển muốn sử dụng Dart hiện đang sử dụng JavaScript. Chúng tôi cũng thấy các nhà phát triển duy nhất muốn làm việc bằng PHP là các nhà phát triển SQL.

Thông tin này được đặt trong một hình ảnh tương tác tốt nhất có thể được sử dụng trực tiếp trên trang web Khảo sát nhà phát triển dòng tràn ngăn xếp.

Cơ sở dữ liệu

 
Chuyển sang cơ sở dữ liệu… đây là kết quả cho câu hỏi tương đương đánh giá việc sử dụng các sản phẩm cơ sở dữ liệu.

Hình
Hình 5. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã thực hiện công việc phát triển rộng rãi trong môi trường cơ sở dữ liệu nào trong năm qua và bạn muốn làm việc trong môi trường cơ sở dữ liệu nào trong năm tới?"

 

Điều này khá đơn giản, nhưng chúng ta có thể thấy rằng cơ sở dữ liệu SQL chiếm 3 vị trí hàng đầu và 4 trong số 5 vị trí hàng đầu.

Nền tảng đám mây

 
Khi nói đến nền tảng đám mây, AWS dường như là vua, với Google Cloud và Microsoft Azure cũng chiếm thị phần đáng kể trên thị trường.

Hình
Hình 6. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã thực hiện công việc phát triển trên nền tảng đám mây nào trong năm qua và bạn muốn làm việc trong nền tảng đám mây nào trong năm tới?"

 

Điều thú vị là, việc so sánh giữa những nền tảng đám mây mà các nhà phát triển yêu thích và những nền tảng mà họ sợ hãi lại khá phù hợp với phản hồi về những nền tảng mà các nhà phát triển đã sử dụng. Cũng không phải vô lý khi cho rằng tỷ lệ sử dụng Đám mây IBM và Đám mây Oracle thấp có thể tương quan với nỗi lo sợ rằng các nhà phát triển đang sử dụng nó sẽ phải sử dụng lại nó.

Hình
Hình 7. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã thực hiện công việc phát triển trên nền tảng đám mây nào trong năm qua và bạn muốn làm việc trong nền tảng đám mây nào trong năm tới?"

Khung và Thư viện khác

 
Nhìn vào cả các khung và thư viện khác được sử dụng nhiều nhất và được mong muốn nhất, bạn có thể thấy một số trong số đó dành riêng cho các nhà khoa học dữ liệu và / hoặc kỹ sư máy học, hoặc được sử dụng nhiều bởi các ngành nghề này.

Trong khi Tensorflow là thư viện được yêu thích nhất, thì Pytorch là một thư viện được yêu thích hơn cả. Là người dùng .NET Core tại Stack Overflow, chúng tôi rất vui khi thấy nó ở vị trí hàng đầu.

Có thể dễ dàng lập luận rằng ít nhất 7 trong số các thư viện và khuôn khổ sau đây rất phù hợp với các chuyên gia dữ liệu hành nghề, thậm chí có thể xảy ra nhiều hơn.

Hình
Hình 8. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã thực hiện công việc phát triển mở rộng nào trong năm qua và bạn muốn làm việc với framework và thư viện nào khác trong năm tới?”

 

Chuyển sự chú ý của chúng tôi đến các khuôn khổ và thư viện mà các nhà phát triển muốn làm việc cùng, nhiều công cụ liên quan đến khoa học dữ liệu tương tự cũng hiển thị ở đây.

Hình
Hình 9. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn đã thực hiện công việc phát triển mở rộng nào trong năm qua và bạn muốn làm việc với framework và thư viện nào khác trong năm tới?”

Học tập và giải quyết vấn đề

 
Là một nhà phát triển, bạn sẽ làm gì khi gặp khó khăn? Hình 10 dường như chỉ ra rằng Google thực sự là bạn của bạn. Tất cả chúng ta đều làm điều đó…

Hình
Hình 10. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Bạn làm gì khi gặp khó khăn trong một vấn đề?"

 

Lương

 
 
Điều cuối cùng chúng ta sẽ xem xét từ báo cáo là dữ liệu tiền lương.

Trên toàn bộ hội đồng quản trị, các nhà quản lý kỹ thuật, SRE, chuyên gia DevOps và kỹ sư dữ liệu có xu hướng nhận được mức lương cao nhất. Khi tập trung vào Mỹ, chúng tôi thấy một số khác biệt ở cuối phổ lương. Tại Hoa Kỳ, các nhà phát triển di động và nhà giáo dục có xu hướng có mức lương cao hơn so với các nghề khác khi so sánh với dân số nhà phát triển toàn cầu.

Hình
Hình 11. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Tổng mức thù lao hiện tại của bạn (lương, thưởng và đặc quyền, trước thuế và các khoản khấu trừ) là bao nhiêu?"

 

Các công cụ và công nghệ được sử dụng có tác động gì đến khả năng kiếm tiền của bạn?

Báo cáo đưa ra một số biến số tương quan với mức lương; mặc dù không phải là một cách tiếp cận hoàn hảo nhưng chúng ta hãy xem danh mục các khuôn khổ và thư viện khác, có vẻ như là một điểm dữ liệu thú vị để các nhà khoa học dữ liệu điều tra. Có vẻ như danh sách này bị chi phối bởi một số thư viện và công cụ mà chúng ta có thể sử dụng hàng ngày.

Hình
Hình 12. Câu trả lời cho câu hỏi Khảo sát tràn ngăn xếp năm 2021 “Tổng mức thù lao hiện tại của bạn (lương, thưởng và đặc quyền, trước thuế và các khoản khấu trừ) là bao nhiêu?"

 

Thật khó để ngoại suy mức lương dựa trên một công nghệ duy nhất, nhưng thật thú vị khi xem xét các công nghệ hàng đầu cùng nhau.

 
Sản phẩm liên quan:

Nguồn: https://www.kdnuggets.com/2021/08/stack-overflow-survey-data-science-highlights.html

Dấu thời gian:

Thêm từ Xe đẩy