Nắm vững nghệ thuật kể chuyện dữ liệu: Hướng dẫn dành cho nhà khoa học dữ liệu - KDnuggets

Nắm vững nghệ thuật kể chuyện dữ liệu: Hướng dẫn dành cho nhà khoa học dữ liệu – KDnuggets

Nút nguồn: 2715938

Làm chủ nghệ thuật kể chuyện dữ liệu: Hướng dẫn dành cho các nhà khoa học dữ liệu
Photo by IsaacSmith on Unsplash
 

Nếu bạn đang muốn trở thành một nhà khoa học dữ liệu hoặc đã là một nhà khoa học dữ liệu – bạn sẽ phải đọc hoặc biết các kỹ năng cần thiết. Bạn sẽ cần một ngôn ngữ lập trình, hiểu biết về thống kê toán học, khả năng tạo trực quan hóa dữ liệu, v.v. 

Nếu bạn đang muốn trở thành một chuyên gia khoa học dữ liệu và cần một số hướng dẫn, hãy xem bài viết này: Trở thành Chuyên gia Khoa học Dữ liệu trong Năm bước.

Mặc dù phần lớn thời gian của bạn sẽ được sử dụng trong giai đoạn chuẩn bị dữ liệu để cố gắng tìm và làm sạch dữ liệu – có những yếu tố quan trọng khác đối với khoa học dữ liệu. 

Khi bạn đã tìm thấy những hiểu biết có giá trị của mình, nếu đó là xu hướng, mẫu hoặc đưa vào trực quan hóa – bạn sẽ cần có khả năng giải thích những điều này. Là một chuyên gia dữ liệu, những người không có kỹ thuật có thể khó hiểu ngôn ngữ kỹ thuật. 

Nếu bạn là dân kỹ thuật, việc truyền tải thông điệp của bạn đến những người không rành về kỹ thuật có thể là một thách thức. Bạn sẽ không chỉ gặp những người không có kỹ thuật mà còn có thể giao dịch với một người thích giải thích thông qua hình ảnh hóa hoặc chạy qua dự án. 

Do đó, một khi bạn có những phát hiện của mình, bạn sẽ cần phục vụ cho nhiều người khác nhau – và nắm vững cách làm điều đó có thể khó khăn, nhưng có thể đạt được. 

Băt đâu nao…

Bản thân là một nhà khoa học dữ liệu, tôi hiểu rằng nhiều bên liên quan hoặc người quản lý sẽ không xuất thân từ nền tảng kỹ thuật. Do đó, một số thuật ngữ được sử dụng trong nhóm hàng ngày của bạn sẽ xa lạ với họ. Ví dụ: điểm F1 hoặc xác thực chéo. 

Hãy nghĩ về cách một giáo viên giải thích một chủ đề cho học sinh và ghi nhớ điều đó khi bạn giải thích cho khán giả của mình. Dịch thuật ngữ khoa học dữ liệu của bạn sang ngôn ngữ mà mọi người đều có thể hiểu được. Nếu không có cách nào bạn có thể thay thế một thuật ngữ khoa học dữ liệu cụ thể, thì việc giải thích ý nghĩa của thuật ngữ đó cũng không có hại gì. Bạn sẽ làm hại nhiều hơn bằng cách đánh mất sự chú ý của khán giả vào các từ chuyên môn. 

Những người khác nhau học theo những cách khác nhau. Một số có thể đọc sách giáo khoa một lần và hiểu nó. Một số cần nó được mã hóa màu. Một số cần hình dung. Khi trình bày những phát hiện của bạn, đừng giới hạn bản thân và đặt mình vào một lối mòn mà bạn phải trả lời 1000 câu hỏi. Hình dung có thể trả lời câu hỏi cho bạn. 

Trực quan hóa dữ liệu sẽ cho phép khán giả của bạn hiểu trực quan về các bước bạn đã thực hiện và những phát hiện của bạn. Trong khi bạn đang nói ở phía sau về các hình ảnh, mắt của họ đang học và hiểu những gì bạn đang nói. 

Ở cuối phần trình bày của bạn, hãy đảm bảo có một trang tóm tắt tất cả các điểm quan trọng và trực quan hóa dữ liệu cho khán giả của bạn xem. Trong thời gian này, bạn nên cởi mở với các câu hỏi mà khán giả của bạn có thể liên tục nhìn vào bảng tóm tắt để đặt ra các câu hỏi mới. 

Khán giả của bạn đặt câu hỏi không phải là một điều xấu, nó cho thấy rằng họ đã lắng nghe, họ quan tâm và họ muốn tìm hiểu và hiểu thêm. 

Những điểm trên là các yếu tố trong cách kể chuyện của bạn sẽ làm cho nó hiệu quả. Tuy nhiên, một cấu trúc là thứ sẽ giúp cho việc kể chuyện dữ liệu của bạn thành công. 

Kể chuyện ba màn là một mô hình phổ biến được sử dụng trong tiểu thuyết kể chuyện chia một câu chuyện thành ba phần:

Thành lập

Mục đích: nêu rõ ràng vấn đề mà bạn đang cố gắng giải quyết.

Điều này bao gồm phần giới thiệu về dự án của bạn, nêu rõ mục đích của dự án, những gì bạn đang cố gắng giải quyết, v.v. Trong quá trình thiết lập, từ góc độ khoa học dữ liệu, bạn sẽ đi sâu hơn vào vấn đề hoặc vấn đề sâu hơn để cung cấp ngữ cảnh cho mục tiêu của dự án. Mục đích của dự án của bạn sẽ tương đương với Điểm 1 của bạn. 

Cuộc đối đầu

Mục đích: giải thích cho khán giả của bạn tại sao điều quan trọng là phải giải quyết vấn đề này và các con đường khác nhau mà bạn đã thực hiện để giải quyết vấn đề. 

Trong phần đối đầu, bạn có thể tiếp tục nói về nhiệm vụ hiện tại và lý do tại sao công ty phải đối mặt với vấn đề này ngay từ đầu. Bạn muốn giữ cho khán giả của mình quan tâm và tò mò, do đó, việc nói về những vấn đề mà công ty đang gặp phải sẽ luôn khiến các bên liên quan bị thu hút. 

Giải thích cho người đọc của bạn từng bước những con đường khác nhau mà bạn đã trải qua và kết quả của bạn cho từng con đường, để hoàn thành nhiệm vụ trong tầm tay. Các bước khác nhau mà bạn đã thực hiện trong dự án khoa học dữ liệu sẽ phản ánh các điểm khác nhau, ví dụ: Điểm 2, Điểm 3,…

Cung cấp cho khán giả bối cảnh của những thất bại và trở ngại mà bạn gặp phải và lý do tại sao, điều này sẽ giúp xây dựng lòng tin và sự hiểu biết giữa bạn và khán giả khi bạn đi đến một giải pháp. 

Độ phân giải

Mục đích: Giải thích giải pháp bạn có thể đưa ra để giải quyết vấn đề và đảm bảo khán giả hài lòng. 

 

Đây là nơi khán giả đi từ lo lắng đến nhẹ nhõm. Nghị quyết của bạn nên nêu rõ cách nó vượt qua những thất bại và trở ngại trước đây của bạn. Mở phần này cho các câu hỏi, vì khán giả của bạn sẽ muốn hoàn toàn tin tưởng vào thông tin chi tiết về dữ liệu của bạn và tin rằng đây là cách phù hợp để thực hiện. 

Sau khi khán giả cảm thấy thoải mái, bạn có thể bắt đầu kết thúc và nói về những hành động cần thực hiện để nhiệm vụ thành công. 

Một cấu trúc khác rất hiệu quả là nguyên tắc kim tự tháp. Đây là một công cụ giao tiếp hiệu quả được sử dụng để truyền đạt rõ ràng các vấn đề phức tạp cho các giám đốc điều hành bận rộn. Mục đích là các ý tưởng bằng văn bản phải luôn tạo thành một kim tự tháp dưới một ý nghĩ duy nhất.

Vì vậy, hãy để tôi giải thích điều này nhiều hơn một chút. Khi giao dịch với những giám đốc điều hành bận rộn muốn tìm hiểu về thông tin chuyên sâu về dữ liệu của bạn nhưng lại thiếu thời gian hoặc háo hức muốn biết các giải pháp – nguyên tắc kim tự tháp là cách tốt nhất. 

Nó được chia thành 3 phần:

câu trả lời của bạn

Trong trường hợp này, câu trả lời của bạn sẽ là giải pháp cho nhiệm vụ hiện tại. Đây là điểm chính mà bạn muốn khán giả của mình ghi nhớ. Đây là thông điệp chính và bạn muốn tập trung vào điểm chính này – giải pháp. 

Lập luận hỗ trợ

Khi bạn đã nêu giải pháp, bước tiếp theo của bạn là thuyết phục khán giả rằng đây là con đường để thực hiện. Để làm được điều này, bạn sẽ phải đưa họ qua một hành trình hỗ trợ các lập luận, với sự thấu hiểu ở cấp độ cao. Trong phần này, cử tọa có thể thắc mắc trong đầu.

Sự kiện/Dữ liệu hỗ trợ

Trong phần này, tất cả các câu hỏi mà khán giả của bạn có thể có sẽ được trả lời tại đây. Mỗi lập luận hỗ trợ của bạn cần được hỗ trợ bằng dữ liệu và sự kiện để đảm bảo với khán giả rằng bạn đã hoàn thành bài tập về nhà và câu trả lời/giải pháp ban đầu của bạn không phải là ngẫu nhiên.

Sử dụng các kỹ năng sử dụng ngôn ngữ phi kỹ thuật và hình ảnh hóa trong cả hai cấu trúc: kể chuyện ba màn hoặc nguyên tắc kim tự tháp sẽ cho phép bạn nắm vững nghệ thuật kể chuyện dữ liệu. 

Việc bạn chọn cấu trúc nào phụ thuộc vào mức độ bạn hiểu đối tượng của mình. Bạn luôn có thể thử và sai cả hai cấu trúc để xem cấu trúc nào hiệu quả nhất. Một cách tốt để đo mức độ hiệu quả của cấu trúc đối với khán giả của bạn là ghi lại cấu trúc nào có ít câu hỏi hơn. Khán giả của bạn càng có ít câu hỏi thì cách kể chuyện của bạn càng thành công.
 
 
Nisha Arya là Nhà khoa học dữ liệu, Nhà văn kỹ thuật tự do và Quản lý cộng đồng tại KDnuggets. Cô ấy đặc biệt quan tâm đến việc cung cấp lời khuyên hoặc hướng dẫn về nghề nghiệp Khoa học dữ liệu và kiến ​​thức dựa trên lý thuyết về Khoa học dữ liệu. Cô ấy cũng mong muốn khám phá những cách khác nhau mà Trí tuệ nhân tạo có thể mang lại lợi ích cho tuổi thọ con người. Một người ham học hỏi, tìm cách mở rộng kiến ​​thức công nghệ và kỹ năng viết của mình, đồng thời giúp hướng dẫn người khác.
 

Dấu thời gian:

Thêm từ Xe đẩy