คำถามและคำตอบในการสัมภาษณ์วิทยาศาสตร์ข้อมูลทั่วไปส่วนใหญ่
หลังจากวิเคราะห์คำถามสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลมากกว่า 900 ข้อจากบริษัทต่างๆ ในช่วงไม่กี่ปีที่ผ่านมา หมวดหมู่คำถามสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลที่พบบ่อยที่สุดจะได้รับการทบทวนในคู่มือนี้ โดยแต่ละข้อจะอธิบายด้วยตัวอย่าง
By เนท โรซิดิ, นักวิทยาศาสตร์ข้อมูลและผู้จัดการผลิตภัณฑ์.
การเป็นนักวิทยาศาสตร์ข้อมูลถือเป็นคุณสมบัติอันทรงเกียรติ ย้อนกลับไปในปี 2012 Harvard Business Review ยกให้ 'นักวิทยาศาสตร์ข้อมูล' เป็นงานที่เซ็กซี่ที่สุดในศตวรรษที่ 21 และแนวโน้มที่เพิ่มขึ้นของบทบาทในอุตสาหกรรมดูเหมือนจะยืนยันคำกล่าวดังกล่าว เพื่อยืนยันว่าความเซ็กซี่นี้ยังคงดำเนินต่อไป ข้อมูลจาก Glassdoor แสดงให้เห็นว่าการเป็นนักวิทยาศาสตร์ข้อมูลคืองานที่ดีที่สุดอันดับสองในอเมริกาในปี 2021
ที่มา: Glassdoor
เพื่อให้ได้งานที่มีเกียรติ คุณต้องผ่านการสัมภาษณ์งานที่เข้มงวด คำถามด้านวิทยาศาสตร์ข้อมูลที่ถามอาจกว้างและซับซ้อนมาก สิ่งนี้เป็นสิ่งที่คาดหวัง เมื่อพิจารณาจากบทบาทของนักวิทยาศาสตร์ข้อมูลมักจะรวมเอาหลายๆ ด้านเข้าไว้ด้วยกัน เพื่อช่วยคุณเตรียมตัวสำหรับการสัมภาษณ์งานด้านวิทยาการข้อมูล ฉันได้ตรวจสอบคำถามที่เกี่ยวข้องทั้งหมดและแยกคำถามออกเป็นหมวดหมู่คำถามต่างๆ นี่คือวิธีที่ฉันทำ
คำอธิบายและวิธีการวิเคราะห์
ฉันรวบรวมข้อมูลจากบอร์ดค้นหางานและเว็บไซต์และแพลตฟอร์มรีวิวบริษัทต่างๆ เช่น Glassdoor, Indeed, Reddit และ Blind App เพื่อให้แม่นยำยิ่งขึ้น มีคำถาม 903 ข้อที่รวบรวมในช่วงสี่ปีที่ผ่านมา
คำถามแบ่งออกเป็นหมวดหมู่ที่กำหนดไว้ล่วงหน้า หมวดหมู่เหล่านี้เป็นผลมาจากการวิเคราะห์โดยผู้เชี่ยวชาญเกี่ยวกับคำอธิบายประสบการณ์การสัมภาษณ์ที่นำมาจากแหล่งข้อมูลของเรา
หมวดหมู่คือ:
- การเข้ารหัส
- การสร้างแบบจำลอง
- อัลกอริทึม
- สถิติ
- ความน่าจะเป็น
- ผลิตภัณฑ์
- กรณีธุรกิจ
- ออกแบบระบบ
- วิชาการ
คุณควรคาดหวังคำถามสัมภาษณ์ประเภทใด
แผนภูมินี้แสดงประเภทคำถามตามหมวดหมู่ตามข้อมูลที่รวบรวม
เมื่อแปลเป็นเปอร์เซ็นต์แล้ว แผนภูมิจะมีลักษณะดังนี้:
อย่างที่คุณเห็น คำถามเกี่ยวกับการเข้ารหัสและการสร้างแบบจำลองมีความสำคัญมากที่สุด มากกว่าครึ่งของคำถามทั้งหมดมาจากพื้นที่นั้น ไม่น่าแปลกใจเมื่อคุณคิดเกี่ยวกับมัน การเข้ารหัสและการสร้างแบบจำลองน่าจะเป็นสองทักษะที่สำคัญที่สุดสำหรับนักวิทยาศาสตร์ข้อมูล คำถามประเภทการเข้ารหัสแพร่หลาย โดยมีมากกว่าหนึ่งในสามของคำถามทั้งหมด ประเภทคำถามอื่นๆ เช่น อัลกอริทึมและสถิติ ก็มีความสำคัญพอสมควรเช่นกัน 24% ของคำถามทั้งหมดมาจากสองหมวดหมู่นี้ หมวดหมู่อื่นไม่ได้เป็นตัวแทน ฉันคิดว่ามันสมเหตุสมผล โดยพิจารณาจากลักษณะของบทบาทของนักวิทยาศาสตร์ข้อมูล
ตอนนี้ฉันต้องการแนะนำคุณเกี่ยวกับคำถามทุกหมวดหมู่และแสดงตัวอย่างบางส่วนของคำถามที่ถาม
แนวคิดที่ได้รับการทดสอบมากที่สุดในคำถามสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูล
การเข้ารหัส
ดังที่คุณได้เห็นแล้วว่า คำถามเกี่ยวกับการเข้ารหัสเป็นหัวข้อเดียวที่สำคัญที่สุดในวิทยาการข้อมูล คำถามดังกล่าวจะต้องมีการจัดการข้อมูลบางประเภทโดยใช้รหัสเพื่อระบุข้อมูลเชิงลึก คำถามออกแบบมาเพื่อทดสอบความสามารถในการเขียนโค้ด ทักษะการแก้ปัญหา และความคิดสร้างสรรค์ โดยปกติคุณจะทำในคอมพิวเตอร์หรือไวท์บอร์ด
ตัวอย่างคำถามสัมภาษณ์การเข้ารหัส
หนึ่ง ตัวอย่างจาก Microsoft นี่คือหนึ่ง:
คำถาม: “คำนวณส่วนแบ่งของผู้ใช้ใหม่และผู้ใช้เดิม แสดงผลเดือน ส่วนแบ่งของผู้ใช้ใหม่ และส่วนแบ่งของผู้ใช้ที่มีอยู่เป็นอัตราส่วน ผู้ใช้ใหม่หมายถึงผู้ใช้ที่เริ่มใช้บริการในเดือนปัจจุบัน ผู้ใช้ปัจจุบันคือผู้ใช้ที่เริ่มใช้บริการในเดือนปัจจุบันและใช้บริการในเดือนก่อนหน้า สมมติว่าวันที่ทั้งหมดมาจากปี 2020”
คุณจะใช้ตาราง ข้อเท็จจริงเหตุการณ์โดยข้อมูลตัวอย่างมีลักษณะดังนี้:
เพื่อให้ได้ผลลัพธ์ที่ต้องการ คุณควรเขียนโค้ดนี้:
โดย all_users เป็น ( SELECT date_part('เดือน', time_id) เป็นเดือน, นับ (DISTINCT user_id) เป็น all_users FROM fact_events GROUP BY month), new_users เป็น ( SELECT date_part('month', new_user_start_date) เป็นเดือน, นับ (DISTINCT user_id) เป็น new_users จาก (SELECT user_id, min(time_id) as new_user_start_date FROM fact_events GROUP BY user_id) sq GROUP BY month ) SELECT au.month, new_users / all_users::decimal as share_new_users, 1- (new_users / all_users::decimal) as share_existing_users จาก all_users au เข้าร่วม new_users nu ON nu.month = au.month
การเขียนโค้ดใน SQL เป็นแนวคิดที่ได้รับการทดสอบบ่อยที่สุดในการเขียนโค้ด ไม่น่าแปลกใจเลยที่ SQL เป็นเครื่องมือที่ใช้มากที่สุดในวิทยาศาสตร์ข้อมูล หนึ่งในแนวคิดที่คุณแทบจะหลีกเลี่ยงไม่ได้ในการสัมภาษณ์คือการรวม ดังนั้น ตรวจสอบให้แน่ใจว่าคุณทราบความแตกต่างระหว่างการรวมแบบต่างๆ และวิธีใช้เพื่อให้ได้ผลลัพธ์ที่ต้องการ
นอกจากนี้ คุณสามารถจัดกลุ่มข้อมูลโดยใช้ GROUP BY clause ได้บ่อยมาก แนวคิดอื่น ๆ ที่มักจะถูกถามคือการกรองข้อมูลโดยใช้ส่วนคำสั่ง WHERE และ/หรือ HAVING คุณจะถูกขอให้เลือกข้อมูลที่แตกต่างกันด้วย และตรวจสอบให้แน่ใจว่าคุณทราบฟังก์ชันรวม เช่น SUM(), AVG(), COUNT(), MIN(), MAX()
แนวคิดบางอย่างไม่ได้เกิดขึ้นบ่อยนัก แต่ก็คุ้มค่าที่จะกล่าวถึงและเตรียมพร้อมสำหรับคำถามดังกล่าว ตัวอย่างเช่น Common Table Expressions หรือ CTEs เป็นหนึ่งในหัวข้อดังกล่าว อีกอันหนึ่งคือคำสั่ง CASE() นอกจากนี้ อย่าลืมรีเฟรชหน่วยความจำในการจัดการประเภทข้อมูลสตริงและวันที่
การสร้างแบบจำลอง
การสร้างแบบจำลองเป็นหมวดหมู่ที่ใหญ่เป็นอันดับสองในข้อมูลการวิจัยของเรา โดย 20% ของคำถามทั้งหมดมาจากที่นี่ คำถามเหล่านี้ออกแบบมาเพื่อทดสอบความรู้ของคุณเกี่ยวกับการสร้างแบบจำลองทางสถิติและการนำแบบจำลองแมชชีนเลิร์นนิงไปใช้
ตัวอย่างคำถามสัมภาษณ์แบบจำลอง
การถดถอย แนวคิดด้านวิทยาการข้อมูลทางเทคนิคที่พบบ่อยที่สุดในการสัมภาษณ์ ไม่น่าแปลกใจเมื่อพิจารณาถึงลักษณะของการสร้างแบบจำลองทางสถิติ
หนึ่ง ตัวอย่างจากกัลวาไนซ์ จะเป็นดังต่อไปนี้:
คำถาม: “การทำให้เป็นมาตรฐานในการถดถอยคืออะไร”
นี่คือวิธีที่คุณสามารถตอบคำถามนี้:
ตอบ: “การทำให้เป็นมาตรฐานคือการถดถอยแบบพิเศษที่การประมาณค่าสัมประสิทธิ์ถูกจำกัด (หรือทำให้เป็นมาตรฐาน) ให้เป็นศูนย์ การทำเช่นนี้ เป็นไปได้ที่จะลดความแปรปรวนของแบบจำลองในขณะเดียวกันก็ลดข้อผิดพลาดในการสุ่มตัวอย่าง การทำให้เป็นมาตรฐานจะใช้เพื่อหลีกเลี่ยงหรือลดการโอเวอร์ฟิตติ้ง การโอเวอร์ฟิตติ้งเกิดขึ้นเมื่อโมเดลเรียนรู้ข้อมูลการฝึกได้ดีจนบั่นทอนประสิทธิภาพของโมเดลจากข้อมูลใหม่ เพื่อหลีกเลี่ยงความไม่พอดี มักใช้การทำให้เป็นปกติของ Ridge หรือ Lasso”
แนวคิดบางอย่างที่ทดสอบเป็นประจำคือแนวคิดการวิเคราะห์การถดถอยอื่นๆ เช่น การถดถอยโลจิสติก การถดถอยโลจิสติกแบบเบย์ และตัวแยกประเภทเบส์ไร้เดียงสา นอกจากนี้คุณยังสามารถถามเกี่ยวกับป่าสุ่ม เช่นเดียวกับการทดสอบและการประเมินแบบจำลอง
อัลกอริทึม
คำถามเกี่ยวกับอัลกอริทึมคือคำถามทั้งหมดที่ต้องใช้การแก้ปัญหาทางคณิตศาสตร์ โดยส่วนใหญ่ใช้รหัสโดยใช้ภาษาการเขียนโปรแกรมภาษาใดภาษาหนึ่ง คำถามเหล่านี้เกี่ยวข้องกับกระบวนการทีละขั้นตอน โดยปกติแล้วจะต้องมีการปรับเปลี่ยนหรือคำนวณเพื่อให้ได้คำตอบ คำถามเหล่านี้ทดสอบความรู้พื้นฐานของการแก้ปัญหาและการจัดการข้อมูล ซึ่งสามารถนำไปใช้กับปัญหาที่ซับซ้อนในที่ทำงาน
ตัวอย่างคำถามสัมภาษณ์อัลกอริทึม
แนวคิดทางเทคนิคที่ทดสอบส่วนใหญ่ภายใต้อัลกอริทึมคือการแก้ปัญหาทางคณิตศาสตร์หรือไวยากรณ์ด้วยภาษาโปรแกรม
ที่นี่คือ ตัวอย่างหนึ่งที่คุณสามารถพบได้ใน Leetcode:
คำถาม: “คุณได้รับรายการเชื่อมโยงที่ไม่ว่างเปล่าสองรายการซึ่งเป็นตัวแทนของจำนวนเต็มที่ไม่เป็นลบสองรายการ ตัวเลขจะถูกจัดเก็บในลำดับที่กลับกัน และแต่ละโหนดมีเลขหลักเดียว เพิ่มตัวเลขสองตัวและส่งคืนผลรวมเป็นรายการที่เชื่อมโยง”
ตัวอย่างของข้อมูลอาจเป็นดังนี้:
ที่มา: Leetcode
ตอบ: โค้ดที่เขียนในภาษาจาวาควรเป็น:
ListNode สาธารณะ addTwoNumbers (ListNode l1, ListNode l2) { ListNode dummyHead = ListNode ใหม่ (0); ListNode p = l1, q = l2, curr = dummyHead; int พกพา = 0; ในขณะที่ (p != null || q != null) { int x = (p != null) ? p.val : 0; int y = (q != null) ? q.val : 0; int sum = พกพา + x + y; พกพา = ผลรวม / 10; curr.next = ListNode ใหม่ (ผลรวม % 10); เคอร์ = curr.next; ถ้า (p != null) p = p.next; ถ้า (q != null) q = q.next; } ถ้า (พกพา > 0) { curr.next = ใหม่ ListNode (พกพา); } ส่งคืน dummyHead.next; }
แนวคิดทั่วไปอื่นๆ ที่มักจะทดสอบโดยคำถามประเภทนี้ ได้แก่ อาร์เรย์ การเขียนโปรแกรมแบบไดนามิก สตริง อัลกอริทึมโลภ การค้นหาเชิงลึกก่อน ต้นไม้ ตารางแฮช และการค้นหาแบบไบนารี
สถิติ
คำถามสัมภาษณ์สถิติเป็นคำถามที่ทดสอบความรู้ของทฤษฎีทางสถิติและหลักการที่เกี่ยวข้อง คำถามเหล่านี้มีจุดมุ่งหมายเพื่อทดสอบว่าคุณคุ้นเคยกับหลักการทางทฤษฎีที่ค้นพบในวิทยาการข้อมูลมากน้อยเพียงใด ความสามารถในการเข้าใจพื้นฐานทางทฤษฎีและคณิตศาสตร์ของการวิเคราะห์ที่กำลังทำอยู่เป็นสิ่งสำคัญ ตอบคำถามเหล่านั้นให้ดี แล้วผู้สัมภาษณ์ทุกคนจะชื่นชมคุณ
ตัวอย่างคำถามสัมภาษณ์สถิติ
แนวคิดทางเทคนิคที่ได้รับการกล่าวถึงมากที่สุดคือการสุ่มตัวอย่างและการกระจาย สำหรับนักวิทยาศาสตร์ข้อมูล นี่เป็นหนึ่งในหลักการทางสถิติที่ใช้บ่อยที่สุดที่นักวิทยาศาสตร์ข้อมูลใช้ทุกวัน
ตัวอย่างเช่น คำถามสัมภาษณ์จาก IBM ถาม:
คำถาม: “ตัวอย่างประเภทข้อมูลที่มีการแจกแจงแบบไม่ใช่เกาส์คืออะไร”
ในการตอบคำถาม ก่อนอื่นคุณต้องกำหนดการแจกแจงแบบเกาส์เซียน จากนั้นคุณสามารถทำตามได้โดยยกตัวอย่างของการแจกแจงที่ไม่ใช่แบบเกาส์เซียน สิ่งนี้:
ตอบ: “การแจกแจงแบบเกาส์เซียนคือการแจกแจงที่สามารถพบเปอร์เซ็นต์ของข้อมูลที่ทราบเมื่อตรวจสอบค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย หรือที่เรียกว่าการแจกแจงแบบปกติ ตัวอย่างบางส่วนของการแจกแจงที่ไม่ใช่แบบเกาส์เซียนอาจเป็นการแจกแจงแบบเอกซ์โปเนนเชียลหรือการแจกแจงแบบทวินาม”
เมื่อเตรียมตัวสำหรับการสัมภาษณ์งาน อย่าลืมครอบคลุมหัวข้อต่อไปนี้ด้วย: ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวนร่วมและสหสัมพันธ์ ค่า p ค่าเฉลี่ยและค่ามัธยฐาน การทดสอบสมมติฐาน และสถิติแบบเบส์ นี่คือแนวคิดทั้งหมดที่คุณต้องการในฐานะนักวิทยาศาสตร์ด้านข้อมูล ดังนั้นควรคาดหวังแนวคิดเหล่านี้ในการสัมภาษณ์งานด้วย
ความน่าจะเป็น
คำถามเหล่านี้ต้องการความรู้ทางทฤษฎีเกี่ยวกับแนวคิดความน่าจะเป็นเท่านั้น ผู้สัมภาษณ์ถามคำถามเหล่านี้เพื่อทำความเข้าใจอย่างลึกซึ้งเกี่ยวกับความรู้ของคุณเกี่ยวกับวิธีการและการใช้ความน่าจะเป็นในการศึกษาข้อมูลที่ซับซ้อนซึ่งมักจะดำเนินการในที่ทำงาน
ตัวอย่างคำถามสัมภาษณ์ความน่าจะเป็น
มีความเป็นไปได้สูง ปุนตั้งใจว่า คำถามที่คุณจะได้รับคือการคำนวณความน่าจะเป็นที่จะได้ไพ่/ตัวเลขจากชุดของลูกเต๋า/ไพ่ นี่ดูเหมือนจะเป็นองค์ประกอบทั่วไปของการตั้งคำถามสำหรับบริษัทส่วนใหญ่ในการวิจัยของเรา เนื่องจากมีบริษัทจำนวนมากถามคำถามประเภทนี้
ตัวอย่างของเช่น คำถามความน่าจะเป็นจาก Facebook:
คำถาม: “ความน่าจะเป็นที่จะได้ไพ่คู่โดยการจั่วไพ่สองใบแยกกันในสำรับไพ่ 52 ใบเป็นเท่าใด”
นี่คือวิธีที่คุณสามารถตอบคำถามนี้:
ตอบ: “ไพ่ใบแรกที่คุณจั่วสามารถเป็นอะไรก็ได้ ดังนั้นมันจะไม่ส่งผลต่อผลลัพธ์ นอกจากว่าจะมีไพ่เหลือน้อยกว่าหนึ่งใบในสำรับ เมื่อจั่วไพ่ใบแรกแล้ว จะมีไพ่เหลืออีกสามใบในสำรับที่สามารถจั่วได้ไพ่คู่ ดังนั้น โอกาสที่จะจับคู่ไพ่ใบแรกของคุณกับไพ่คู่คือ 3 ใน 51 (ไพ่ที่เหลือ) ซึ่งหมายความว่าความน่าจะเป็นของเหตุการณ์นี้คือ 3/51 หรือ 5.89%”
เนื่องจากคำถามนี้เป็นคำถาม "เฉพาะทาง" ที่เกี่ยวข้องกับความน่าจะเป็นเท่านั้น จึงไม่มีการถามแนวคิดอื่นๆ ข้อแตกต่างเพียงอย่างเดียวคือความคิดสร้างสรรค์ของคำถาม แต่โดยพื้นฐานแล้ว คุณจะต้องคำนวณความน่าจะเป็นของเหตุการณ์บางอย่างและแสดงความคิดของคุณเสมอ
ผลิตภัณฑ์
คำถามสัมภาษณ์ผลิตภัณฑ์จะขอให้คุณประเมินประสิทธิภาพของผลิตภัณฑ์/บริการผ่านข้อมูล คำถามเหล่านี้ทดสอบความรู้ของคุณเกี่ยวกับการปรับและใช้หลักการด้านวิทยาศาสตร์ข้อมูลในทุกสภาพแวดล้อม เช่นเดียวกับการทำงานประจำวัน
ตัวอย่างคำถามสัมภาษณ์ผลิตภัณฑ์
แนวคิดทางเทคนิคที่โดดเด่นที่สุดในหมวดหมู่นี้คือการระบุผลิตภัณฑ์ของบริษัทและเสนอการปรับปรุงจากมุมมองของนักวิทยาศาสตร์ข้อมูล ความแปรปรวนสูงในแนวคิดทางเทคนิคที่ทดสอบในด้านผลิตภัณฑ์สามารถอธิบายได้ด้วยลักษณะของคำถามเกี่ยวกับผลิตภัณฑ์และความคิดสร้างสรรค์ในระดับที่สูงขึ้นที่จำเป็นในการตอบคำถามเหล่านี้
ตัวอย่างของไฟล์ คำถามเกี่ยวกับผลิตภัณฑ์จาก Facebook อยากจะเป็น:
คำถาม: “ผลิตภัณฑ์ Facebook ที่คุณชื่นชอบคืออะไร และคุณจะปรับปรุงมันอย่างไร”
ตอบ: เนื่องจากลักษณะของคำถาม เราจะให้คุณตอบคำถามนี้ด้วยตัวเอง
แนวคิดทั่วไปที่ทดสอบอย่างหนักขึ้นอยู่กับบริษัทที่สัมภาษณ์คุณ เพียงให้แน่ใจว่าคุณคุ้นเคยกับธุรกิจของบริษัทและผลิตภัณฑ์ของบริษัท (ควรเป็นผู้ใช้ของบริษัทด้วย) เท่านี้คุณก็สบายดี
¡Ã³ÕÈÖ¡ÉÒ·Ò§¸ØáԨ
หมวดหมู่นี้รวมถึงกรณีศึกษาและคำถามทั่วไปที่เกี่ยวข้องกับธุรกิจที่จะทดสอบทักษะด้านวิทยาศาสตร์ข้อมูล ความสำคัญของการรู้วิธีตอบคำถามเหล่านี้มีความสำคัญมาก เนื่องจากผู้สัมภาษณ์บางคนต้องการให้ผู้สมัครรู้วิธีใช้หลักการด้านวิทยาศาสตร์ข้อมูลเพื่อแก้ปัญหาเฉพาะของบริษัทก่อนที่จะจ้างพวกเขา
ตัวอย่างคำถามกรณีธุรกิจ
เนื่องจากลักษณะของคำถาม ฉันไม่สามารถระบุแนวคิดทางเทคนิคเดียวที่โดดเด่นได้ เนื่องจากคำถามส่วนใหญ่ที่จัดหมวดหมู่ไว้ในที่นี้เป็นกรณีศึกษา จึงมีลักษณะเฉพาะที่แตกต่างกันไป
อย่างไรก็ตาม นี่คือตัวอย่างหนึ่งของ คำถามกรณีธุรกิจจาก Uber:
คำถาม: “มีคนจำนวนมากที่ใช้บริการ Uber จากสองเมืองที่อยู่ใกล้กัน เช่น Menlo Park และ Palo Alto และข้อมูลใดๆ ก็ตามที่คุณนึกออกจะถูกเก็บรวบรวม คุณจะรวบรวมข้อมูลอะไรเพื่อให้สามารถระบุเมืองที่ผู้โดยสารนั่งรถมา”
ตอบ: “ในการระบุเมือง เราจำเป็นต้องเข้าถึงตำแหน่งที่ตั้ง/ข้อมูลทางภูมิศาสตร์ ข้อมูลที่เก็บรวบรวมอาจเป็นพิกัด GPS ลองจิจูด/ละติจูด และรหัสไปรษณีย์”
การออกแบบระบบ
คำถามเกี่ยวกับการออกแบบระบบเป็นคำถามที่เกี่ยวข้องกับการออกแบบระบบเทคโนโลยีทั้งหมด พวกเขาจะถูกขอให้วิเคราะห์กระบวนการของผู้สมัครในการแก้ปัญหา สร้าง และออกแบบระบบเพื่อช่วยเหลือลูกค้า/ผู้รับบริการ การรู้ว่าการออกแบบระบบมีความสำคัญมากสำหรับนักวิทยาศาสตร์ข้อมูล แม้ว่าบทบาทของคุณไม่ใช่การออกแบบระบบ แต่คุณมักจะมีบทบาทในระบบที่จัดตั้งขึ้นและจำเป็นต้องรู้ว่ามันทำงานอย่างไรเพื่อทำงานของคุณ
ตัวอย่างคำถามสัมภาษณ์การออกแบบระบบ
คำถามเหล่านี้ครอบคลุมหัวข้อและงานต่างๆ แต่สิ่งที่โดดเด่นคือการสร้างฐานข้อมูล นักวิทยาศาสตร์ด้านข้อมูลจัดการกับฐานข้อมูลอย่างหนักทุกวัน ดังนั้นจึงเหมาะสมที่จะถามคำถามนี้เพื่อดูว่าคุณสามารถสร้างฐานข้อมูลตั้งแต่เริ่มต้นได้หรือไม่
ที่นี่ที่หนึ่ง ตัวอย่างคำถามจาก Audible ค้นพบในการวิจัยของเรา:
คำถาม: “คุณช่วยแนะนำเราเกี่ยวกับวิธีการสร้างระบบคำแนะนำได้ไหม”
ตอบ: เนื่องจากมีแนวทางที่หลากหลายในการตอบคำถามนี้ เราจะปล่อยให้คุณสร้างแนวทางของคุณเอง
อีกครั้ง เพื่อตอบคำถามเหล่านี้ จำเป็นต้องรู้ธุรกิจของบริษัท คิดสักนิดเกี่ยวกับฐานข้อมูลที่บริษัทอาจต้องการมากที่สุด และพยายามขยายแนวทางของคุณเล็กน้อยก่อนการสัมภาษณ์
วิชาการ
คำถามทางเทคนิคเป็นคำถามทั้งหมดที่ถามเกี่ยวกับคำอธิบายของแนวคิดทางเทคนิคด้านวิทยาการข้อมูลต่างๆ คำถามทางเทคนิคเป็นคำถามเชิงทฤษฎีและต้องการความรู้ด้านเทคโนโลยีที่คุณจะใช้ที่บริษัท เนื่องจากธรรมชาติแล้ว คำถามเหล่านี้อาจดูเหมือนคำถามเกี่ยวกับการเข้ารหัส การรู้ทฤษฎีเบื้องหลังสิ่งที่คุณกำลังทำอยู่นั้นค่อนข้างสำคัญ ดังนั้นคำถามทางเทคนิคจึงมักถูกถามในการสัมภาษณ์
ตัวอย่างคำถามสัมภาษณ์ทางเทคนิค
ส่วนที่ทดสอบมากที่สุดคือความรู้ทางทฤษฎีของ Python และ SQL ไม่น่าแปลกใจ เนื่องจากทั้งสองภาษานี้มีความโดดเด่นในด้านวิทยาศาสตร์ข้อมูล พร้อมด้วย R เพื่อเสริมการทำงานของ Python
ตัวอย่างของไฟล์ คำถามทางเทคนิคในโลกแห่งความจริงจาก Walmart อยากจะเป็น:
คำถาม"โครงสร้างข้อมูลใน Python คืออะไร?"
ตอบ: “โครงสร้างข้อมูลใช้สำหรับจัดเก็บข้อมูล มีสี่โครงสร้างข้อมูลใน Python: List, Dictionary, Tuple และ Set นั่นคือโครงสร้างข้อมูลในตัว รายการใช้สำหรับสร้างรายการที่สามารถมีข้อมูลประเภทต่างๆ พจนานุกรมนั้นเป็นชุดของคีย์ ใช้เพื่อเก็บค่าด้วยคีย์และรับข้อมูลโดยใช้คีย์เดียวกัน สิ่งอันดับจะเหมือนกับรายการ ความแตกต่างคือใน tuple ข้อมูลไม่สามารถเปลี่ยนแปลงได้ ชุดประกอบด้วยองค์ประกอบที่ไม่ได้เรียงลำดับโดยไม่มีการซ้ำกัน นอกจากโครงสร้างข้อมูลในตัวแล้ว ยังมีโครงสร้างข้อมูลที่ผู้ใช้กำหนดอีกด้วย”
คำถามเหล่านี้เป็นคำถามที่จับใจความได้ทุกประเภท เป็นหมวดหมู่สำหรับคำถามทั้งหมดที่ไม่สามารถจัดอยู่ในหมวดหมู่อื่นได้อย่างหมดจด ด้วยเหตุนี้จึงไม่มีแนวคิดเฉพาะที่เกิดขึ้นมากหรือน้อย
สรุป
คู่มือการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลนี้เขียนขึ้นเพื่อสนับสนุนการวิจัยที่ดำเนินการเพื่อทำความเข้าใจประเภทของคำถามที่ถูกถามในการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูล ข้อมูลคำถามสัมภาษณ์นำมาจากบริษัทหลายสิบแห่งในช่วงเวลาสี่ปีและวิเคราะห์ คำถามได้รับการจัดหมวดหมู่ภายใต้คำถามที่แตกต่างกันเก้าประเภท (อัลกอริทึม กรณีธุรกิจ การเข้ารหัส การสร้างแบบจำลอง ความน่าจะเป็น ผลิตภัณฑ์ สถิติ การออกแบบระบบ และคำถามทางเทคนิค)
ในส่วนหนึ่งของการวิเคราะห์ ฉันได้พูดคุยเกี่ยวกับแนวคิดทางเทคนิคที่พบบ่อยที่สุดจากประเภทคำถามแต่ละประเภท ตัวอย่างเช่น คำถามทางสถิติที่ถูกถามมากที่สุดเกี่ยวข้องกับการสุ่มตัวอย่างและการแจกแจง คำถามทุกหมวดหมู่ได้รับการสนับสนุนโดยตัวอย่างจริงของคำถามจริง
บทความนี้มีไว้เพื่อเป็นแนวทางสำคัญในการเตรียมการสัมภาษณ์หรือเรียนรู้เพิ่มเติมเกี่ยวกับวิทยาศาสตร์ข้อมูล ฉันหวังว่าฉันจะช่วยให้คุณรู้สึกสบายใจมากขึ้นเกี่ยวกับกระบวนการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูล ขอให้โชคดีกับการสัมภาษณ์ของคุณ!
Original. โพสต์ใหม่โดยได้รับอนุญาต
ที่เกี่ยวข้อง
ที่มา: https://www.kdnuggets.com/2021/08/common-data-science-interview-questions-answers.html
- "
- &
- 2020
- 2021
- เข้า
- ขั้นตอนวิธี
- อัลกอริทึม
- ทั้งหมด
- สหรัฐอเมริกา
- การวิเคราะห์
- การวิเคราะห์
- app
- AREA
- บทความ
- รถยนต์
- บล็อก
- ชายแดน
- สร้าง
- การก่อสร้าง
- ธุรกิจ
- กรณีศึกษา
- เมือง
- เมือง
- รหัส
- การเข้ารหัส
- มา
- ร่วมกัน
- บริษัท
- บริษัท
- การสร้าง
- ความคิดสร้างสรรค์
- ปัจจุบัน
- ข้อมูล
- วิทยาศาสตร์ข้อมูล
- นักวิทยาศาสตร์ข้อมูล
- ฐานข้อมูล
- ฐานข้อมูล
- วันที่
- จัดการ
- ข้อเสนอ
- การเรียนรู้ลึก ๆ
- ออกแบบ
- DID
- เลข
- ตัวเลข
- ผู้อำนวยการ
- ทำอย่างละเอียด
- วิศวกร
- วิศวกร
- สิ่งแวดล้อม
- ประมาณการ
- เหตุการณ์
- ประสบการณ์
- ปลาย
- ชื่อจริง
- พอดี
- ปฏิบัติตาม
- General
- ให้
- Glassdoor
- ดี
- จีพีเอส
- GPUs
- บัญชีกลุ่ม
- การเจริญเติบโต
- ให้คำแนะนำ
- การจัดการ
- ฮาร์วาร์
- กัญชา
- โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม
- จุดสูง
- การว่าจ้าง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTTPS
- ร้อย
- แยกแยะ
- ส่งผลกระทบ
- รวม
- อุตสาหกรรม
- ข้อมูล
- ข้อมูลเชิงลึก
- สัมภาษณ์
- บทสัมภาษณ์
- IT
- ชวา
- การสัมภาษณ์
- ร่วม
- คีย์
- กุญแจ
- ความรู้
- ภาษา
- ภาษา
- เรียนรู้
- การเรียนรู้
- ชั้น
- รายการ
- รายการ
- เรียนรู้เครื่อง
- การจัดการ
- ML
- แบบ
- โหนด
- ตัวเลข
- ออนไลน์
- เปิด
- โอเพนซอร์ส
- ใบสั่ง
- อื่นๆ
- คน
- การปฏิบัติ
- มุมมอง
- แพลตฟอร์ม
- สระ
- ผลิตภัณฑ์
- ผลิตภัณฑ์
- การเขียนโปรแกรม
- การเขียนโปรแกรมภาษา
- หลาม
- ลด
- ถดถอย
- การวิจัย
- ย้อนกลับ
- ทบทวน
- วิทยาศาสตร์
- นักวิทยาศาสตร์
- ค้นหา
- ความรู้สึก
- บริการ
- ชุด
- Share
- เงิน
- ทักษะ
- So
- แก้
- SQL
- ข้อความที่เริ่ม
- คำแถลง
- สถิติ
- จัดเก็บ
- จำนวนชั้น
- การศึกษา
- สนับสนุน
- ที่สนับสนุน
- แปลกใจ
- ระบบ
- ระบบ
- วิชาการ
- เทคโนโลยี
- ทดสอบ
- การทดสอบ
- คิด
- เวลา
- ด้านบน
- หัวข้อ
- การฝึกอบรม
- us
- ผู้ใช้
- ความคุ้มค่า
- เว็บไซต์
- WHO
- งาน
- ที่ทำงาน
- โรงงาน
- คุ้มค่า
- X
- ปี
- ปี
- เป็นศูนย์