คำถามและคำตอบในการสัมภาษณ์วิทยาศาสตร์ข้อมูลทั่วไปส่วนใหญ่

โหนดต้นทาง: 1860815

บล็อกเงินคำถามและคำตอบในการสัมภาษณ์วิทยาศาสตร์ข้อมูลทั่วไปส่วนใหญ่

หลังจากวิเคราะห์คำถามสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลมากกว่า 900 ข้อจากบริษัทต่างๆ ในช่วงไม่กี่ปีที่ผ่านมา หมวดหมู่คำถามสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลที่พบบ่อยที่สุดจะได้รับการทบทวนในคู่มือนี้ โดยแต่ละข้อจะอธิบายด้วยตัวอย่าง


By เนท โรซิดิ, นักวิทยาศาสตร์ข้อมูลและผู้จัดการผลิตภัณฑ์.

การเป็นนักวิทยาศาสตร์ข้อมูลถือเป็นคุณสมบัติอันทรงเกียรติ ย้อนกลับไปในปี 2012 Harvard Business Review ยกให้ 'นักวิทยาศาสตร์ข้อมูล' เป็นงานที่เซ็กซี่ที่สุดในศตวรรษที่ 21 และแนวโน้มที่เพิ่มขึ้นของบทบาทในอุตสาหกรรมดูเหมือนจะยืนยันคำกล่าวดังกล่าว เพื่อยืนยันว่าความเซ็กซี่นี้ยังคงดำเนินต่อไป ข้อมูลจาก Glassdoor แสดงให้เห็นว่าการเป็นนักวิทยาศาสตร์ข้อมูลคืองานที่ดีที่สุดอันดับสองในอเมริกาในปี 2021

ที่มา: Glassdoor

เพื่อให้ได้งานที่มีเกียรติ คุณต้องผ่านการสัมภาษณ์งานที่เข้มงวด คำถามด้านวิทยาศาสตร์ข้อมูลที่ถามอาจกว้างและซับซ้อนมาก สิ่งนี้เป็นสิ่งที่คาดหวัง เมื่อพิจารณาจากบทบาทของนักวิทยาศาสตร์ข้อมูลมักจะรวมเอาหลายๆ ด้านเข้าไว้ด้วยกัน เพื่อช่วยคุณเตรียมตัวสำหรับการสัมภาษณ์งานด้านวิทยาการข้อมูล ฉันได้ตรวจสอบคำถามที่เกี่ยวข้องทั้งหมดและแยกคำถามออกเป็นหมวดหมู่คำถามต่างๆ นี่คือวิธีที่ฉันทำ

คำอธิบายและวิธีการวิเคราะห์

ฉันรวบรวมข้อมูลจากบอร์ดค้นหางานและเว็บไซต์และแพลตฟอร์มรีวิวบริษัทต่างๆ เช่น Glassdoor, Indeed, Reddit และ Blind App เพื่อให้แม่นยำยิ่งขึ้น มีคำถาม 903 ข้อที่รวบรวมในช่วงสี่ปีที่ผ่านมา

คำถามแบ่งออกเป็นหมวดหมู่ที่กำหนดไว้ล่วงหน้า หมวดหมู่เหล่านี้เป็นผลมาจากการวิเคราะห์โดยผู้เชี่ยวชาญเกี่ยวกับคำอธิบายประสบการณ์การสัมภาษณ์ที่นำมาจากแหล่งข้อมูลของเรา

หมวดหมู่คือ:

  1. การเข้ารหัส
  2. การสร้างแบบจำลอง
  3. อัลกอริทึม
  4. สถิติ
  5. ความน่าจะเป็น
  6. ผลิตภัณฑ์
  7. กรณีธุรกิจ
  8. ออกแบบระบบ
  9. วิชาการ

คุณควรคาดหวังคำถามสัมภาษณ์ประเภทใด

แผนภูมินี้แสดงประเภทคำถามตามหมวดหมู่ตามข้อมูลที่รวบรวม

เมื่อแปลเป็นเปอร์เซ็นต์แล้ว แผนภูมิจะมีลักษณะดังนี้:

อย่างที่คุณเห็น คำถามเกี่ยวกับการเข้ารหัสและการสร้างแบบจำลองมีความสำคัญมากที่สุด มากกว่าครึ่งของคำถามทั้งหมดมาจากพื้นที่นั้น ไม่น่าแปลกใจเมื่อคุณคิดเกี่ยวกับมัน การเข้ารหัสและการสร้างแบบจำลองน่าจะเป็นสองทักษะที่สำคัญที่สุดสำหรับนักวิทยาศาสตร์ข้อมูล คำถามประเภทการเข้ารหัสแพร่หลาย โดยมีมากกว่าหนึ่งในสามของคำถามทั้งหมด ประเภทคำถามอื่นๆ เช่น อัลกอริทึมและสถิติ ก็มีความสำคัญพอสมควรเช่นกัน 24% ของคำถามทั้งหมดมาจากสองหมวดหมู่นี้ หมวดหมู่อื่นไม่ได้เป็นตัวแทน ฉันคิดว่ามันสมเหตุสมผล โดยพิจารณาจากลักษณะของบทบาทของนักวิทยาศาสตร์ข้อมูล

ตอนนี้ฉันต้องการแนะนำคุณเกี่ยวกับคำถามทุกหมวดหมู่และแสดงตัวอย่างบางส่วนของคำถามที่ถาม

แนวคิดที่ได้รับการทดสอบมากที่สุดในคำถามสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูล

การเข้ารหัส

ดังที่คุณได้เห็นแล้วว่า คำถามเกี่ยวกับการเข้ารหัสเป็นหัวข้อเดียวที่สำคัญที่สุดในวิทยาการข้อมูล คำถามดังกล่าวจะต้องมีการจัดการข้อมูลบางประเภทโดยใช้รหัสเพื่อระบุข้อมูลเชิงลึก คำถามออกแบบมาเพื่อทดสอบความสามารถในการเขียนโค้ด ทักษะการแก้ปัญหา และความคิดสร้างสรรค์ โดยปกติคุณจะทำในคอมพิวเตอร์หรือไวท์บอร์ด

ตัวอย่างคำถามสัมภาษณ์การเข้ารหัส

หนึ่ง ตัวอย่างจาก Microsoft นี่คือหนึ่ง:

คำถาม: “คำนวณส่วนแบ่งของผู้ใช้ใหม่และผู้ใช้เดิม แสดงผลเดือน ส่วนแบ่งของผู้ใช้ใหม่ และส่วนแบ่งของผู้ใช้ที่มีอยู่เป็นอัตราส่วน ผู้ใช้ใหม่หมายถึงผู้ใช้ที่เริ่มใช้บริการในเดือนปัจจุบัน ผู้ใช้ปัจจุบันคือผู้ใช้ที่เริ่มใช้บริการในเดือนปัจจุบันและใช้บริการในเดือนก่อนหน้า สมมติว่าวันที่ทั้งหมดมาจากปี 2020”

คุณจะใช้ตาราง ข้อเท็จจริงเหตุการณ์โดยข้อมูลตัวอย่างมีลักษณะดังนี้:

เพื่อให้ได้ผลลัพธ์ที่ต้องการ คุณควรเขียนโค้ดนี้:

โดย all_users เป็น ( SELECT date_part('เดือน', time_id) เป็นเดือน, นับ (DISTINCT user_id) เป็น all_users FROM fact_events GROUP BY month), new_users เป็น ( SELECT date_part('month', new_user_start_date) เป็นเดือน, นับ (DISTINCT user_id) เป็น new_users จาก (SELECT user_id, min(time_id) as new_user_start_date FROM fact_events GROUP BY user_id) sq GROUP BY month ) SELECT au.month, new_users / all_users::decimal as share_new_users, 1- (new_users / all_users::decimal) as share_existing_users จาก all_users au เข้าร่วม new_users nu ON nu.month = au.month 

การเขียนโค้ดใน SQL เป็นแนวคิดที่ได้รับการทดสอบบ่อยที่สุดในการเขียนโค้ด ไม่น่าแปลกใจเลยที่ SQL เป็นเครื่องมือที่ใช้มากที่สุดในวิทยาศาสตร์ข้อมูล หนึ่งในแนวคิดที่คุณแทบจะหลีกเลี่ยงไม่ได้ในการสัมภาษณ์คือการรวม ดังนั้น ตรวจสอบให้แน่ใจว่าคุณทราบความแตกต่างระหว่างการรวมแบบต่างๆ และวิธีใช้เพื่อให้ได้ผลลัพธ์ที่ต้องการ

นอกจากนี้ คุณสามารถจัดกลุ่มข้อมูลโดยใช้ GROUP BY clause ได้บ่อยมาก แนวคิดอื่น ๆ ที่มักจะถูกถามคือการกรองข้อมูลโดยใช้ส่วนคำสั่ง WHERE และ/หรือ HAVING คุณจะถูกขอให้เลือกข้อมูลที่แตกต่างกันด้วย และตรวจสอบให้แน่ใจว่าคุณทราบฟังก์ชันรวม เช่น SUM(), AVG(), COUNT(), MIN(), MAX()

แนวคิดบางอย่างไม่ได้เกิดขึ้นบ่อยนัก แต่ก็คุ้มค่าที่จะกล่าวถึงและเตรียมพร้อมสำหรับคำถามดังกล่าว ตัวอย่างเช่น Common Table Expressions หรือ CTEs เป็นหนึ่งในหัวข้อดังกล่าว อีกอันหนึ่งคือคำสั่ง CASE() นอกจากนี้ อย่าลืมรีเฟรชหน่วยความจำในการจัดการประเภทข้อมูลสตริงและวันที่

การสร้างแบบจำลอง

การสร้างแบบจำลองเป็นหมวดหมู่ที่ใหญ่เป็นอันดับสองในข้อมูลการวิจัยของเรา โดย 20% ของคำถามทั้งหมดมาจากที่นี่ คำถามเหล่านี้ออกแบบมาเพื่อทดสอบความรู้ของคุณเกี่ยวกับการสร้างแบบจำลองทางสถิติและการนำแบบจำลองแมชชีนเลิร์นนิงไปใช้

ตัวอย่างคำถามสัมภาษณ์แบบจำลอง

การถดถอย แนวคิดด้านวิทยาการข้อมูลทางเทคนิคที่พบบ่อยที่สุดในการสัมภาษณ์ ไม่น่าแปลกใจเมื่อพิจารณาถึงลักษณะของการสร้างแบบจำลองทางสถิติ

หนึ่ง ตัวอย่างจากกัลวาไนซ์ จะเป็นดังต่อไปนี้:

คำถาม: “การทำให้เป็นมาตรฐานในการถดถอยคืออะไร”

นี่คือวิธีที่คุณสามารถตอบคำถามนี้:

ตอบ: “การทำให้เป็นมาตรฐานคือการถดถอยแบบพิเศษที่การประมาณค่าสัมประสิทธิ์ถูกจำกัด (หรือทำให้เป็นมาตรฐาน) ให้เป็นศูนย์ การทำเช่นนี้ เป็นไปได้ที่จะลดความแปรปรวนของแบบจำลองในขณะเดียวกันก็ลดข้อผิดพลาดในการสุ่มตัวอย่าง การทำให้เป็นมาตรฐานจะใช้เพื่อหลีกเลี่ยงหรือลดการโอเวอร์ฟิตติ้ง การโอเวอร์ฟิตติ้งเกิดขึ้นเมื่อโมเดลเรียนรู้ข้อมูลการฝึกได้ดีจนบั่นทอนประสิทธิภาพของโมเดลจากข้อมูลใหม่ เพื่อหลีกเลี่ยงความไม่พอดี มักใช้การทำให้เป็นปกติของ Ridge หรือ Lasso”

แนวคิดบางอย่างที่ทดสอบเป็นประจำคือแนวคิดการวิเคราะห์การถดถอยอื่นๆ เช่น การถดถอยโลจิสติก การถดถอยโลจิสติกแบบเบย์ และตัวแยกประเภทเบส์ไร้เดียงสา นอกจากนี้คุณยังสามารถถามเกี่ยวกับป่าสุ่ม เช่นเดียวกับการทดสอบและการประเมินแบบจำลอง

อัลกอริทึม

คำถามเกี่ยวกับอัลกอริทึมคือคำถามทั้งหมดที่ต้องใช้การแก้ปัญหาทางคณิตศาสตร์ โดยส่วนใหญ่ใช้รหัสโดยใช้ภาษาการเขียนโปรแกรมภาษาใดภาษาหนึ่ง คำถามเหล่านี้เกี่ยวข้องกับกระบวนการทีละขั้นตอน โดยปกติแล้วจะต้องมีการปรับเปลี่ยนหรือคำนวณเพื่อให้ได้คำตอบ คำถามเหล่านี้ทดสอบความรู้พื้นฐานของการแก้ปัญหาและการจัดการข้อมูล ซึ่งสามารถนำไปใช้กับปัญหาที่ซับซ้อนในที่ทำงาน

ตัวอย่างคำถามสัมภาษณ์อัลกอริทึม

แนวคิดทางเทคนิคที่ทดสอบส่วนใหญ่ภายใต้อัลกอริทึมคือการแก้ปัญหาทางคณิตศาสตร์หรือไวยากรณ์ด้วยภาษาโปรแกรม

ที่นี่คือ ตัวอย่างหนึ่งที่คุณสามารถพบได้ใน Leetcode:

คำถาม: “คุณได้รับรายการเชื่อมโยงที่ไม่ว่างเปล่าสองรายการซึ่งเป็นตัวแทนของจำนวนเต็มที่ไม่เป็นลบสองรายการ ตัวเลขจะถูกจัดเก็บในลำดับที่กลับกัน และแต่ละโหนดมีเลขหลักเดียว เพิ่มตัวเลขสองตัวและส่งคืนผลรวมเป็นรายการที่เชื่อมโยง”

ตัวอย่างของข้อมูลอาจเป็นดังนี้:

ที่มา: Leetcode

ตอบ: โค้ดที่เขียนในภาษาจาวาควรเป็น:

ListNode สาธารณะ addTwoNumbers (ListNode l1, ListNode l2) { ListNode dummyHead = ListNode ใหม่ (0); ListNode p = l1, q = l2, curr = dummyHead; int พกพา = 0; ในขณะที่ (p != null || q != null) { int x = (p != null) ? p.val : 0; int y = (q != null) ? q.val : 0; int sum = พกพา + x + y; พกพา = ผลรวม / 10; curr.next = ListNode ใหม่ (ผลรวม % 10); เคอร์ = curr.next; ถ้า (p != null) p = p.next; ถ้า (q != null) q = q.next; } ถ้า (พกพา > 0) { curr.next = ใหม่ ListNode (พกพา); } ส่งคืน dummyHead.next; } 

แนวคิดทั่วไปอื่นๆ ที่มักจะทดสอบโดยคำถามประเภทนี้ ได้แก่ อาร์เรย์ การเขียนโปรแกรมแบบไดนามิก สตริง อัลกอริทึมโลภ การค้นหาเชิงลึกก่อน ต้นไม้ ตารางแฮช และการค้นหาแบบไบนารี

สถิติ

คำถามสัมภาษณ์สถิติเป็นคำถามที่ทดสอบความรู้ของทฤษฎีทางสถิติและหลักการที่เกี่ยวข้อง คำถามเหล่านี้มีจุดมุ่งหมายเพื่อทดสอบว่าคุณคุ้นเคยกับหลักการทางทฤษฎีที่ค้นพบในวิทยาการข้อมูลมากน้อยเพียงใด ความสามารถในการเข้าใจพื้นฐานทางทฤษฎีและคณิตศาสตร์ของการวิเคราะห์ที่กำลังทำอยู่เป็นสิ่งสำคัญ ตอบคำถามเหล่านั้นให้ดี แล้วผู้สัมภาษณ์ทุกคนจะชื่นชมคุณ

ตัวอย่างคำถามสัมภาษณ์สถิติ

แนวคิดทางเทคนิคที่ได้รับการกล่าวถึงมากที่สุดคือการสุ่มตัวอย่างและการกระจาย สำหรับนักวิทยาศาสตร์ข้อมูล นี่เป็นหนึ่งในหลักการทางสถิติที่ใช้บ่อยที่สุดที่นักวิทยาศาสตร์ข้อมูลใช้ทุกวัน

ตัวอย่างเช่น คำถามสัมภาษณ์จาก IBM ถาม:

คำถาม: “ตัวอย่างประเภทข้อมูลที่มีการแจกแจงแบบไม่ใช่เกาส์คืออะไร”

ในการตอบคำถาม ก่อนอื่นคุณต้องกำหนดการแจกแจงแบบเกาส์เซียน จากนั้นคุณสามารถทำตามได้โดยยกตัวอย่างของการแจกแจงที่ไม่ใช่แบบเกาส์เซียน สิ่งนี้:

ตอบ: “การแจกแจงแบบเกาส์เซียนคือการแจกแจงที่สามารถพบเปอร์เซ็นต์ของข้อมูลที่ทราบเมื่อตรวจสอบค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย หรือที่เรียกว่าการแจกแจงแบบปกติ ตัวอย่างบางส่วนของการแจกแจงที่ไม่ใช่แบบเกาส์เซียนอาจเป็นการแจกแจงแบบเอกซ์โปเนนเชียลหรือการแจกแจงแบบทวินาม”

เมื่อเตรียมตัวสำหรับการสัมภาษณ์งาน อย่าลืมครอบคลุมหัวข้อต่อไปนี้ด้วย: ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวนร่วมและสหสัมพันธ์ ค่า p ค่าเฉลี่ยและค่ามัธยฐาน การทดสอบสมมติฐาน และสถิติแบบเบส์ นี่คือแนวคิดทั้งหมดที่คุณต้องการในฐานะนักวิทยาศาสตร์ด้านข้อมูล ดังนั้นควรคาดหวังแนวคิดเหล่านี้ในการสัมภาษณ์งานด้วย

ความน่าจะเป็น

คำถามเหล่านี้ต้องการความรู้ทางทฤษฎีเกี่ยวกับแนวคิดความน่าจะเป็นเท่านั้น ผู้สัมภาษณ์ถามคำถามเหล่านี้เพื่อทำความเข้าใจอย่างลึกซึ้งเกี่ยวกับความรู้ของคุณเกี่ยวกับวิธีการและการใช้ความน่าจะเป็นในการศึกษาข้อมูลที่ซับซ้อนซึ่งมักจะดำเนินการในที่ทำงาน

ตัวอย่างคำถามสัมภาษณ์ความน่าจะเป็น

มีความเป็นไปได้สูง ปุนตั้งใจว่า คำถามที่คุณจะได้รับคือการคำนวณความน่าจะเป็นที่จะได้ไพ่/ตัวเลขจากชุดของลูกเต๋า/ไพ่ นี่ดูเหมือนจะเป็นองค์ประกอบทั่วไปของการตั้งคำถามสำหรับบริษัทส่วนใหญ่ในการวิจัยของเรา เนื่องจากมีบริษัทจำนวนมากถามคำถามประเภทนี้

ตัวอย่างของเช่น คำถามความน่าจะเป็นจาก Facebook:

คำถาม: “ความน่าจะเป็นที่จะได้ไพ่คู่โดยการจั่วไพ่สองใบแยกกันในสำรับไพ่ 52 ใบเป็นเท่าใด”

นี่คือวิธีที่คุณสามารถตอบคำถามนี้:

ตอบ: “ไพ่ใบแรกที่คุณจั่วสามารถเป็นอะไรก็ได้ ดังนั้นมันจะไม่ส่งผลต่อผลลัพธ์ นอกจากว่าจะมีไพ่เหลือน้อยกว่าหนึ่งใบในสำรับ เมื่อจั่วไพ่ใบแรกแล้ว จะมีไพ่เหลืออีกสามใบในสำรับที่สามารถจั่วได้ไพ่คู่ ดังนั้น โอกาสที่จะจับคู่ไพ่ใบแรกของคุณกับไพ่คู่คือ 3 ใน 51 (ไพ่ที่เหลือ) ซึ่งหมายความว่าความน่าจะเป็นของเหตุการณ์นี้คือ 3/51 หรือ 5.89%”

เนื่องจากคำถามนี้เป็นคำถาม "เฉพาะทาง" ที่เกี่ยวข้องกับความน่าจะเป็นเท่านั้น จึงไม่มีการถามแนวคิดอื่นๆ ข้อแตกต่างเพียงอย่างเดียวคือความคิดสร้างสรรค์ของคำถาม แต่โดยพื้นฐานแล้ว คุณจะต้องคำนวณความน่าจะเป็นของเหตุการณ์บางอย่างและแสดงความคิดของคุณเสมอ

ผลิตภัณฑ์

คำถามสัมภาษณ์ผลิตภัณฑ์จะขอให้คุณประเมินประสิทธิภาพของผลิตภัณฑ์/บริการผ่านข้อมูล คำถามเหล่านี้ทดสอบความรู้ของคุณเกี่ยวกับการปรับและใช้หลักการด้านวิทยาศาสตร์ข้อมูลในทุกสภาพแวดล้อม เช่นเดียวกับการทำงานประจำวัน

ตัวอย่างคำถามสัมภาษณ์ผลิตภัณฑ์

แนวคิดทางเทคนิคที่โดดเด่นที่สุดในหมวดหมู่นี้คือการระบุผลิตภัณฑ์ของบริษัทและเสนอการปรับปรุงจากมุมมองของนักวิทยาศาสตร์ข้อมูล ความแปรปรวนสูงในแนวคิดทางเทคนิคที่ทดสอบในด้านผลิตภัณฑ์สามารถอธิบายได้ด้วยลักษณะของคำถามเกี่ยวกับผลิตภัณฑ์และความคิดสร้างสรรค์ในระดับที่สูงขึ้นที่จำเป็นในการตอบคำถามเหล่านี้

ตัวอย่างของไฟล์ คำถามเกี่ยวกับผลิตภัณฑ์จาก Facebook อยากจะเป็น:

คำถาม: “ผลิตภัณฑ์ Facebook ที่คุณชื่นชอบคืออะไร และคุณจะปรับปรุงมันอย่างไร”

ตอบ: เนื่องจากลักษณะของคำถาม เราจะให้คุณตอบคำถามนี้ด้วยตัวเอง

แนวคิดทั่วไปที่ทดสอบอย่างหนักขึ้นอยู่กับบริษัทที่สัมภาษณ์คุณ เพียงให้แน่ใจว่าคุณคุ้นเคยกับธุรกิจของบริษัทและผลิตภัณฑ์ของบริษัท (ควรเป็นผู้ใช้ของบริษัทด้วย) เท่านี้คุณก็สบายดี

¡Ã³ÕÈÖ¡ÉÒ·Ò§¸ØáԨ

หมวดหมู่นี้รวมถึงกรณีศึกษาและคำถามทั่วไปที่เกี่ยวข้องกับธุรกิจที่จะทดสอบทักษะด้านวิทยาศาสตร์ข้อมูล ความสำคัญของการรู้วิธีตอบคำถามเหล่านี้มีความสำคัญมาก เนื่องจากผู้สัมภาษณ์บางคนต้องการให้ผู้สมัครรู้วิธีใช้หลักการด้านวิทยาศาสตร์ข้อมูลเพื่อแก้ปัญหาเฉพาะของบริษัทก่อนที่จะจ้างพวกเขา

ตัวอย่างคำถามกรณีธุรกิจ

เนื่องจากลักษณะของคำถาม ฉันไม่สามารถระบุแนวคิดทางเทคนิคเดียวที่โดดเด่นได้ เนื่องจากคำถามส่วนใหญ่ที่จัดหมวดหมู่ไว้ในที่นี้เป็นกรณีศึกษา จึงมีลักษณะเฉพาะที่แตกต่างกันไป

อย่างไรก็ตาม นี่คือตัวอย่างหนึ่งของ คำถามกรณีธุรกิจจาก Uber:

คำถาม: “มีคนจำนวนมากที่ใช้บริการ Uber จากสองเมืองที่อยู่ใกล้กัน เช่น Menlo Park และ Palo Alto และข้อมูลใดๆ ก็ตามที่คุณนึกออกจะถูกเก็บรวบรวม คุณจะรวบรวมข้อมูลอะไรเพื่อให้สามารถระบุเมืองที่ผู้โดยสารนั่งรถมา”

ตอบ: “ในการระบุเมือง เราจำเป็นต้องเข้าถึงตำแหน่งที่ตั้ง/ข้อมูลทางภูมิศาสตร์ ข้อมูลที่เก็บรวบรวมอาจเป็นพิกัด GPS ลองจิจูด/ละติจูด และรหัสไปรษณีย์”

การออกแบบระบบ

คำถามเกี่ยวกับการออกแบบระบบเป็นคำถามที่เกี่ยวข้องกับการออกแบบระบบเทคโนโลยีทั้งหมด พวกเขาจะถูกขอให้วิเคราะห์กระบวนการของผู้สมัครในการแก้ปัญหา สร้าง และออกแบบระบบเพื่อช่วยเหลือลูกค้า/ผู้รับบริการ การรู้ว่าการออกแบบระบบมีความสำคัญมากสำหรับนักวิทยาศาสตร์ข้อมูล แม้ว่าบทบาทของคุณไม่ใช่การออกแบบระบบ แต่คุณมักจะมีบทบาทในระบบที่จัดตั้งขึ้นและจำเป็นต้องรู้ว่ามันทำงานอย่างไรเพื่อทำงานของคุณ

ตัวอย่างคำถามสัมภาษณ์การออกแบบระบบ

คำถามเหล่านี้ครอบคลุมหัวข้อและงานต่างๆ แต่สิ่งที่โดดเด่นคือการสร้างฐานข้อมูล นักวิทยาศาสตร์ด้านข้อมูลจัดการกับฐานข้อมูลอย่างหนักทุกวัน ดังนั้นจึงเหมาะสมที่จะถามคำถามนี้เพื่อดูว่าคุณสามารถสร้างฐานข้อมูลตั้งแต่เริ่มต้นได้หรือไม่

ที่นี่ที่หนึ่ง ตัวอย่างคำถามจาก Audible ค้นพบในการวิจัยของเรา:

คำถาม: “คุณช่วยแนะนำเราเกี่ยวกับวิธีการสร้างระบบคำแนะนำได้ไหม”

ตอบ: เนื่องจากมีแนวทางที่หลากหลายในการตอบคำถามนี้ เราจะปล่อยให้คุณสร้างแนวทางของคุณเอง

อีกครั้ง เพื่อตอบคำถามเหล่านี้ จำเป็นต้องรู้ธุรกิจของบริษัท คิดสักนิดเกี่ยวกับฐานข้อมูลที่บริษัทอาจต้องการมากที่สุด และพยายามขยายแนวทางของคุณเล็กน้อยก่อนการสัมภาษณ์

วิชาการ

คำถามทางเทคนิคเป็นคำถามทั้งหมดที่ถามเกี่ยวกับคำอธิบายของแนวคิดทางเทคนิคด้านวิทยาการข้อมูลต่างๆ คำถามทางเทคนิคเป็นคำถามเชิงทฤษฎีและต้องการความรู้ด้านเทคโนโลยีที่คุณจะใช้ที่บริษัท เนื่องจากธรรมชาติแล้ว คำถามเหล่านี้อาจดูเหมือนคำถามเกี่ยวกับการเข้ารหัส การรู้ทฤษฎีเบื้องหลังสิ่งที่คุณกำลังทำอยู่นั้นค่อนข้างสำคัญ ดังนั้นคำถามทางเทคนิคจึงมักถูกถามในการสัมภาษณ์

ตัวอย่างคำถามสัมภาษณ์ทางเทคนิค

ส่วนที่ทดสอบมากที่สุดคือความรู้ทางทฤษฎีของ Python และ SQL ไม่น่าแปลกใจ เนื่องจากทั้งสองภาษานี้มีความโดดเด่นในด้านวิทยาศาสตร์ข้อมูล พร้อมด้วย R เพื่อเสริมการทำงานของ Python

ตัวอย่างของไฟล์ คำถามทางเทคนิคในโลกแห่งความจริงจาก Walmart อยากจะเป็น:

คำถาม"โครงสร้างข้อมูลใน Python คืออะไร?"

ตอบ: “โครงสร้างข้อมูลใช้สำหรับจัดเก็บข้อมูล มีสี่โครงสร้างข้อมูลใน Python: List, Dictionary, Tuple และ Set นั่นคือโครงสร้างข้อมูลในตัว รายการใช้สำหรับสร้างรายการที่สามารถมีข้อมูลประเภทต่างๆ พจนานุกรมนั้นเป็นชุดของคีย์ ใช้เพื่อเก็บค่าด้วยคีย์และรับข้อมูลโดยใช้คีย์เดียวกัน สิ่งอันดับจะเหมือนกับรายการ ความแตกต่างคือใน tuple ข้อมูลไม่สามารถเปลี่ยนแปลงได้ ชุดประกอบด้วยองค์ประกอบที่ไม่ได้เรียงลำดับโดยไม่มีการซ้ำกัน นอกจากโครงสร้างข้อมูลในตัวแล้ว ยังมีโครงสร้างข้อมูลที่ผู้ใช้กำหนดอีกด้วย”

คำถามเหล่านี้เป็นคำถามที่จับใจความได้ทุกประเภท เป็นหมวดหมู่สำหรับคำถามทั้งหมดที่ไม่สามารถจัดอยู่ในหมวดหมู่อื่นได้อย่างหมดจด ด้วยเหตุนี้จึงไม่มีแนวคิดเฉพาะที่เกิดขึ้นมากหรือน้อย

สรุป

คู่มือการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูลนี้เขียนขึ้นเพื่อสนับสนุนการวิจัยที่ดำเนินการเพื่อทำความเข้าใจประเภทของคำถามที่ถูกถามในการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูล ข้อมูลคำถามสัมภาษณ์นำมาจากบริษัทหลายสิบแห่งในช่วงเวลาสี่ปีและวิเคราะห์ คำถามได้รับการจัดหมวดหมู่ภายใต้คำถามที่แตกต่างกันเก้าประเภท (อัลกอริทึม กรณีธุรกิจ การเข้ารหัส การสร้างแบบจำลอง ความน่าจะเป็น ผลิตภัณฑ์ สถิติ การออกแบบระบบ และคำถามทางเทคนิค)

ในส่วนหนึ่งของการวิเคราะห์ ฉันได้พูดคุยเกี่ยวกับแนวคิดทางเทคนิคที่พบบ่อยที่สุดจากประเภทคำถามแต่ละประเภท ตัวอย่างเช่น คำถามทางสถิติที่ถูกถามมากที่สุดเกี่ยวข้องกับการสุ่มตัวอย่างและการแจกแจง คำถามทุกหมวดหมู่ได้รับการสนับสนุนโดยตัวอย่างจริงของคำถามจริง

บทความนี้มีไว้เพื่อเป็นแนวทางสำคัญในการเตรียมการสัมภาษณ์หรือเรียนรู้เพิ่มเติมเกี่ยวกับวิทยาศาสตร์ข้อมูล ฉันหวังว่าฉันจะช่วยให้คุณรู้สึกสบายใจมากขึ้นเกี่ยวกับกระบวนการสัมภาษณ์ด้านวิทยาศาสตร์ข้อมูล ขอให้โชคดีกับการสัมภาษณ์ของคุณ!

Original. โพสต์ใหม่โดยได้รับอนุญาต

ที่เกี่ยวข้อง



เรื่องเด่นใน 30 วันที่ผ่านมา
เป็นที่นิยม
  1. หลักสูตรออนไลน์วิทยาศาสตร์ข้อมูล 6 อันดับแรกในปี 2021
  2. นักวิทยาศาสตร์ข้อมูลและวิศวกร ML เป็นพนักงานที่หรูหรา
  3. คำแนะนำสำหรับการเรียนรู้ Data Science จากผู้อำนวยการฝ่ายวิจัยของ Google
  4. GitHub Copilot โอเพ่นซอร์สทางเลือก
  5. รากฐานทางเรขาคณิตของการเรียนรู้เชิงลึก
แบ่งปันมากที่สุด
  1. ทำไมคุณควรเรียนรู้ "Productive Data Science" และอย่างไร
  2. ไม่เพียงแต่สำหรับ Deep Learning เท่านั้น: GPUs เร่งความเร็ว Data Science & Data Analytics ได้อย่างไร
  3. บูตสแตรป Modern Data Stack ใน 5 นาทีด้วย Terraform
  4. วิทยาศาสตร์ข้อมูลที่ขับเคลื่อนด้วย GPU (ไม่ใช่การเรียนรู้เชิงลึก) ด้วย RAPIDS
  5. มาเป็นวิศวกรวิเคราะห์ใน 90 วัน

ที่มา: https://www.kdnuggets.com/2021/08/common-data-science-interview-questions-answers.html

ประทับเวลา:

เพิ่มเติมจาก KD นักเก็ต