Συχνότερες ερωτήσεις και απαντήσεις συνέντευξης επιστήμης δεδομένων

Κόμβος πηγής: 1860815

Ασημένιο ιστολόγιοΣυχνότερες ερωτήσεις και απαντήσεις συνέντευξης επιστήμης δεδομένων

Μετά την ανάλυση 900+ ερωτήσεων συνεντεύξεων επιστήμης δεδομένων από εταιρείες τα τελευταία χρόνια, οι πιο συνηθισμένες κατηγορίες ερωτήσεων συνεντεύξεων επιστήμης δεδομένων εξετάζονται σε αυτόν τον οδηγό, καθεμία από τις οποίες εξηγείται με ένα παράδειγμα.


By Νέιτ Ροσίδη, Data Scientist και Product Manager.

Το να γίνεις επιστήμονας δεδομένων θεωρείται χαρακτηριστικό γνώρισμα κύρους. Το 2012, το Harvard Business Review αποκάλεσε τον «επιστήμονα δεδομένων» την πιο σέξι δουλειά του 21ου αιώνα και η αυξανόμενη τάση των ρόλων στον κλάδο φαίνεται να επιβεβαιώνει αυτή τη δήλωση. Για να επιβεβαιώσουμε ότι αυτή η σεξουαλικότητα είναι ακόμα σε εξέλιξη, οι πληροφορίες από το Glassdoor δείχνουν ότι το να είσαι επιστήμονας δεδομένων είναι η δεύτερη καλύτερη δουλειά στην Αμερική το 2021.

Πηγή: Glassdoor.

Για να αποκτήσετε μια τόσο αξιόλογη δουλειά, πρέπει να περάσετε από αυστηρές συνεντεύξεις για δουλειά. Οι ερωτήσεις επιστήμης δεδομένων που τίθενται μπορεί να είναι πολύ ευρείες και πολύπλοκες. Αυτό είναι αναμενόμενο, δεδομένου ότι ο ρόλος ενός επιστήμονα δεδομένων συνήθως ενσωματώνει τόσους πολλούς τομείς. Για να σας βοηθήσω να προετοιμαστείτε για τις συνεντεύξεις εργασίας για την επιστήμη δεδομένων, εξέτασα όλες τις ισχύουσες ερωτήσεις και τις διαχώρισα σε διαφορετικές κατηγορίες ερωτήσεων. Να πώς το έκανα αυτό.

Περιγραφή και Μεθοδολογία της Ανάλυσης

Συγκέντρωσα δεδομένα από διάφορους πίνακες αναζήτησης εργασίας και ιστότοπους και πλατφόρμες αξιολόγησης εταιρειών όπως το Glassdoor, το Indeed, το Reddit και το Blind App. Για να είμαστε πιο ακριβείς, υπάρχουν 903 ερωτήσεις που συλλέχθηκαν τα τελευταία τέσσερα χρόνια.

Οι ερωτήσεις χωρίζονται σε προκαθορισμένες κατηγορίες. Αυτές οι κατηγορίες είναι το αποτέλεσμα μιας ανάλυσης εμπειρογνωμόνων της περιγραφής της εμπειρίας της συνέντευξης που ελήφθη από τις πηγές μας.

Οι κατηγορίες είναι:

  1. Κωδικοποίηση
  2. Πρίπλασμα
  3. Αλγόριθμοι
  4. Σε Πραγματικό Χρόνο
  5. Πιθανότητα
  6. Προϊόν
  7. Επαγγελματική υπόθεση
  8. Σχεδιασμός συστήματος
  9. Τεχνικός

Τι είδους ερωτήσεις συνέντευξης θα πρέπει να περιμένετε;

Αυτό το γράφημα δείχνει τον τύπο ερώτησης ανά κατηγορία σύμφωνα με τα δεδομένα που συλλέγονται.

Μεταφρασμένο σε ποσοστά, το γράφημα μοιάζει με αυτό:

Όπως μπορείτε να δείτε, οι ερωτήσεις κωδικοποίησης και μοντελοποίησης είναι οι πιο κυρίαρχες. Περισσότερες από τις μισές ερωτήσεις προέρχονται από αυτήν την περιοχή. Δεν είναι περίεργο όταν το σκέφτεσαι. Η κωδικοποίηση και η μοντελοποίηση είναι πιθανώς οι δύο πιο σημαντικές δεξιότητες για έναν επιστήμονα δεδομένων. Οι ερωτήσεις τύπου κωδικοποίησης είναι ευρέως διαδεδομένες και περιλαμβάνουν περισσότερο από το ένα τρίτο όλων των ερωτήσεων. Άλλοι τύποι ερωτήσεων, όπως αλγόριθμοι και στατιστικές, είναι επίσης αρκετά σημαντικοί. Το 24% όλων των ερωτήσεων προέρχεται από αυτές τις δύο κατηγορίες. Άλλες κατηγορίες δεν είναι όπως αντιπροσωπεύονται. Το βρίσκω λογικό, λαμβάνοντας υπόψη τη φύση του ρόλου του επιστήμονα δεδομένων.

Τώρα θέλω να σας καθοδηγήσω σε κάθε κατηγορία ερωτήσεων και να σας δείξω μερικά παραδείγματα των ερωτήσεων που τίθενται.

Οι πιο δοκιμασμένες έννοιες σε ερωτήσεις συνέντευξης επιστήμης δεδομένων

Κωδικοποίηση

Όπως είδατε ήδη, οι ερωτήσεις κωδικοποίησης είναι το πιο σημαντικό θέμα στην επιστήμη των δεδομένων. Τέτοιες ερωτήσεις θα απαιτούν κάποιου είδους χειρισμό δεδομένων με χρήση του κώδικα για τον εντοπισμό πληροφοριών. Οι ερωτήσεις έχουν σχεδιαστεί για να δοκιμάσουν την ικανότητα κωδικοποίησης, τις δεξιότητες επίλυσης προβλημάτων και τη δημιουργικότητα. Συνήθως θα το κάνετε σε υπολογιστή ή λευκό πίνακα.

Παράδειγμα ερώτησης συνέντευξης κωδικοποίησης

Ένας παράδειγμα από τη Microsoft είναι αυτό:

ΕΡΏΤΗΣΗ: «Υπολογίστε το μερίδιο νέων και υπαρχόντων χρηστών. Εξαγωγή του μήνα, του μεριδίου νέων χρηστών και του μεριδίου των υπαρχόντων χρηστών ως αναλογία. Ως νέοι χρήστες ορίζονται οι χρήστες που άρχισαν να χρησιμοποιούν υπηρεσίες τον τρέχοντα μήνα. Οι υπάρχοντες χρήστες είναι χρήστες που άρχισαν να χρησιμοποιούν υπηρεσίες τον τρέχοντα μήνα και χρησιμοποίησαν υπηρεσίες οποιονδήποτε προηγούμενο μήνα. Ας υποθέσουμε ότι οι ημερομηνίες είναι όλες από το έτος 2020."

Θα χρησιμοποιήσετε τον πίνακα γεγονότα_γεγονότων, με τα δείγματα δεδομένων να έχουν ως εξής:

Για να λάβετε την επιθυμητή έξοδο, θα πρέπει να γράψετε αυτόν τον κώδικα:

με all_users ως ( SELECT date_part('month', time_id) AS month, count(DISTINCT user_id) as all_users FROM fact_events GROUP BY BY),
new_users as ( SELECT date_part('month', new_user_start_date) AS month, count(DISTINCT user_id) as new_users FROM (SELECT user_id, min(time_id) as new_user_start_date FROM fact_events GROUP BY user_id) τετρ.
)
SELECT au.month, new_users / all_users::decimal as share_new_users, 1- (new_users / all_users::decimal) as share_existing_users
FROM all_users au
JOIN new_users nu ON nu.month = au.month 

Η σύνταξη ενός κώδικα σε SQL είναι η πιο συχνά δοκιμασμένη έννοια όταν πρόκειται για κωδικοποίηση. Δεν αποτελεί έκπληξη αφού η SQL είναι το πιο χρησιμοποιούμενο εργαλείο στην επιστήμη δεδομένων. Μία από τις έννοιες που σχεδόν δεν μπορείτε να αποφύγετε στις συνεντεύξεις είναι οι ενώσεις. Βεβαιωθείτε λοιπόν ότι γνωρίζετε τη διαφορά μεταξύ διαφορετικών ενώσεων και πώς να τις χρησιμοποιήσετε για να έχετε το απαιτούμενο αποτέλεσμα.

Επίσης, μπορείτε να περιμένετε να ομαδοποιήσετε δεδομένα χρησιμοποιώντας την ρήτρα GROUP BY πολύ συχνά. Ορισμένες άλλες έννοιες που συνήθως ζητούνται είναι το φιλτράρισμα δεδομένων με χρήση της ρήτρας WHERE και/ή HAVING. Θα σας ζητηθεί επίσης να επιλέξετε διαφορετικά δεδομένα. Επίσης, βεβαιωθείτε ότι γνωρίζετε τις συγκεντρωτικές συναρτήσεις, όπως SUM(), AVG(), COUNT(), MIN(), MAX().

Ορισμένες έννοιες δεν εμφανίζονται τόσο συχνά, αλλά αξίζει να τις αναφέρετε και να προετοιμαστείτε για τέτοιες ερωτήσεις. Για παράδειγμα, οι Κοινές εκφράσεις πίνακα ή τα CTE είναι ένα τέτοιο θέμα. Ο άλλος είναι ο όρος CASE(). Επίσης, μην ξεχνάτε να ανανεώνετε τη μνήμη σας κατά το χειρισμό των τύπων δεδομένων συμβολοσειρών και των ημερομηνιών.

Μοντελοποίηση

Η μοντελοποίηση ήταν η δεύτερη μεγαλύτερη κατηγορία στα ερευνητικά μας δεδομένα, με το 20% όλων των ερωτήσεων να προέρχονται από εδώ. Αυτές οι ερωτήσεις έχουν σχεδιαστεί για να ελέγξουν τις γνώσεις σας σχετικά με τη δημιουργία στατιστικών μοντέλων και την εφαρμογή μοντέλων μηχανικής εκμάθησης.

Παράδειγμα ερώτησης συνέντευξης μοντελοποίησης

Η παλινδρόμηση, η πιο κοινή έννοια της επιστήμης των τεχνικών δεδομένων που ζητείται σε συνεντεύξεις. Δεν αποτελεί έκπληξη, λαμβάνοντας υπόψη τη φύση της στατιστικής μοντελοποίησης.

Ένας παράδειγμα από το Galvanize θα ήταν το εξής:

ΕΡΏΤΗΣΗ: «Τι είναι η τακτοποίηση στην παλινδρόμηση;»

Δείτε πώς θα μπορούσατε να απαντήσετε σε αυτήν την ερώτηση:

ΑΠΑΝΤΗΣΗ: «Η τακτοποίηση είναι ένας ειδικός τύπος παλινδρόμησης όπου οι εκτιμήσεις των συντελεστών περιορίζονται (ή ρυθμίζονται) στο μηδέν. Κάνοντας αυτό, είναι δυνατό να μειωθεί η διακύμανση του μοντέλου ενώ ταυτόχρονα να μειωθεί το σφάλμα δειγματοληψίας. Η τακτοποίηση χρησιμοποιείται για την αποφυγή ή τη μείωση της υπερπροσαρμογής. Η υπερβολική προσαρμογή συμβαίνει όταν το μοντέλο μαθαίνει τόσο καλά τα δεδομένα εκπαίδευσης που υπονομεύει την απόδοση του μοντέλου σε νέα δεδομένα. Για να αποφευχθεί η υπερβολική προσαρμογή, συνήθως χρησιμοποιούνται τακτοποιήσεις Ridge ή Lasso.

Μερικές από τις έννοιες που ελέγχονται τακτικά είναι, και πάλι, άλλες έννοιες ανάλυσης παλινδρόμησης, όπως η λογιστική παλινδρόμηση, η λογιστική παλινδρόμηση Bayes και οι απλοί ταξινομητές Bayes. Μπορείτε επίσης να ερωτηθείτε για τα τυχαία δάση, καθώς και για τη δοκιμή και την αξιολόγηση μοντέλων.

Αλγόριθμοι

Οι ερωτήσεις σχετικά με τους αλγόριθμους είναι όλες ερωτήσεις που απαιτούν την επίλυση ενός μαθηματικού προβλήματος, κυρίως μέσω κώδικα χρησιμοποιώντας μία από τις γλώσσες προγραμματισμού. Αυτές οι ερωτήσεις περιλαμβάνουν μια διαδικασία βήμα προς βήμα, που συνήθως απαιτεί προσαρμογή ή υπολογισμό για να δώσει μια απάντηση. Αυτές οι ερωτήσεις ελέγχουν τις βασικές γνώσεις επίλυσης προβλημάτων και χειρισμού δεδομένων, οι οποίες μπορούν να εφαρμοστούν για πολύπλοκα προβλήματα στην εργασία.

Παράδειγμα ερώτησης συνέντευξης αλγόριθμου

Η τεχνική ιδέα που ελέγχεται περισσότερο στους αλγόριθμους είναι η επίλυση ενός μαθηματικού ή συντακτικού προβλήματος με μια γλώσσα προγραμματισμού.

Ιδού ένα παράδειγμα που μπορείτε να βρείτε στο Leetcode:

ΕΡΏΤΗΣΗ: «Σας δίνονται δύο μη κενές συνδεδεμένες λίστες που αντιπροσωπεύουν δύο μη αρνητικούς ακέραιους αριθμούς. Τα ψηφία αποθηκεύονται με αντίστροφη σειρά και κάθε κόμβος τους περιέχει ένα μόνο ψηφίο. Προσθέστε τους δύο αριθμούς και επιστρέψτε το άθροισμα ως συνδεδεμένη λίστα."

Το παράδειγμα των δεδομένων θα μπορούσε να είναι κάπως έτσι:

Πηγή: Leetcode.

ΑΠΑΝΤΗΣΗ: Ο κώδικας που είναι γραμμένος σε Java θα πρέπει να είναι:

public ListNode addTwoNumbers(ListNode l1, ListNode l2) { ListNode dummyHead = new ListNode(0); ListNode p = l1, q = l2, curr = dummyHead; int carry = 0; ενώ (p != null || q != null) { int x = (p != null) ? p.val : 0; int y = (q != null) ? q.val : 0; int sum = μεταφορά + x + y; μεταφορά = άθροισμα / 10; curr.next = new ListNode(άθροισμα % 10); curr = curr.next; if (p != null) p = p.next; if (q != null) q = q.next; } if (carry > 0) { curr.next = new ListNode(carry); } επιστροφή dummyHead.next;
} 

Οι άλλες γενικές έννοιες που ελέγχονται συχνά από αυτόν τον τύπο ερωτήσεων είναι πίνακες, δυναμικός προγραμματισμός, συμβολοσειρές, άπληστος αλγόριθμος, αναζήτηση σε βάθος, δέντρο, πίνακας κατακερματισμού και δυαδική αναζήτηση.

Σε Πραγματικό Χρόνο

Οι ερωτήσεις της στατιστικής συνέντευξης είναι ερωτήσεις που ελέγχουν τη γνώση της στατιστικής θεωρίας και τις σχετικές αρχές. Αυτές οι ερωτήσεις σκοπεύουν να δοκιμάσουν πόσο εξοικειωμένοι είστε με τις θεμελιώδεις θεωρητικές αρχές στην επιστήμη των δεδομένων. Είναι σημαντικό να μπορούμε να κατανοήσουμε το θεωρητικό και μαθηματικό υπόβαθρο των αναλύσεων που γίνονται. Απαντήστε καλά σε αυτές τις ερωτήσεις και κάθε ερευνητής θα σας εκτιμήσει.

Παράδειγμα ερώτησης συνέντευξης στα στατιστικά στοιχεία

Η πιο αναφερόμενη τεχνική έννοια είναι η δειγματοληψία και η διανομή. Για έναν επιστήμονα δεδομένων, αυτή είναι μια από τις πιο συχνά χρησιμοποιούμενες αρχές στατιστικής που εφαρμόζει καθημερινά ο επιστήμονας δεδομένων.

Για παράδειγμα, μια ερώτηση συνέντευξης από την IBM ρωτά:

ΕΡΏΤΗΣΗ: "Τι είναι ένα παράδειγμα τύπου δεδομένων με μη Gaussian κατανομή;"

Για να απαντήσετε στην ερώτηση, θα μπορούσατε πρώτα να ορίσετε μια κατανομή Gauss. Στη συνέχεια, θα μπορούσατε να το ακολουθήσετε δίνοντας παραδείγματα της μη-Γκαουσιανής κατανομής. Κάτι σαν αυτό:

ΑΠΑΝΤΗΣΗ: «Μια κατανομή Gauss είναι μια κατανομή όπου μπορεί να βρεθεί ένα ορισμένο γνωστό ποσοστό των δεδομένων κατά την εξέταση τυπικών αποκλίσεων από τον μέσο όρο, αλλιώς γνωστή ως κανονική κατανομή. Μερικά από τα παραδείγματα της μη Gaussian κατανομής μπορεί να είναι εκθετική κατανομή ή διωνυμική κατανομή.

Κατά την προετοιμασία για τη συνέντευξη εργασίας, φροντίστε να καλύπτετε επίσης τα ακόλουθα θέματα: διακύμανση και τυπική απόκλιση, συνδιακύμανση και συσχέτιση, τιμή p, μέση και διάμεσος, δοκιμή υποθέσεων και στατιστικά Bayes. Αυτές είναι όλες οι έννοιες που θα χρειαστείτε ως επιστήμονας δεδομένων, οπότε περιμένετε τις και στις συνεντεύξεις για δουλειά.

Πιθανότητα

Αυτά τα ερωτήματα απαιτούν θεωρητικές γνώσεις μόνο σε έννοιες πιθανοτήτων. Οι συνεντευξιαζόμενοι κάνουν αυτές τις ερωτήσεις για να κατανοήσουν σε βάθος τις γνώσεις σας σχετικά με τις μεθόδους και τις χρήσεις των πιθανοτήτων για την ολοκλήρωση των πολύπλοκων μελετών δεδομένων που συνήθως εκτελούνται στο χώρο εργασίας.

Παράδειγμα ερώτησης συνέντευξης πιθανοτήτων

Είναι πολύ πιθανό, λογοπαίγνιο, ότι η ερώτηση που θα λάβετε είναι να υπολογίσετε την πιθανότητα να λάβετε ένα συγκεκριμένο φύλλο/αριθμό από ένα σύνολο ζαριών/χαρτών. Αυτό φαίνεται να είναι το πιο κοινό στοιχείο ερωτήσεων για τις περισσότερες εταιρείες στην έρευνά μας, καθώς πολλές από αυτές έχουν υποβάλει τέτοιου είδους ερωτήσεις.

Ένα παράδειγμα τέτοιου ερώτηση πιθανοτήτων από το Facebook:

ΕΡΏΤΗΣΗ: "Ποια είναι η πιθανότητα να αποκτήσετε ένα ζευγάρι τραβώντας δύο φύλλα χωριστά σε μια τράπουλα 52 φύλλων;"

Εδώ είναι πώς μπορείτε να απαντήσετε σε αυτό:

ΑΠΑΝΤΗΣΗ: «Αυτό το πρώτο φύλλο που τραβάτε μπορεί να είναι οποιοδήποτε, επομένως δεν επηρεάζει το αποτέλεσμα εκτός από το ότι μένει ένα φύλλο λιγότερο στην τράπουλα. Μόλις τραβηχτεί το πρώτο φύλλο, υπάρχουν τρία εναπομείναντα φύλλα στην τράπουλα που μπορούν να τραβηχτούν για να πάρετε ένα ζευγάρι. Έτσι, η πιθανότητα να ταιριάξετε το πρώτο σας φύλλο με ένα ζευγάρι είναι 3 στα 51 (υπόλοιπα φύλλα). Αυτό σημαίνει ότι η πιθανότητα να συμβεί αυτό το συμβάν είναι 3/51 ή 5.89%.

Δεδομένου ότι πρόκειται για ένα είδος «εξειδικευμένης» ερώτησης που ασχολείται μόνο με την πιθανότητα, δεν τίθενται άλλες έννοιες. Η μόνη διαφορά είναι πόσο ευφάνταστη είναι η ερώτηση. Αλλά βασικά, θα πρέπει πάντα να υπολογίζετε την πιθανότητα κάποιου γεγονότος και να δείχνετε τη σκέψη σας.

Προϊόν

Οι ερωτήσεις συνέντευξης προϊόντος θα σας ζητήσουν να αξιολογήσετε την απόδοση ενός προϊόντος/υπηρεσίας μέσω δεδομένων. Αυτές οι ερωτήσεις ελέγχουν τις γνώσεις σας για την προσαρμογή και τη χρήση των αρχών της επιστήμης δεδομένων σε οποιοδήποτε περιβάλλον, όπως συμβαίνει με την καθημερινή εργασία.

Παράδειγμα ερώτησης συνέντευξης προϊόντος

Η πιο σημαντική τεχνική ιδέα σε αυτήν την κατηγορία είναι ο προσδιορισμός του προϊόντος μιας εταιρείας και η πρόταση βελτιώσεων από την οπτική γωνία ενός επιστήμονα δεδομένων. Η υψηλή διακύμανση στις τεχνικές έννοιες που δοκιμάστηκαν από την πλευρά του προϊόντος μπορεί να εξηγηθεί από τη φύση των ερωτήσεων για το προϊόν και το υψηλότερο επίπεδο δημιουργικότητας που απαιτείται για να απαντηθούν.

Ένα παράδειγμα α ερώτηση προϊόντος από το Facebook επιθυμών να φαίνεται ώς:

ΕΡΏΤΗΣΗ: "Ποιο είναι το αγαπημένο σας προϊόν Facebook και πώς θα το βελτιώσατε;"

ΑΠΑΝΤΗΣΗ: Λόγω της φύσης της ερώτησης, θα σας επιτρέψουμε να απαντήσετε μόνοι σας.

Οι γενικές έννοιες που δοκιμάστηκαν εξαρτώνται σε μεγάλο βαθμό από την εταιρεία που σας παίρνει συνέντευξη. Απλώς βεβαιωθείτε ότι είστε εξοικειωμένοι με τις επιχειρήσεις της εταιρείας και τα προϊόντα της (ιδανικά, είστε και ο χρήστης της) και θα είστε εντάξει.

Υπόθεση Επιχειρήσεων

Αυτή η κατηγορία περιλαμβάνει μελέτες περιπτώσεων και γενικές ερωτήσεις που σχετίζονται με την επιχείρηση που θα δοκιμάσουν μια δεξιότητα επιστήμης δεδομένων. Η σημασία του να ξέρεις πώς να απαντάς σε αυτές τις ερωτήσεις μπορεί να είναι τεράστια, καθώς ορισμένοι συνεντευξιακοί θα ήθελαν οι υποψήφιοι να γνωρίζουν πώς να εφαρμόζουν τις αρχές της επιστήμης δεδομένων για να λύσουν τα συγκεκριμένα προβλήματα μιας εταιρείας πριν τους προσλάβουν.

Παράδειγμα ερώτησης επιχειρησιακής υπόθεσης

Λόγω της φύσης του τύπου ερώτησης, δεν μπόρεσα να προσδιορίσω μια τεχνική έννοια που να ξεχωρίζει. Δεδομένου ότι οι περισσότερες από τις ερωτήσεις που κατηγοριοποιούνται εδώ είναι μελέτες περιπτώσεων, είναι μοναδικές κατά κάποιο τρόπο.

Ωστόσο, εδώ είναι ένα παράδειγμα του α ερώτηση επιχειρηματικής υπόθεσης από την Uber:

ΕΡΏΤΗΣΗ: «Υπάρχει μια ομάδα ανθρώπων που έκαναν βόλτες με το Uber από δύο πόλεις που βρίσκονταν σε κοντινή απόσταση, για παράδειγμα, το Menlo Park και το Palo Alto, και όποια δεδομένα μπορούσατε να σκεφτείτε θα μπορούσαν να συλλεχθούν. Ποια δεδομένα θα συλλέγατε για να προσδιοριστεί η πόλη από την οποία πήγε ο επιβάτης;»

ΑΠΑΝΤΗΣΗ: «Για να προσδιορίσουμε την πόλη, πρέπει να έχουμε πρόσβαση στην τοποθεσία/γεωγραφικά δεδομένα. Τα δεδομένα που συλλέγονται θα μπορούσαν να είναι συντεταγμένες GPS, γεωγραφικό μήκος/γεωγραφικό πλάτος και ταχυδρομικός κώδικας."

Σχεδιασμός συστήματος

Οι ερωτήσεις σχεδιασμού συστήματος είναι όλες ερωτήσεις που σχετίζονται με το σχεδιασμό τεχνολογικών συστημάτων. Τους ζητείται να αναλύσουν τη διαδικασία του υποψηφίου για την επίλυση προβλημάτων, τη δημιουργία και το σχεδιασμό συστημάτων για να βοηθήσουν τους πελάτες/πελάτες. Η γνώση του σχεδιασμού του συστήματος μπορεί να είναι πολύ σημαντική για έναν επιστήμονα δεδομένων. ακόμα κι αν ο ρόλος σας δεν είναι να σχεδιάσετε ένα σύστημα, πιθανότατα θα παίξετε ρόλο σε ένα καθιερωμένο σύστημα και θα πρέπει να γνωρίζετε πώς λειτουργεί για να κάνετε τη δουλειά σας.

Παράδειγμα ερώτησης συνέντευξης σχεδιασμού συστήματος

Αυτές οι ερωτήσεις καλύπτουν διαφορετικά θέματα και εργασίες. Αυτό όμως που ξεχωρίζει είναι η δημιουργία μιας βάσης δεδομένων. Οι επιστήμονες δεδομένων ασχολούνται σε μεγάλο βαθμό με τις βάσεις δεδομένων καθημερινά, επομένως είναι λογικό να κάνουμε αυτήν την ερώτηση για να δούμε αν μπορείτε να δημιουργήσετε μια βάση δεδομένων από την αρχή.

Εδώ είναι ένα παράδειγμα ερώτησης από το Audible αποκαλύφθηκε στην έρευνά μας:

ΕΡΏΤΗΣΗ: «Μπορείτε να μας καθοδηγήσετε πώς θα δημιουργήσατε ένα σύστημα συστάσεων;»

ΑΠΑΝΤΗΣΗ: Δεδομένου ότι υπάρχει μια τέτοια ποικιλία προσεγγίσεων για να απαντήσετε σε αυτήν την ερώτηση, θα σας αφήσουμε να βρείτε τον δικό σας τρόπο να δημιουργήσετε ένα.

Και πάλι, για να απαντήσετε σε αυτές τις ερωτήσεις, είναι απαραίτητο να γνωρίζετε την επιχείρηση της εταιρείας. Σκεφτείτε λίγο τις βάσεις δεδομένων που πιθανότατα χρειάζεται η εταιρεία και προσπαθήστε να αναπτύξετε την προσέγγισή σας λίγο πριν τη συνέντευξη.

Τεχνικός

Οι τεχνικές ερωτήσεις είναι όλες οι ερωτήσεις που αφορούν την εξήγηση διαφόρων τεχνικών εννοιών της επιστήμης δεδομένων. Οι τεχνικές ερωτήσεις είναι θεωρητικές και απαιτούν γνώση της τεχνολογίας που θα χρησιμοποιήσετε στην εταιρεία. Λόγω της φύσης τους, μπορεί να μοιάζουν με ερωτήσεις κωδικοποίησης. Το να γνωρίζετε τη θεωρία πίσω από αυτό που κάνετε είναι πολύ σημαντικό, επομένως τεχνικές ερωτήσεις μπορούν συχνά να τεθούν σε συνεντεύξεις.

Παράδειγμα ερώτησης τεχνικής συνέντευξης

Ο πιο δοκιμασμένος τομέας είναι η θεωρητική γνώση Python και SQL. Δεν αποτελεί έκπληξη, καθώς αυτές οι δύο γλώσσες είναι κυρίαρχες στην επιστήμη των δεδομένων, μαζί με το R για να συμπληρώσουν την Python.

Ένα παράδειγμα α πραγματική τεχνική ερώτηση από τη Walmart επιθυμών να φαίνεται ώς:

ΕΡΏΤΗΣΗ: "Ποιες είναι οι δομές δεδομένων στην Python;"

ΑΠΑΝΤΗΣΗ: «Οι δομές δεδομένων χρησιμοποιούνται για την αποθήκευση δεδομένων. Υπάρχουν τέσσερις δομές δεδομένων στην Python: List, Dictionary, Tuple και Set. Αυτές είναι οι ενσωματωμένες δομές δεδομένων. Οι λίστες χρησιμοποιούνται για τη δημιουργία λιστών που μπορούν να περιέχουν διαφορετικούς τύπους δεδομένων. Το λεξικό είναι βασικά ένα σύνολο κλειδιών. χρησιμοποιούνται για την αποθήκευση μιας τιμής με ένα κλειδί και τη λήψη των δεδομένων χρησιμοποιώντας το ίδιο κλειδί. Οι πλειάδες είναι ίδιες με τις λίστες. Η διαφορά είναι ότι σε μια πλειάδα, τα δεδομένα δεν μπορούν να αλλάξουν. Το σετ περιέχει τα μη ταξινομημένα στοιχεία χωρίς διπλότυπα. Μαζί με τις ενσωματωμένες δομές δεδομένων, υπάρχουν και οι δομές δεδομένων που ορίζονται από τον χρήστη.»

Αυτές είναι οι ερωτήσεις που καλύπτουν όλα τα είδη. Είναι μια κατηγορία για όλες τις ερωτήσεις που δεν μπορούν να χωρέσουν καθαρά σε άλλες κατηγορίες. Εξαιτίας αυτού, δεν υπάρχουν συγκεκριμένες έννοιες που εμφανίζονται περισσότερο ή λιγότερο συχνά.

Συμπέρασμα

Αυτός ο οδηγός συνέντευξης επιστήμης δεδομένων έχει γραφτεί για να υποστηρίξει την έρευνα που πραγματοποιήθηκε για την κατανόηση των τύπων ερωτήσεων που τίθενται σε μια συνέντευξη επιστήμης δεδομένων. Τα δεδομένα των ερωτήσεων της συνέντευξης λαμβάνονται από δεκάδες εταιρείες σε μια τετραετία και αναλύονται. Οι ερωτήσεις έχουν κατηγοριοποιηθεί σε εννέα διαφορετικούς τύπους ερωτήσεων (αλγόριθμοι, επιχειρησιακή περίπτωση, κωδικοποίηση, μοντελοποίηση, πιθανότητα, προϊόν, στατιστικά στοιχεία, σχεδιασμός συστήματος και τεχνικές ερωτήσεις).

Ως μέρος της ανάλυσης, μίλησα για μερικές από τις πιο κοινές τεχνικές έννοιες από κάθε κατηγορία τύπου ερώτησης. Για παράδειγμα, οι πιο δημοφιλείς ερωτήσεις στατιστικών έχουν να κάνουν με τη δειγματοληψία και τη διανομή. Κάθε κατηγορία ερωτήσεων υποστηρίζεται από ένα πρακτικό παράδειγμα της πραγματικής ερώτησης.

Το άρθρο προορίζεται να σας χρησιμεύσει ως ένας σημαντικός οδηγός για την προετοιμασία συνεντεύξεων ή απλώς για να μάθετε περισσότερα για την επιστήμη των δεδομένων. Ελπίζω να σας βοήθησα να νιώσετε πιο άνετα σχετικά με τη διαδικασία συνέντευξης της επιστήμης δεδομένων. Καλή επιτυχία στις συνεντεύξεις σας!

Πρωτότυπο. Αναδημοσιεύτηκε με άδεια.

Συγγενεύων:

Πηγή: https://www.kdnuggets.com/2021/08/common-data-science-interview-questions-answers.html

Σφραγίδα ώρας:

Περισσότερα από KDnuggets