5 proiecte de portofoliu pentru studenții anului final la știința datelor - KDnuggets

5 proiecte de portofoliu pentru studenții anului final la știința datelor – KDnuggets

Nodul sursă: 2864902

5 proiecte de portofoliu pentru studenții anului final la știința datelor
Imagine de autor
 

Construirea unui portofoliu de proiecte de știință a datelor este un pas crucial pentru începătorii care doresc să intre în domeniu. Având în vedere că experiența practică devine din ce în ce mai importantă pentru solicitanții de locuri de muncă în domeniul științei datelor, a avea un portofoliu variat care să vă prezinte abilitățile vă poate ajuta să vă evidențiați.

Pe lângă demonstrarea abilităților tehnice, proiectele vă permit să vă evidențiați abilitățile de rezolvare a problemelor și gândirea analitică. Recrutorii caută adesea candidați care pot folosi datele pentru a oferi informații strategice de afaceri și pentru a construi soluții bazate pe date pentru problemele din lumea reală. Proiectele bine executate te pot deosebi ca cineva gata să adauge valoare unei organizații.

În acest blog, vom explora proiecte simple de portofoliu, de la analiza datelor până la învățarea automată. Veți descoperi cum să curățați și să procesați datele dvs., urmat de utilizarea diferitelor tehnici analitice pentru a transmite informații către părțile interesate non-tehnice.

În Proiect de știință a datelor end-to-end cu ChatGPT proiect, veți folosi ChatGPT pentru planificarea proiectului, analiza datelor, preprocesarea datelor, selectarea modelului, reglarea hiperparametrilor, dezvoltarea unei aplicații web și implementarea acesteia pe Spaces.

În zilele noastre, oricine are cunoștințe limitate poate folosi ChatGPT pentru a înțelege datele și pentru a construi aplicații de învățare automată. Acest proiect va demonstra că puteți lucra cu cele mai recente tehnologii AI pentru a produce rezultate rapide și eficiente. 

 

5 proiecte de portofoliu pentru studenții anului final la știința datelor
Imagine de la Project

Pentru Energie reciclată economisită în Singapore proiect, veți folosi statisticile de reciclare pentru a determina cantitatea de energie economisită anual din 2003 până în 2020 pentru cinci tipuri diferite de deșeuri: materiale plastice, hârtie, sticlă, metale feroase și metale neferoase. Mai exact, veți încărca și organiza setul de date, veți îmbina diferite fișiere CSV și veți efectua o analiză exploratorie a datelor. Acest proiect vă va provoca abilitățile analitice și de manipulare a datelor.

 

5 proiecte de portofoliu pentru studenții anului final la știința datelor
Imagine de la Project

Analiza pieței bursiere proiectul utilizează date financiare din lumea reală pentru a demonstra abilitățile de analiză a seriilor de timp. După curățarea datelor, analiza exploratorie și vizualizarea sunt efectuate folosind Matplotlib și Seaborn pentru a analiza valorile de risc și relațiile dintre stocuri.

Un model de memorie pe termen lung (LSTM) este antrenat pe baza datelor din seria temporală pentru a prognoza prețurile viitoare. Cuprinzând colectarea datelor, curățarea, vizualizarea și modelarea datelor de pe o bursă, acest proiect evidențiază competența în analiza datelor de bază și fluxurile de lucru de învățare automată. 

 

5 proiecte de portofoliu pentru studenții anului final la știința datelor
Imagine de la Project

În Analiza și predicția proiectului Consumer Engagement, veți folosi setul de date Știri pe internet și implicare a consumatorilor de la Kaggle pentru a prezice cel mai popular articol și scorul său de popularitate. Veți analiza datele pentru a găsi modele, cum ar fi corelația, distribuția, media și analiza serii cronologice. Veți folosi atât modele de regresie text, cât și modele de clasificare a textului pentru a prezice scorul de implicare și articolul de top pe baza titlului.

În acest proiect, veți învăța cum să gestionați datele text, să efectuați o analiză a textului folosind bibliotecile Python, să convertiți textul în vectori și să construiți un model de clasificator LGBM.

 

5 proiecte de portofoliu pentru studenții anului final la știința datelor
Imagine de la Project

În Evoluția învățării digitale în timpul COVID19 proiect, vom folosi instrumente de analiză a datelor pentru a descoperi tendințele în învățarea digitală și modul în care este eficientă față de comunitățile improvizate. Vom compara districtele și statele pe factori precum demografia, accesul la internet, accesul la produse de învățare și finanțele. În cele din urmă, vom rezuma raportul nostru și vom indica zonele care necesită mai multă atenție pentru a face educația accesibilă pentru toți studenții din Statele Unite.

Veți învăța să utilizați toate instrumentele majore de analiză și vizualizare a datelor. Este, de asemenea, un ghid pentru cei care doresc să devină creativi în a genera vizualizări atrăgătoare pentru prezentarea lor.

 

5 proiecte de portofoliu pentru studenții anului final la știința datelor
Imagine de la Project

Construirea unui portofoliu de proiecte de știință a datelor le permite începătorilor să-și demonstreze abilitățile tehnice și abilitățile de rezolvare a problemelor potențialilor angajatori. Prin prezentarea competențelor în colectarea datelor, curățarea, analiză, modelare și vizualizare, aceste proiecte pot evidenția competența cuiva într-un flux de lucru știința datelor.

În acest blog, am analizat cinci proiecte de portofoliu pentru studenții din anul final la știința datelor. Acesta acoperă elementele de bază privind manipularea, manipularea, vizualizarea și modelarea datelor. Pentru a explora mai multe proiecte, consultați Colecția completă de proiecte de știință a datelor – Partea 1 și Partea 2.
 
 
Abid Ali Awan (@ 1abidaliawan) este un profesionist certificat în domeniul științei datelor, căruia îi place să construiască modele de învățare automată. În prezent, se concentrează pe crearea de conținut și pe scrierea de bloguri tehnice despre învățarea automată și tehnologiile științei datelor. Abid deține o diplomă de master în managementul tehnologiei și o diplomă de licență în ingineria telecomunicațiilor. Viziunea lui este de a construi un produs AI folosind o rețea neuronală grafică pentru studenții care se luptă cu boli mintale.
 

Timestamp-ul:

Mai mult de la KDnuggets