Pilt autorilt
Saadaval on palju masinõppe ja andmeteaduse kursusi ja ressursse, kuid andmetehnoloogia kohta väga vähe. See tekitab mõningaid küsimusi. Kas see on raske ala? Kas see pakub madalat palka? Kas seda ei peeta sama põnevaks kui teisi tehnilisi rolle? Reaalsus on aga see, et paljud ettevõtted otsivad aktiivselt andmetehnoloogia talente ja pakuvad märkimisväärset palka, mis mõnikord ületab 200,000 XNUMX USD. Andmeinsenerid mängivad andmeplatvormide arhitektidena üliolulist rolli, kavandades ja ehitades alussüsteeme, mis võimaldavad andmeteadlastel ja masinõppeekspertidel tõhusalt toimida.
Selle tööstusharu lõhega tegelemiseks on DataTalkClub võtnud kasutusele transformatiivse ja tasuta alglaagri, "Andmetehnoloogia Zoomcamp“. See kursus on mõeldud selleks, et anda algajatele või professionaalidele, kes soovivad karjääri vahetada, anda olulised oskused ja praktilised kogemused andmetehnoloogia vallas.
See on 6-nädalane alglaager kus saate õppida mitme kursuse, lugemismaterjalide, töötubade ja projektide kaudu. Iga mooduli lõpus antakse teile õpitu praktiseerimiseks kodutöö.
- Nädal 1: Sissejuhatus GCP, Dockeri, Postgresi, Terraformi ja keskkonna seadistamisse.
- Nädal 2: Töövoo orkestreerimine koos Mage'iga.
- Nädal 3: Andmehoidla BigQueryga ja masinõpe BigQueryga.
- Nädal 4: Dbt, Google Data Studio ja metabaasiga analüütiline insener.
- Nädal 5: Partii töötlemine Sparkiga.
- Nädal 6: Voogesitus Kafkaga.
Pilt DataTalksClub/data-engineering-zoomcamp
Õppekava sisaldab 6 moodulit, 2 töötuba ja projekti, mis hõlmab kõike, mis on vajalik professionaalseks andmeinseneriks saamiseks.
1. moodul: konteineriseerimise ja taristu koodina valdamine
Selles moodulis saate teada Dockeri ja Postgresi kohta, alustades põhitõdedest ja edenedes üksikasjalike õpetuste kaudu, mis käsitlevad andmekonveierite loomist, Postgresi käitamist Dockeriga ja palju muud.
Moodul hõlmab ka olulisi tööriistu, nagu pgAdmin, Docker-compose ja SQL-i värskendamise teemad, koos valikulise sisuga Dockeri võrgunduses ja spetsiaalse ülevaatega Windowsi alamsüsteemi Linuxi kasutajatele. Lõpuks tutvustab kursus teile GCP-d ja Terraformi, pakkudes terviklikku arusaama konteineriseerimisest ja infrastruktuurist kui koodist, mis on tänapäevaste pilvepõhiste keskkondade jaoks hädavajalik.
2. moodul: töövoo orkestreerimise tehnikad
Moodul pakub põhjalikku uurimist Mage'i, uuendusliku avatud lähtekoodiga hübriidraamistiku andmete teisendamiseks ja integreerimiseks. See moodul algab töövoo orkestreerimise põhitõdedega, edenedes Mage'i praktiliste harjutusteni, sealhulgas selle seadistamine Dockeri kaudu ja ETL-i torujuhtmete loomine API-st Postgresi ja Google Cloud Storage'i (GCS) ning seejärel BigQuerysse.
Mooduli segu videotest, ressurssidest ja praktilistest ülesannetest tagab igakülgse õppimiskogemuse, andes õppijatele oskused hallata keerukaid andmetöövooge kasutades Mage.
1. töötuba: Andmete sisestamise strateegiad
Esimeses töötoas õpite ehitama tõhusaid andmete sisestamise torujuhtmeid. Töötuba keskendub olulistele oskustele, nagu andmete ekstraheerimine API-dest ja failidest, andmete normaliseerimine ja laadimine ning järkjärgulise laadimise tehnikad. Pärast selle töötoa läbimist saate luua tõhusaid andmetorusid nagu vanemandmeinsener.
3. moodul: andmehoidla
Moodul on andmete salvestamise ja analüüsi põhjalik uurimine, keskendudes BigQuery abil andmehoidlale. See hõlmab põhikontseptsioone, nagu jaotamine ja rühmitamine, ning tutvustab BigQuery parimaid tavasid. Moodul liigub edasi arenenud teemadeni, eriti masinõppe (ML) integreerimine BigQueryga, tõstab esile SQL-i kasutamist ML-i jaoks ning pakub ressursse hüperparameetrite häälestamiseks, funktsioonide eeltöötluseks ja mudeli juurutamiseks.
4. moodul: Analyticsi tehnika
Analüütikatehnika moodul keskendub projekti loomisele, kasutades dbt-d (Data Build Tool) olemasoleva andmelaoga, kas BigQuery või PostgreSQL-iga.
Moodul hõlmab dbt seadistamist nii pilve- kui ka kohalikus keskkonnas, analüütikatehnika kontseptsioonide tutvustamist, ETL vs ELT ja andmete modelleerimist. See hõlmab ka täiustatud dbt-funktsioone, nagu astmelised mudelid, sildid, konksud ja hetktõmmised.
Lõpuks tutvustab moodul tehnikaid muudetud andmete visualiseerimiseks, kasutades selliseid tööriistu nagu Google Data Studio ja metabaas, ning pakub ressursse tõrkeotsinguks ja tõhusaks andmete laadimiseks.
5. moodul: paketttöötluse oskus
See moodul hõlmab paketttöötlemist Apache Sparki abil, alustades paketttöötluse ja Sparki tutvustustest ning installijuhistest Windowsi, Linuxi ja MacOS-i jaoks.
See hõlmab Spark SQL-i ja DataFrame'ide uurimist, andmete ettevalmistamist, SQL-i toimingute sooritamist ja Sparki sisemiste elementide mõistmist. Lõpuks lõpeb see Sparki pilves käitamisega ja Sparki integreerimisega BigQueryga.
6. moodul: Kafkaga andmete voogesituse kunst
Moodul algab vootöötluse kontseptsioonide sissejuhatusega, millele järgneb Kafka põhjalik uurimine, sealhulgas selle põhialuste, Confluent Cloudiga integreerimise ning tootjate ja tarbijate praktiliste rakenduste uurimine.
Moodul hõlmab ka Kafka konfiguratsiooni ja vooge, käsitledes selliseid teemasid nagu vooühendused, testimine, akende loomine ja Kafka ksqldb & Connecti kasutamine. Lisaks laiendab see oma tähelepanu Pythoni ja JVM-i keskkondadele, sisaldades Pythoni vootöötluse jaoks mõeldud Faust, Pyspark – struktureeritud voogesitust ja Scala näiteid Kafka Streamsi jaoks.
2. töötuba: Voo töötlemine SQL-iga
Õpid töötlema ja haldama voogedastusandmeid RisingWave'iga, mis pakub kulutõhusat PostgreSQL-stiilis kogemusega lahendust teie voogesitusrakenduste võimendamiseks.
Projekt: reaalmaailma andmetehnoloogia rakendus
Selle projekti eesmärk on rakendada kõiki sellel kursusel õpitud kontseptsioone, et luua täielik andmekonveier. Loote kahest paanist koosneva armatuurlaua loomiseks valides andmestiku, luues konveieri andmete töötlemiseks ja salvestades need andmejärves, ehitades konveieri töödeldud andmete edastamiseks andmejärvest andmelattu, teisendades andmelaos olevad andmed ja nende ettevalmistamine armatuurlaua jaoks ning lõpuks armatuurlaua ehitamine andmete visuaalseks esitamiseks.
2024. aasta kohordi üksikasjad
- Registreerimine: Registreeru nüüd
- Alguskuupäev: 15. jaanuar 2024, kell 17:00 CET
- Iseseisev õppimine juhendatud toega
- Kohordi kaust koos kodutööde ja tähtaegadega
- Interaktiivne Slack kogukond kaaslastelt õppimiseks
Eeldused
- Põhilised kodeerimis- ja käsureaoskused
- Vundament SQL-is
- Python: kasulik, kuid mitte kohustuslik
Asjatundlikud juhendajad juhivad teie reisi
- Ankush Khanna
- Victoria Perez Mola
- Aleksei Grigorev
- Matt Palmer
- Luis Oliveira
- Michael Kingsepp
Liituge meie 2024. aasta rühmaga ja alustage õppimist hämmastava andmetehnoloogia kogukonnaga. Spetsialistide juhitud koolituse, praktilise kogemuse ja tööstuse vajadustele kohandatud õppekavaga ei varusta see alglaager teid mitte ainult vajalike oskustega, vaid asetab teid ka tulusa ja nõudliku karjääritee esirinnas. Registreeruge juba täna ja muutke oma püüdlused reaalsuseks!
Abid Ali Awan (@1abidaliawan) on sertifitseeritud andmeteadlase professionaal, kes armastab masinõppemudelite loomist. Praegu keskendub ta sisu loomisele ning tehniliste ajaveebide kirjutamisele masinõppe ja andmeteaduse tehnoloogiate kohta. Abid on omandanud magistrikraadi tehnoloogiajuhtimises ja bakalaureusekraadi telekommunikatsioonitehnikas. Tema visioon on luua graafilise närvivõrgu abil tehisintellekti toode vaimuhaigustega võitlevatele õpilastele.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://www.kdnuggets.com/the-only-free-course-you-need-to-become-a-professional-data-engineer?utm_source=rss&utm_medium=rss&utm_campaign=the-only-free-course-you-need-to-become-a-professional-data-engineer
- :on
- :on
- :mitte
- : kus
- $ UP
- 000
- 1
- 15%
- 17
- 2024
- a
- Võimalik
- MEIST
- aktiivselt
- Lisaks
- adresseerimine
- edasijõudnud
- edeneb
- pärast
- AI
- Materjal: BPA ja flataatide vaba plastik
- mööda
- Ka
- hämmastav
- an
- analüüs
- Analüütiline
- analytics
- ja
- infrastruktuuri
- Apache
- Apache Spark
- API
- API-liidesed
- rakendused
- arhitektid
- OLEME
- Kunst
- AS
- At
- saadaval
- Alused
- BE
- muutuma
- saada
- Algajatele
- kasulik
- BEST
- parimaid tavasid
- suur päring
- Segu
- blogid
- mõlemad
- ehitama
- Ehitus
- kuid
- by
- Karjäär
- karjääri
- atesteeritud
- Cloud
- Cloud Storage
- Klastrite loomine
- kood
- Kodeerimine
- Kohordi
- kogukond
- Ettevõtted
- lõpetamist
- terviklik
- mõisted
- järeldab
- konfiguratsioon
- Konfidentsiaalne
- Võta meiega ühendust
- kaaluda
- Koosneb
- ehitama
- Tarbijad
- sisaldab
- sisu
- sisu loomine
- kursus
- kursused
- kaaned
- looma
- loomine
- loomine
- otsustav
- Praegu
- Curriculum
- armatuurlaud
- andmed
- andmeinsener
- andmejärv
- andmeteadus
- andmeteadlane
- andmete salvestamine
- andmekogus
- kuupäev
- Kraad
- kasutuselevõtu
- kavandatud
- projekteerimine
- üksikasjalik
- raske
- laevalaadija
- iga
- tõhusalt
- tõhus
- kumbki
- volitama
- võimaldama
- lõpp
- Lõpuks-lõpuni
- insener
- Inseneriteadus
- Inseneride
- registreerima
- tagab
- keskkond
- keskkondades
- oluline
- Eeter (ETH)
- kõik
- näited
- põnev
- olemasolevate
- kogemus
- ekspertide
- uurimine
- Avastades
- laieneb
- tunnusjoon
- FUNKTSIOONID
- Lisaks
- vähe
- väli
- Faile
- Lõpuks
- esimene
- Keskenduma
- keskendub
- keskendumine
- Järgneb
- eest
- esirinnas
- Sihtasutus
- Raamistik
- tasuta
- Alates
- funktsioon
- Põhialused
- lõhe
- GCP
- antud
- Google Cloud
- graafik
- Graafiline närvivõrk
- juhitud
- käed-
- Olema
- he
- esiletõstmine
- tema
- omab
- terviklikku
- kodutöö
- Konksud
- aga
- HTTPS
- hübriid
- Hüperparameetrite häälestamine
- haigus
- rakendada
- in
- sügavuti minev
- hõlmab
- Kaasa arvatud
- kasvav
- tööstus
- Infrastruktuur
- uuenduslik
- paigaldamine
- juhised
- Integreerimine
- integratsioon
- sisse
- sisse
- Tutvustab
- sisse
- Sissejuhatus
- asustamise
- kaasates
- IT
- ITS
- Jaanuar
- Liita
- Kafka
- KDnuggets
- Võti
- järv
- juhtivate
- Õppida
- õppinud
- õppijad
- õppimine
- nagu
- joon
- Linux
- laadimine
- kohalik
- otsin
- armastab
- Madal
- tulus
- masin
- masinõpe
- MacOS
- juhtima
- juhtimine
- kohustuslik
- palju
- meister
- Mastering
- materjalid
- vaimne
- Vaimuhaigus
- ML
- mudel
- modelleerimine
- mudelid
- Kaasaegne
- moodul
- Moodulid
- rohkem
- mitmekordne
- vajalik
- Vajadus
- vaja
- vajadustele
- võrk
- võrgustike loomine
- Neural
- Närvivõrgus
- eesmärk
- of
- pakkumine
- Pakkumised
- on
- ainult
- avatud lähtekoodiga
- Operations
- or
- Korraldus
- Muu
- meie
- Palmer
- eriti
- tee
- Maksma
- peer
- esitades
- torujuhe
- Platvormid
- Platon
- Platoni andmete intelligentsus
- PlatoData
- mängima
- positsioone
- Postgresql
- Praktiline
- Praktilised rakendused
- tava
- tavad
- ettevalmistamisel
- esitada
- protsess
- töödeldud
- töötlemine
- Tootjad
- Toode
- professionaalne
- spetsialistid
- edeneb
- projekt
- projektid
- annab
- pakkudes
- Python
- Küsimused
- tõstab
- Lugemine
- päris maailm
- Reaalsus
- Vahendid
- Roll
- rollid
- jooksmine
- s
- palgad
- Scala
- teadus
- teadlane
- teadlased
- otsib
- valides
- vanem
- kehtestamine
- seade
- oskused
- nõrk
- lahendus
- mõned
- mõnikord
- keeruline
- Säde
- eriline
- SQL
- algus
- Käivitus
- ladustamine
- oja
- streaming
- ojad
- struktureeritud
- Võitlemine
- Õpilased
- stuudio
- mahukas
- selline
- toetama
- Lüliti
- süsteemid
- kohandatud
- talent
- ülesanded
- tech
- Tehniline
- tehnikat
- Tehnoloogiad
- Tehnoloogia
- elekterside
- Terraform
- Testimine
- et
- .
- Põhitõed
- SIIS
- see
- Läbi
- et
- täna
- tööriist
- töövahendid
- Teemasid
- koolitus
- Ülekanne
- Muutma
- Transformation
- muundav
- ümber
- transformeerivate
- õpetused
- kaks
- mõistmine
- USD
- kasutama
- Kasutajad
- kasutamine
- Ve
- väga
- kaudu
- Videod
- nägemus
- visuaalselt
- vs
- Ladu
- Ladustamine
- we
- M
- mis
- WHO
- will
- aknad
- koos
- töövoog
- Töövoogud
- töökoda
- Töötoad
- kirjutamine
- sa
- Sinu
- sephyrnet