Amazon EMR pakub hallatavat teenust analüütikarakenduste hõlpsaks käitamiseks, kasutades avatud lähtekoodiga raamistikke, nagu Apache Spark, Hive, Presto, Trino, HBase ja Flink. Amazoni EMR-i käitusaeg Säde ja Presto sisaldab optimeerimisi, mis pakuvad rohkem kui kaks korda suuremat jõudlust võrreldes avatud lähtekoodiga Apache Sparki ja Prestoga.
Amazon EMR-i versiooniga 6.7 saate nüüd kasutada Amazon Elastic Compute Cloud (Amazon EC2) C7g eksemplarid, mis kasutavad AWS Graviton3 protsessorid. Need eksemplarid parandavad Amazon EMR-is Sparki töökoormuste käitamise hinna-jõudlust 7.93–13.35% võrreldes eelmise põlvkonna eksemplaridega, olenevalt eksemplari suurusest. Selles postituses kirjeldame, kuidas hindasime hinna ja kvaliteedi suhet.
Amazon EMR käitusaegne jõudlus EC2 C7g eksemplaridega
Käitasime TPC-DS 3 TB etalonpäringuid versioonis Amazon EMR 6.9, kasutades Amazon EMR-i käituskeskkonda Apache Sparkile (ühildub versiooniga Apache Spark 3.3) koos C7g eksemplaridega. Andmed salvestati Amazoni lihtne salvestusteenus (Amazon S3) ja tulemusi võrreldi samaväärsete C6g klastritega eelmise põlvkonna eksemplaride perekonnast. Mõõtsime jõudluse paranemist, kasutades TPC-DS 3 TB võrdluspäringute kogu päringu käitusaega ja päringu käitusaja geomeetrilist keskmist.
Meie tulemused näitasid 13.65–18.73% paranemist kogu päringu käitusaja toimivuses ja 16.98–20.28% geomeetrilise keskmise paranemist C7g-ga EMR-klastrites võrreldes samaväärsete C6g-juhtumitega EMR-klastritega, olenevalt eksemplari suurusest. Kulude võrdlemisel täheldasime 7.93–13.35% kulude vähenemist EMR-klastris C7g-ga võrreldes ekvivalendiga C6g-ga, sõltuvalt eksemplari suurusest. Me ei võrdlenud C6g xlarge eksemplari, kuna sellel ei olnud päringute käitamiseks piisavalt mälu.
Järgmises tabelis on näidatud TPC-DS 3 TB etalonpäringute käitamise tulemused, kasutades Amazon EMR 6.9, võrreldes samaväärsete C7g ja C6g eksemplari EMR klastritega.
Eksemplari suurus | 16 XL | 12 XL | 8 XL | 4 XL | 2 XL |
Klastri kogumaht (1 juht + 5 põhisõlme) | 6 | 6 | 6 | 6 | 6 |
Päringu kogu käitusaeg C6g-s (sekundites) | 2774.86205 | 2752.84429 | 3173.08086 | 5108.45489 | 8697.08117 |
Päringu kogu käitusaeg C7g-s (sekundites) | 2396.22799 | 2336.28224 | 2698.72928 | 4151.85869 | 7249.58148 |
Päringu käitusaja täielik täiustamine C7g-ga | 13.65% | 15.13% | 14.95% | 18.73% | 16.64% |
Päringu geomeetriline keskmine käitusaeg C6g (sekundites) | 22.2113 | 21.75459 | 23.38081 | 31.97192 | 45.41656 |
Päringu geomeetriline keskmine käitusaeg C7g (sekundites) | 18.43905 | 17.65898 | 19.01684 | 25.48695 | 37.43737 |
Päringu käitusaja geomeetrilise keskmise parandamine C7g-ga | 16.98% | 18.83% | 18.66% | 20.28% | 17.57% |
EC2 C6g eksemplari hind ($ tunnis) | $2.1760 | $1.6320 | $1.0880 | $0.5440 | $0.2720 |
EMR C6g eksemplari hind ($ tunnis) | $0.5440 | $0.4080 | $0.2720 | $0.1360 | $0.0680 |
(EC2 + EMR) eksemplari hind ($ tunnis) | $2.7200 | $2.0400 | $1.3600 | $0.6800 | $0.3400 |
C6g töötamise kulu ($ eksemplari kohta) | $2.09656 | $1.55995 | $1.19872 | $0.96493 | $0.82139 |
EC2 C7g eksemplari hind ($ tunnis) | $2.3200 | $1.7400 | $1.1600 | $0.5800 | $0.2900 |
EMR C7g hind ($ tunnis eksemplari kohta) | $0.5800 | $0.4350 | $0.2900 | $0.1450 | $0.0725 |
(EC2 + EMR) C7g eksemplari hind ($ tunnis) | $2.9000 | $2.1750 | $1.4500 | $0.7250 | $0.3625 |
C7g töötamise kulu ($ eksemplari kohta) | $1.930290 | $1.411500 | $1.086990 | $0.836140 | $0.729990 |
Kogukulude vähendamine C7g-ga, sealhulgas jõudluse parandamine | -7.93% | -9.52% | -9.32% | -13.35% | -11.13% |
Järgmine graafik näitab C7g 2xsuurtel eksemplaridel täheldatud täiustusi päringu kohta võrreldes samaväärsete C6g põlvkondadega.
Võrdlusuuringu metoodika
Selles postituses kasutatav võrdlusalus on tuletatud tööstusstandardi TPC-DS võrdlusalusest ja kasutab päringuid Spark SQL Performance Tests GitHubi repo järgmisega parandused rakendatud.
Arvutasime TCO, korrutades tunni maksumuse klastris olevate eksemplaride arvu ja klastris päringute käitamiseks kulunud ajaga. Kasutasime USA idapiirkonna (N. Virginia) kõikidel juhtudel tellitavat hinnakujundust.
Järeldus
Selles postituses kirjeldasime, kuidas hindasime Amazon EMR-i kasutamisest koos C7g eksemplaridega saadavat tasuvust võrreldes samaväärsete eelmise põlvkonna eksemplaride kasutamisega. Nende uute eksemplaride kasutamine koos Amazon EMR-iga parandab kulutasuvust veel 7–13%.
Autoritest
Al MS on Amazon EMR-i tootejuht ettevõttes Amazon Web Services.
Kyeonghyun Ryoo on Amazon Web Services EMR-i tarkvaraarenduse insener. Ta tegeleb peamiselt sisemiste meeskondade ja klientide automatiseerimistööriistade kavandamise ja ehitamisega, et maksimeerida nende tootlikkust. Väljaspool tööd on ta pensionil profimängude maailmameister, kellele meeldib endiselt videomänge mängida.
Yuzhou päike on Amazon Web Servicesi EMR-i tarkvaraarenduse insener.
Steve Koonce on Amazon Web Services EMR-i insenerijuht.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/big-data/amazon-emr-launches-support-for-amazon-ec2-c7g-graviton3-instances-to-improve-cost-performance-for-spark-workloads-by-7-13/
- 1
- 100
- 35%
- 7
- 9
- a
- üle
- Täiendavad lisad
- AI
- Materjal: BPA ja flataatide vaba plastik
- Amazon
- Amazon EC2
- Amazon EMR
- Amazon Web Services
- analytics
- ja
- Apache
- Apache Spark
- rakendused
- rakendatud
- Automaatika
- sest
- võrrelda
- kasu
- Ehitus
- arvutatud
- meister
- Cluster
- võrreldes
- võrrelda
- kokkusobiv
- Arvutama
- tuum
- Maksma
- kulude vähendamine
- kulud
- Kliendid
- andmed
- Olenevalt
- Tuletatud
- kirjeldama
- kirjeldatud
- projekteerimine
- & Tarkvaraarendus
- DID
- kergesti
- Ida
- insener
- Inseneriteadus
- nautima
- Samaväärne
- Hinnanguliselt
- Eeter (ETH)
- pere
- Järel
- raamistikud
- Alates
- Mängud
- mäng
- põlvkond
- Põlvkonnad
- GitHub
- graafik
- Mesilaspere
- Kuidas
- HTTPS
- parandama
- paranemine
- parandusi
- parandab
- in
- hõlmab
- Kaasa arvatud
- Näiteks
- sisemine
- IT
- käivitab
- juht
- juhitud
- juht
- Maksimeerima
- Mälu
- MS
- korrutades
- Uus
- sõlmed
- number
- avatud lähtekoodiga
- väljaspool
- jõudlus
- Platon
- Platoni andmete intelligentsus
- PlatoData
- mängimine
- post
- eelmine
- hind
- hinnapoliitika
- eelkõige
- töötlejad
- Toode
- tootejuht
- tootlikkus
- professionaalne
- anda
- annab
- piirkond
- vabastama
- Tulemused
- jooks
- jooksmine
- sekundit
- teenus
- Teenused
- Näitused
- lihtne
- SUURUS
- tarkvara
- tarkvaraarenduse
- Säde
- SQL
- Veel
- ladustamine
- ladustatud
- selline
- piisav
- toetama
- tabel
- meeskonnad
- testid
- .
- oma
- aeg
- et
- töövahendid
- Summa
- us
- kasutama
- Video
- Videomängude
- virginia
- web
- veebiteenused
- mis
- WHO
- Töö
- töötab
- maailm
- sephyrnet