سرویس جستجوی باز آمازون اخیرا معرفی شده است Multi-AZ با Standby، یک گزینه استقرار طراحی شده برای ارائه دسترسی به مشاغل و عملکرد ثابت برای بارهای کاری حیاتی. با استفاده از این ویژگی، خوشه های مدیریت شده می توانند به 99.99٪ در دسترس بودن دست یابند در حالی که در برابر خرابی های زیرساخت منطقه ای انعطاف پذیر هستند.
در این پست، نحوه عملکرد جستجو و نمایه سازی با Multi-AZ با حالت Standby را بررسی می کنیم و به مکانیسم های اساسی که به قابلیت اطمینان، سادگی و تحمل خطا کمک می کند، می پردازیم.
زمینه
Multi-AZ با حالت آماده به کار، نمونههای دامنه سرویس جستجوی باز را در سه منطقه دسترسپذیری، با دو منطقه فعال و یکی بهعنوان آمادهبهکار، مستقر میکند. این پیکربندی با حفظ ظرفیت یکسان در همه مناطق، عملکرد ثابت را حتی در صورت خرابی های ناحیه ای تضمین می کند. نکته مهم این است که این منطقه آماده به کار از یک پیروی می کند طراحی پایدار استاتیکی، از بین بردن نیاز به تامین ظرفیت یا جابجایی داده در هنگام خرابی.
در طول عملیات منظم، منطقه فعال ترافیک هماهنگ کننده را برای درخواست های خواندن و نوشتن و همچنین ترافیک پرس و جوی خرد انجام می دهد. از طرف دیگر، منطقه آماده به کار فقط ترافیک تکراری را دریافت می کند. سرویس OpenSearch از یک پروتکل تکرار همزمان برای درخواست های نوشتن استفاده می کند. این سرویس را قادر میسازد تا در صورت خرابی، سریعاً یک منطقه آماده به کار را به وضعیت فعال ارتقا دهد (میانگین زمان خرابی <= 1 دقیقه)، که به عنوان یک شکست ناحیه ای. سپس منطقه فعال قبلی به حالت آماده به کار تنزل می یابد و عملیات بازیابی برای بازگرداندن وضعیت سالم آن آغاز می شود.
برای تضمین دسترسی بالا، مسیریابی ترافیک و failover را جستجو کنید
در یک دامنه سرویس OpenSearch، الف هماهنگ کننده هر گره ای است که درخواست های HTTP(S) را رسیدگی می کند، به ویژه درخواست های فهرست بندی و جستجو. در یک Multi-AZ با دامنه Standby، گره های داده در منطقه فعال به عنوان هماهنگ کننده برای درخواست های جستجو عمل می کنند.
در طول مرحله پرس و جو درخواست جستجو، هماهنگ کننده قطعات مورد نظر را تعیین می کند و درخواستی را به گره داده میزبان کپی خرده می فرستد. پرس و جو به صورت محلی روی هر خرده اجرا می شود و اسناد منطبق به گره هماهنگ کننده بازگردانده می شوند. گره هماهنگ کننده که وظیفه ارسال درخواست به گره های حاوی کپی های خرد شده را بر عهده دارد، فرآیند را در دو مرحله اجرا می کند. اول، یک تکرار کننده ایجاد می کند که ترتیبی را تعریف می کند که در آن گره ها باید برای یک کپی خرده پرس و جو شوند تا ترافیک به طور یکنواخت در بین نسخه های خرد توزیع شود. متعاقباً درخواست به گره های مربوطه ارسال می شود.
به منظور ایجاد یک لیست مرتب از گرهها که باید برای کپی خردهای پرس و جو شوند، گره هماهنگکننده از الگوریتمهای مختلفی استفاده میکند. این الگوریتمها عبارتند از انتخاب دورگرد، انتخاب کپی تطبیقی، مسیریابی تکهای مبتنی بر اولویت، و دور روبین وزن دار.
برای Multi-AZ با حالت Standby، الگوریتم دور چرخشی وزنی برای انتخاب کپی خرده استفاده می شود. در این روش، به مناطق فعال وزن 1 و به منطقه آماده به کار وزن 0 اختصاص داده می شود.
وزن ها در فراداده حالت خوشه ای به عنوان یک شی JSON ذخیره می شوند:
همانطور که در تصویر زیر نشان داده شده است، us-east-1b
منطقه وضعیت منطقه خود را به عنوان StandBy
، نشان می دهد که گره های داده در این منطقه دسترسی در حالت آماده به کار هستند و درخواست های جستجو یا نمایه سازی را از متعادل کننده بار دریافت نمی کنند.
برای حفظ عملیات حالت پایدار، منطقه در دسترس بودن آماده به کار هر 30 دقیقه یکبار چرخانده میشود و اطمینان حاصل میکند که تمام بخشهای شبکه در سراسر مناطق در دسترس پوشش داده میشوند. این رویکرد فعال، در دسترس بودن مسیرهای خواندن را تأیید میکند و انعطافپذیری سیستم را در هنگام خرابیهای احتمالی افزایش میدهد. نمودار زیر این معماری را نشان می دهد.
در نمودار قبلی، Zone-C دارای وزن چرخشی وزنی است که روی صفر تنظیم شده است. این تضمین می کند که گره های داده در منطقه آماده به کار هیچ ترافیک فهرست بندی یا جستجو را دریافت نمی کنند. هنگامی که هماهنگکننده گرههای داده را برای کپیهای خرده جستجو میکند، از وزنهای دور رابین وزندار برای تصمیمگیری در مورد ترتیب گرهها استفاده میکند. از آنجا که وزن برای منطقه در دسترس بودن آماده به کار صفر است، درخواست های هماهنگ کننده ارسال نمی شود.
در یک خوشه سرویس OpenSearch، مناطق فعال و آماده به کار را می توان در هر زمان با استفاده از معیارهای چرخش منطقه در دسترس بررسی کرد، همانطور که در تصویر زیر نشان داده شده است.
در طول خاموشی های منطقه ای، منطقه در دسترس بودن آماده به کار به طور یکپارچه به حالت باز کردن شکست برای درخواست های جستجو تغییر می کند. این بدان معناست که ترافیک پرس و جوی خرده به همه مناطق در دسترس هدایت میشود، حتی آنهایی که در حالت آمادهباش هستند، زمانی که یک نسخه خرد سالم در منطقه دسترسی فعال در دسترس نیست. این رویکرد باز کردن شکست، درخواستهای جستجو را از اختلال در هنگام خرابی محافظت میکند و خدمات مستمر را تضمین میکند. نمودار زیر این معماری را نشان می دهد.
در نمودار قبلی، در طول حالت پایدار، ترافیک پرس و جوی خرده به گره داده در مناطق فعال (Zone-A و Zone-B) ارسال می شود. به دلیل خرابی گره در Zone-A، منطقه در دسترس بودن آماده به کار (Zone-C) باز نمی شود تا ترافیک پرس و جوی خرده ای را بگیرد، به طوری که هیچ تاثیری بر درخواست های جستجو ندارد. در نهایت، Zone-A به عنوان ناسالم تشخیص داده می شود و خطای خواندن حالت آماده به کار را به Zone-A تغییر می دهد.
چگونه failover دسترسی بالا را در هنگام اختلال نوشتن تضمین می کند
مدل تکرار سرویس OpenSearch از یک مدل پشتیبان اولیه پیروی میکند که با ماهیت همزمان آن مشخص میشود، که در آن تأیید از همه کپیهای خرد قبل از تأیید درخواست نوشتن برای کاربر ضروری است. یکی از اشکالات قابل توجه این مدل تکرار، حساسیت آن به کندی در صورت بروز هرگونه اختلال در مسیر نوشتن است. این سیستم ها برای شناسایی خرابی ها یا تاخیرها به یک گره رهبر فعال متکی هستند و سپس این اطلاعات را به همه گره ها پخش می کنند. مدت زمانی که برای شناسایی این مسائل (میانگین زمان شناسایی) و متعاقباً حل آنها (میانگین زمان تعمیر) طول میکشد، تا حد زیادی تعیینکننده مدت زمان عملکرد سیستم در حالت آسیبدیده است. علاوه بر این، هر رویداد شبکه ای که بر ارتباطات بین منطقه ای تأثیر می گذارد، به دلیل ماهیت همزمان تکرار، می تواند به طور قابل توجهی مانع از درخواست نوشتن شود.
سرویس OpenSearch از یک پروتکل ارتباطی داخلی گره به گره برای تکرار ترافیک نوشتن و هماهنگی بهروزرسانیهای ابرداده از طریق یک رهبر منتخب استفاده میکند. در نتیجه، قرار دادن منطقه دارای استرس در حالت آماده به کار نمیتواند به طور مؤثر مشکل اختلال نوشتن را برطرف کند.
خطای نوشتن منطقه ای: قطع ترافیک تکرار بین منطقه ای
برای Multi-AZ با Standby، برای کاهش مشکلات عملکرد بالقوه ناشی از رویدادهای پیش بینی نشده مانند خرابی منطقه ای و رویدادهای شبکه، خطای نوشتن منطقه ای یک رویکرد موثر است. این رویکرد شامل حذف برازنده گرهها در منطقه آسیبدیده از خوشه است که به طور موثر ترافیک ورودی و خروجی بین مناطق را قطع میکند. با قطع ترافیک تکرار بین منطقه ای، می توان تاثیر خرابی های ناحیه ای را در منطقه آسیب دیده مهار کرد. این یک تجربه قابل پیش بینی بیشتر برای مشتریان فراهم می کند و تضمین می کند که سیستم به طور قابل اعتماد به کار خود ادامه می دهد.
شکست نوشتن برازنده
هماهنگ سازی یک خطای نوشتن در سرویس OpenSearch توسط گره رهبر منتخب از طریق یک مکانیسم کاملاً تعریف شده انجام می شود. این مکانیسم شامل یک پروتکل اجماع برای انتشار حالت خوشه ای است که از توافق متفق القول بین همه گره ها برای تعیین یک منطقه واحد (در همه زمان ها) برای از کار انداختن اطمینان حاصل می کند. نکته مهم این است که ابرداده مربوط به منطقه آسیبدیده در تمام گرهها تکرار میشود تا از ماندگاری آن اطمینان حاصل شود، حتی در هنگام راهاندازی مجدد کامل در صورت قطع شدن.
علاوه بر این، گره رهبر با قرار دادن گرهها در نواحی آسیبدیده در حالت آماده به کار به مدت 5 دقیقه قبل از شروع حصار ورودی/خروجی، یک انتقال صاف و برازنده را تضمین میکند. این رویکرد عمدی از هدایت هرگونه ترافیک هماهنگ کننده جدید یا ترافیک پرس و جوی خرده به گره های داخل منطقه تحت تاثیر جلوگیری می کند. این به نوبه خود به این گرهها اجازه میدهد تا وظایف در حال انجام خود را با ظرافت انجام دهند و به تدریج قبل از خارج شدن از سرویس، درخواستهای مربوط به پرواز را انجام دهند. نمودار زیر این معماری را نشان می دهد.
در فرآیند اجرای یک شکست نوشتن برای یک گره رهبر، سرویس OpenSearch این مراحل کلیدی را دنبال می کند:
- کناره گیری رهبر - اگر گره رهبر در منطقه ای قرار داشته باشد که برای نوشتن خطا برنامه ریزی شده است، سیستم تضمین می کند که گره رهبر به طور داوطلبانه از نقش رهبری خود کنار می رود. این کناره گیری به صورت کنترل شده انجام می شود و کل فرآیند به گره واجد شرایط دیگری واگذار می شود که سپس مسئولیت اقدامات مورد نیاز را بر عهده می گیرد.
- جلوگیری از انتخاب مجدد رهبر منحل شده - برای جلوگیری از انتخاب مجدد یک رهبر از ناحیه ای که برای نوشتن خطا مشخص شده است، زمانی که گره رهبر واجد شرایط اقدام به نوشتن شکست را آغاز می کند، اقداماتی را انجام می دهد تا اطمینان حاصل شود که گره های رهبر که قرار است از رده خارج شوند در هیچ انتخابات بعدی شرکت نکنند. این امر با کنار گذاشتن گره رهبر که قرار است از رده خارج شود از پیکربندی رأی گیری به دست می آید، و به طور مؤثری از رأی دادن آن در هر مرحله حیاتی از عملکرد خوشه جلوگیری می کند.
ابرداده مربوط به منطقه شکست نوشتن در حالت خوشه ذخیره می شود و این اطلاعات به صورت زیر برای همه گره های خوشه سرویس OpenSearch توزیع شده منتشر می شود:
اسکرین شات زیر نشان میدهد که در طول کاهش سرعت شبکه در یک منطقه، خطای نوشتن به بازیابی دسترسی کمک میکند.
بازیابی منطقه ای پس از نوشتن شکست
فرآیند راه اندازی مجدد منطقه ای نقش مهمی در مرحله بازیابی پس از شکست نوشتن منطقه ای ایفا می کند. پس از اینکه ناحیه تحت تاثیر بازیابی شد و پایدار در نظر گرفته شد، گره هایی که قبلاً از کار افتاده بودند دوباره به خوشه می پیوندند. این راه اندازی مجدد معمولاً در بازه زمانی 2 دقیقه پس از راه اندازی مجدد منطقه رخ می دهد.
این به آنها امکان میدهد با گرههای همتای خود همگام شوند و فرآیند بازیابی برای تکههای ماکت را آغاز میکند و به طور موثر خوشه را به حالت دلخواه خود باز میگرداند.
نتیجه
معرفی OpenSearch Service Multi-AZ with Standby راه حلی قدرتمند برای دستیابی به دسترسی بالا و عملکرد ثابت برای بارهای کاری حیاتی در اختیار کسب و کارها قرار می دهد. با استفاده از این گزینه استقرار، کسبوکارها میتوانند انعطافپذیری زیرساخت خود را افزایش دهند، پیکربندی و مدیریت خوشهها را سادهسازی کنند و بهترین شیوهها را اعمال کنند. سرویس OpenSearch Multi-AZ با قابلیت Standby با ویژگیهایی مانند انتخاب کپی تکه تکهای با وزن، مکانیسمهای failover فعال، و مناطق در دسترس آماده به کار با شکست، تجربه جستجوی قابل اعتماد و کارآمدی را برای محیطهای سازمانی سخت تضمین میکند.
برای اطلاعات بیشتر در مورد Multi-AZ با حالت آماده به کار، به سرویس جستجوی باز آمازون زیر سرپوش: Multi-AZ با حالت آماده به کار.
درباره نویسنده
انشو آگاروال یک مهندس نرم افزار ارشد است که روی AWS OpenSearch در خدمات وب آمازون کار می کند. او مشتاق حل مشکلات مربوط به ساخت سیستم های مقیاس پذیر و بسیار قابل اعتماد است.
ریشاب ناهاتا یک مهندس نرم افزار است که روی OpenSearch در خدمات وب آمازون کار می کند. او شیفته حل مشکلات در سیستم های توزیع شده است. او مشارکت کننده فعال OpenSearch است.
بوختوارخان یک مهندس اصلی است که در سرویس جستجوی باز آمازون کار می کند. او به سیستم های توزیع شده و مستقل علاقه مند است. او یک مشارکت کننده فعال در OpenSearch است.
رانجیت راماچاندرا یک مدیر مهندسی است که روی سرویس جستجوی باز آمازون در خدمات وب آمازون کار می کند.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/big-data/achieve-high-availability-in-amazon-opensearch-multi-az-with-standby-enabled-domains-a-deep-dive-into-failovers/
- : دارد
- :است
- :نه
- :جایی که
- 1
- 10
- 100
- 12
- 30
- 501
- a
- درباره ما
- رسیدن
- دست
- تصدیق شده
- در میان
- عمل
- عمل
- اقدامات
- فعال
- انطباقی
- علاوه بر این
- نشانی
- تحت تاثیر قرار
- پس از
- توافق
- الگوریتم
- الگوریتم
- معرفی
- اجازه دادن
- آمازون
- آمازون خدمات وب
- در میان
- an
- و
- دیگر
- هر
- روش
- معماری
- هستند
- AS
- اختصاص داده
- At
- خود مختار
- سیستم های مستقل
- دسترس پذیری
- اطلاع
- AWS
- پشتیبان گیری
- متعادل کننده
- BE
- زیرا
- بوده
- قبل از
- بودن
- بهترین
- بهترین شیوه
- میان
- هر دو
- پخش
- بنا
- کسب و کار
- by
- CAN
- ظرفیت
- انجام
- ایجاد می شود
- مشخص شده است
- بار
- بررسی شده
- خوشه
- ارتباط
- ارتباطات
- کامل
- پیکر بندی
- اجماع
- در نتیجه
- در نظر گرفته
- استوار
- کنسول
- موجود
- ادامه
- مداوم
- کمک
- شرکت کننده
- کنترل
- هماهنگ کردن
- تعدیل کننده
- هماهنگ کننده ها
- نسخه
- پوشش داده شده
- ایجاد
- ایجاد
- بحرانی
- بسیار سخت
- مشتریان
- برش
- داده ها
- تصمیم گیری
- عمیق
- شیرجه عمیق
- تعریف می کند
- تاخیر
- غرق کردن
- خواستار
- گسترش
- مستقر می کند
- تعیین شده
- طراحی
- مطلوب
- تشخیص
- شناسایی شده
- تعیین می کند
- جهت دار
- قطع
- توزیع شده
- سیستم های توزیع شده
- شیرجه رفتن
- do
- اسناد و مدارک
- دامنه
- حوزه
- آیا
- پایین
- دو
- مدت
- در طی
- هر
- موثر
- به طور موثر
- موثر
- انتخاب شده
- انتخابات
- واجد شرایط
- از بین بردن
- فعال
- را قادر می سازد
- اعمال
- مهندس
- مهندسی
- بالا بردن
- افزایش
- افزایش
- اطمینان حاصل شود
- تضمین می کند
- حصول اطمینان از
- سرمایه گذاری
- تمام
- محیط
- به خصوص
- اتر (ETH)
- حتی
- واقعه
- حوادث
- در نهایت
- هر
- به استثنای
- تجربه
- تجربه
- اکتشاف
- نتواند
- شکست
- شکست
- ویژگی
- امکانات
- نرده
- نام خانوادگی
- پیروی
- به دنبال آن است
- برای
- FRAME
- از جانب
- کامل
- بیشتر
- GIF
- برازنده
- بتدریج
- ضمانت
- دست
- دسته
- دستگیره
- اتفاق می افتد
- he
- سالم
- کمک می کند
- زیاد
- خیلی
- کاپوت
- میزبانی وب
- چگونه
- HTTP
- HTTPS
- شناسایی
- if
- نشان می دهد
- تأثیر
- نهفته
- نقص
- اجرای
- مهمتر
- in
- شامل
- نشان دادن
- اطلاعات
- شالوده
- در ابتدا
- شروع می کند
- شروع
- نمونه ها
- علاقه مند
- داخلی
- به
- معرفی
- معرفی
- شامل
- موضوع
- مسائل
- IT
- ITS
- JPG
- json
- کلید
- شناخته شده
- تا حد زیادی
- رهبر
- رهبری
- پسندیدن
- فهرست
- بار
- به صورت محلی
- واقع شده
- طولانی
- حفظ
- نگهداری
- اداره می شود
- مدیریت
- مدیر
- روش
- علامت گذاری شده
- تطبیق
- متوسط
- به معنی
- معیارهای
- مکانیزم
- مکانیسم
- متاداده
- متریک
- دقیقه
- دقیقه
- کاهش
- حالت
- مدل
- بیش
- جنبش
- طبیعت
- لازم
- نیاز
- شبکه
- شبکه
- جدید
- نه
- گره
- گره
- قابل توجه
- هدف
- of
- خاموش
- on
- ONE
- مداوم
- فقط
- باز کن
- کار
- عمل
- عملیات
- گزینه
- or
- تنظیم و ارکستراسیون
- سفارش
- دیگر
- خارج
- قطع شدن
- خاموشی
- روی
- شرکت کردن
- بخش
- احساساتی
- مسیر
- راه ها
- همکار
- کارایی
- اصرار
- فاز
- دادن
- افلاطون
- هوش داده افلاطون
- PlatoData
- نقش
- پست
- پتانسیل
- قوی
- شیوه های
- ماقبل
- قابل پیش بینی
- جلوگیری از
- جلوگیری
- جلوگیری از
- قبلا
- اصلی
- اصلی
- بلادرنگ
- مشکلات
- روند
- ترویج
- پروتکل
- ارائه
- فراهم می کند
- انتشار
- منتشر شده
- قرار دادن
- نمایش ها
- خواندن
- گرفتن
- دریافت
- تازه
- بهبود یافتن
- بازیابی
- بهبود
- مراجعه
- منطقه
- منظم
- مربوط
- مربوط
- قابلیت اطمینان
- قابل اعتماد
- تکیه
- باقی مانده
- برداشت
- تعمیر
- پاسخ
- تکرار شده
- تکرار
- درخواست
- درخواست
- ضروری
- حالت ارتجاعی
- انعطاف پذیر
- تصمیم
- مسئوليت
- بازیابی
- ترمیم
- بازگرداندن
- نقش
- مسیریابی
- دویدن
- اجرا می شود
- s
- پادمان
- همان
- مقیاس پذیر
- برنامه ریزی
- یکپارچه
- جستجو
- انتخاب
- در حال ارسال
- می فرستد
- ارشد
- فرستاده
- سرویس
- خدمات
- تنظیم
- او
- نشان داده شده
- به طور قابل توجهی
- سادگی
- ساده کردن
- تنها
- کاهش سرعت
- کندی
- هموار کردن
- So
- نرم افزار
- مهندس نرمافزار
- راه حل
- حل کردن
- پایدار
- دولت
- وضعیت
- ثابت
- مراحل
- ذخیره شده
- فشار
- متعاقبا
- موفق
- حساسیت
- سیستم
- سیستم های
- گرفتن
- صورت گرفته
- طول می کشد
- وظایف
- که
- La
- شان
- آنها
- سپس
- آنجا.
- اینها
- این
- کسانی که
- سه
- از طریق
- زمان
- بار
- به
- تحمل
- ترافیک
- انتقال
- دور زدن
- دو
- به طور معمول
- زیر
- اساسی
- پیش بینی نشده
- به روز رسانی
- استفاده
- کاربر
- استفاده
- با استفاده از
- استفاده می کند
- مختلف
- به طور داوطلبانه
- رای گیری
- we
- وب
- خدمات وب
- وزن
- خوب
- به خوبی تعریف شده است
- بود
- چه زمانی
- که
- در حین
- اراده
- با
- در داخل
- کارگر
- با این نسخهها کار
- نوشتن
- زفیرنت
- صفر
- مناطق