سیستم توصیه مبتنی بر نمودار با Neptune ML: تصویری در مورد چالش‌های پیش‌بینی پیوند شبکه اجتماعی

بازنشر افلاطون

دنبال: 0

سیستم‌های توصیه یکی از پرکاربردترین فناوری‌های یادگیری ماشینی (ML) در برنامه‌های کاربردی دنیای واقعی هستند که از شبکه‌های اجتماعی گرفته تا پلتفرم‌های تجارت الکترونیک را شامل می‌شود. کاربران بسیاری از سیستم های آنلاین برای ایجاد دوستی های جدید، کشف موسیقی جدید با توجه به لیست های موسیقی پیشنهادی، یا حتی تصمیم گیری خرید تجارت الکترونیک بر اساس محصولات توصیه شده، به سیستم های توصیه تکیه می کنند. در شبکه‌های اجتماعی، یکی از موارد استفاده رایج، توصیه دوستان جدید به کاربر بر اساس سایر ارتباطات کاربران است. کاربران با دوستان مشترک احتمالا یکدیگر را می شناسند. بنابراین، آنها باید امتیاز بالاتری برای یک سیستم توصیه داشته باشند تا اگر هنوز متصل نشده اند، پیشنهاد دهند.

شبکه های اجتماعی به طور طبیعی می توانند در یک نمودار بیان شوند، که در آن گره ها نشان دهنده افراد هستند و ارتباطات بین افراد، مانند دوستی یا همکاران، با لبه ها نشان داده می شوند. زیر یکی از این شبکه های اجتماعی را نشان می دهد. بیایید تصور کنیم که یک شبکه اجتماعی با اعضای (گره ها) بیل، تری، هنری، گری و آلیستر داریم. روابط آنها با یک پیوند (لبه) نشان داده می شود و علایق هر فرد مانند ورزش، هنر، بازی و کمیک با ویژگی های گره نشان داده می شود.

هدف در اینجا این است که پیش بینی شود آیا یک حلقه گمشده بالقوه بین اعضا وجود دارد یا خیر. به عنوان مثال، آیا باید ارتباط بین هنری و تری را توصیه کنیم؟ با نگاهی به نمودار، می بینیم که آنها دو دوست مشترک به نام های گری و آلیستر دارند. بنابراین، احتمال زیادی وجود دارد که هنری و تری یا قبلاً یکدیگر را می شناختند یا ممکن است به زودی یکدیگر را بشناسند. هنری و بیل چطور؟ آنها هیچ دوست مشترکی ندارند، اما از طریق ارتباطات دوستان خود ارتباط ضعیفی دارند. علاوه بر این، هر دوی آنها علایق مشابهی در هنر، کمیک و بازی دارند. آیا باید این ارتباط را ترویج کنیم؟ همه این سوالات و شهودات منطق اصلی سیستم های توصیه شبکه های اجتماعی هستند.

یکی از راه های ممکن برای انجام این کار، توصیه روابط مبتنی بر اکتشاف نمودار است. در زبان های پرس و جو گراف، مانند Apache TinkerPop Gremlin، اجرای مجموعه قوانین مانند شمارش دوستان مشترک نسبتا آسان است و می توان از آن برای تعیین ارتباط بین هنری و تری استفاده کرد. با این حال، این مجموعه قوانین زمانی بسیار پیچیده خواهد بود که ما بخواهیم ویژگی های دیگری مانند ویژگی های گره، قدرت اتصال و غیره را در نظر بگیریم. بیایید مجموعه قوانینی را برای تعیین ارتباط بین هنری و بیل تصور کنیم. این مجموعه قوانین باید علایق مشترک و ارتباطات ضعیف آنها را از طریق مسیرهای مشخصی در نمودار در نظر بگیرد. برای افزایش استحکام، ممکن است لازم باشد فاکتور فاصله را نیز اضافه کنیم تا به اتصالات قوی کمک کرده و اتصالات ضعیف را جریمه کنیم. به همین ترتیب، ما می خواهیم عاملی به نفع منافع مشترک باشد. به زودی، مجموعه قوانینی که می توانند الگوهای پنهان پیچیده را آشکار کنند، غیرممکن خواهد شد.

فناوری ML به ما امکان می دهد الگوهای پنهان را با یادگیری الگوریتم ها کشف کنیم. یک مثال XGBoost است که به طور گسترده برای کارهای طبقه بندی یا رگرسیون استفاده می شود. با این حال، الگوریتم‌هایی مانند XGBoost از یک رویکرد ML معمولی مبتنی بر قالب داده‌های جدولی استفاده می‌کنند. این رویکردها برای ساختارهای داده گراف بهینه نشده اند و برای مقابله با این الگوهای داده به مهندسی ویژگی های پیچیده نیاز دارند.

در مثال شبکه اجتماعی قبلی، اطلاعات تعامل نمودار برای بهبود دقت توصیه بسیار مهم است. شبکه عصبی گراف (GNN) یک چارچوب یادگیری عمیق (DL) است که می‌تواند روی داده‌های نمودار برای انجام وظایف پیش‌بینی در سطح لبه، سطح گره یا سطح گراف اعمال شود. GNN ها می توانند از ویژگی های گره منفرد و همچنین اطلاعات ساختار گراف در هنگام یادگیری نمایش نمودار و الگوهای اساسی استفاده کنند. بنابراین، در سال‌های اخیر، روش‌های مبتنی بر GNN استانداردهای جدیدی را بر روی بسیاری از معیارهای سیستم توصیه‌گر تنظیم کرده‌اند. اطلاعات دقیق تر را در مقالات تحقیقاتی اخیر ببینید: بررسی جامع شبکه های عصبی نموداری و سیستم های توصیه گر مبتنی بر یادگیری نمودار: یک بررسی.

مثال زیر یکی از نمونه های معروف چنین موارد استفاده است. محققان و مهندسان در Pinterest آموزش دیده اند نمودار شبکه های عصبی کانولوشن برای سیستم های توصیه کننده مقیاس وب، PinSage نامیده می شود، با سه میلیارد گره نشان دهنده پین ها و تخته ها و 18 میلیارد لبه. PinSage جاسازی‌هایی با کیفیت بالا ایجاد می‌کند که نشان‌دهنده پین‌ها (نشانک‌های بصری به محتوای آنلاین) است. اینها را می توان برای طیف گسترده ای از وظایف توصیه های پایین دستی، مانند جستجوی نزدیکترین همسایه در فضای جاسازی آموخته شده برای کشف محتوا و توصیه ها، استفاده کرد.

در این پست، نحوه استفاده از GNN برای موارد استفاده توصیه‌ای را با درج این مشکل به عنوان یک مشکل پیش‌بینی پیوند به شما آموزش می‌دهیم. ما همچنین نشان خواهیم داد که چگونه Neptune ML می تواند پیاده سازی را تسهیل کند. ما نیز ارائه خواهیم کرد نمونه کد در GitHub برای آموزش اولین GNN خود با Neptune ML، و استنتاج توصیه‌هایی در نمودار آزمایشی از طریق وظایف پیش‌بینی پیوند.

پیش‌بینی پیوند با شبکه‌های عصبی گراف

با توجه به مثال قبلی شبکه اجتماعی، دوست داریم دوستان جدیدی را به هنری توصیه کنیم. تری و بیل هر دو نامزدهای خوبی خواهند بود. تری دوستان مشترک بیشتری (گری، آلیستر) با هنری دارد اما علایق مشترکی ندارد. در حالی که بیل علایق مشترکی (هنر، کمیک، بازی) با هنری دارد، اما دوستان مشترکی ندارد. کدام یک توصیه بهتر خواهد بود؟ هنگامی که به عنوان یک مشکل پیش‌بینی پیوند قاب می‌شود، وظیفه تعیین امتیاز به هر پیوند احتمالی بین دو گره است. هر چه امتیاز پیوند بالاتر باشد، احتمال همگرایی این توصیه بیشتر می شود. با یادگیری ساختارهای پیوند از قبل موجود در نمودار، یک مدل پیش‌بینی پیوند می‌تواند پیش‌بینی‌های پیوند جدیدی را تعمیم دهد که نمودار را «تکمیل» می‌کند.

پارامترهای تابع f که پیش بینی می کند امتیاز پیوند در مرحله آموزش آموخته می شود. از آنجایی که تابع f برای هر دو گره در نمودار پیش بینی می کند، بردارهای ویژگی مرتبط با گره ها برای فرآیند یادگیری ضروری هستند. برای پیش‌بینی امتیاز پیوند بین هنری و بیل، مجموعه‌ای از ویژگی‌های داده خام (هنر، کمیک، بازی) داریم که می‌تواند نمایانگر هنری و بیل باشد. ما این را همراه با اتصالات موجود در نمودار، با استفاده از یک شبکه GNN برای تشکیل نمایش‌های جدیدی که به عنوان جاسازی گره شناخته می‌شوند، تبدیل می‌کنیم. همچنین می‌توانیم ویژگی‌های خام اولیه را با بردارهایی از یک جدول جستجوی جاسازی که می‌توان در طول فرآیند آموزش یاد گرفت، تکمیل یا جایگزین کنیم. در حالت ایده‌آل، ویژگی‌های تعبیه‌شده برای هنری و بیل باید علایق آنها و همچنین اطلاعات توپولوژیکی آنها را از نمودار نشان دهد.

GNN ها چگونه کار می کنند

یک GNN ویژگی های اولیه گره را با استفاده از تکنیکی به نام به جاسازی گره تبدیل می کند ارسال پیام. فرآیند ارسال پیام در شکل زیر نشان داده شده است. در ابتدا، ویژگی ها یا ویژگی های گره به ویژگی های عددی تبدیل می شوند. در مورد ما، ما ویژگی های طبقه بندی شده (علائم هنری: هنرها، کمیک ها، بازی ها) را یکبار رمزگذاری می کنیم. سپس، اولین لایه GNN همه ویژگی‌های خام همسایگان (گری و آلیستر) (به رنگ سیاه) را جمع می‌کند تا مجموعه جدیدی از ویژگی‌ها (به رنگ زرد) را تشکیل دهد. یک رویکرد رایج، تبدیل خطی همه ویژگی‌های همسایه است، سپس آنها را از طریق یک مجموع نرمال‌شده جمع می‌کند، و نتایج را به یک تابع فعال‌سازی غیرخطی، مانند ReLU، منتقل می‌کند تا یک مجموعه برداری جدید تولید کند. شکل زیر نحوه عملکرد ارسال پیام برای گره را نشان می دهد هنری. H، الگوریتم ارسال پیام GNN، نمایش‌هایی را برای تمام گره‌های گراف محاسبه می‌کند. اینها بعداً به عنوان ویژگی های ورودی برای لایه دوم استفاده می شوند.

لایه دوم یک GNN همان فرآیند را تکرار می کند. ویژگی محاسبه شده قبلی (به رنگ زرد) را از لایه اول به عنوان ورودی می گیرد، همه ویژگی های جاسازی شده جدید همسایگان گری و آلیستر را جمع می کند و بردارهای ویژگی لایه دوم را برای هنری (به رنگ نارنجی) ایجاد می کند. همانطور که می بینید، با تکرار مکانیسم ارسال پیام، تجمیع ویژگی را به همسایگان 2-hop گسترش دادیم. در تصویر خود، ما خود را به همسایه های 2-hop محدود می کنیم، اما گسترش به همسایه های 3-hop را می توان با افزودن یک لایه GNN دیگر به همین روش انجام داد.

تعبیه‌های نهایی هنری و بیل (به رنگ نارنجی) برای محاسبه امتیاز استفاده می‌شود. در طول فرآیند آموزش، امتیاز پیوند زمانی که یال بین دو گره وجود دارد (نمونه مثبت)، و زمانی که لبه‌های بین دو گره وجود ندارد (نمونه منفی) به عنوان 1 تعریف می‌شود. سپس، خطا یا ضرر بین امتیاز واقعی و پیش بینی f(e₁,e₂) برای تنظیم وزن ها به لایه های قبلی مجدداً منتشر می شود. پس از پایان آموزش، می‌توانیم به بردارهای ویژگی تعبیه‌شده برای هر گره تکیه کنیم تا امتیاز پیوند آنها را با تابع خود محاسبه کنیم. f.

در این مثال، ما کار یادگیری را در a ساده کردیم نمودار همگن، که در آن همه گره ها و لبه ها از یک نوع هستند. برای مثال، تمام گره‌های نمودار از نوع «People» و تمام یال‌ها از نوع «دوستان با» هستند. با این حال، الگوریتم یادگیری از نمودارهای ناهمگن با انواع مختلف گره و لبه نیز پشتیبانی می کند. ما می‌توانیم مورد استفاده قبلی را گسترش دهیم تا محصولاتی را به کاربران مختلفی توصیه کنیم که تعاملات و علایق مشابهی دارند. جزئیات بیشتر را در این مقاله تحقیقاتی ببینید: مدل سازی داده های رابطه ای با گراف شبکه های کانولوشن.

در AWS re:Invent 2020 معرفی کردیم آمازون نپتون ام ال، که به مشتریان ما امکان می دهد مدل های ML را بر روی داده های نمودار آموزش دهند، بدون اینکه لزوماً تخصص عمیق ML داشته باشند. در این مثال با کمک Neptune ML به شما نشان خواهیم داد که چگونه سیستم توصیه گر خود را بر روی داده های گراف بسازید.

شبکه Convolution Graph خود را با Amazon Neptune ML آموزش دهید

Neptune ML از فناوری شبکه عصبی گراف برای ایجاد، آموزش و استقرار خودکار مدل‌های ML بر روی داده‌های گراف شما استفاده می‌کند. Neptune ML از وظایف رایج پیش‌بینی گراف، مانند طبقه‌بندی گره و رگرسیون، طبقه‌بندی لبه و رگرسیون، و پیش‌بینی پیوند پشتیبانی می‌کند.

این توسط:

نپتون آمازون: یک پایگاه داده گراف سریع، قابل اعتماد و کاملاً مدیریت شده که برای ذخیره میلیاردها رابطه و جستجوی نمودار با تأخیر میلی ثانیه بهینه شده است. آمازون نپتون از سه استاندارد باز برای ساخت برنامه های گراف پشتیبانی می کند: Apache TinkerPop Gremlin، RDF SPARQL و openCypher. بیشتر بدانید در مروری بر ویژگی های آمازون نپتون.
آمازون SageMaker: یک سرویس کاملاً مدیریت شده که به هر توسعه دهنده و دانشمند داده توانایی آماده سازی ساخت، آموزش و استقرار سریع مدل های ML را می دهد.
کتابخانه نمودار عمیق (DGL): یک منبع بازبسته پایتون با کارایی بالا و مقیاس پذیر برای DL روی نمودارها. برای آموزش شبکه‌های عصبی گراف، پیام‌های اولیه را سریع و کارآمد ارائه می‌کند. Neptune ML از DGL برای انتخاب و آموزش خودکار بهترین مدل ML برای حجم کاری شما استفاده می کند. این به شما امکان می‌دهد تا پیش‌بینی‌های مبتنی بر ML بر روی داده‌های نمودار را به‌جای هفته‌ها در ساعت‌ها انجام دهید.

ساده ترین راه برای شروع کار با Neptune ML استفاده از آن است الگوی شروع سریع AWS CloudFormation. این الگو همه اجزای لازم، از جمله یک خوشه DB Neptune را نصب می‌کند، و پیکربندی‌های شبکه، نقش‌های IAM و نمونه نوت‌بوک SageMaker مرتبط را با نمونه‌های نوت‌بوک از پیش پرشده برای Neptune ML تنظیم می‌کند.

شکل زیر مراحل مختلف Neptune ML را برای آموزش یک سیستم توصیه مبتنی بر GNN نشان می دهد. بیایید روی هر مرحله بزرگنمایی کنیم و آنچه را که شامل می شود بررسی کنیم:

پیکربندی صادرات داده

اولین گام در فرآیند Neptune ML ما صادر کردن داده های نمودار از خوشه Neptune است. ما باید پارامترها و پیکربندی مدل را برای وظیفه صادرات داده مشخص کنیم. ما از میز کار نپتون برای همه پیکربندی‌ها و ستایش‌ها استفاده می‌کنیم. میز کار به ما امکان می دهد با استفاده از نوت بوک های Jupyter که توسط Amazon SageMaker میزبانی می شوند، با خوشه DB Neptune کار کنیم. علاوه بر این، تعدادی دستور جادویی را در نوت بوک ارائه می دهد که باعث صرفه جویی زیادی در زمان و تلاش می شود. در اینجا مثال ما از پارامترهای صادرات است:

export_params={ "command": "export-pg", "params": { "endpoint": neptune_host, "profile": "neptune_ml", "cloneCluster": False }, "outputS3Path": f'{s3_bucket_uri}/neptune-export', "additionalParams": { "neptune_ml": { "version": "v2.0", "targets": [ { "edge": ["User", "FRIEND", "User"], "type" : "link_prediction" } ], "features": [ { "node": "User", "property": "interests", "type": "category", "separator": " ;" } ] } }, "jobSize": "small"}

In export_params، باید تنظیمات اولیه مانند خوشه نپتون و خروجی را پیکربندی کنیم سرویس ذخیره سازی ساده آمازون (S3) مسیر ذخیره سازی داده های صادر شده پیکربندی مشخص شده در additionalParams نوع وظیفه ML برای انجام است. در این مثال، پیش‌بینی پیوند به صورت اختیاری برای پیش‌بینی یک نوع لبه خاص (User—FRIEND—User) استفاده می‌شود. اگر هیچ نوع هدفی مشخص نشده باشد، Neptune ML فرض می‌کند که کار پیش‌بینی لینک است. پارامترها همچنین جزئیات مربوط به داده های ذخیره شده در نمودار ما و نحوه تفسیر مدل ML آن داده را مشخص می کنند (ما "User" را به عنوان گره و "interests" را به عنوان ویژگی گره داریم).

برای اجرای هر مرحله در فرآیند ساخت ML، به سادگی از دستورات میز کار Neptune استفاده کنید. این میز کار نپتون حاوی یک جادوی خط و یک جادوی سلولی است که می تواند زمان زیادی را برای مدیریت این مراحل صرفه جویی کند. برای اجرای صادرات داده، از دستور Neptune workbench استفاده کنید: %neptune_ml export start

پس از اتمام کار صادرات، نمودار نپتون را به فرمت CSV صادر کرده و در یک سطل S3 ذخیره می کنیم. دو نوع فایل وجود خواهد داشت: nodes.csv و edges.csv. فایلی به نام training-data-configuration.json همچنین تولید خواهد شد که دارای پیکربندی لازم برای Neptune ML برای انجام آموزش مدل است.

دیدن صادر کردن داده ها از نپتون برای Neptune ML برای اطلاعات بیشتر.

پردازش داده ها

Neptune ML استخراج ویژگی و رمزگذاری را به عنوان بخشی از مراحل پردازش داده انجام می دهد. انواع متداول پیش پردازش ویژگی ها عبارتند از: رمزگذاری ویژگی های طبقه بندی شده از طریق رمزگذاری یکباره، سطل بندی ویژگی های عددی، یا استفاده از word2vec برای رمزگذاری یک ویژگی رشته یا سایر مقادیر ویژگی متن آزاد.

در مثال ما، ما به سادگی از ویژگی "منافع" استفاده خواهیم کرد. Neptune ML مقادیر را به صورت چند طبقه ای رمزگذاری می کند. با این حال، اگر یک مقدار مقوله ای پیچیده باشد (بیش از سه کلمه در هر گره)، آنگاه Neptune ML نوع ویژگی را متن استنباط می کند و از رمزگذاری text_word2vec استفاده می کند.

برای اجرای پیش پردازش داده ها، از دستور جادویی نوت بوک نپتون زیر استفاده کنید: %neptune_ml dataprocessing start

در پایان این مرحله، یک نمودار DGL از مجموعه داده های صادر شده برای استفاده در مرحله آموزش مدل تولید می شود. Neptune ML به طور خودکار مدل را با کارهای تنظیم بهینه سازی Hyperparameter تعریف شده در آن تنظیم می کند training-data-configuration.json. ما می‌توانیم این فایل را برای تنظیم پارامترهای مدل، مانند اندازه دسته‌ای، num-hidden، num-epochs، dropout و غیره دانلود و تغییر دهیم. نمونه فایل configuration.json.

دیدن پردازش داده های نمودار صادر شده از نپتون برای آموزش برای اطلاعات بیشتر.

آموزش مدل

مرحله بعدی آموزش خودکار مدل GNN است. آموزش مدل در دو مرحله انجام می شود. مرحله اول از یک کار پردازش SageMaker برای ایجاد یک استراتژی آموزشی مدل استفاده می کند. این یک مجموعه پیکربندی است که مشخص می کند از چه نوع مدل و محدوده هایپرپارامتر مدل برای آموزش مدل استفاده می شود.

سپس، یک کار تنظیم فراپارامتر SageMaker راه اندازی خواهد شد. این SageMaker Hyperparameter Tuning Optimization تعداد از پیش تعیین شده ای از آزمایش های شغلی آموزشی مدل را بر روی داده های پردازش شده اجرا می کند، ترکیب های فراپارامترهای مختلف را با توجه به model-hpo-configuration.json فایل، و مصنوعات مدل تولید شده توسط آموزش را در محل خروجی آمازون S3 ذخیره می کند.

برای شروع مرحله آموزش می توانید از %neptune_ml training start فرمان

پس از تکمیل تمام کارهای آموزشی، کار تنظیم Hyperparameter، مصنوعات را از بهترین مدلی که برای استنتاج استفاده می شود، نجات می دهد.

در پایان آموزش، Neptune ML به SageMaker دستور می دهد تا مدل آموزش دیده، جاسازی های خام محاسبه شده برای گره ها و لبه ها و اطلاعات نگاشت بین جاسازی ها و شاخص های گره را ذخیره کند.

دیدن آموزش یک مدل با استفاده از Neptune ML برای اطلاعات بیشتر.

یک نقطه پایانی استنتاج در Amazon SageMaker ایجاد کنید

اکنون که نمایش نمودار آموخته شده است، می توانیم مدل آموخته شده را در پشت نقطه پایانی برای انجام درخواست های استنتاج مستقر کنیم. ورودی مدل، کاربری خواهد بود که ما باید توصیه های دوستان را برای آن ایجاد کنیم، همراه با نوع لبه، و خروجی لیستی از دوستان احتمالی توصیه شده برای آن کاربر خواهد بود.

برای استقرار مدل در نمونه پایانی SageMaker، از %neptune_ml endpoint create فرمان

مدل ML را با استفاده از Gremlin جستجو کنید

هنگامی که نقطه پایانی آماده شد، می‌توانیم از آن برای استنتاج نمودار استفاده کنیم. Neptune ML از پرس و جوهای استنتاج گراف در Gremlin یا SPARQL پشتیبانی می کند. در مثال ما، اکنون می‌توانیم توصیه دوستان را با Neptune ML در کاربر «هنری» بررسی کنیم. برای عبور از لبه تقریباً به همان نحو نیاز دارد و سایر کاربرانی را که از طریق اتصال FRIEND به Henry متصل شده اند لیست می کند.

%%gremlin
g.with("Neptune#ml.endpoint","${endpoint_name}"). V().hasLabel('User').has('name', 'Henry'). out('FRIEND').with("Neptune#ml.prediction").hasLabel('User').values('name') Console: 1 Bill

Neptune#ml.prediction ارتباط تعیین شده توسط پیش بینی های Neptune ML را با استفاده از مدلی که به تازگی در نمودار اجتماعی آموزش داده ایم، برمی گرداند. صورتحساب درست مانند انتظار ما برگردانده می شود.

در اینجا نمونه پرس و جوی پیش بینی دیگری وجود دارد که برای پیش بینی هشت کاربر برتر که به احتمال زیاد با هنری ارتباط برقرار می کنند استفاده می شود:

%%gremlin
g.with("Neptune#ml.endpoint","${endpoint_name}").
with("Neptune#ml.limit",8).V().hasLabel('User').has('name', 'Henry').
out('FRIEND').with("Neptune#ml.prediction").hasLabel('User').values('name') Console: 1 Bill, 2 Colin, 3 Sarah, 4 Gordon, 5 Mary, 6 Josie, 7 Arnold, 8 Terry

نتایج از اتصال قوی تر به ضعیف تر، جایی که پیوند رتبه بندی می شوند Henry — FRIEND — Colin and Henry — FRIEND — Terry نیز پیشنهاد می شود. این گزاره از طریق ML مبتنی بر گراف است که در آن الگوهای تعامل پیچیده بر روی نمودار قابل بررسی است.

دیدن پرس و جوهای استنتاج Gremlin در Neptune ML برای اطلاعات بیشتر.

تبدیل مدل یا بازآموزی زمانی که داده های نمودار تغییر می کند

سوال دیگری که ممکن است بپرسید این است: اگر شبکه اجتماعی من تغییر کند، یا اگر بخواهم برای کاربرانی که به تازگی اضافه شده اند، توصیه هایی ارائه کنم، چه؟ در این سناریوها، که در آن نمودارها به طور مداوم در حال تغییر هستند، ممکن است لازم باشد پیش‌بینی‌های ML را با جدیدترین داده‌های نمودار به‌روزرسانی کنید. مصنوعات مدل تولید شده پس از آموزش مستقیماً به نمودار آموزشی گره خورده است. این به این معنی است که نقطه پایان استنتاج باید زمانی که موجودیت‌ها در گراف آموزشی اصلی تغییر کنند، به‌روزرسانی شود.

با این حال، برای انجام پیش‌بینی در نمودار به‌روز شده، نیازی به آموزش مجدد کل مدل ندارید. با یک گردش کار استنتاج مدل افزایشی، شما فقط باید داده های Neptune DB را صادر کنید، یک پیش پردازش داده افزایشی انجام دهید، یک کار تبدیل دسته ای مدل را اجرا کنید، و سپس نقطه پایان استنتاج را به روز کنید. مرحله تبدیل مدل، مدل آموزش دیده را از گردش کار اصلی و نتایج مرحله پیش پردازش داده افزایشی را به عنوان ورودی می گیرد. سپس یک آرتیفکت مدل جدید را برای استنباط استفاده می کند. این مصنوع مدل جدید از داده های به روز گراف ایجاد شده است.

یک تمرکز ویژه در اینجا برای دستور گام مدل-تغییر است. این می تواند مصنوعات مدل را بر روی داده های نموداری که برای آموزش مدل استفاده نشده اند محاسبه کند. تعبیه‌های گره دوباره محاسبه می‌شوند و هر جاسازی گره موجود لغو می‌شود. Neptune ML رمزگذار GNN آموخته شده از مدل آموزش دیده قبلی را به گره های داده گراف جدید با ویژگی های جدیدشان اعمال می کند. بنابراین، داده‌های گراف جدید باید با استفاده از رمزگذاری‌های ویژگی مشابه پردازش شوند و باید به همان طرح نموداری مانند داده‌های اصلی گراف پایبند باشند. جزئیات بیشتر اجرای Neptune ML را در اینجا ببینید تولید مصنوعات مدل جدید.

علاوه بر این، اگر نمودار به طور چشمگیری تغییر کند، یا اگر مدل قبلی آموزش داده شده دیگر نمی تواند به دقت نشان دهنده تعاملات اساسی باشد، می توانید کل مدل را دوباره آموزش دهید. در این مورد، استفاده مجدد از پارامترهای مدل آموخته شده در یک نمودار جدید نمی تواند عملکرد مشابه مدل را تضمین کند. شما باید مدل خود را در نمودار جدید دوباره آموزش دهید. برای تسریع در جستجوی فراپارامترها، Neptune ML می‌تواند از اطلاعات مربوط به کار آموزش مدل قبلی با شروع گرم استفاده کند: از نتایج کارهای آموزشی قبلی برای انتخاب ترکیب‌های خوب ابرپارامترها برای جستجو در کار تنظیم جدید استفاده می‌شود.

دیدن گردش کار برای مدیریت داده های نمودار در حال تکامل برای جزئیات بیشتر.

نتیجه

در این پست، دیدید که چگونه ML و GNN های نپتون می توانند به شما در ارائه توصیه هایی در مورد داده های گراف با استفاده از یک کار پیش بینی پیوند با ترکیب اطلاعات از الگوهای تعامل پیچیده در نمودار کمک کنند.

پیش‌بینی لینک یکی از راه‌های پیاده‌سازی یک سیستم پیشنهادی بر روی نمودار است. شما می توانید توصیه کننده خود را به روش های بسیار دیگری بسازید. می‌توانید از جاسازی‌های آموخته‌شده در طول آموزش پیش‌بینی پیوند برای خوشه‌بندی گره‌ها در بخش‌های مختلف به شیوه‌ای بدون نظارت استفاده کنید، و موارد را به گره‌های متعلق به همان بخش توصیه کنید. علاوه بر این، می توانید جاسازی ها را به دست آورید و آنها را به عنوان یک ویژگی ورودی به یک سیستم توصیه مبتنی بر شباهت پایین دستی وارد کنید. اکنون این ویژگی ورودی اضافی اطلاعات معنایی مشتق شده از نمودار را نیز رمزگذاری می کند و می تواند پیشرفت های قابل توجهی در دقت کلی سیستم ایجاد کند. با مراجعه به سایت آمازون Neptune ML بیشتر بدانید سایت اینترنتی یا در نظرات بپرسید!

درباره نویسنده

یانوی کویدکترا، معمار راه حل های متخصص یادگیری ماشین در AWS است. او تحقیقات یادگیری ماشین را در IRISA (موسسه تحقیقات علوم کامپیوتر و سیستم‌های تصادفی) آغاز کرد و چندین سال تجربه در ساخت برنامه‌های صنعتی مبتنی بر هوش مصنوعی در بینایی کامپیوتر، پردازش زبان طبیعی و پیش‌بینی رفتار کاربر آنلاین دارد. در AWS، او تخصص دامنه را به اشتراک می‌گذارد و به مشتریان کمک می‌کند تا پتانسیل‌های کسب‌وکار را باز کنند و با یادگیری ماشینی در مقیاس، نتایج عملی را به دست آورند. در خارج از محل کار از مطالعه و مسافرت لذت می برد.

ویل بدر یک متخصص اصلی AI/ML SA است که به عنوان بخشی از تیم جهانی یادگیری ماشین آمازون کار می کند. ویل مشتاق استفاده از فناوری به روش‌های نوآورانه برای تأثیرگذاری مثبت بر جامعه است. او در اوقات فراغت خود دوست دارد غواصی کند، فوتبال بازی کند و جزایر اقیانوس آرام را کشف کند.

منبع: https://aws.amazon.com/blogs/machine-learning/graph-based-recommendation-system-with-neptune-ml-an-illustration-on-social-network-link-prediction-challenges/

تمبر زمان: ژانویه 12، 2022

تمبر زمان: ژوئن 10، 2021

بازنشر افلاطون

پیکربندی صادرات داده

پردازش داده ها

آموزش مدل

یک نقطه پایانی استنتاج در Amazon SageMaker ایجاد کنید

مدل ML را با استفاده از Gremlin جستجو کنید

تخمین ژست سه بعدی برای ردیابی ورزشکاران با استفاده از ویدیوهای دو بعدی و Amazon SageMaker Studio

ویترین انجمن AWS ML: نسخه مارس 2021

پردازش داده های تعاملی را با استفاده از Spark در نوت بوک های Amazon SageMaker Studio انجام دهید

با Amazon Lookout for Metrics، تشخیص ناهنجاری در جریان داده را ساده و خودکار کنید

پردازش داده های Amazon Redshift و برنامه ریزی یک خط لوله آموزشی با Amazon SageMaker Processing و Amazon SageMaker Pipelines

تسریع آموزش بینایی کامپیوتر با استفاده از پیش پردازش GPU با NVIDIA DALI در Amazon SageMaker

استنتاج ML را روی AWS Snowball Edge با Amazon SageMaker Edge Manager و AWS IoT Greengrass اجرا کنید.

ادغام Amazon Polly با سیستم‌های قدیمی تلفن گویا با تبدیل خروجی به فرمت WAV

تجزیه و تحلیل مدل های خط لوله منبع باز ML در زمان واقعی با استفاده از Amazon SageMaker Debugger

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب