سیستمهای توصیه یکی از پرکاربردترین فناوریهای یادگیری ماشینی (ML) در برنامههای کاربردی دنیای واقعی هستند که از شبکههای اجتماعی گرفته تا پلتفرمهای تجارت الکترونیک را شامل میشود. کاربران بسیاری از سیستم های آنلاین برای ایجاد دوستی های جدید، کشف موسیقی جدید با توجه به لیست های موسیقی پیشنهادی، یا حتی تصمیم گیری خرید تجارت الکترونیک بر اساس محصولات توصیه شده، به سیستم های توصیه تکیه می کنند. در شبکههای اجتماعی، یکی از موارد استفاده رایج، توصیه دوستان جدید به کاربر بر اساس سایر ارتباطات کاربران است. کاربران با دوستان مشترک احتمالا یکدیگر را می شناسند. بنابراین، آنها باید امتیاز بالاتری برای یک سیستم توصیه داشته باشند تا اگر هنوز متصل نشده اند، پیشنهاد دهند.
شبکه های اجتماعی به طور طبیعی می توانند در یک نمودار بیان شوند، که در آن گره ها نشان دهنده افراد هستند و ارتباطات بین افراد، مانند دوستی یا همکاران، با لبه ها نشان داده می شوند. زیر یکی از این شبکه های اجتماعی را نشان می دهد. بیایید تصور کنیم که یک شبکه اجتماعی با اعضای (گره ها) بیل، تری، هنری، گری و آلیستر داریم. روابط آنها با یک پیوند (لبه) نشان داده می شود و علایق هر فرد مانند ورزش، هنر، بازی و کمیک با ویژگی های گره نشان داده می شود.
هدف در اینجا این است که پیش بینی شود آیا یک حلقه گمشده بالقوه بین اعضا وجود دارد یا خیر. به عنوان مثال، آیا باید ارتباط بین هنری و تری را توصیه کنیم؟ با نگاهی به نمودار، می بینیم که آنها دو دوست مشترک به نام های گری و آلیستر دارند. بنابراین، احتمال زیادی وجود دارد که هنری و تری یا قبلاً یکدیگر را می شناختند یا ممکن است به زودی یکدیگر را بشناسند. هنری و بیل چطور؟ آنها هیچ دوست مشترکی ندارند، اما از طریق ارتباطات دوستان خود ارتباط ضعیفی دارند. علاوه بر این، هر دوی آنها علایق مشابهی در هنر، کمیک و بازی دارند. آیا باید این ارتباط را ترویج کنیم؟ همه این سوالات و شهودات منطق اصلی سیستم های توصیه شبکه های اجتماعی هستند.
یکی از راه های ممکن برای انجام این کار، توصیه روابط مبتنی بر اکتشاف نمودار است. در زبان های پرس و جو گراف، مانند Apache TinkerPop Gremlin، اجرای مجموعه قوانین مانند شمارش دوستان مشترک نسبتا آسان است و می توان از آن برای تعیین ارتباط بین هنری و تری استفاده کرد. با این حال، این مجموعه قوانین زمانی بسیار پیچیده خواهد بود که ما بخواهیم ویژگی های دیگری مانند ویژگی های گره، قدرت اتصال و غیره را در نظر بگیریم. بیایید مجموعه قوانینی را برای تعیین ارتباط بین هنری و بیل تصور کنیم. این مجموعه قوانین باید علایق مشترک و ارتباطات ضعیف آنها را از طریق مسیرهای مشخصی در نمودار در نظر بگیرد. برای افزایش استحکام، ممکن است لازم باشد فاکتور فاصله را نیز اضافه کنیم تا به اتصالات قوی کمک کرده و اتصالات ضعیف را جریمه کنیم. به همین ترتیب، ما می خواهیم عاملی به نفع منافع مشترک باشد. به زودی، مجموعه قوانینی که می توانند الگوهای پنهان پیچیده را آشکار کنند، غیرممکن خواهد شد.
فناوری ML به ما امکان می دهد الگوهای پنهان را با یادگیری الگوریتم ها کشف کنیم. یک مثال XGBoost است که به طور گسترده برای کارهای طبقه بندی یا رگرسیون استفاده می شود. با این حال، الگوریتمهایی مانند XGBoost از یک رویکرد ML معمولی مبتنی بر قالب دادههای جدولی استفاده میکنند. این رویکردها برای ساختارهای داده گراف بهینه نشده اند و برای مقابله با این الگوهای داده به مهندسی ویژگی های پیچیده نیاز دارند.
در مثال شبکه اجتماعی قبلی، اطلاعات تعامل نمودار برای بهبود دقت توصیه بسیار مهم است. شبکه عصبی گراف (GNN) یک چارچوب یادگیری عمیق (DL) است که میتواند روی دادههای نمودار برای انجام وظایف پیشبینی در سطح لبه، سطح گره یا سطح گراف اعمال شود. GNN ها می توانند از ویژگی های گره منفرد و همچنین اطلاعات ساختار گراف در هنگام یادگیری نمایش نمودار و الگوهای اساسی استفاده کنند. بنابراین، در سالهای اخیر، روشهای مبتنی بر GNN استانداردهای جدیدی را بر روی بسیاری از معیارهای سیستم توصیهگر تنظیم کردهاند. اطلاعات دقیق تر را در مقالات تحقیقاتی اخیر ببینید: بررسی جامع شبکه های عصبی نموداری و سیستم های توصیه گر مبتنی بر یادگیری نمودار: یک بررسی.
مثال زیر یکی از نمونه های معروف چنین موارد استفاده است. محققان و مهندسان در Pinterest آموزش دیده اند نمودار شبکه های عصبی کانولوشن برای سیستم های توصیه کننده مقیاس وب، PinSage نامیده می شود، با سه میلیارد گره نشان دهنده پین ها و تخته ها و 18 میلیارد لبه. PinSage جاسازیهایی با کیفیت بالا ایجاد میکند که نشاندهنده پینها (نشانکهای بصری به محتوای آنلاین) است. اینها را می توان برای طیف گسترده ای از وظایف توصیه های پایین دستی، مانند جستجوی نزدیکترین همسایه در فضای جاسازی آموخته شده برای کشف محتوا و توصیه ها، استفاده کرد.
در این پست، نحوه استفاده از GNN برای موارد استفاده توصیهای را با درج این مشکل به عنوان یک مشکل پیشبینی پیوند به شما آموزش میدهیم. ما همچنین نشان خواهیم داد که چگونه Neptune ML می تواند پیاده سازی را تسهیل کند. ما نیز ارائه خواهیم کرد نمونه کد در GitHub برای آموزش اولین GNN خود با Neptune ML، و استنتاج توصیههایی در نمودار آزمایشی از طریق وظایف پیشبینی پیوند.
پیشبینی پیوند با شبکههای عصبی گراف
با توجه به مثال قبلی شبکه اجتماعی، دوست داریم دوستان جدیدی را به هنری توصیه کنیم. تری و بیل هر دو نامزدهای خوبی خواهند بود. تری دوستان مشترک بیشتری (گری، آلیستر) با هنری دارد اما علایق مشترکی ندارد. در حالی که بیل علایق مشترکی (هنر، کمیک، بازی) با هنری دارد، اما دوستان مشترکی ندارد. کدام یک توصیه بهتر خواهد بود؟ هنگامی که به عنوان یک مشکل پیشبینی پیوند قاب میشود، وظیفه تعیین امتیاز به هر پیوند احتمالی بین دو گره است. هر چه امتیاز پیوند بالاتر باشد، احتمال همگرایی این توصیه بیشتر می شود. با یادگیری ساختارهای پیوند از قبل موجود در نمودار، یک مدل پیشبینی پیوند میتواند پیشبینیهای پیوند جدیدی را تعمیم دهد که نمودار را «تکمیل» میکند.
پارامترهای تابع f
که پیش بینی می کند امتیاز پیوند در مرحله آموزش آموخته می شود. از آنجایی که تابع f
برای هر دو گره در نمودار پیش بینی می کند، بردارهای ویژگی مرتبط با گره ها برای فرآیند یادگیری ضروری هستند. برای پیشبینی امتیاز پیوند بین هنری و بیل، مجموعهای از ویژگیهای داده خام (هنر، کمیک، بازی) داریم که میتواند نمایانگر هنری و بیل باشد. ما این را همراه با اتصالات موجود در نمودار، با استفاده از یک شبکه GNN برای تشکیل نمایشهای جدیدی که به عنوان جاسازی گره شناخته میشوند، تبدیل میکنیم. همچنین میتوانیم ویژگیهای خام اولیه را با بردارهایی از یک جدول جستجوی جاسازی که میتوان در طول فرآیند آموزش یاد گرفت، تکمیل یا جایگزین کنیم. در حالت ایدهآل، ویژگیهای تعبیهشده برای هنری و بیل باید علایق آنها و همچنین اطلاعات توپولوژیکی آنها را از نمودار نشان دهد.
GNN ها چگونه کار می کنند
یک GNN ویژگی های اولیه گره را با استفاده از تکنیکی به نام به جاسازی گره تبدیل می کند ارسال پیام. فرآیند ارسال پیام در شکل زیر نشان داده شده است. در ابتدا، ویژگی ها یا ویژگی های گره به ویژگی های عددی تبدیل می شوند. در مورد ما، ما ویژگی های طبقه بندی شده (علائم هنری: هنرها، کمیک ها، بازی ها) را یکبار رمزگذاری می کنیم. سپس، اولین لایه GNN همه ویژگیهای خام همسایگان (گری و آلیستر) (به رنگ سیاه) را جمع میکند تا مجموعه جدیدی از ویژگیها (به رنگ زرد) را تشکیل دهد. یک رویکرد رایج، تبدیل خطی همه ویژگیهای همسایه است، سپس آنها را از طریق یک مجموع نرمالشده جمع میکند، و نتایج را به یک تابع فعالسازی غیرخطی، مانند ReLU، منتقل میکند تا یک مجموعه برداری جدید تولید کند. شکل زیر نحوه عملکرد ارسال پیام برای گره را نشان می دهد هنری. H، الگوریتم ارسال پیام GNN، نمایشهایی را برای تمام گرههای گراف محاسبه میکند. اینها بعداً به عنوان ویژگی های ورودی برای لایه دوم استفاده می شوند.
لایه دوم یک GNN همان فرآیند را تکرار می کند. ویژگی محاسبه شده قبلی (به رنگ زرد) را از لایه اول به عنوان ورودی می گیرد، همه ویژگی های جاسازی شده جدید همسایگان گری و آلیستر را جمع می کند و بردارهای ویژگی لایه دوم را برای هنری (به رنگ نارنجی) ایجاد می کند. همانطور که می بینید، با تکرار مکانیسم ارسال پیام، تجمیع ویژگی را به همسایگان 2-hop گسترش دادیم. در تصویر خود، ما خود را به همسایه های 2-hop محدود می کنیم، اما گسترش به همسایه های 3-hop را می توان با افزودن یک لایه GNN دیگر به همین روش انجام داد.
تعبیههای نهایی هنری و بیل (به رنگ نارنجی) برای محاسبه امتیاز استفاده میشود. در طول فرآیند آموزش، امتیاز پیوند زمانی که یال بین دو گره وجود دارد (نمونه مثبت)، و زمانی که لبههای بین دو گره وجود ندارد (نمونه منفی) به عنوان 1 تعریف میشود. سپس، خطا یا ضرر بین امتیاز واقعی و پیش بینی f(e1,e2)
برای تنظیم وزن ها به لایه های قبلی مجدداً منتشر می شود. پس از پایان آموزش، میتوانیم به بردارهای ویژگی تعبیهشده برای هر گره تکیه کنیم تا امتیاز پیوند آنها را با تابع خود محاسبه کنیم. f
.
در این مثال، ما کار یادگیری را در a ساده کردیم نمودار همگن، که در آن همه گره ها و لبه ها از یک نوع هستند. برای مثال، تمام گرههای نمودار از نوع «People» و تمام یالها از نوع «دوستان با» هستند. با این حال، الگوریتم یادگیری از نمودارهای ناهمگن با انواع مختلف گره و لبه نیز پشتیبانی می کند. ما میتوانیم مورد استفاده قبلی را گسترش دهیم تا محصولاتی را به کاربران مختلفی توصیه کنیم که تعاملات و علایق مشابهی دارند. جزئیات بیشتر را در این مقاله تحقیقاتی ببینید: مدل سازی داده های رابطه ای با گراف شبکه های کانولوشن.
در AWS re:Invent 2020 معرفی کردیم آمازون نپتون ام ال، که به مشتریان ما امکان می دهد مدل های ML را بر روی داده های نمودار آموزش دهند، بدون اینکه لزوماً تخصص عمیق ML داشته باشند. در این مثال با کمک Neptune ML به شما نشان خواهیم داد که چگونه سیستم توصیه گر خود را بر روی داده های گراف بسازید.
شبکه Convolution Graph خود را با Amazon Neptune ML آموزش دهید
Neptune ML از فناوری شبکه عصبی گراف برای ایجاد، آموزش و استقرار خودکار مدلهای ML بر روی دادههای گراف شما استفاده میکند. Neptune ML از وظایف رایج پیشبینی گراف، مانند طبقهبندی گره و رگرسیون، طبقهبندی لبه و رگرسیون، و پیشبینی پیوند پشتیبانی میکند.
این توسط:
- نپتون آمازون: یک پایگاه داده گراف سریع، قابل اعتماد و کاملاً مدیریت شده که برای ذخیره میلیاردها رابطه و جستجوی نمودار با تأخیر میلی ثانیه بهینه شده است. آمازون نپتون از سه استاندارد باز برای ساخت برنامه های گراف پشتیبانی می کند: Apache TinkerPop Gremlin، RDF SPARQL و openCypher. بیشتر بدانید در مروری بر ویژگی های آمازون نپتون.
- آمازون SageMaker: یک سرویس کاملاً مدیریت شده که به هر توسعه دهنده و دانشمند داده توانایی آماده سازی ساخت، آموزش و استقرار سریع مدل های ML را می دهد.
- کتابخانه نمودار عمیق (DGL): یک منبع بازبسته پایتون با کارایی بالا و مقیاس پذیر برای DL روی نمودارها. برای آموزش شبکههای عصبی گراف، پیامهای اولیه را سریع و کارآمد ارائه میکند. Neptune ML از DGL برای انتخاب و آموزش خودکار بهترین مدل ML برای حجم کاری شما استفاده می کند. این به شما امکان میدهد تا پیشبینیهای مبتنی بر ML بر روی دادههای نمودار را بهجای هفتهها در ساعتها انجام دهید.
ساده ترین راه برای شروع کار با Neptune ML استفاده از آن است الگوی شروع سریع AWS CloudFormation. این الگو همه اجزای لازم، از جمله یک خوشه DB Neptune را نصب میکند، و پیکربندیهای شبکه، نقشهای IAM و نمونه نوتبوک SageMaker مرتبط را با نمونههای نوتبوک از پیش پرشده برای Neptune ML تنظیم میکند.
شکل زیر مراحل مختلف Neptune ML را برای آموزش یک سیستم توصیه مبتنی بر GNN نشان می دهد. بیایید روی هر مرحله بزرگنمایی کنیم و آنچه را که شامل می شود بررسی کنیم:
-
پیکربندی صادرات داده
اولین گام در فرآیند Neptune ML ما صادر کردن داده های نمودار از خوشه Neptune است. ما باید پارامترها و پیکربندی مدل را برای وظیفه صادرات داده مشخص کنیم. ما از میز کار نپتون برای همه پیکربندیها و ستایشها استفاده میکنیم. میز کار به ما امکان می دهد با استفاده از نوت بوک های Jupyter که توسط Amazon SageMaker میزبانی می شوند، با خوشه DB Neptune کار کنیم. علاوه بر این، تعدادی دستور جادویی را در نوت بوک ارائه می دهد که باعث صرفه جویی زیادی در زمان و تلاش می شود. در اینجا مثال ما از پارامترهای صادرات است:
In export_params
، باید تنظیمات اولیه مانند خوشه نپتون و خروجی را پیکربندی کنیم سرویس ذخیره سازی ساده آمازون (S3) مسیر ذخیره سازی داده های صادر شده پیکربندی مشخص شده در additionalParams
نوع وظیفه ML برای انجام است. در این مثال، پیشبینی پیوند به صورت اختیاری برای پیشبینی یک نوع لبه خاص (User—FRIEND—User) استفاده میشود. اگر هیچ نوع هدفی مشخص نشده باشد، Neptune ML فرض میکند که کار پیشبینی لینک است. پارامترها همچنین جزئیات مربوط به داده های ذخیره شده در نمودار ما و نحوه تفسیر مدل ML آن داده را مشخص می کنند (ما "User" را به عنوان گره و "interests" را به عنوان ویژگی گره داریم).
برای اجرای هر مرحله در فرآیند ساخت ML، به سادگی از دستورات میز کار Neptune استفاده کنید. این میز کار نپتون حاوی یک جادوی خط و یک جادوی سلولی است که می تواند زمان زیادی را برای مدیریت این مراحل صرفه جویی کند. برای اجرای صادرات داده، از دستور Neptune workbench استفاده کنید: %neptune_ml export start
پس از اتمام کار صادرات، نمودار نپتون را به فرمت CSV صادر کرده و در یک سطل S3 ذخیره می کنیم. دو نوع فایل وجود خواهد داشت: nodes.csv
و edges.csv
. فایلی به نام training-data-configuration.json
همچنین تولید خواهد شد که دارای پیکربندی لازم برای Neptune ML برای انجام آموزش مدل است.
دیدن صادر کردن داده ها از نپتون برای Neptune ML برای اطلاعات بیشتر.
-
پردازش داده ها
Neptune ML استخراج ویژگی و رمزگذاری را به عنوان بخشی از مراحل پردازش داده انجام می دهد. انواع متداول پیش پردازش ویژگی ها عبارتند از: رمزگذاری ویژگی های طبقه بندی شده از طریق رمزگذاری یکباره، سطل بندی ویژگی های عددی، یا استفاده از word2vec برای رمزگذاری یک ویژگی رشته یا سایر مقادیر ویژگی متن آزاد.
در مثال ما، ما به سادگی از ویژگی "منافع" استفاده خواهیم کرد. Neptune ML مقادیر را به صورت چند طبقه ای رمزگذاری می کند. با این حال، اگر یک مقدار مقوله ای پیچیده باشد (بیش از سه کلمه در هر گره)، آنگاه Neptune ML نوع ویژگی را متن استنباط می کند و از رمزگذاری text_word2vec استفاده می کند.
برای اجرای پیش پردازش داده ها، از دستور جادویی نوت بوک نپتون زیر استفاده کنید: %neptune_ml dataprocessing start
در پایان این مرحله، یک نمودار DGL از مجموعه داده های صادر شده برای استفاده در مرحله آموزش مدل تولید می شود. Neptune ML به طور خودکار مدل را با کارهای تنظیم بهینه سازی Hyperparameter تعریف شده در آن تنظیم می کند training-data-configuration.json
. ما میتوانیم این فایل را برای تنظیم پارامترهای مدل، مانند اندازه دستهای، num-hidden، num-epochs، dropout و غیره دانلود و تغییر دهیم. نمونه فایل configuration.json.
دیدن پردازش داده های نمودار صادر شده از نپتون برای آموزش برای اطلاعات بیشتر.
-
آموزش مدل
مرحله بعدی آموزش خودکار مدل GNN است. آموزش مدل در دو مرحله انجام می شود. مرحله اول از یک کار پردازش SageMaker برای ایجاد یک استراتژی آموزشی مدل استفاده می کند. این یک مجموعه پیکربندی است که مشخص می کند از چه نوع مدل و محدوده هایپرپارامتر مدل برای آموزش مدل استفاده می شود.
سپس، یک کار تنظیم فراپارامتر SageMaker راه اندازی خواهد شد. این SageMaker Hyperparameter Tuning Optimization تعداد از پیش تعیین شده ای از آزمایش های شغلی آموزشی مدل را بر روی داده های پردازش شده اجرا می کند، ترکیب های فراپارامترهای مختلف را با توجه به model-hpo-configuration.json
فایل، و مصنوعات مدل تولید شده توسط آموزش را در محل خروجی آمازون S3 ذخیره می کند.
برای شروع مرحله آموزش می توانید از %neptune_ml training start
فرمان
پس از تکمیل تمام کارهای آموزشی، کار تنظیم Hyperparameter، مصنوعات را از بهترین مدلی که برای استنتاج استفاده می شود، نجات می دهد.
در پایان آموزش، Neptune ML به SageMaker دستور می دهد تا مدل آموزش دیده، جاسازی های خام محاسبه شده برای گره ها و لبه ها و اطلاعات نگاشت بین جاسازی ها و شاخص های گره را ذخیره کند.
دیدن آموزش یک مدل با استفاده از Neptune ML برای اطلاعات بیشتر.
-
یک نقطه پایانی استنتاج در Amazon SageMaker ایجاد کنید
اکنون که نمایش نمودار آموخته شده است، می توانیم مدل آموخته شده را در پشت نقطه پایانی برای انجام درخواست های استنتاج مستقر کنیم. ورودی مدل، کاربری خواهد بود که ما باید توصیه های دوستان را برای آن ایجاد کنیم، همراه با نوع لبه، و خروجی لیستی از دوستان احتمالی توصیه شده برای آن کاربر خواهد بود.
برای استقرار مدل در نمونه پایانی SageMaker، از %neptune_ml endpoint create
فرمان
-
مدل ML را با استفاده از Gremlin جستجو کنید
هنگامی که نقطه پایانی آماده شد، میتوانیم از آن برای استنتاج نمودار استفاده کنیم. Neptune ML از پرس و جوهای استنتاج گراف در Gremlin یا SPARQL پشتیبانی می کند. در مثال ما، اکنون میتوانیم توصیه دوستان را با Neptune ML در کاربر «هنری» بررسی کنیم. برای عبور از لبه تقریباً به همان نحو نیاز دارد و سایر کاربرانی را که از طریق اتصال FRIEND به Henry متصل شده اند لیست می کند.
Neptune#ml.prediction
ارتباط تعیین شده توسط پیش بینی های Neptune ML را با استفاده از مدلی که به تازگی در نمودار اجتماعی آموزش داده ایم، برمی گرداند. صورتحساب درست مانند انتظار ما برگردانده می شود.
در اینجا نمونه پرس و جوی پیش بینی دیگری وجود دارد که برای پیش بینی هشت کاربر برتر که به احتمال زیاد با هنری ارتباط برقرار می کنند استفاده می شود:
نتایج از اتصال قوی تر به ضعیف تر، جایی که پیوند رتبه بندی می شوند Henry — FRIEND — Colin and Henry — FRIEND — Terry
نیز پیشنهاد می شود. این گزاره از طریق ML مبتنی بر گراف است که در آن الگوهای تعامل پیچیده بر روی نمودار قابل بررسی است.
دیدن پرس و جوهای استنتاج Gremlin در Neptune ML برای اطلاعات بیشتر.
تبدیل مدل یا بازآموزی زمانی که داده های نمودار تغییر می کند
سوال دیگری که ممکن است بپرسید این است: اگر شبکه اجتماعی من تغییر کند، یا اگر بخواهم برای کاربرانی که به تازگی اضافه شده اند، توصیه هایی ارائه کنم، چه؟ در این سناریوها، که در آن نمودارها به طور مداوم در حال تغییر هستند، ممکن است لازم باشد پیشبینیهای ML را با جدیدترین دادههای نمودار بهروزرسانی کنید. مصنوعات مدل تولید شده پس از آموزش مستقیماً به نمودار آموزشی گره خورده است. این به این معنی است که نقطه پایان استنتاج باید زمانی که موجودیتها در گراف آموزشی اصلی تغییر کنند، بهروزرسانی شود.
با این حال، برای انجام پیشبینی در نمودار بهروز شده، نیازی به آموزش مجدد کل مدل ندارید. با یک گردش کار استنتاج مدل افزایشی، شما فقط باید داده های Neptune DB را صادر کنید، یک پیش پردازش داده افزایشی انجام دهید، یک کار تبدیل دسته ای مدل را اجرا کنید، و سپس نقطه پایان استنتاج را به روز کنید. مرحله تبدیل مدل، مدل آموزش دیده را از گردش کار اصلی و نتایج مرحله پیش پردازش داده افزایشی را به عنوان ورودی می گیرد. سپس یک آرتیفکت مدل جدید را برای استنباط استفاده می کند. این مصنوع مدل جدید از داده های به روز گراف ایجاد شده است.
یک تمرکز ویژه در اینجا برای دستور گام مدل-تغییر است. این می تواند مصنوعات مدل را بر روی داده های نموداری که برای آموزش مدل استفاده نشده اند محاسبه کند. تعبیههای گره دوباره محاسبه میشوند و هر جاسازی گره موجود لغو میشود. Neptune ML رمزگذار GNN آموخته شده از مدل آموزش دیده قبلی را به گره های داده گراف جدید با ویژگی های جدیدشان اعمال می کند. بنابراین، دادههای گراف جدید باید با استفاده از رمزگذاریهای ویژگی مشابه پردازش شوند و باید به همان طرح نموداری مانند دادههای اصلی گراف پایبند باشند. جزئیات بیشتر اجرای Neptune ML را در اینجا ببینید تولید مصنوعات مدل جدید.
علاوه بر این، اگر نمودار به طور چشمگیری تغییر کند، یا اگر مدل قبلی آموزش داده شده دیگر نمی تواند به دقت نشان دهنده تعاملات اساسی باشد، می توانید کل مدل را دوباره آموزش دهید. در این مورد، استفاده مجدد از پارامترهای مدل آموخته شده در یک نمودار جدید نمی تواند عملکرد مشابه مدل را تضمین کند. شما باید مدل خود را در نمودار جدید دوباره آموزش دهید. برای تسریع در جستجوی فراپارامترها، Neptune ML میتواند از اطلاعات مربوط به کار آموزش مدل قبلی با شروع گرم استفاده کند: از نتایج کارهای آموزشی قبلی برای انتخاب ترکیبهای خوب ابرپارامترها برای جستجو در کار تنظیم جدید استفاده میشود.
دیدن گردش کار برای مدیریت داده های نمودار در حال تکامل برای جزئیات بیشتر.
نتیجه
در این پست، دیدید که چگونه ML و GNN های نپتون می توانند به شما در ارائه توصیه هایی در مورد داده های گراف با استفاده از یک کار پیش بینی پیوند با ترکیب اطلاعات از الگوهای تعامل پیچیده در نمودار کمک کنند.
پیشبینی لینک یکی از راههای پیادهسازی یک سیستم پیشنهادی بر روی نمودار است. شما می توانید توصیه کننده خود را به روش های بسیار دیگری بسازید. میتوانید از جاسازیهای آموختهشده در طول آموزش پیشبینی پیوند برای خوشهبندی گرهها در بخشهای مختلف به شیوهای بدون نظارت استفاده کنید، و موارد را به گرههای متعلق به همان بخش توصیه کنید. علاوه بر این، می توانید جاسازی ها را به دست آورید و آنها را به عنوان یک ویژگی ورودی به یک سیستم توصیه مبتنی بر شباهت پایین دستی وارد کنید. اکنون این ویژگی ورودی اضافی اطلاعات معنایی مشتق شده از نمودار را نیز رمزگذاری می کند و می تواند پیشرفت های قابل توجهی در دقت کلی سیستم ایجاد کند. با مراجعه به سایت آمازون Neptune ML بیشتر بدانید سایت اینترنتی یا در نظرات بپرسید!
درباره نویسنده
یانوی کویدکترا، معمار راه حل های متخصص یادگیری ماشین در AWS است. او تحقیقات یادگیری ماشین را در IRISA (موسسه تحقیقات علوم کامپیوتر و سیستمهای تصادفی) آغاز کرد و چندین سال تجربه در ساخت برنامههای صنعتی مبتنی بر هوش مصنوعی در بینایی کامپیوتر، پردازش زبان طبیعی و پیشبینی رفتار کاربر آنلاین دارد. در AWS، او تخصص دامنه را به اشتراک میگذارد و به مشتریان کمک میکند تا پتانسیلهای کسبوکار را باز کنند و با یادگیری ماشینی در مقیاس، نتایج عملی را به دست آورند. در خارج از محل کار از مطالعه و مسافرت لذت می برد.
ویل بدر یک متخصص اصلی AI/ML SA است که به عنوان بخشی از تیم جهانی یادگیری ماشین آمازون کار می کند. ویل مشتاق استفاده از فناوری به روشهای نوآورانه برای تأثیرگذاری مثبت بر جامعه است. او در اوقات فراغت خود دوست دارد غواصی کند، فوتبال بازی کند و جزایر اقیانوس آرام را کشف کند.
- '
- "
- 100
- 2020
- 7
- درباره ما
- مطابق
- حساب
- اضافه
- اضافی
- الگوریتم
- الگوریتم
- معرفی
- قبلا
- آمازون
- آموزش ماشین آمازون
- آمازون SageMaker
- آپاچی
- برنامه های کاربردی
- مصنوعی
- هوش مصنوعی
- هنر
- خودکار
- AWS
- AWS دوباره: اختراع
- شروع
- بهترین
- لایحه
- بیلیون
- سیاه پوست
- ساختن
- بنا
- کسب و کار
- موارد
- چالش ها
- طبقه بندی
- رمز
- مشترک
- انجمن
- پیچیده
- محاسبه
- علم کامپیوتر
- چشم انداز کامپیوتر
- محاسبه
- پیکر بندی
- ارتباط
- اتصالات
- کنسول
- محتوا
- همگرا
- میتوانست
- مشتریان
- داده ها
- دانشمند داده
- ذخیره سازی داده ها
- پایگاه داده
- مقدار
- یادگیری عمیق
- توسعه دهنده
- مختلف
- کشف
- فاصله
- تجارت الکترونیک
- لبه
- نقطه پایانی
- مهندسی
- مورد تأیید
- و غیره
- مثال
- تجربه
- اکتشاف
- صادرات
- استخراج
- FAST
- ویژگی
- امکانات
- شکل
- نام خانوادگی
- تمرکز
- فرم
- قالب
- چارچوب
- رایگان
- دوستی
- تابع
- بازیها
- تولید می کنند
- جهانی
- خوب
- نمودارهای عصبی نمودار
- بزرگ
- اداره
- کمک
- کمک می کند
- اینجا کلیک نمایید
- چگونه
- چگونه
- HTTPS
- IAM
- تأثیر
- اجرای
- بهبود
- از جمله
- افزایش
- فرد
- صنعتی
- اطلاعات
- ابتکاری
- اطلاعات
- اثر متقابل
- منافع
- IT
- کار
- شغل ها
- زبان
- زبان ها
- یاد گرفتن
- آموخته
- یادگیری
- قدرت نفوذ
- کتابخانه
- لاین
- ارتباط دادن
- فهرست
- لیست
- محل
- به دنبال
- مراجعه
- فراگیری ماشین
- اعضا
- میلی ثانیه
- ML
- مدل
- موسیقی
- زبان طبیعی
- پردازش زبان طبیعی
- ضروری
- همسایه ها
- شبکه
- شبکه
- عصبی
- شبکه های عصبی
- شبکه های عصبی
- ویژگی های جدید
- گره
- نوت بوک
- آنلاین
- باز کن
- دیگر
- ارام
- مقاله
- مردم
- کارایی
- فاز
- سیستم عامل
- بازی
- دقت
- پیش گویی
- پیش بینی
- در حال حاضر
- اصلی
- مشکل
- روند
- محصولات
- مشخصات
- ترویج
- ویژگی
- پیشنهادات
- ارائه
- فراهم می کند
- خرید
- پــایتــون
- سوال
- محدوده
- خام
- داده های خام
- RE
- مطالعه
- رگرسیون
- روابط
- جایگزین کردن
- تحقیق
- نتایج
- بازآموزی
- بازده
- دویدن
- حکیم ساز
- مقیاس
- علم
- جستجو
- تنظیم
- اشتراک گذاری
- سهام
- مشابه
- ساده
- کوچک
- فوتبال
- آگاهی
- نمودار اجتماعی
- شبکه های اجتماعی
- شبکه های اجتماعی
- مزایا
- فضا
- ورزش ها
- صحنه
- استانداردهای
- شروع
- آغاز شده
- ذخیره سازی
- پرده
- استراتژی
- مکمل
- پشتیبانی از
- بررسی
- سیستم
- سیستم های
- هدف
- فن آوری
- پیشرفته
- نمودار
- از طریق
- زمان
- بالا
- آموزش
- دگرگون کردن
- دگرگونی
- بروزرسانی
- us
- کاربران
- ارزش
- دید
- چی
- WHO
- به طور گسترده ای
- ویکیپدیا
- بدون
- کلمات
- مهاجرت کاری
- گردش کار
- با این نسخهها کار
- خواهد بود
- سال
- زوم