Elbette Microsoft, ChatGPT'yi robotların kontrolüne verelim

Elbette Microsoft, ChatGPT'yi robotların kontrolüne verelim

Kaynak Düğüm: 1971360

Video OpenAI'ye "çok yıllı, milyarlarca dolarlık" bir yatırım taahhüdünde bulunan Microsoft, ChatGPT gibi büyük dil modelleriyle o kadar şaşkın ki, bu tür akıllı yazılımların robotlarla iletişim kurma şeklimizi basitleştirdiğini görüyor.

ChatGPT, web'den ve diğer kaynaklardan alınan metinlerden oluşan OpenAI GPT (Generative Pre-trained Transformer) veri kümesi üzerinde eğitilmiş bir büyük dil modelidir (LLM). Bir sohbet arayüzü ile birleştirilen modelin sorulara yarı tutarlı bir şekilde yanıt verme yeteneği, her zaman doğru değil, ona Microsoft'un Bing arama motorunda bir yer kazandırdı ve reklamlarla süslü, SEO ile oynanan, ödeme destekli Google Arama sonunda sona eriyor olabilir.

Yeterince meşgul yangın söndürmek Bing'in AI mind meld'inden Microsoft, insanların fiziksel dünyadaki robotları yönetmesine yardımcı olmanın bir yolu olarak ChatGPT'yi öneriyor.

Şirket, "Bu araştırmadaki amacımız, ChatGPT'nin metnin ötesinde düşünüp düşünemeyeceğini ve robotik görevlerde yardımcı olmak için fiziksel dünya hakkında akıl yürütüp düşünemeyeceğini görmek" dedi. göndermek için Pazartesi gününde. "Karmaşık programlama dillerini veya robotik sistemlerle ilgili ayrıntıları öğrenmeye ihtiyaç duymadan insanların robotlarla daha kolay etkileşim kurmasına yardımcı olmak istiyoruz."

Bu amaçla, Redmond'un araştırmacıları yayınladı PromptCraft, LLM sorgularının ve komutlarının robotlara en iyi şekilde nasıl ifade edileceğini paylaşmak için işbirlikçi bir açık kaynak platformu olarak tanımlanır.

Görünüşe göre doğrudan gidemezsin “Pod bölme kapılarını aç, lütfen HalBir drone için sesli kontrol kanalı olarak ChatGPT ile etkileşim kuruyorsanız. Model için sahneyi ayarlamalısınız. O başlıyor Böyle bir şey:

Drone'lar için AirSim simülatörüyle etkileşimde bulunmama yardım ettiğinizi hayal edin. Herhangi bir zamanda, her biri benzersiz bir etiketle tanımlanan aşağıdaki yeteneklere sahipsiniz. Ayrıca bazı istekler için kod çıktısı almanız gerekir.

Soru: “Soru” diyerek özellikle tanımladığınız sürece bana bir açıklama sorusu sorabilirsiniz. Kod: İstenen hedefe ulaşan bir kod komutu çıktısı alın.

Sebep: Kodu çıkardıktan sonra, yaptığınız şeyi neden yaptığınıza dair bir açıklama sağlamalısınız.

Simülatör, birkaç nesneyle birlikte bir drone içerir. Drone dışında nesnelerin hiçbiri hareketli değil. Kod içerisinde aşağıdaki komutları kullanabiliriz. Başka varsayımsal işlevler kullanmayacaksınız.

...

Ve belirtilmesi gereken önemli seyir parametreleri vardır. Ancak biraz hazırlık yaptıktan sonra, ChatGPT ile sohbet edebileceğiniz ve çevredeki ortamda size bir içecek bulması için bir drone yönlendirmesini sağlayabileceğiniz noktaya gelebilirsiniz. Ya da herhangi bir hata yoksa drone'un emirlerinizi yerine getirmesine izin verecek Python kodunu üretebilir.

Youtube Video

Microsoft, "ChatGPT yeni bir robot paradigmasının kilidini açar ve (potansiyel olarak teknik olmayan) bir kullanıcının döngüde oturmasına izin vererek robotun performansını izlerken büyük dil modeline (LLM) üst düzey geri bildirim sağlar" diye açıklıyor. "Tasarım ilkelerimizi izleyerek, ChatGPT robotik senaryolar için kod üretebilir."

Başka bir deyişle, Github Copilot tarafından üretilen aynı tür, zorunlu olarak doğru olmayan kod, belirli bir görevi gerçekleştirmesine yardımcı olmak için ChatGPT aracılığıyla bir robota doğrudan beslenebilir.

Microsoft Otonom Sistemler ve Robotlar Araştırma Grubu'ndan Sai Vemprala, Rogerio Bonatti, Arthur Bucker ve Ashish Kapoor, ChatGPT aracılığıyla robotları yönetme girişimlerini anlatıyor. bir araştırma makalesi [PDF] başlıklı "Robot Bilimi için ChatGPT: Tasarım İlkeleri ve Model Yetenekleri."

Proje, ChatGPT'nin anlayabileceği üst düzey bir API tanımlar ve bunu alt düzey robot işlevleriyle eşler. Daha sonra, ChatGPT için görev hedeflerini açıklayan, kullanılabilir işlevleri belirten ve görev kısıtlamalarını ayarlayan metin istemleri yazdılar.

ChatGPT daha sonra, belirlenen simülasyon hedefine ulaşmak için cihaza uygun kod üreterek yanıt verdi. Buradaki fikir, ChatGPT ile sohbet eden bir kişinin robot yönergelerini düzgün çalışana kadar hata testi yapabilmesidir.

Microsoft bilim adamları, ChatGPT'nin bir robotu kamerayla kontrol etme yeteneğine dayanarak "uzay-zamansal akıl yürütme" yeteneğine sahip olduğunu söylüyor, bu nedenle bir basketbol topunu yakalamak için görsel sensörler kullanabiliyor.

Makalede, "ChatGPT'nin sağlanan API işlevlerini uygun şekilde kullanabildiğini, topun görünümü hakkında akıl yürütebildiğini ve ilgili OpenCV işlevlerini çağırabildiğini ve orantılı bir denetleyiciye dayalı olarak robotun hızını yönetebildiğini görüyoruz" diye açıklıyorlar.

Bu tür bir akıl yürütmenin - dünyanın sağduyulu bir modeline sahip olmanın - robotların fiziksel bir ortamda etkili bir şekilde çalışmasını çok daha kolaylaştırdığı tartışılıyor. Otonom araç endüstrisi henüz orada değil ve görünüşe göre ChatGPT de yok.

Daha bu hafta, Güney Kaliforniya Üniversitesi'nden bir çift araştırmacı, Zhisheng Tang ve Mayank Kejriwal, serbest bırakıldı. Kağıt ArXiv aracılığıyla, ChatGPT ve DALL•E 2'nin dünya hakkında mantıklı çıkarımlar yapma becerisine meydan okuyor.

"Karar Verme ve Mekansal Akıl Yürütme Üzerine ChatGPT ve DALL-E 2'nin Pilot Değerlendirmesi" başlıklı makale, iki modelin tutarsız bir şekilde akıl yürüttüğü sonucuna varıyor.

ChatGPT ile ilgili olarak, "bir düzeyde rasyonel karar verme gösterse de, tercihlerin, bahislerin ve karar verme istemlerinin makul yapıları altında bile kararlarının çoğunun aksiyomlardan en az birini ihlal ettiğini" buldular. Ve bazen, ChatGPT'nin yanlış nedenlerle doğru kararı verdiğini söylediler.

Microsoft'un bilim adamları, ChatGPT'nin sınırlamaları olduğunu kabul ediyor ve model çıktısının denetlenmeyen bir robota uygulanmaması gerektiğini belirtiyorlar.

Makalelerinde "Bu araçlara, özellikle güvenlik açısından kritik uygulamalar için robotik boru hattının tam kontrolünün verilmemesi gerektiğini vurguluyoruz" diyorlar. "LLM'lerin eninde sonunda yanlış yanıtlar üretme eğilimi göz önüne alındığında, robotta yürütmeden önce kodun çözüm kalitesini ve güvenliğini insan gözetiminde sağlamak oldukça önemlidir." ®

Zaman Damgası:

Den fazla Kayıt