Gövdeli ChatGPT’ye benziyor: OpenAI destekli robot ‘Şekil 01’in tüyler ürpertici demosunu izleyin

İnsansı, konuşkan bir robot olan “Şekil 01″in tüyler ürpertici bir demosu internete düştü – ve bunun filmden silinmiş bir sahne olmadığına inanamıyorum. Ben, Robot’um. Demoda, OpenAI teknolojisiyle dolu Şekil 01’e ne “görebildiği” soruluyor. Görsel tanıma becerisini sergileyen avangart robot, önünde ne olduğunu doğru bir şekilde açıklıyor: kırmızı bir elma, bulaşıkların olduğu bir kurutma rafı ve […]

Gövdeli ChatGPT’ye benziyor: OpenAI destekli robot ‘Şekil 01’in tüyler ürpertici demosunu izleyin

İnsansı, konuşkan bir robot olan “Şekil 01″in tüyler ürpertici bir demosu internete düştü – ve bunun filmden silinmiş bir sahne olmadığına inanamıyorum. Ben, Robot’um.

Demoda, OpenAI teknolojisiyle dolu Şekil 01’e ne “görebildiği” soruluyor. Görsel tanıma becerisini sergileyen avangart robot, önünde ne olduğunu doğru bir şekilde açıklıyor: kırmızı bir elma, bulaşıkların olduğu bir kurutma rafı ve soruyu soran adam Şekil 01.

AYRICA BAKINIZ:

ChatGPT: Yanıtları yüksek sesle okuması nasıl sağlanır?

Tamam, biraz esrarengiz ama daha önce görmediğimiz bir şey değil, değil mi? Örneğin geçen yıl Google, Yapay Zeka modeli Gemini’nin, mavi plastik ördekten elle çizilmiş çeşitli resimlere kadar önüne yerleştirilen uyaranları nasıl tanıyabildiğini gösterdi (gerçi daha sonra ustaca düzenlemenin yeteneklerini biraz abarttığı keşfedildi).

Ama sonra adam “Yiyecek bir şeyler alabilir miyim?” diye sorar. Şekil 01, masadaki tek yenilebilir nesnenin o olduğunu açıkça fark ederek elmayı yakalıyor ve ona veriyor.

Will Smith’in yakın zamanda ortaya çıkmayacağından emin miyiz?

Şekil 01’deki robot nasıl çalışır?

Şekil 01’in bir insanla kesintisiz etkileşiminin temelini oluşturan şey tam olarak nedir? Şekil 01’i hantal bir hurda yığınından bilimkurgu benzeri, fütürist bir robota dönüştüren yeni bir Görsel Dil Modeli (VLM) fazla İnsan gibi. (VLM, OpenAI ve Figure 01’in arkasındaki startup olan Figure ile yapılan işbirliğinden kaynaklanmaktadır.)

Elmayı teslim ettikten sonra Şekil 01, “Neden bunu yaptığınızı açıklayabilir misiniz?” diye sorulduğunda aynı anda birden fazla görevi yerine getirebildiğini ortaya koyuyor. [gave me the apple] Sen bu çöpü toplarken?”

Neyin çöp olduğunu (ve ne olmadığını) tanıyan ve uygun eşyaları Şekil 01’de çöp kutusu olarak tanımlanan yere yerleştiren robot, adama bir elma teklif ettiğini çünkü önünde yenebilecek tek şeyin elma olduğunu açıklıyor. Bu etkileyici bir çoklu görev!

Sonunda adam Şekil 01’e ne kadar başarılı olduğunu düşündüğünü sorar. Robot sohbet eder gibi şöyle diyor: “Sanırım oldukça iyi iş çıkardım. Elma yeni sahibini buldu, çöp gitti ve sofra takımları ait olduğu yerde.”

Buna göre Brett AdcockFigure, Figure 01’in kurucusu, önündeki sahneyi “anlamasına” yardımcı olan ve robotun önündeki insanla sorunsuz bir şekilde etkileşime girmesine olanak tanıyan VLM verilerini besleyen yerleşik kameralara sahiptir. Şekil 01, Adcock’un yanı sıra şu fikrin ürünüdür: birkaç önemli oyuncu Boston Dynamics, Tesla, Google Deep Mind ve Archer Aviation’dan.

Elon Musk’un Optimus robotunu inceleyen Adcock, Şekil 01’in uzaktan çalıştırılmamasıyla övündü. Başka bir deyişle Optimus’tan farklı olarak Gömleği katlama olayı viral olduŞekil 01 bağımsız olarak çalışabilir.

Adcock’un nihai hedefi? Milyarlarca insansı robotu kontrol etmek için süper gelişmiş bir yapay zeka sistemi yetiştirmek, potansiyel olarak birden fazla endüstride devrim yaratmak. Öyle görünüyor ben, Robot düşündüğümüzden çok daha gerçek.

Konular
Yapay Zeka Robotiği

Teknory