Sora ne üzerine eğitildi? Yaratıcılar yanıtlar ister.

Perşembe günü OpenAI, Sora adlı video oluşturma modeliyle yapay zeka dünyasını bir kez daha sarstı. Demolar, basit metin yönlendirmelerine dayanan, net ayrıntılara ve karmaşıklığa sahip fotogerçekçi videolar gösteriyordu. A video “Tokyo banliyölerinde seyahat eden bir trenin penceresindeki yansımalar” istemine dayanan film, bir telefonla çekilmiş gibi görünüyordu, titrek kamera çalışması ve tren yolcularının yansımaları da dahil. […]

Sora ne üzerine eğitildi?  Yaratıcılar yanıtlar ister.

Perşembe günü OpenAI, Sora adlı video oluşturma modeliyle yapay zeka dünyasını bir kez daha sarstı.

Demolar, basit metin yönlendirmelerine dayanan, net ayrıntılara ve karmaşıklığa sahip fotogerçekçi videolar gösteriyordu. A video “Tokyo banliyölerinde seyahat eden bir trenin penceresindeki yansımalar” istemine dayanan film, bir telefonla çekilmiş gibi görünüyordu, titrek kamera çalışması ve tren yolcularının yansımaları da dahil. Görünürde tuhaf, çarpık eller yok.

“Kırmızı yünlü örme motosiklet kaskı takan, mavi gökyüzü, tuzlu çöl, sinema tarzı, 35mm filme çekilmiş, canlı renklerle 30 yaşındaki uzay adamının maceralarını anlatan bir film fragmanı” başlıklı tanıtımdan bir video Christopher Nolan’a benziyordu -Wes Anderson melezi.

Karda oynayan bir başka Golden Retriever yavru, yumuşak kürkü ve kabarık karı, uzanıp dokunabileceğiniz kadar gerçekçi hale getirdi.

7 trilyon dolarlık soru şu: OpenAI bunu nasıl başardı? Aslında bilmiyoruz çünkü OpenAI eğitim verileri hakkında neredeyse hiçbir şey paylaşmadı. Ancak bu kadar gelişmiş bir model oluşturmak için Sora’nın çok sayıda video verisine ihtiyacı vardı, dolayısıyla onun internetin her köşesinden alınan video verileriyle eğitildiğini varsayabiliriz. Bazıları eğitim verilerinin telif hakkıyla korunan çalışmaları içerdiğini düşünüyor. OpenAI, Sora’nın eğitim verileriyle ilgili yorum talebine hemen yanıt vermedi.

AYRICA BAKINIZ:

Görmeniz gereken yeni OpenAI aracı tarafından oluşturulan 8 çılgın Sora AI videosu

OpenAI’de teknik belge büyük ölçüde bu sonuçlara ulaşma yöntemine odaklanıyor: Sora, görsel verileri modelin anlayabileceği “yamalara” veya veri parçalarına dönüştüren bir yayılma modelidir. Ancak görsel verilerin nereden geldiğine dair çok az söz var.

OpenAI şunu söylüyor: “al[s] İnternet ölçeğindeki veriler üzerinde eğitim vererek genel yetenekler kazanan büyük dil modellerinden ilham aldık.” İnanılmaz derecede belirsiz olan “ilham alma” kısmı, Sora’nın eğitim verilerinin kaynağına yapılan tek kaçamak referanstır. OpenAI, makalenin ilerleyen kısımlarında şunu söylüyor: “Metinden videoya dönüştürme sistemlerini eğitmek, karşılık gelen metin altyazılarına sahip büyük miktarda video gerektirir.” Büyük miktarda görsel verinin tek kaynağının internette bulunabilmesi, Sora’nın nereden geldiğine dair bir başka ipucu.

Yapay zeka modelleri için eğitim verilerinin nasıl elde edildiğine ilişkin yasal ve etik sorun, OpenAI ChatGPT’yi başlattığından beri gündemde. İkisi birden OpenAI Ve Google dil modellerini eğitmek için verileri “çalmakla”, başka bir deyişle sosyal medyadan, Reddit ve Quora gibi çevrimiçi forumlardan, Wikipedia’dan, özel kitap veritabanlarından ve haber sitelerinden alınan verileri kullanmakla suçlanıyorlar.

Şimdiye kadar internetin tamamını eğitim verileri için kullanmanın mantığı, bunların kamuya açık olmasıdır. Ancak halka açık her zaman tercüme etmez kamu malına. Söz konusu durumda, New York Times dır-dir dava açmak OpenAI ve Microsoft, OpenAI modellerinin kullanıldığını iddia ederek telif hakkı ihlali nedeniyle Zamanlar‘ kelimesi kelimesine işe yarıyor veya hikayelerden yanlış alıntı yapılıyor.

Görünüşe göre OpenAI aynı şeyi videoyla yapıyor. Durum böyleyse, eğlence sektörünün en güçlü isimlerinin bu konuda söyleyecek bir şeyleri olmasını bekleyebilirsiniz.

Ancak sorun devam ediyor: Sora’nın eğitim verilerinin kaynağını hâlâ bilmiyoruz. “Şirket (ismine rağmen) karakteristik olarak modelleri ne üzerine eğittikleri konusunda ağzı sıkı davrandı.” yazdı ABD Senatosu Yapay Zeka Gözetim Komitesi duruşmasında ifade veren yapay zeka uzmanı Gary Marcus. “Birçok insan var [speculated] muhtemelen Unreal gibi oyun motorlarından üretilen birçok şey var. Ayrıca YouTube’da çok sayıda eğitimin ziyaret edilmesi ve çeşitli telif hakkıyla korunan materyallerin ziyaret edilmesi beni hiç şaşırtmazdı,” diyen Marcus, ardından şunu ekledi: “Muhtemelen burada sanatçılar gerçekten kazıklanıyor.”

OpenAI’nin sırlarını açıklamayı reddetmesine rağmen sanatçılar ve yaratıcılar en kötüsünü varsayıyorlar. film yapımcısı ve SAG-AFTRA üretken yapay zeka danışmanı Justine Bateman lafı esirgemedi. “Bunun her nanosaniyesi #AI çöp, gerçek sanatçıların çalıntı çalışmaları üzerine eğitiliyor.” gönderildi Bateman X hakkında. “İğrenç” diye ekledi.

Yaratıcı sektörlerdeki diğerleri, Sora’nın ve video oluşturma modellerinin yükselişinin işlerini nasıl etkileyeceği konusunda endişeli. “film görsel efektleri alanında çalışıyorum, neredeyse tanıdığım herkes karamsarlık içinde, şimdi ne yapacağımı şaşırıyor.” gönderildi @jimmylanceworth.

OpenAI, Sora’nın yaratabileceği patlayıcı etkiyi tamamen göz ardı etmedi. Ancak bu, büyük ölçüde deepfake ve yanlış bilgilendirme içeren potansiyel zararlara odaklanıyor. Şu anda kırmızı ekip aşamasındadır, bu da uygunsuz ve zararlı içerik açısından stres testine tabi tutulduğu anlamına gelir. Duyurusunun sonuna doğru OpenAI, “dünya çapındaki politika yapıcıları, eğitimcileri ve sanatçıları onların endişelerini anlamaları ve bu yeni teknolojinin olumlu kullanım örneklerini belirlemeleri için bir araya getireceğini” söyledi.

Ancak bu, Sora’nın ilk etapta yapılmasıyla meydana gelmiş olabilecek zararları gidermez.

Konular
Yapay Zeka OpenAI

Teknory