Apple, metin istemlerine dayalı olarak karmaşık görüntü düzenlemeleri gerçekleştirebilen bir yapay zeka aracını birlikte yarattı.

Robert Triggs / Android Yetkilisi TL;DR Apple, metin komutlarına dayalı olarak görüntüler üzerinde gelişmiş düzenlemeler yapabilen bir yapay zeka modelini birlikte oluşturdu. MGIE, arka planları değiştirmek, nesneleri değiştirmek, nesneleri kaldırmak ve çok daha fazlası gibi düzenlemeler gerçekleştirerek bir görüntüyü tamamen değiştirebilir. Yapay zeka modeli bir araştırma makalesinde sunuldu ve yakın zamanda bir iPhone’da görmeyi beklediğimiz […]

Apple, metin istemlerine dayalı olarak karmaşık görüntü düzenlemeleri gerçekleştirebilen bir yapay zeka aracını birlikte yarattı.

Robert Triggs / Android Yetkilisi

TL;DR

  • Apple, metin komutlarına dayalı olarak görüntüler üzerinde gelişmiş düzenlemeler yapabilen bir yapay zeka modelini birlikte oluşturdu.
  • MGIE, arka planları değiştirmek, nesneleri değiştirmek, nesneleri kaldırmak ve çok daha fazlası gibi düzenlemeler gerçekleştirerek bir görüntüyü tamamen değiştirebilir.
  • Yapay zeka modeli bir araştırma makalesinde sunuldu ve yakın zamanda bir iPhone’da görmeyi beklediğimiz bir şey değil.

Apple ve Santa Barbara’daki Kaliforniya Üniversitesi’nden araştırmacılar, metin komutlarına dayalı olarak görüntü düzenlemeleri gerçekleştirebilen bir yapay zeka aracını birlikte yarattılar (aracılığıyla) Girişim Ritmi).

“MGIE” olarak adlandırılan yapay zeka, Kağıt Uluslararası Öğrenme Temsilleri 2024 Konferansı’nda. Bu, Google Gemini gibi, görüntüleri Photoshop’ta yaptığınız gibi düzenleyebilen çok modlu bir geniş dil modelidir. Yalnızca burada düşüncelerinizi metin olarak ifade edebilirsiniz ve yapay zeka tüm düzenleme işini sizin için yapacaktır.

Diyelim ki elinizde bir Pizza resmi var. MGIE’ye “daha sağlıklı hale getirmesini” söyleyebilirsiniz ve bu, görseldeki pastaya daha sağlıklı malzemeler katacaktır. Apple’ın ortak yazdığı makale ayrıca görüntülerden nesneleri kaldırabileceğiniz, renkleri değiştirebileceğiniz ve görüntünün aydınlatmasını ve diğer ayrıntılarını geliştirebileceğiniz diğer düzenleme kullanım örneklerini de sunuyor. Hatta bir orman yolunu kumsala dönüştürebilir, fotoğrafların arka planını değiştirebilir, sanatsal çizimler oluşturabilir ve çok daha fazlasını yapabilir. Google’ın steroidler üzerindeki Magic Editor’unu düşünün. MGIE’nin düzenleme yeteneklerine ilişkin örnekleri görüntüleyebilirsiniz Burada.

MGIE Elma

“MGIE, bir MLLM (Multimodal Large Language Model) ve bir yayılma modelinden oluşur. MLLM, kısa ve anlamlı talimatlar çıkarmayı öğrenir ve görselle ilgili açık rehberlik sunar. Difüzyon modeli ortaklaşa güncelleniyor ve görüntü düzenlemeyi gerçekleştiriyor” diye açıklıyor makale.

Apple’ın bu öğrendiklerini tüketicilere yönelik gerçek görüntü düzenleme araçlarında nasıl kullanmayı planladığına dair hiçbir bilgi yok. Şirketin platformları için üretken yapay zeka özellikleri üzerinde çalıştığını biliyoruz. Yeni iPhone 16 serisinde yapay zeka tabanlı düzenleme araçlarını görmemiz mümkün. Her ne kadar MGIE’nin kapsamlı düzenleme yeteneklerinin sağlıklı miktarda işlem gerektirebileceğini varsaysak da, Apple, iPhone’lara uygulandığında yapay zekanın yumuşatılmış bir versiyonunu sunabilir.

MGIE’yi denemekle ilgileniyorsanız, barındırılan bir demoya göz atabilirsiniz. Burada.

Apple, metin istemlerine dayalı olarak karmaşık görüntü düzenlemeleri gerçekleştirebilen bir yapay zeka aracını birlikte yarattı.

Teknory