Deepseek R1: AI uzmanları niçin bu kadar hususi bulunduğunu düşünüyor?

Ansızın, Deepseek her yerde. R1 modeli açık kaynaktır, iddia edilen öteki AI modellerinin maliyetinin bir kısmı için eğitildiği iddia edilir ve chatgpt'ten daha iyi olmasa da aynı derecede iyidir. Bu ölümcül kombinasyon, Wall Street'e sert vurdu, teknoloji stoklarının düşmesine niçin oldu ve yatırımcıların iyi AI modelleri geliştirmek için ne kadar paraya gerekseme duyulduğunu sorguladı. Deepseek […]

Teknoloji Ocak 29, 2025 21 Okuma Listesine Ekle

Deepseek R1: AI uzmanları niçin bu kadar hususi bulunduğunu düşünüyor?

Ansızın, Deepseek her yerde.

R1 modeli açık kaynaktır, iddia edilen öteki AI modellerinin maliyetinin bir kısmı için eğitildiği iddia edilir ve chatgpt'ten daha iyi olmasa da aynı derecede iyidir.

Bu ölümcül kombinasyon, Wall Street'e sert vurdu, teknoloji stoklarının düşmesine niçin oldu ve yatırımcıların iyi AI modelleri geliştirmek için ne kadar paraya gerekseme duyulduğunu sorguladı. Deepseek mühendisleri iddia ediyor R1, Openai'nin GPT-4'üne kıyasla ortalama 6 milyon dolara mal olan 2.788 GPU'da eğitildi. bildirilmiş Eğitim için 100 milyon dolara mal oldu.

Deepseek'in maliyet verimliliği de daha büyük modellerin ve daha çok verinin daha iyi performansa yol açmış olduğu fikrine de meydan okuyor. Deepseek'in kabiliyetleri, Openai benzer biçimde AI şirketlerine olan tehdidi ve ürkütücü yatırımcılarla ilgili çılgınca konuşmaların ortasında neler olup bittiğini idrak etmek zor olabilir. Sadece kıdemli deneyime haiz AI uzmanları kıymetli perspektiflerle ağırlık vermiştir.

Deepseek, AI uzmanlarının senelerdir söylediklerini kanıtlıyor: Bigger daha iyi değil

Tecim kısıtlamaları ve Nvidia GPU'larına erişim sebebiyle engellenen Çin merkezli Deepseek, R1'i geliştirmek ve eğitmek için yaratıcı olmak mecburiyetinde bırakıldı. Bu başarıyı yalnız 6 milyon dolar (AI açısından fazlaca para değil) için başarabilmeleri yatırımcılar için bir vahiydi.

Sadece AI uzmanları şaşırmadı. “Google'da niçin en büyük modeli meydana getirmeye sabitlendiklerini sormuş oldum. Niçin boyut için gidiyorsunuz? Hangi işlevi başarmaya çalışıyorsunuz? Niçin en büyük modele haiz bulunmadığınız için üzüldüğünüz şey? Onlar beni ateşleyerek yanıt verdi ” yayınlanmış AI Bias'ı aramış olduğu için Google'dan meşhur olan Timnit Gebru.

Püre Işık Hızı

Tweet silinmiş olabilir

Sarılma Yüzüİklim ve AI önder Sasha Luccioni, AI yatırımının güvencesiz bir halde pazarlama ve hype üstüne iyi mi kurulduğuna dikkat çekti. “Tek bir (yüksek performanslı) LLM'nin binlerce GPU'dan boktan kabadayı zorlamadan bu performansı elde edebileceğini ima etmek yırtıcı, buna niçin olmak için kafi,” söz konusu Luconi.

Tweet silinmiş olabilir

Deepseek R1'in niçin bu kadar büyük bulunduğunu açıklığa kavuşturmak

Deepseek R1, anahtar ölçütlerde Openai O1 modeline benzer şekilde performans gösterdi. Matematik, kodlama ve genel informasyon testlerinde marjinal olarak aştı, eşitlendi yada O1'in derhal altına düştü. Kısaca, antropik Claude, Google Gemini ve Meta'nın averaj kullanıcı için yetenekli açık kaynak model lama benzer biçimde başka modeller de var.

Sadece R1, ne kadar azca mal olması sebebiyle bu şekilde bir çılgınlığa niçin oluyor. “Daha önceki modellerden daha akıllı değil, daha ucuza eğitildi,” söz konusu AI araştırma bilimcisi Gary Marcus.

Tweet silinmiş olabilir

Deepseek'in Openai'nin modelleriyle rekabet eden bir model oluşturabildiği gerçeği oldukça dikkat çekicidir. Openai'yi kuran Andrej Karpathy, yayınlanmış X'te, “Bu, sınır llms için büyük GPU kümelerine ihtiyacınız olmadığı anlamına mı geliyor? Hayır, sadece haiz olduklarınızla savurgan olmadığınızdan güvenilir olmalısınız ve bu hala fazlaca şey bulunduğunu gösteren güzel bir şov benzer biçimde görünüyor Hem veriler hem de algoritmalarla geçin. “

Tweet silinmiş olabilir

Wharton AI Profesörü Ethan Mollick söz konusu Bu, kabiliyetleri değil, insanların şu anda erişebileceği modellerle ilgili. “Deepseek hakkaten iyi bir model, fakat çoğu zaman O1 yada Claude'dan daha iyi bir model değil” dedi. “Fakat hem özgür hem de bir ton dikkat çekmiş olduğu için, bence parasız 'mini' modelleri kullanan birçok insan, 2025'in başlarında bir akılcı AI'nın yapabileceği ve şaşırmış olduğu şeylere maruz kalıyor.”

Tweet silinmiş olabilir

Açık kaynaklı AI modelleri için bir puan

Deepseek R1 Breakout, kuvvetli AI modellerine erişimi demokratikleştirmenin, şeffaflık, yenilik ve sıhhatli rekabet sağladığını iddia eden açık kaynak savunucuları için büyük bir kazançtır. “'Çin ABD'yi AI'da aşıyor' diye düşünen insanoğlu için, doğru fikir 'açık kaynak modelleri kapalı olanları aşıyor' ' söz konusu Meta'nın baş AI bilim adamı Yann Lecun, kendi Lama modelleriyle açık kaynak kullanımı destekledi.

Tweet silinmiş olabilir

Bilgisayar bilimcisi ve AI uzmanı Andrew NG, R1'in açık kaynaklı bir model olmasının öneminden açıkça bahsetmedi, sadece Deepseek aksamasının geliştiriciler için iyi mi bir nimet bulunduğunu altını çizdi, şundan dolayı aksi takdirde Big Tech tarafınca ağ geçmesine izin veriyor.

“Borsada bugünün 'Deepseek Selloff' – Deepseek V3/R1 teknoloji ekosistemini bozan – uygulama katmanının mükemmel bir yer olduğuna dair başka bir işaret,” söz konusu Ng. “Hiper-rekabeti olan temel model katmanı, uygulamalar oluşturan insanoğlu için mükemmel.”