Anthropic’in en yeni Claude sohbet robotu bazı kıyaslamalarda OpenAI’nin GPT-4o’sunu geride bırakıyor

Antropik dışarı haddelenmiş Perşembe günü en yeni AI dil modeli, Claude 3.5 Sonnet. Güncellenen chatbot, iki kat daha hızlı çalışırken şirketin önceki üst düzey modeli Claude 3 Opus’tan daha iyi performans gösteriyor. Claude kullanıcıları (ücretsiz hesaplara sahip olanlar da dahil) bugünden itibaren kontrol edebilirler. Anthropic’in en dengeli modeli olma eğiliminde olan Sonnet, Claude 3.5 ailesinin […]

Anthropic’in en yeni Claude sohbet robotu bazı kıyaslamalarda OpenAI’nin GPT-4o’sunu geride bırakıyor

Antropik dışarı haddelenmiş Perşembe günü en yeni AI dil modeli, Claude 3.5 Sonnet. Güncellenen chatbot, iki kat daha hızlı çalışırken şirketin önceki üst düzey modeli Claude 3 Opus’tan daha iyi performans gösteriyor. Claude kullanıcıları (ücretsiz hesaplara sahip olanlar da dahil) bugünden itibaren kontrol edebilirler.

Anthropic’in en dengeli modeli olma eğiliminde olan Sonnet, Claude 3.5 ailesinin ilk sürümüdür. Şirket, Claude 3.5 Haiku’nun (her neslin en hızlısı) ve Claude 3.5 Opus’un (en güçlüsü) bu yılın sonlarında geleceğini söylüyor. (Bu modeller bu arada sürüm 3’te kalacak.) Sonnet güncellemesi, Claude 3 ailesinin gelişinden yalnızca birkaç ay sonra geliyor ve yapay zeka şirketlerinin en yeni ve en iyilerini ortaya çıkarmak için çalıştığı olağanüstü hızı gösteriyor.

Son yapay zeka sohbet robotu modelleri arasındaki kıyaslama karşılaştırmalarını gösteren tablo: Claude 3.5 Sonnet, Claude 3 Opus, GPT-4o, Gemini 1.5 Pro ve Llama-400b.

Antropik

Antropik iddialar Claude 3.5 Sonnet, nüansı, mizahı ve karmaşık yönlendirmeleri anlamada ileri bir adım atıyor ve daha doğal bir tonda yazabiliyor. Karşılaştırmalar (yukarıda) yeni modelin lisans düzeyinde muhakeme, lisans düzeyinde bilgi ve kodlama yeterliliği açısından endüstri rekorları kırdığını gösteriyor. Anthropic’in yayınladığı birçok kriterde OpenAI’nin GPT-4o’sunu geçiyor. Bununla birlikte, en yeni Claude, ChatGPT, Gemini ve Llama modelleri çoğu testte birbirlerinden birkaç yüzde puan farkla puan alma eğiliminde olup, bu da sıkı rekabetin altını çizmektedir.

Şirket, Claude 3.5 Sonnet’in görsel girdiyi yorumlamada Claude 3.0 Opus’tan daha iyi olduğunu iddia ediyor. Anthropic, yeni modelin “kusurlu görüntülerden metni doğru bir şekilde kopyalayabildiğini” söylüyor; bu becerinin perakende, lojistik ve finansal hizmetlerde çizelgeler, grafikler ve diğer görsel ipuçlarından veri toplaması gereken müşterilerin ilgisini çekeceğini umuyor.

Claude’un güncellemesi ayrıca şirketin Artifacts (yukarıda) adını verdiği yeni bir çalışma alanını da beraberinde getiriyor. Chatbot’tan kod, metin belgeleri veya web tasarımları gibi içerik üretmesini istediğinizde, sohbetin sağında özel bir pencere görünür. Buradan Claude’dan değişiklik yapmasını isteyebilirsiniz ve o, Yapıtlar penceresini en son çıktısıyla güncel tutacaktır.

Şirket, Artifacts’ı Claude’u daha geniş ekip işbirliği için bir alan haline getirme yolunda ilk adım olarak görüyor. Şirket bir basın bülteninde şöyle yazdı: “Yakın gelecekte ekipler ve nihayetinde tüm kuruluşlar, bilgilerini, belgelerini ve devam eden çalışmalarını tek bir ortak alanda güvenli bir şekilde merkezileştirebilecek ve Claude isteğe bağlı ekip arkadaşı olarak hizmet verebilecek.” .

Claude 3.5 Sonnet artık hesabı olan herkesin deneyebilmesi için mevcut web sitesiayrıca Claude iOS uygulaması. (Bu platformların her ikisinde de Claude Pro ve Team aboneleri daha yüksek jeton sayılarına sahip olur.) Buna ayrıca Anthropic API, Amazon Bedrock ve Google Cloud’un Vertex AI aracılığıyla da erişebilirsiniz. Önceki modelle aynı şekilde, bir milyon giriş tokenı başına 3 ABD Doları ve bir milyon çıkış tokenı başına 15 ABD Doları maliyeti vardır.

Anthropic’in en yeni Claude sohbet robotu bazı kıyaslamalarda OpenAI’nin GPT-4o’sunu geride bırakıyor

Teknory