OpenAI, bugüne kadarki en bilgi dolu yapay zekası GPT-4.5’i duyurdu

Elon Musk’ın sözde “dünyanın en akıllı yapay zekası” Grok-3’ün ardından OpenAI, bugüne kadarki en bilgi dolu AI modeli GPT-4.5 modelini duyurdu. Peki yeni modelin özellikleri neler?

OpenAI, bugüne kadarki en bilgi dolu yapay zekası GPT-4.5’i duyurdu

Yapay zeka sektöründe rekabet 2025’te dur durak bilmiyor. Google Gemini, Microsoft Copilot, Claude, DeepSeek ve ChatGPT’nin yarışında peş peşe yenilikler duyuruluyor. Google, Gemini için Flash 2.0 modellerini devreye aldı. 

Daha öncesinde ise Elon Musk’ın  xAI şirketi, çok iddialı Grok-3 modelini kullanıma sundu; üstelik bu model şu anda herkes tarafından ücretsiz olarak test edilebiliyor. Ancak bitmedi. Sektörün önde gelen markası OpenAI, merakla beklenen GPT-4.5 modelini duyurdu.

Kullanıcılara da sunulan GPT-4.5 modeli, OpenAI şirketine göre “bugüne kadarki en bilgi dolu yapay zeka modeli” olarak karşımıza çıkıyor. GPT-4o temelinde ön geliştirme sürecine başlanan GPT-4.5, her ne kadar son teknoloji bir model olmasa da bilgi dolu ve bugüne kadar göreceğiniz en iyi model denilebilir.

GPT-4.5 ÖZELLİKLERİ NELER?

Asıl gözler GPT-5 modelinde olsa da OpenAI, bir süredir üzerine çalıştığı GPT-4.5 ile hünerlerini sergiledi. GPT-4o modeline kıyasla daha fazla bilgiye sahip olan yeni sohbet botu, daha iyi yazma becereye ek olarak rafine kişiliğe sahip.

SON TEKNOLOJİ BİR MODEL DEĞİL

Daha önce sızdırılan OpenAI belgelerinde de yeni modele ilişkin birçok detay yer alıyordu. GPT-4.5’in son teknoloji model olmadığı, ancak OpenAI’in en büyük LLM’si olduğu aktarılıyordu. Üstelik GOT-4’ten 10 kat daha fazla hesaplama verimliliğine sahip olduğu da belgede yer alan ifadeler arasındaydı.

GPT-4 İLE ARASINDA ÇOK FARK YOK

10 kat daha fazla hesaplama verimliliği olması elbette çok büyük bir avantaj değil. Nitekim yapılan benchmark testleri doğrultusunda GPT-4.5’in, mevcut GPT-4o’ya kıyasla büyük bir yükseltme sunmadığını ortaya koyuyor. 

Ayrıca SWE-bench Verified benchmark testinde GPT-4.5, %38 başarı oranına ulaşarak GPT-4o'ya kıyasla %2 ila %7 arasında bir iyileşme kaydedildi. 

Ancak bu oran, OpenAI’nin O3 tabanlı derinlemesine araştırma modelinden %30 daha düşük. Zira buna karşılık Anthropic’in Claude 3.7 Sonnet modeli, SWE-bench Verified testinde %62,3 oranında bir performans ortaya koymuştu.

OPENAI’DAN ÖZEL BENCHMARK: SWE-LANCER

Özellikle son dönemde OpenAI’nin Preparedness ekibi, büyük dil modellerinin (LLM) yazılım mühendisliği alanındaki performansını değerlendirmek için yeni bir benchmark olan SWE-Lancer’ı geliştirdi.

 Bu benchmark, işlevsel geliştirmenin yanı sıra, tasarım ve hata düzeltme gibi gerçek dünya yazılım mühendisliği görevlerini kapsıyor. Buna ek olarak yeni değerlendirmede GPT-4.5 modeli, IC SWE görevlerinin %20’sini ve SWE Manager görevlerinin %44’ünü başarıyla tamamlayarak OpenAI’nin o1 modeline kıyasla küçük bir iyileşme ortaya koydu. 

GPT-4.5 ÜCRETSİZ Mİ?

Şu an için sadece ücretli aboneler yeni yapay zeka modelini deneyimleyebiliyor. ChatGPT Pro ve tüm ücretli plana sahip geliştiriciler, API aracılığıyla OpenAI’ın yeni modeline erişebiliyor. Öte yandan önümüzdeki hafta ChatGPT Plus aboneleri de bu yeni modelin keyfini sürebilecek. Ancak ücretsiz kullanıcılar için şimdilik bir deneme fırsatı bile verilmedi. Muhtemelen önümüzdeki hafta kısa sürelik bir deneme imkanı tanınacaktır diye düşünüyoruz.

Kaynak: OpenAI