
OpenAI Görevleri Tamamlayabilen ChatGPT Aracısını Tanıttı
OpenAI halihazırda internette gezinebilen ve görevleri bağımsız olarak gerçekleştirebilen Operator ve büyük hacimli çevrimiçi bilgileri sentezlemede uzmanlaşmış Derin Araştırma olmak üzere iki farklı türde aracı sunuyor. Şimdi ise şirket Operator’ın web tarama yeteneklerini, Derin Araştırma’nın araştırma yeteneklerini ve ChatGPT’nin konuşma becerilerini tek ve güçlü bir aracıda birleştiren yeni bir yapay zeka olan ChatGPT aracısını tanıttı.
OpenAI ChatGPT Aracısı Neler Sunuyor?
ChatGPT aracısı artık kendi bilgisayarını kullanarak iş yapabiliyor. Bu aracı kullanıcı sorgusuna bağlı olarak web sitelerinde gezinebiliyor, sonuçları filtreleyebiliyor, gerektiğinde kullanıcıdan oturum açmasını isteyebiliyor, kod çalıştırabiliyor, analiz yapabiliyor, elektronik tablolar ve PowerPoint sunumları oluşturabiliyor ve çok daha fazlasını yapabiliyor.
ChatGPT aracısı, kullanıcılar tarafından verilen görevleri tamamlamak için aşağıdaki araçlara erişebilecek:
- GUI aracılığıyla web ile etkileşim kuran görsel bir web tarayıcısı
- Daha basit akıl yürütmeye dayalı web sorguları için metin tabanlı bir tarayıcı
- Bir terminal
- Doğrudan API erişimi
- ChatGPT bağlayıcılarına bağlanma yeteneği.
ChatGPT aracısı tüm işini kendi sanal bilgisayarı üzerinden yaptığı için, görevi tamamlamak için gereken tüm içeriğe sahip olacak. Örneğin, aracı tarayıcıyı kullanarak bir web sitesini ziyaret edebilir, web sitesinden bir dosya indirebilir, terminalde bir komut çalıştırarak aynı dosyayı işleyebilir ve ardından çıktıyı görsel tarayıcıda görüntüleyebilir.
OpenAI, ChatGPT aracısının web’de gezinme ve gerçek dünyadaki görev tamamlama yeteneklerini ölçen çeşitli değerlendirmelerde en son teknoloji performans gösterdiğini iddia ediyor. Bunlardan bazıları şu şekilde:
- Humanity’s Last Exam: ChatGPT aracısı, 41,6 puanla 1 SOTA’da yeni bir geçiş puanı alıyor. Aynı anda sekiz denemeye kadar çalıştırıldığında ve en yüksek öz bildirim güvenine sahip olanı seçtiğinde, puan 44,4’e yükseliyor.
- FrontierMath: ChatGPT aracısı %27,4 doğruluk oranına ulaşıyor.
- OpenAI’ın karmaşık ve ekonomik açıdan değerli bilgi-çalışma görevlerinde model performansını değerlendiren dahili kıyaslama ölçütü: ChatGPT aracısının çıktısı, vakaların yaklaşık yarısında insanlarınkine benzer veya daha iyidir.
- DSBench: ChatGPT aracısı, veri bilimi görevlerinde insan performansını önemli ölçüde geride bırakıyor.
- SpreadsheetBench: ChatGPT aracısı %45,5 puan alırken, Excel’deki Copilot %20,0 puana sahip.
- BrowseComp: ChatGPT aracısı %68,9 ile yeni bir SOTA puanı elde etti.
- WebArena: ChatGPT aracısı %65,4 puan aldı.
ChatGPT aracısı artık yeni “aracı modu” ile ChatGPT araçları açılır menüsünde mevcut. Aracı görevini yerine getirirken, kullanıcılar ekranda anlatım bulabilecekler ve ayrıca gerektiğinde tarayıcıyı kesip kontrolünü ele geçirebilirler.
ChatGPT aracısı, artık tüm ChatGPT Pro kullanıcıları için kullanılabilir olacak. ChatGPT Plus ve Team kullanıcıları önümüzdeki birkaç gün içinde, Enterprise ve Education kullanıcıları ise önümüzdeki haftalarda erişime kavuşacak. ChatGPT Pro kullanıcıları, temsilciyle ayda 400 mesajlaşabilirken diğer ücretli kullanıcılar ayda yalnızca 40 mesaj alabilecekler. Öte yandan kullanıcılar, esnek kredi tabanlı seçenekler kullanarak ek temsilci kullanımı satın alabilecekler.