2024 yılında öne çıkan 5 yapay zekâ görüntü oluşturma aracı
Yapay zekâ görüntü oluşturma araçları son birkaç yıldır kullanıcılar tarafından yoğun ilgi görüyor. Gelin sizler için derlediğimiz 2024 yılında öne çıkan yapay zekâ görüntü oluşturma araçlarına birlikte bakalım.
DALL·E 3, yapay zekâ görüntü oluşturma araçları alanında akla gelen ilk modellerden biri. Bunun sebebi ise önceki modeli DALL·E 2’nin hem oldukça ilginç görüntüler oluşturacak kadar iyi olması hem de insanlar tarafından yaygınca kullanılabilmesiydi.
ChatGPT Plus kapsamında sunulan DALL·E 3 son derece kolay kullanımıyla öne çıkıyor. DALL·E 3’ün başlıca eksileri ise ChatGPT kontrollerinin yer yer isabetsiz oluşu ve eğer GPT modellerini kullanmak istemiyorsanız aylık 20 doların oldukça pahalı olması denilebilir.
DALL·E 3’ün, DALL·E 2’ye kıyasla önemli bir gelişme kaydettiğini söyleyebiliriz. Yeni güncelleme sayesinde DALL·E 3, herhangi bir komut istemi için daha ilginç, daha gerçekçi ve daha tutarlı sonuçlar üretiyor. OpenAI’ın DALL·E 3 ile rakiplerine yeniden meydan okuduğunu söyleyebiliriz. Uygulamaya ChatGPT ve Microsoft Bing’in AI Copilot’ının yanı sıra API’ını kullanan birkaç başka hizmet aracılığıyla da erişebilirsiniz.
Daha önce de belirttiğimiz gibi DALL·E 3’ün en önemli özelliği kullanımının inanılmaz derecede basit olması. ChatGPT veya Bing’e ne görmek istediğinizi söylediğinizde birkaç dakika içinde yapay zekâ tarafından üretilen iki ilâ dört varyasyon arasından seçim yapabiliyorsunuz. Araç, istemlerinizi genişletmek için GPT-4o’nun dil anlayışını kullanıyor, böylece her sonuç farklı oluyor ve her zaman daha fazlasını isteyebiliyorsunuz.
OpenAI, ücretsiz ChatGPT kullanıcılarının DALL·E 3 ile günde iki görüntü oluşturmasına izin verirken, Microsoft ücretsiz seçeneklerde çok daha fazla esneklik sağlıyor.
DALL·E 3’ü kullanırken, resimlerinizi düzenlemenin iki yolu mevcut; ChatGPT’den değişiklik yapmasını isteyebilirsiniz, o da sizin eklemelerinizle istemleri yeniden çalıştıracaktır; ya da güncellemeleri resmin belirli bölümleriyle sınırlamak için bir seçme aracı kullanabilirsiniz. Eğer görüntüler üzerinde daha fazla kontrol sahibi olmak istiyorsanız, bu listedeki diğer uygulamalardan birini deneyebilirsiniz.
ChatGPT aracılığıyla DALL·E 3’e ek olarak OpenAI, geliştiricilerin iki DALL·E 3 modeliyle entegre olan uygulamalar oluşturmasına olanak tanıyan bir API da sunduğunu belirtelim.DALL·E 3, ChatGPT Plus’ın bir parçası olarak aylık 20 dolar ve Microsoft Copilot aracılığıyla ücretsiz olarak kullanılabilir; API fiyatlandırması biraz daha karmaşık, ancak görüntü başına 0,016 dolardan başlıyor.
Grok-2’yi destekleyen ve Midjourney’i geride bırakan FLUX.1 modellerinin arkasındaki isimleri sizlerle daha önce paylaşmıştık. Stability.ai çökmeye başladığında ekibin önemli bir kısmı Black Forest Labs’i kurmak için şirketten ayrılmıştı. Ekip bu adımın ardından, ilk ‘metinden görüntüye’ model serileri olan FLUX.1’i yayınladı.
FLUX.1’in en az Stable Diffusion kadar iyi olduğu söylenebilir. Model, şu an için yaygın olarak desteklenmiyor. Yine de daha fazla yapay zeka sanatçısı niş modeller oluşturmak için ince ayar yaptıkça, yavaş yavaş daha fazla ilgi görmesi beklenebilir.
Şu anda daha basit metinden görüntüye araçlarından birini kullanmak yerine açık kaynak yapay zekâ görüntü üretimine girmek istiyorsanız, Stable Diffusion yerine FLUX.1 ile deneme yapabilirsiniz. FLUX.1 Schnell açık Apache 2.0 lisansı altında yayınlanırken, daha büyük olan FLUX.1 ticari olmayan kullanıma açık bulunuyor.
Tıpkı Stable Diffusion gibi FLUX.1’i kullanmanın da en basit yolu NightCafe, Tensor.Art ve Civitai gibi çevrimiçi yapay zekâ sanat oluşturucuları. Ücretsiz bir hesap oluşturarak modeli deneyebilir ve diğer modellerden bazılarıyla yan yana karşılaştırabilirsiniz. FLUX.1 ücretlendirmesi platforma göre değişiklik gösteriyor ancak çoğu platform ücretsiz kullanım hakkı sunuyor, böylece modelleri deneyebiliyorsunuz.
Yapay zekâ görüntü oluşturucularının çoğu, difüzyon süreci harfleri oluşturmaya uygun olmadığından ötürü, doğru bir şekilde metin oluşturmakta zorlansa da Ideogram bu süreci çözmüş durumda. Şubat ayında 80 milyon dolar yatırım alan Ideogram’ın güncel 2.0 algoritması, oluşturulan herhangi bir görüntüye metni doğru bir şekilde dahil edebiliyor.
Bunun da ötesinde, Ideogram aynı zamanda genel olarak önde gelen görüntü oluşturuculardan biri olarak karşımıza çıkıyor. Sezgisel bir web uygulamasının yanı sıra resim editörü ve herhangi bir resmi yeni bir resim için temel olarak kullanabilme gibi bazı güzel özelliklere sahip.
Günde 10 krediyle sınırlı olmak kaydıyla Ideogram’ın ücretsiz planı da mevcut. Bir resim oluşturmanın başlaması için birkaç dakika beklemeniz gerekmekte. Bu süreçte Ideogram’ın yalnızca temel özelliklerine sahip oluyorsunuz. Ancak yine de uygulama hakkında fikir edinmek için iyi bir yol olduğunu belirtmemiz gerekiyor.
Ideogram’ın başlıca eksisi ise oluşturduğunuz görsellerin varsayılan olarak herkese açık olarak bulunması denilebilir. Sınırlı ücretsiz planın yanında; tam çözünürlüklü indirme ve aylık 400 öncelikli kredi için aylık 8 dolardan başlayan fiyatlarla Ideogram’a erişebilirsiniz.
Son zamanlarda donanım geliştirmeye odaklanan Midjourney’nin bu listedeki tüm görüntü oluşturuculara kıyasla sürekliliğinin daha yüksek olmasıyla öne çıktığını söyleyebiliriz. Araç sürekli olarak iyi görünen görüntüler üretiyor. Oluşturduğu görüntüler daha iyi dokular ve renklerle daha tutarlı görünüyor. Özellikle insanlar ve gerçek dünyadaki nesneler diğer yapay zekâ görüntü oluşturuculara kıyasla daha gerçekçi ve doğal görünüyor, üstelik bunu çok fazla yönlendirme olmadan da yapabiliyor.
Midjourney’nin artık kendine özel bir web uygulaması da mevcut. Yani araca, eskiden olduğu gibi sadece Discord üzerinden erişmek zorunda değilsiniz. Birden fazla görüntüyü harmanlama, oluşturulan farklı görseller arasında ayrıntıları koruma ve stilleri eşleştirme gibi bazı en gelişmiş özellikleri henüz web uygulamasına geçiş yapmadı. Yine de platformda düzenleyiciyi kullanabilir ve görsellerin nasıl görüneceği üzerinde oldukça fazla kontrole sahip olabilirsiniz.
Öte yandan ürettiğiniz görüntülerin varsayılan olarak Midjourney’nin Keşfet sayfasında herkese açık olarak görünmesi ve profilinizde görüntülenebilir olması, hem artı hem de eksi sayılabilecek bir yönü. Bu durum, görsel üretim sürecine bir topluluk katmanı eklerken, herkesin ne ürettiğinizi görebileceği anlamına geliyor. Kendini göstermek isteyen sanatçılar için bir sorun teşkil etmeyecek olsa da; aracı iş amaçlı kullanacaklar için vazgeçme sebebi olabilir.
Midjourney’nin yardım dokümanlarından destek alabileceğinizi de belirtelim. Platform, hem web uygulamasına hem de Discord’a başlarken size yol gösteriyor. Model sürümlerini seçmekten karakter referanslarını ve kişiselleştirme araçlarını kullanmaya kadar tüm çeşitli özelliklerini nasıl kontrol edeceğinizi gösteriyor. Farklı seçenekleri bir kez anladığınızda elde edebileceğiniz sonuçlar oldukça şaşırtıcı olabilir.
Midjourney’nin ücretsiz denemeleri, kullanmaya çalışan çok sayıda insan nedeniyle şu anda askıya alınmış durumda, ancak zaman zaman birkaç günlüğüne eski haline getiriliyor. Ücretsiz deneme süresini kaçırırsanız Basic Plan ayda 10 dolardan başlıyor ve ayda 3,3 saat GPU süresi veya yaklaşık 200 görüntü ile birlikte geliyor. Ayrıca ek GPU süresi satın alma seçeneğiniz de mevcut ve görsellerinizi ticari olarak kullanabiliyorsunuz.
Daha evvel Stability AI’ın metinden görüntüye modeli SD3 medium’u sizlere tanıtmıştık. DALL·E ve Midjourney’nin aksine Stable Diffusion açık kaynak kodlu olarak karşımıza çıkıyor. Bu da gerekli teknik becerilere sahip herkesin onu indirebileceği ve kendi bilgisayarında yerel olarak çalıştırabileceği anlamına geliyor. Ayrıca modeli belirli amaçlar doğrultusunda eğitebileceğiniz ve ince ayar yapabileceğiniz anlamına da gelmekte. Son birkaç yıldır, Stable Diffusion, sanatsal portreler, tarihi portreler ve mimari renderlar dahil olmak üzere pek çok alanda kullanılıyor. Ayrıca Stability AI’ın Stable Diffusion modelleri Amazon Bedrock’a da gelmiş bulunmakta.
Aslına bakarsanız, Stability.ai bir süredir çeşitli zorluklarla karşı karşıya. Şirketin son modeli ve lisanslama koşulları ağır bir şekilde eleştirilirken, yazının başında da bahsettiğimiz üzere araştırma ekibinin çoğu yeni bir şirket kurmak üzere ayrıldı.
Tüm bunlar Stable Diffusion’ı tuhaf bir konuma soksa da; modellerinin sayısız ince ayarlı sürümü mevcut. Bu anlamda popülerliğiyle öne çıkan Stable Diffusion’ı kullanmanın en istikrarlı yolu NightCafe, Tensor.Art ya da Civitai gibi görüntü oluşturma araçları üzerinden erişmek. Aynı şekilde araca erişmenizi sağlayacak pek çok başka uygulama da mevcut. Bu platformların birçoğu size birkaç ücretsiz kredi de vermekte, böylece modelleri ödeme yapmadan önce deneyebilirsiniz. Yine de uyarmalıyız ki bu platformlardan bazıları daha büyük sosyal sitelerde rastlanılan türden bir içerik denetimine sahip değil. Bazı tuhaf ve müstehcen şeyler görme ihtimaliniz mevcut. Tüm bunlardan kaçınmak veya tam kontrole sahip olmak istiyorsanız Stable Diffusion’ı indirebilir ve yerel olarak çalıştırabilirsiniz.
Görsel Kaynak: Dall-E