Güle güle Midjourney
Black Forest Labs, çok kısa bir süre önce üç FLUX.1 metinden görüntüye modelini piyasaya sürdü: üst düzey bir ticari “pro” sürümü, ticari olmayan kullanım için açık ağırlıklara sahip orta sınıf bir “dev” sürümü ve daha hızlı olan açık “schnell” sürümü. Firma, kendi modellerinin görüntü kalitesi ve metin komutlarına bağlılık gibi alanlarda Midjourney ve DALL-E gibi rakiplerinden daha iyi olduğunu söylüyor. Bu arada daha önceki benzer haberlerimizde olduğu gibi, haber içindeki tüm görseller ilgili yapay zekaya ait.
Açıkçası everart.ai (bunun yerine Fal ve Replicate de kullanabilirsiniz) üzerinden yaptığım denemelerde firmanın bu söyleminin boş olmadığını anladım. FLUX.1, görsel kalite açısından Midjourney 6’ya çok yakın ve bazen daha iyi. İstemlerdeki doğruluk da DALL-E 3 kadar iyi ve tam olarak ne isteniyorsa onu verebiliyor.
FLUX.1 modelleri, şirketin transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen “hibrit mimari” olarak adlandırdığı bir mimari kullanıyor. FLUX.1 modelleri ayrıca diğer çoğu yapay zeka modelinin zayıf kaldığı insan eli konusunda muazzam işler çıkarıyor. İlk başlarda tüm yapay zekalar insan eli üretiminde sınıfta kalıyordu ancak günümüzde Midjourney gibi araçlar insan elinde ustalaşmış durumda. FLUX.1 ise açık bir model olduğu için insan elindeki ustalığı biraz daha fazla önem arz ediyor.
Sırada Sora rakibi SOTA var