FLUX: Bu yapay zeka insan ellerini hatasız bir şekilde oluşturuyor

Yapay zeka görüntü oluşturucu araçlarda rekabet oldukça yüksek ve oyuna yeni birisi daha dahil oluyor: FLUX.1. Black Forest Labs adındaki Almanya merkezli bir girişim tarafından ortaya konan metinden görüntüye yapay zeka modeli FLUX.1, adından oldukça söz ettirecek gibi. Zira bu şirket Stable Diffusion‘ın arkasındaki teknolojiyi geliştiren ve Latent Diffusion tekniğini icat eden araştırmacılar tarafından kurulmuş durumda ve FLUX.1 daha başlangıç.

Güle güle Midjourney

Black Forest Labs, çok kısa bir süre önce üç FLUX.1 metinden görüntüye modelini piyasaya sürdü: üst düzey bir ticari “pro” sürümü, ticari olmayan kullanım için açık ağırlıklara sahip orta sınıf bir “dev” sürümü ve daha hızlı olan açık “schnell” sürümü. Firma, kendi modellerinin görüntü kalitesi ve metin komutlarına bağlılık gibi alanlarda Midjourney ve DALL-E gibi rakiplerinden daha iyi olduğunu söylüyor. Bu arada daha önceki benzer haberlerimizde olduğu gibi, haber içindeki tüm görseller ilgili yapay zekaya ait.

Açıkçası everart.ai (bunun yerine Fal ve Replicate de kullanabilirsiniz) üzerinden yaptığım denemelerde firmanın bu söyleminin boş olmadığını anladım. FLUX.1, görsel kalite açısından Midjourney 6’ya çok yakın ve bazen daha iyi. İstemlerdeki doğruluk da DALL-E 3 kadar iyi ve tam olarak ne isteniyorsa onu verebiliyor.

FLUX.1 modelleri, şirketin transformatör ve difüzyon tekniklerini birleştiren ve 12 milyar parametreye kadar ölçeklendirilen “hibrit mimari” olarak adlandırdığı bir mimari kullanıyor. FLUX.1 modelleri ayrıca diğer çoğu yapay zeka modelinin zayıf kaldığı insan eli konusunda muazzam işler çıkarıyor. İlk başlarda tüm yapay zekalar insan eli üretiminde sınıfta kalıyordu ancak günümüzde Midjourney gibi araçlar insan elinde ustalaşmış durumda. FLUX.1 ise açık bir model olduğu için insan elindeki ustalığı biraz daha fazla önem arz ediyor.

Sırada Sora rakibi SOTA var

Black Forest Labs, yapay zeka alanında yeni bir şirket olsa da firmanın adını gelecekte daha sık duyabiliriz. Pazara üst seviyeden hızlı bir giriş yapan şirket, yakında SOTA adında metinden videoya yapay zekasını tanıtacak. SOTA, günümüzün popüler yapay zekaları OpenAI Sora, Runway Gen3-Alpha veya KLING ile mücadele edecek. Aşağıdaki galeriden daha fazla FLUX.1 örneğine göz atabilirsiniz.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir