Sitemize üye olarak beğendiğiniz içerikleri favorilerinize ekleyebilir, kendi ürettiğiniz ya da internet üzerinde beğendiğiniz içerikleri sitemizin ziyaretçilerine içerik gönder seçeneği ile sunabilirsiniz.
Zaten bir üyeliğiniz mevcut mu ? Giriş yapın
Sitemize üye olarak beğendiğiniz içerikleri favorilerinize ekleyebilir, kendi ürettiğiniz ya da internet üzerinde beğendiğiniz içerikleri sitemizin ziyaretçilerine içerik gönder seçeneği ile sunabilirsiniz.
Üyelerimize Özel Tüm Opsiyonlardan Kayıt Olarak Faydalanabilirsiniz
L-MAGIC, ince ayar yapmadan önceden eğitilmiş difüzyon ve dil modellerini kullanıyor, böylece sıfır ayar performansı sağlıyor. Çıktı kalitesi, süper çözünürlük ve çok görünümlü birleştirme teknikleriyle daha da artırılıyor.
Mevcut yöntemlerin aksine, L-MAGIC dil modellerini, global sahne düzeni önbilgisi sağlamak için kullanıyor. Bu, yinelemeli veya eş zamanlı çok görünümlü dolgu yöntemlerinde karşılaşılan, tekrarlanan nesneler (örneğin, bir yatak odasındaki çoklu yataklar) ve her görünüm için gereken zaman alan insan metin girişleri sorunlarını çözüyor.
L-MAGIC‘in özü, 360 derece panoramik bir sahnenin birbirleriyle uyumlu görünümlerinin difüzyon tabanlı üretimidir. Dil modeli kılavuzluğunu dahil ederek, sistem, ilgili çalışmalara kıyasla daha iyi sahne düzenleri ve perspektif görünüm kalitesiyle panoramik sahneler üretebiliyor.
Koşullu difüzyon modelleriyle birleştirilerek, L-MAGIC, metin, derinlik haritaları, eskizler ve renkli betikler gibi çeşitli girdi modellerini kabul edebiliyor. Derinlik tahmininin uygulanması, 3B nokta bulutu oluşturma ve akıcı kamera hareketleriyle dinamik sahne keşfini de mümkün kılıyor.
Kapsamlı deneyler, oluşturulan panoramik sahnelerin, ilgili çalışmalara kıyasla daha iyi sahne düzenleri ve perspektif görünüm kalitesine sahip olduğunu, ayrıca insan değerlendirmelerinde %70’in üzerinde tercih edildiğini gösteriyor.
L-MAGIC, sanal turizm, film yapımı, oyun ve iç mimari gibi çeşitli endüstrilerde, çeşitli girdi modellerinden yola çıkarak, kapsayıcı ve uyumlu panoramik sahnelerin oluşturulmasını sağlayarak devrim yaratma potansiyeline sahip.
L-MAGIC makalesi, Zhipeng Cai, Matthias Müller, Reiner Birkl, Diana Wofk, Shao-Yen Tseng, JunDa Cheng, Gabriela Ben-Melech Stan, Vasudev Lal ve Michael Paulitsch’ten oluşan Intel Labs araştırmacıları tarafından kaleme alındı. Bu çalışma, 2024 yılında IEEE/CVF Bilgisayarlı Görü ve Örüntü Tanıma Konferansı’nda (CVPR) sunuldu.