المستخدمون يسمونه «قاتل الفوتوشوب»، نموذج جوجل الجديد للصور يجتاح الإنترنت

⬤ أطلقت جوجل نموذج ذكاء اصطناعي صور جديد انتشر بسرعة دعت البعض لوصفه «قاتل الفوتوشوب».

⬤ يستطيع النموذج توليد صور من أوامر بسيطة، وإجراء تعديلات معقدة بمجرد وصفها فقط.

⬤ تمتد قدرات النموذج لدمج الصور واستخراج نماذج ثلاثية الأبعاد، وحتى استبدال الوجوه في الفيديو.

مع التحديثات المستمرة التي تتلقاها أدوات الذكاء الاصطناعي لتحسين قدراتها التوليدية، لم يعد من السهل تحقيق الحماس لكل نموذج جديد يتم إصداره، فالأدوات الموجودة اليوم مثيرة للإعجاب كفاية ليكون من الصعب التفوق عليها. لكن يبدو أن إصدار نموذج جوجل الجديد الذي يحمل اسم Gemini 2.5 Flash، والمعروف أيضاً باسم nano banana، أثار ضجة كبيرة على الإنترنت. فقد أظهر هذا النموذج قدرات تحرير وتوليد صور وفيديو مذهلة دفعت البعض لوصفه بأنه قاتل الفوتوشوب حتى.

يستطيع النموذج الجديد تحويل صورتين ثابتتين لشخصيات مرسومة إلى شخصيات مرجعية، ومن ثم استخدام رسمين بسيطين كمدخلات لإنتاج مشهد أنمي كامل يطابق الشخصيات والحركة المطلوبة، وهو أمر مذهل دون شك بالنظر إلى أن هذا النوع من العمليات عادة ما يحتاج لوقت طويل لإنجازه يدوياً. وبشكل مذهل أكثر ربما، يمكن استخدام الأسلوب نفسه لصناعة مشهد فيديو من الرسوم المتحركة.

مواضيع مشابهة

في مثال آخر يُظهر النموذج قدرة استثنائية على تحويل صور مبانِ حقيقية في باريس إلى مجسمات إيزومترية صغيرة يمكن استخدامها في الألعاب وذلك بمجرد سحب الصور وإفلاتها.

في الواقع تعد الألعاب مجال تطوير كبير محتمل للنموذج، حيث إنه قادر على إزالة عناصر من الصور وتحويلها إلى نماذج ثلاثية الأبعاد. كما يتيح دمج عدة صور مختلفة بسلاسة في صورة واحدة، مثل مثال دمج 13 عنصراً في صورة واحدة. ويمكن كذلك إنشاء الشخصيات، وإضافة العناصر، وصناعة المشاهد عبر الأوامر النصية فقط.

على مستوى أبسط، لكنه عادة ما يكون شديد الصعوبة لأدوات الذكاء الاصطناعي، يستطيع النموذج أيضاً التعامل مع تعديلات معقدة من دون إفساد الصور، مثل تغيير لون منزل مع المحافظة على انعكاسه في الماء، أو إعادة تصميم الملابس على الصور لتجربة شكلها قبل الشراء. كما يتيح استبدال الوجوه بدقة (وهو ما قد يكون مقلقاً بشدة في مجال التزييف العميق)، واستعادة الصور القديمة وتحديثها بشكل عصري. حتى في السيناريوهات المعقدة، مثل تكرار الصور داخل صور أخرى، يحافظ النظام على جودة المشهد من دون تشويه.

حالياً، يتوفر nano banana مجاناً للمستخدمين عبر تطبيق Gemini على الويب والهواتف المحمولة، بينما يمكن للمطورين الوصول إليه من خلال Gemini API وGoogle AI Studio ومنصة Vertex AI.

شارك المحتوى |
close icon