حوّل صورة ثابتة واحدة إلى فيديو واقعي باستخدام تكنولوجيا الذكاء الاصطناعي من Google Gemini ، مع حركة طبيعية، وصوت، وتفاصيل عاطفية دقيقة.
مصدر الصورة:
freepik
شهد مجال تحويل الصور إلى فيديوهات تطورًا
ملحوظًا في السنوات الأخيرة، ويأتي نموذج
Veo 3 — ضمن منظومة
Gemini من
Google — ليؤسس لمرحلة جديدة في هذا
المسار. تم تطوير الأداة لتحويل صورة واحدة ثابتة إلى مشهد مرئي متكامل مدته 8
ثوانٍ، يتضمن حركة واقعية، وعمق بصري، وصوت ناتج عن الذكاء الاصطناعي، ما يمنح
الصور حياة جديدة تحاكي السرد السينمائي الحقيقي.
على عكس الأدوات التقليدية التي تعتمد على
قوالب حركة مسبقة، يستخدم Veo 3 نماذج توليدية تفسر عناصر الصورة وتحاكي الحركة المحتملة
فيها. ويقوم النظام بقراءة التفاصيل الدقيقة مثل البيئة، والإضاءة، وعناصر المشهد،
ثم يُركّب تسلسلًا حركيًّا منطقيًّا بناءً على هذه المعلومات. وتشمل هذه العملية:
يتم تنفيذ كل هذه الخطوات خلال ثوانٍ، مما
يجعل الأداة مثالية للاستخدامات الإبداعية والتجريبية.
عند إدخال وصف نصي لطائر بومة وغرير في غابة مضيئة بضوء القمر، أنشأ Veo 3 مقطع فيديو قصير يظهر فيه الطائر يطير ويتفاعل، ويغادر المشهد — وكل ذلك تم توليده من صورة واحدة فقط. تضمن الفيديو مؤثرات صوتية واقعية مثل حفيف الأوراق وموسيقى هادئة وحوار منطوق، ما يؤكد قدرة النموذج على تحويل الفكرة إلى تجربة بصرية متكاملة دون الحاجة إلى أدوات تصوير تقليدية.
رغم القدرات المتقدمة، تثير هذه التقنية
تساؤلات تتعلق باستخدام البيانات، والمصداقية، وحقوق الملكية الفكرية. نظرًا لأن
المشاهد المنتجة قد تبدو حقيقية، فمن الضروري استخدام هذه التقنية بشكل أخلاقي،
والتأكيد على توضيح أنها ناتجة عن الذكاء الاصطناعي عند عرضها للجمهور.
بالإضافة إلى ذلك، فإن جودة النتائج تعتمد
بشكل كبير على وضوح الصورة الأصلية ودقة الأوامر النصية المقدمة.
يرجى الاشتراك للحصول على وصول غير محدود إلى ابتكاراتنا.