هذه الصورة ستكون الإطار الأول لفيديوك
0 / 5000
ينشئ فيديو مع صوت AI (قد يتم تعطيل الصوت للمحتوى الحساس)
مولد فيديو بالذكاء الاصطناعي Veo 3.1
يمنحك GeminiPro وصولًا مباشرًا إلى Veo 3.1، نموذج الفيديو السينمائي من Google DeepMind. يمكنك توليد فيديوهات مدتها 8 ثوانٍ مع حوار ومؤثرات صوتية وصوت محيطي مولّد أصلاً في تمريرة واحدة. ويضيف Veo 3.1 وضع 9:16 العمودي وتمديد الفيديو والتحكم في أول وآخر إطار وإدخال صور مرجعية متعددة، من دون الحاجة إلى خبرة في تحرير الفيديو.
ما هو Veo 3؟ نموذج الفيديو السينمائي من Google DeepMind
Veo 3 هو نموذج الجيل الثالث من Google DeepMind لتوليد الفيديو بالذكاء الاصطناعي. وعلى عكس معظم الأدوات التي تحتاج إلى إضافة الصوت لاحقًا، يركّب Veo 3 الفيديو والصوت معًا، فيولد الحوار والصوت المحيطي والموسيقى متزامنة مع الصورة. ويتميز خصوصًا بالحركة الدقيقة فيزيائيًا، من ديناميكيات السوائل إلى حركة الشخصيات.
حتى 8 ثوانٍ
أقصى مدة للفيديو
صوت AI أصلي
توليد الصوت
حتى 4K
أقصى دقة
ما الجديد في Veo 3.1
يضيف Veo 3.1 خمس قدرات رئيسية توسّع التحكم الإبداعي مقارنة بالإصدار الأصلي من Veo 3.
الوضع العمودي (9:16)
إخراج عمودي مخصص لـ TikTok وInstagram Reels وYouTube Shorts من دون الحاجة إلى قص لاحق.
تمديد الفيديو
يمكنك متابعة مقطع مولد مسبقًا بسلاسة مع الحفاظ على الأسلوب البصري والشخصية وسياق المشهد.
التحكم في أول وآخر إطار
يتيح لك تحديد الإطار الافتتاحي والإطار الختامي للمشهد، ثم يولد Veo 3.1 تسلسلًا مترابطًا بينهما.
إدخال متعدد للصور المرجعية
ارفع عدة صور لتوجيه مظهر الشخصية أو تكوين المشهد أو الأسلوب البصري للنتيجة.
تحسين اتساق الموضوع
تحافظ الشخصيات والعناصر على مظهرها بشكل أفضل على امتداد الفيديو كاملًا، مع تقليل الانحراف بين الإطارات.
Veo 3 مقابل Kling: أي مولد فيديو بالذكاء الاصطناعي يناسبك أكثر؟
كلاهما من أبرز منصات الفيديو بالذكاء الاصطناعي في 2026. إليك مقارنة مباشرة عبر أهم الأبعاد العملية.
| Veo 3.1أفضل جودة سينمائية | Kling 2.6 | Kling 3.0 | |
|---|---|---|---|
| المطور | Google DeepMind | Kuaishou | Kuaishou |
| المدة القصوى | حتى 8 ثوانٍ | 5 إلى 10 ثوانٍ | 3 إلى 15 ثانية |
| الصوت الأصلي | نعم - حوار ومؤثرات وموسيقى | محدود | محدود |
| أقصى دقة | حتى 4K | حتى 1080p | حتى 1080p |
| عمودي 9:16 | نعم | نعم | نعم |
| متعدد اللقطات | — | — | نعم |
| التحكم بالكاميرا | قياسي | جيد | متقدم |
| مرجعية الصور | متعدد الصور | صورة واحدة | متعدد الصور |
| تمديد الفيديو | نعم | — | — |
| الأنسب لـ | جودة سينمائية وسرد بصوت AI | الحركة واللقطات الأطول | السرد متعدد اللقطات والتحكم المتقدم بالكاميرا |
اختر Veo 3.1 إذا كانت الأولوية للجودة السينمائية والسرد المدفوع بصوت AI. واختر Kling إذا كنت تحتاج إلى لقطات أطول وتسلسلات متعددة ومزيد من التحكم بالكاميرا.
نماذج الفيديو بالذكاء الاصطناعي المتاحة على GeminiPro
أنشئ باستخدام Google Veo 3.1 أو Kuaishou Kling، إذ جرى تحسين كل نموذج لاحتياجات إبداعية وإنتاجية مختلفة.
Veo 3.1
Google DeepMind · أفضل جودة سينمائية
النموذج السينمائي الرائد من Google. يولد مقاطع HD مدتها 8 ثوانٍ مع صوت مولد أصلًا يشمل الحوار والمؤثرات الصوتية والموسيقى في تمريرة واحدة.
Veo 3.1 Fast
Google DeepMind · توليد أسرع
النسخة المحسنة للسرعة من Veo 3.1. تحتفظ بالأساس السينمائي للنموذج مع زمن توليد أسرع، ما يجعلها مناسبة للاختبار السريع والتكرار المكثف.
Kling 2.6
Kuaishou · لقطات أطول وحركة أقوى
نموذج Kling المجرب الذي يقدم مقاطع تصل إلى 10 ثوانٍ مع جودة حركة ممتازة واتساق جيد للموضوع، مع إمكانية توليد صوت AI اختياري.
Kling 3.0
Kuaishou · متعدد اللقطات وكاميرا متقدمة
أقوى إصدارات Kling، مع تركيب متعدد اللقطات وتوليد يصل إلى 15 ثانية وتحكم متقدم بالكاميرا ودعم @Elements للشخصيات المرجعية.
Wan 2.6
Alibaba · جودة حركة طبيعية
يتخصص Wan 2.6 في توليد حركة طبيعية وسلسة، مع دعم قوي لكل من text-to-video وimage-to-video بدقات 720p و1080p.
Seedance 2
ByteDance · توليد متزامن للصوت والفيديو
النموذج المشترك من ByteDance يولد الصوت والفيديو معًا في تمريرة واحدة، محافظًا على تزامن الحوار والموسيقى والمؤثرات من أول إخراج. يدعم حتى 15 ثانية ودقة 2K ومزامنة شفاه بأكثر من 8 لغات.
ماذا يمكنك أن تنشئ باستخدام Veo 3.1؟
من الأفلام القصيرة السينمائية إلى محتوى وسائل التواصل، تفتح جودة Veo 3.1 وصوته الأصلي أبوابًا كانت تتطلب سابقًا فرق إنتاج كاملة.
الأفلام والسرد السينمائي
أفلام قصيرة، عروض مفاهيمية، سرد بصري
أنشئ أفلامًا قصيرة وسردًا بصريًا ومشاهد سينمائية مع حركة واقعية وصوت محيطي تلقائي وأجواء أكثر إقناعًا.
فيديوهات العلامة التجارية والتسويق
فيديوهات المنتجات، حملات العلامة، مواد إعلانية
أنتج عروض منتجات ومحتوى علامتك وإعلاناتك بجودة احترافية ووقت وتكلفة أقل من الإنتاج التقليدي.
محتوى قصير لوسائل التواصل
TikTok وInstagram Reels وYouTube Shorts
ولّد محتوى عموديًا 9:16 لـ TikTok وReels وShorts، وجرّب أكثر من اتجاه إبداعي قبل النشر.
المحتوى التعليمي والشرح
شروحات، دروس، سلاسل تعليمية
حوّل المفاهيم المعقدة إلى مرئيات توضيحية ومحتوى تعليمي بصوت ينسجم مع ما يظهر على الشاشة.
كيف تكتب برومبتات Veo 3: إطار من 3 طبقات
يفهم Veo 3 البرومبتات المنظمة على طبقات أفضل من الكلمات المفتاحية القصيرة. يساعدك هذا الإطار الثلاثي في الحصول على نتائج أكثر سينمائية وتحكمًا.
الطبقة 1 - المشهد
صِف الموضوع والبيئة والفعل بتفاصيل محددة. بدلًا من “شخص يمشي”، اكتب “امرأة ترتدي معطفًا أحمر تمشي في ساحة أوروبية مغطاة بالثلج عند الفجر”.
الطبقة 2 - الكاميرا
حدّد موضع الكاميرا (لقطة واسعة أو لقطة متوسطة أو منظور درون)، وحركتها (بان بطيء، ثابتة، تتبع)، ونوع الإضاءة (golden hour أو ضوء غائم منتشر أو إضاءة استوديو).
الطبقة 3 - الصوت
اشرح البيئة الصوتية المطلوبة: غابة هادئة، مقهى مزدحم، ضجيج مدينة، نبرة الحوار أو مؤثرات محددة. يستخدم Veo 3 هذه الإشارات لتوليد صوت متزامن.
مشهد سينمائي
افتتاحية فيلم قصير
“حارس منارة وحيد يقف على حافة جرف أثناء عاصفة، معطفه المبتل يتطاير مع الريح، لقطة منخفضة تنظر إليه من أسفل، أمواج متلاطمة في الخلفية، سماء رمادية، تتبع بطيء يقترب منه، وصوت المحيط والرعد البعيد”
إعلان علامة تجارية
فيديو إطلاق منتج
“ساعة ذكية سوداء مطفية على معصم داخل مكتب حديث بسيط، لقطة منتج قريبة مع دوران بطيء، إضاءة استوديو ناعمة ودرامية، موسيقى إلكترونية محيطية خفيفة، تركيز حاد، جودة تجارية 4K”
فيديو قصير للسوشيال
محتوى لـ TikTok / Reels
“باريستا يصب لاتيه آرت داخل مقهى دافئ ومشرق، لقطة متوسطة قريبة من خلف الكاونتر، ضوء صباحي ناعم من نوافذ كبيرة، بخار يتصاعد من الكوب، أصوات مقهى خافتة مع موسيقى جاز هادئة، صيغة عمودية 9:16”
وثائقي طبيعي
محتوى حياة برية أو طبيعة
“ثعلب أحمر يمشي بحذر داخل غابة ثلجية عند الغسق، لقطة واسعة منخفضة، ضوء ذهبي وردي يمر بين أشجار الصنوبر، يتوقف الثعلب وينظر إلى الكاميرا، أجواء غابة هادئة مع صوت الريح بين الأغصان، بان سينمائي بطيء يتبعه”
نصائح برومبت Veo 3
- •أضف حركة الكاميرا — يستجيب Veo 3 جيدًا لتعليمات الكاميرا الواضحة. عبارات مثل “لقطة تتبع” أو “اقتراب بطيء” أو “لقطة واسعة ثابتة” تساعد كثيرًا في تحسين اتساق النتيجة.
- •اذكر الإشارات الصوتية بوضوح — بما أن Veo 3 يولد الصوت أصلاً، فإن تسمية البيئة الصوتية مباشرة تعطيه إشارة أفضل: مثل “ضوضاء مرور في الخلفية” أو “موسيقى أوركسترالية ناعمة” أو “شخص يتحدث بهدوء”.
- •حدّد نوع الإضاءة، لا تكتفِ بوصفها بأنها جميلة — بدلًا من “إضاءة جميلة”، اذكر ما إذا كانت golden hour أو ضوءًا غائمًا منتشرًا أو إضاءة نيون خلفية أو إضاءة استوديو ثلاثية. هذا يساعد في الظلال والخامات والواقعية.
- •استخدم موضوعات وبيئات ملموسة — المشاهد المحددة والمرتكزة على الواقع تتفوق عادة على الأوصاف العامة أو المجردة. ذكر المواد والطقس والوقت ونوع المكان يثبت العالم الفيزيائي الذي يبنيه Veo 3.
كيفية استخدام مولد الفيديو بالذكاء الاصطناعي Veo 3 على GeminiPro
أنشئ أول فيديو سينمائي لك في ثلاث خطوات.
اكتب البرومبت
صِف المشهد وأسلوب الكاميرا والبيئة الصوتية باستخدام إطار الطبقات الثلاث. وفي image-to-video ارفع صورًا مرجعية لتوجيه مظهر الشخصية والأسلوب البصري.
اختر النموذج
اختر Veo 3.1 لأقصى جودة سينمائية، أو Veo 3.1 Fast لتكرار أسرع، أو Kling 2.6 / 3.0 إذا كنت تحتاج إلى مدة أطول أو تحكم أكبر بالكاميرا.
ولّد ثم نزّل
يُولد الفيديو بشكل غير متزامن، وستصلك إشعارات عند الجاهزية. بعد ذلك يمكنك تنزيله بجودة كاملة أو تمديده باستخدام ميزة تمديد الفيديو في Veo 3.1.
استكشف المزيد من أدوات الإبداع بالذكاء الاصطناعي على GeminiPro
من توليد الصور عبر Nano Banana إلى أفاتار AI وتحويل النص إلى كلام، يقدم GeminiPro مجموعة إبداعية متكاملة.
الأسئلة الشائعة حول Veo 3
أسئلة شائعة حول Google Veo 3 وVeo 3.1 على GeminiPro.
أنشئ أول فيديو Veo 3.1 اليوم
جرّب على GeminiPro أكثر نماذج الفيديو بالذكاء الاصطناعي سينمائية من Google: صوت AI أصلي، وحركة دقيقة فيزيائيًا، ووضع عمودي مخصص لمنصات الفيديو القصير، وكل ذلك من داخل المتصفح.