بحث باسم الموضوع المطلوب

تعمل شركة Apple على تطوير أداة ذكاء اصطناعي تعمل على تحريك الصور مع أوصاف نصية

 




كشف الباحثون في شركة Apple النقاب عن Keyframer، وهو نموذج أولي لأداة الرسوم المتحركة المدعومة بالذكاء الاصطناعي والتي تتيح للمستخدمين إضافة حركة إلى الصور ثنائية الأبعاد من خلال وصف كيفية تحريكها.


يستخدم Keyframer قوة نماذج اللغة الكبيرة لتحريك الصور الثابتة باستخدام مطالبات اللغة الطبيعية.


وقالت الشركة في ورقة بحثية إن نماذج اللغات الكبيرة لم يتم استكشافها بشكل كافٍ في الرسوم المتحركة، على الرغم من أنها أظهرت إمكانات كبيرة عبر الوسائط الإبداعية الأخرى، مثل الكتابة وتوليد الصور.


تقدم Apple أداة Keyframer، وهي أداة تعمل مع نماذج لغوية كبيرة، كمثال على كيفية استخدام هذه التكنولوجيا.


يستطيع Keyframer التقاط ملفات SVG بتنسيق يمكن تغيير حجمه وبدون جودة وإنشاء تعليمات برمجية CSS لتحريك الصورة بناءً على مطالبة نصية، باستخدام نموذج اللغة الكبير GPT4 الخاص بـ OpenAI كنموذج أساسي.


يحتاج المستخدم إلى تحميل الصورة، وكتابة رسالة نصية، ثم الضغط على زر "إنشاء".


توضح الأمثلة الواردة في الورقة البحثية كيف يمكن لصورة زحل أن تنتقل بين ألوان الخلفية، أو تظهر النجوم وتتلاشى.


يمكن للمستخدمين إنتاج تصميمات رسوم متحركة متعددة في وقت واحد، وضبط الخصائص، مثل الألوان ومدة الرسوم المتحركة، في نافذة منفصلة.


ليست هناك حاجة إلى خبرة في البرمجة، حيث يقوم Keyframer تلقائيًا بتحويل هذه التغييرات إلى CSS، على الرغم من أن الكود نفسه قابل للتحرير بالكامل.


يعد هذا النهج القائم على الوصف بسيطًا مقارنة بالأشكال الأخرى للرسوم المتحركة التي ينشئها الذكاء الاصطناعي، والتي تتطلب عادةً العديد من التطبيقات المختلفة وبعض الخبرة في البرمجة.


Keyframer ليس متاحًا للعامة بعد، وقد شملت دراسة المستخدم المضمنة في ورقة بحث Apple 13 شخصًا فقط يمكنهم استخدام صورتين بسيطتين محددتين مسبقًا بصيغة SVG عند تجربة الأداة.


حرصت Apple على ذكر القيود في الورقة، مع تحديد أن Keyframer يركز على الرسوم المتحركة المستندة إلى الويب، مثل تسلسلات التحميل، وتصور البيانات، والانتقالات المتحركة.


في المقابل، فإن نوع الرسوم المتحركة الذي تراه في الأفلام وألعاب الفيديو معقد للغاية ولا يمكن، على الأقل حاليًا، إنتاجه باستخدام الأوصاف وحدها.


يعد Keyframer واحدًا من العديد من ابتكارات الذكاء الاصطناعي التي أعلنت عنها شركة Apple في الأشهر الأخيرة.


في شهر ديسمبر، طرحت شركة Apple أداة HUGS، وهي أداة يمكنها إنشاء صور رمزية بشرية جاهزة للرسوم المتحركة من مقاطع الفيديو.


في الأسبوع الماضي، أصدرت شركة Apple نموذج MGIE، وهو نموذج جديد للذكاء الاصطناعي يمكنه تحرير الصور باستخدام أوصاف النص.