ٹیکنالوجی کمپنی مائیکروسافٹ ریسرچ ایشیا میں مصنوعی ذہانت کے محققین کی ایک ٹیم نے ایک ایسی مصنوعی ذہانت کی ایپلی کیشن تیار کی ہے جو کسی بھی انسان اور آڈیو ٹریکس کی ساکت تصاویر کو حرکت پذیری میں تبدیل کرسکتی ہے۔
مصنوع ذہانت (اے آئی) کی اس ایپلی کیشن کا استعمال کرتے ہوئے محققین نے باقاعدہ تصاویر کو لوگوں کے چہرے کے اصل تاثرات کے ساتھ آڈیو ٹریکس کے ساتھ بولتے یا گاتے ہوئے دکھایا ہے۔ یہ اپیلی کیشن کسی بھی ساکت تصویر کو ایسی مہارت سے حرکت دیتی ہے کہ سب اصل لگنے لگتا ہے، اسے بصری دُنیا میں انقلابی ایپلی کیشن بھی کہا جا رہا ہے۔
یہ مائیکروسافٹ ایپلی کیشن جسے واسا -1 کا نام دیا گیا ہے، کے ذریعے ایک ساکت تصویر اور آڈیو تقریر کے کلپ سے پرکشش بصری اور جذباتی مہارتوں (وی اے ایس) کے ساتھ ورچوئل معیار کی تصویر کو حرکت کرتے ہوئے، بولتے ہوئے اور گاتے ہوئے دکھایا گیا ہے۔
محققین نے فریم ورک کی وضاحت کرتے ہوئے ایک مقالے میں لکھا ہے کہ ’ ہمارا پریمیئر ماڈل، واسا -1 ، نہ صرف آڈیو ٹریک کے مطابق ہونٹوں کو حرکت دینے کی صلاحیت رکھتا ہے بلکہ چہرے کی باریکیوں اور قدرتی سُر یعنی آواز کو ٹریک کر کے ایک بڑے اسپیکٹرم کو بھی پکڑتا ہے، یہ بالکل حقیقت کے احساس میں کردار ادا کرتا ہے۔
مائیکروسافٹ کا واسا -1 کیسے کام کرتا ہے؟
ٹیم کے مطابق بنیادی ڈیزائن میں چہرے کی مجموعی حرکات اور سر کی جنبش کا ماڈل شامل ہے جو چہرے ویڈیوز کا استعمال کرتے ہوئے ایک واضح چہرے کے طور پر کام کرتا ہے۔
محققین نے کہا ہے کہ ’ہمارا طریقہ نہ صرف حقیقت پسندانہ چہرے اور سر کی حرکات کے ساتھ اعلیٰ ویڈیو معیار فراہم کرتا ہے بلکہ 40 ایف پی ایس تک 512×512 ویڈیوز کی آن لائن جنریشن کی بھی مہارت رکھتا ہے۔