مایکروسافت یک ربات هوش مصنوعی تبدیل متن به صدا توسعه داده است که تنها با شنیدن سه ثانیه از صدای یک شخص به خوبی می تواند آن را تقلید کند.
ربات WALL-E مربوط به جدیدترین پژوهش مایکروسافت تعلق دارد که می تواند به خوبی شبیه سازی صدای افراد را از یک فایل صوتی سه ثانیه ای انجام دهد.
مدل چشمگیر جدید مایکروسافت به گونه ای طراحی شده است که می تواند با شنیدن تنها چند ثانیه از یک صدا، آن را تقلید کرده و مانند آن صحبت کند. حتی میتواند هر صدایی که صحبتی که کاربر دوست دارد انجام دهد.
مایکروسافت می گوید در آینده می توان از این ربات برای برنامه های سفارشی و یا پیشرفته استفاده کرد البته خطر سواستفاده از آن نیز وجود دارد. این ربات که توسط مایکروسافت با نام مدل زبان عصبی کدک نام گرفته است از شبکه فشرده سازی عصبی متعلق به متا استفاده کرده است.
البته خروجی های مربوط به این ربات در برخی مواقع بسیار واقعی و در برخی دیگر نیز به صدای ماشینی شباهت دارد. مایکروسافت قصد دارد در آینده با بهبود این ربات، در عملکرد آن از نظر قواعد زبانی و سبک گفتاری نیز بهبودهایی ایجاد کند.