هوش مصنوعی مایکروسافت ظرف سه ثانیه صدای شما را تقلید میکند

مایکروسافت از یک هوش مصنوعی شبیهساز صدا رونمایی کرده که قادر است صدای افراد را پس از فقط سه ثانیه گوش دادن به صحبت کردن آنها، عینا تقلید کند.
VALL-E با استفاده از شش هزار ساعت سخنرانی انگلیسی از هفت هزار سخنران مختلف آموزش داده شد تا طرز حرف زدن شخصیسازی شده با کیفیت بالا از هر گوینده را بازآفرینی کند.
هنگامی که این دستگاه هوشمصنوعی، صدای ضبطشده فردی را در اختیار داشته باشد، قادر است صدای او را جوری بازسازی کند که گویی آن شخص در حال گفتن هر چیزی است. این سیستم حتی میتواند لحن احساسی و محیط پژواکشناختی گوینده اصلی را تقلید کند.
از جمله کاربردهای بالقوه آن، خواندن کامل کتابهای صوتی از تنها یک نمونه ضبطشده [صدای] نویسندگان، ویدیوهایی با صداگذاری به زبان طبیعی، و پرکردن صدا برای بازیگر فیلم در صورت خراب شدن ضبط اصلی است.
نرم افزار وال-ای که برای تولید صدای ساختگی استفاده میشود، در حال حاضر برای استفاده عموم در دسترس نیست، و مایکروسافت به خطرات احتمالی در استفاده نادرست از این ابزار، از جمله جعل شناسایی صدا یا جعل هویت یک گوینده خاصاشاره کرده است.