گوگل در حال بهبود قابلیت تبدیل متن به گفتار هوش مصنوعی Gemini است. این شرکت، در جریان کنفرانس I/O از قابلیت جدید این سیستم رونمایی کرد که در نسخه‌ جدید می‌تواند با استفاده از خروجی صدای محلی به روش‌ بیانگرانه‌تری نسبت به پیش صحبت کند.

در جریان این کنفرانس، مسئول ارشد هوش مصنوعی Gemini، خانم Tulsee Doshi، با استفاده از یک دمو، قابلیت‌های جدید ابزار تبدیل متن به گفتار Gemini نسخه‌ی ۲.۵ را به نمایش گذاشت. این ویژگی از صدای تولید شده با هوش مصنوعی رونمایی کرد که می‌تواند بسیار طبیعی‌تر و با با ظرافت‌ها و پیچیدگی‌های عمیق‌تری صحبت کند؛ به طوری که رباتیک بودن آن بسیار کم‌تر از قبل نمایان می‌شود.

گوگل در ابزار تبدیل متن به گفتارِ جدید خود، می‌تواند در لحظه زبان مورد نظر را تغییر دهد - دیجینوی

این ابزار می‌تواند به ۲۴ زبان صحبت کند و جابجایی در بین آن‌ها بسیار سریع و بدون زحمت اتفاق می‌افتد. این دموی نمایش داده شده با زبان انگلیسی آغاز شد، پس از آن به زبان هندی تغییر کرد و در نهایت با برگشت به زبان انگلیسی پایان یافت. تمامی این مکالمه از یک صدای یکسان استفاده کرد که به ساختِ تصور صحبت کردن یک فرد واقعی بسیار کمک می‌کند. این ابزار، همچنین قابلیت استفاده از صدای زمزمه کردن را نیز دارد که البته تا این لحظه مقداری عجیب به‌نظر می‌رسد.

قابلیت جدید تبدیل متن به گفتار Gemini از همین امروز در دسترس است. همچنین این هوش مصنوعی در بروزرسانی جدید، یک نسخه‌ی پیش نمایش از گفتگوی صوتی بومی، ارائه می‌دهد.

source
کلاس یوس

توسط petese.ir