گوگل از یک مدل هوش مصنوعی جدید به نام Inksight رونمایی کرد. این شرکت آن را «ابزاری برای تبدیل نوشتار دست‌نویس آفلاین به نسخه دیجیتال» معرفی می‌کند. به عبارت ساده‌تر، این مدل قادر است با استفاده از هوش مصنوعی، حروف موجود در یک عکس از متن دست‌نویس را استخراج کرده و به متن قابل ویرایش تبدیل کند. این فرایند جایگزینی کارآمد برای روش‌های سنتی اسکن نوری همچون OCR محسوب می‌شود.

تیم تحقیقات گوگل این مدل را به نحوی آموزش داده‌اند که بتواند کلمات دست‌نویس را با دقت بالایی شناسایی و تفسیر کند. سپس، با بهره‌گیری از الگوریتم‌های تولید متن دست‌نویس، خروجی را به صورت متنی با همان سبک نوشتاری اولیه ارائه دهد.

توسعه‌دهندگان این مدل مدعی‌اند که Inksight قادر است در شرایط نوری نامناسب و تصاویر با کیفیت پایین نیز عمل کرده و نتایج قابل قبولی ارائه دهد. یکی از ویژگی‌های جذاب و کاربردی این ابزار، امکان حفظ سبک نوشتاری دست‌نویس در نسخه دیجیتال است.

به عنوان مثال، کاربر می‌تواند یک یادداشت دست‌نویس را به مدل داده و پس از تبدیل آن به متن قابل ویرایش، تغییرات مورد نظر را اعمال کرده و در نهایت، نسخه نهایی را با همان سبک دست‌نویس اولیه دریافت کند.

هوش مصنوعی گوگل Inksight

حاصل این تلاش‌ها، ایجاد یک بایگانی دیجیتال از یادداشت‌های دست‌نویس است. این بایگانی امکان ویرایش آزادانه یادداشت‌ها را فراهم می‌کند، در حالی که ویژگی‌های اصلی دست‌نوشته به صورت دیجیتال حفظ می‌شود. این همانند داشتن یک نسخه پشتیبان دائمی و غیرقابل تخریب از یادداشت‌های شخصی است. نسخه‌ای که به سادگی در دسترس بوده و می‌توان آن را در فضای ابری یا رایانه شخصی ذخیره کرد.

علاقه شدید دانشگاهیان و پژوهشگران به این فناوری نوین، امری طبیعی است. این گروه‌ها سال‌هاست در تلاشند تا فناوری‌های OCR و اسکن را با نیاز به یادداشت‌برداری سریع و دقیق تطبیق دهند.

اهمیت این فناوری برای کارمندان میدانی که به تجهیزات تخصصی دسترسی ندارند، دوچندان است. تصور کنید باستان‌شناسان در حین کاوش، بیمه‌گران در هنگام ارزیابی خسارت و یا سایر کارمندان میدانی در شرایط مشابه، مجبورند یادداشت‌های خود را به صورت دستی و روی کاغذ ثبت کنند. این روش نه تنها منجر به پراکندگی یادداشت‌ها می‌شود، بلکه خطای انسانی در فرایند ثبت اطلاعات را نیز افزایش می‌دهد.

هوش مصنوعی گوگل Inksight هنوز در مراحل ابتدایی تحقیق قرار دارد؛ با این حال، نتایج بدست آمده تا کنون نویدبخش آینده‌ای روشن هستند. گوگل با انجام آزمایش‌های متعدد بر روی سه مدل مختلف از این فناوری، به نتایج قابل توجهی دست یافته‌اند. بر اساس این آزمایش‌ها، مدل‌های جدید در 87 درصد موارد توانسته‌اند نتایج دقیق یا تقریبا دقیقی را ارائه دهند.

زمان دقیق در دسترس قرار گرفتن این فناوری برای عموم مردم هنوز مشخص نیست. اما می‌توان پیش‌بینی کرد که افراد بسیاری، به ویژه کسانی که با خواندن دست‌نوشته‌های نامفهوم دست و پنجه نرم می‌کنند، از ورود این فناوری به بازار استقبال گرمی خواهند کرد.

source
کلاس یوس

توسط petese.ir