گوگل از یک مدل هوش مصنوعی جدید به نام Inksight رونمایی کرد. این شرکت آن را «ابزاری برای تبدیل نوشتار دستنویس آفلاین به نسخه دیجیتال» معرفی میکند. به عبارت سادهتر، این مدل قادر است با استفاده از هوش مصنوعی، حروف موجود در یک عکس از متن دستنویس را استخراج کرده و به متن قابل ویرایش تبدیل کند. این فرایند جایگزینی کارآمد برای روشهای سنتی اسکن نوری همچون OCR محسوب میشود.
تیم تحقیقات گوگل این مدل را به نحوی آموزش دادهاند که بتواند کلمات دستنویس را با دقت بالایی شناسایی و تفسیر کند. سپس، با بهرهگیری از الگوریتمهای تولید متن دستنویس، خروجی را به صورت متنی با همان سبک نوشتاری اولیه ارائه دهد.
توسعهدهندگان این مدل مدعیاند که Inksight قادر است در شرایط نوری نامناسب و تصاویر با کیفیت پایین نیز عمل کرده و نتایج قابل قبولی ارائه دهد. یکی از ویژگیهای جذاب و کاربردی این ابزار، امکان حفظ سبک نوشتاری دستنویس در نسخه دیجیتال است.
به عنوان مثال، کاربر میتواند یک یادداشت دستنویس را به مدل داده و پس از تبدیل آن به متن قابل ویرایش، تغییرات مورد نظر را اعمال کرده و در نهایت، نسخه نهایی را با همان سبک دستنویس اولیه دریافت کند.
حاصل این تلاشها، ایجاد یک بایگانی دیجیتال از یادداشتهای دستنویس است. این بایگانی امکان ویرایش آزادانه یادداشتها را فراهم میکند، در حالی که ویژگیهای اصلی دستنوشته به صورت دیجیتال حفظ میشود. این همانند داشتن یک نسخه پشتیبان دائمی و غیرقابل تخریب از یادداشتهای شخصی است. نسخهای که به سادگی در دسترس بوده و میتوان آن را در فضای ابری یا رایانه شخصی ذخیره کرد.
علاقه شدید دانشگاهیان و پژوهشگران به این فناوری نوین، امری طبیعی است. این گروهها سالهاست در تلاشند تا فناوریهای OCR و اسکن را با نیاز به یادداشتبرداری سریع و دقیق تطبیق دهند.
اهمیت این فناوری برای کارمندان میدانی که به تجهیزات تخصصی دسترسی ندارند، دوچندان است. تصور کنید باستانشناسان در حین کاوش، بیمهگران در هنگام ارزیابی خسارت و یا سایر کارمندان میدانی در شرایط مشابه، مجبورند یادداشتهای خود را به صورت دستی و روی کاغذ ثبت کنند. این روش نه تنها منجر به پراکندگی یادداشتها میشود، بلکه خطای انسانی در فرایند ثبت اطلاعات را نیز افزایش میدهد.
هوش مصنوعی گوگل Inksight هنوز در مراحل ابتدایی تحقیق قرار دارد؛ با این حال، نتایج بدست آمده تا کنون نویدبخش آیندهای روشن هستند. گوگل با انجام آزمایشهای متعدد بر روی سه مدل مختلف از این فناوری، به نتایج قابل توجهی دست یافتهاند. بر اساس این آزمایشها، مدلهای جدید در 87 درصد موارد توانستهاند نتایج دقیق یا تقریبا دقیقی را ارائه دهند.
زمان دقیق در دسترس قرار گرفتن این فناوری برای عموم مردم هنوز مشخص نیست. اما میتوان پیشبینی کرد که افراد بسیاری، به ویژه کسانی که با خواندن دستنوشتههای نامفهوم دست و پنجه نرم میکنند، از ورود این فناوری به بازار استقبال گرمی خواهند کرد.
source
کلاس یوس