همه‌ی ما آن احساس شک خزنده را تجربه کرده‌ایم که مبادا نوشته‌ای که می‌خوانیم توسط هوش مصنوعی تولید شده باشد؛ اما تعیین قطعی این موضوع به‌طرز شگفت‌انگیزی دشوار است.

سال گذشته، بسیاری از افراد ادعا می‌کردند که واژه‌هایی مشخص، می‌توانند نشانه‌ی متن تولید شده توسط هوش مصنوعی باشند، اما شواهد این ادعا بسیار اندک هستند و با پیچیده‌تر شدن مدل‌های زبانی، ردگیری این کلمات به‌عنوان نشانه‌های قابل اتکا دشوارتر شده است.

با این حال، به نظر می‌رسد که اعضای Wikipedia در شناسایی نوشته تولید شده توسط هوش مصنوعی روشی بسیار دقیق پیدا کرده‌اند و راهنمای عمومی این گروه با عنوان Signs of AI writing بهترین منبع در این زمینه باشد.

از سال ۲۰۲۳، ویرایشگران Wikipedia تلاش کرده‌اند تا مدیریت بهتری بر نوشته‌های تولید شده توسط هوش مصنوعی داشته باشند؛ پروژه‌ای که آن را Project AI Cleanup نامیده‌اند. با وجود میلیون‌ها ویرایش در هر روز، حجم فراوانی از داده برای بررسی وجود دارد و مطابق سنت دیرینه‌ی ویرایشگران Wikipedia، خروجی این تلاش‌ها یک راهنمای عمومی بوده که هم غنی از جزئیات و هم متکی بر شواهد است.

در آغاز، این راهنما چیزی را تأیید می‌کند که پیش‌تر نیز می‌دانستیم: ابزارهای خودکار، در این حوزه تقریباً بی‌فایده‌اند. در عوض، تمرکز راهنما بر الگوهای نوشتاری و ساختارهایی است که در Wikipedia نادرند اما در گستره‌ی اینترنت فراوان دیده می‌شوند (و بنابراین در داده‌ی آموزشی مدل‌ها نیز رایج‌اند).

طبق این راهنما، متن‌های تولیدی هوش مصنوعی زمان زیادی را صرف برجسته‌سازی اهمیت یک موضوع، معمولاً با عباراتی کلی و مبهم می‌کنند. همچنین مدل‌های هوش مصنوعی بخش زیادی از متن را به توضیح جزئیات مربوط به حضورهای کم‌اهمیت در رسانه‌ها اختصاص می‌دهند تا موضوع را مهم‌تر و برجسته‌تر جلوه دهند؛ رویکردی که بیشتر از یک زندگی‌نامه‌ی شخصی انتظار می‌رود، نه از یک منبع مستقل.

راهنما به نکته‌ای بسیار جالب درباره‌ی ساختارهای پایانی جملات نیز اشاره می‌کند؛ جایی که مدل‌ها معمولاً ادعاهایی مبهم درباره‌ی موضوع مطرح می‌کنند. علاقه‌مندان دستور زبان این ساختار را وجه وصفی حال (Present Participle) می‌نامند. تشخیص این الگو کمی دشوار است، اما پس از شناختنش، در جای‌جای متون قابل مشاهده خواهد بود.

تمایل دیگری نیز از سوی مدل‌های هوش مصنوعی برای استفاده از زبان تبلیغاتی مبهم وجود دارد؛ زبانی که در سراسر اینترنت به‌شدت رایج است. این مدل‌ها، مناظر را همیشه زیبا، چشم‌اندازها را همواره نفس‌گیر و به‌طور کلی هر چیزی را تمیز و مدرن توصیف می‌کنند. همان‌طور که ویرایشگران ویکی‌پدیا می‌گویند، چنین نثری بیش از آن‌که شبیه نوشته‌ی دانشنامه‌ای باشد، تداعی‌کننده‌ی متن یک آگهی تلویزیونی است.

خواندن کامل این راهنما ارزشمند است. تا قبل از این، تصور می‌شد که سبک نثر مدل‌های زبانی آن‌قدر سریع تحول می‌یابد که نمی‌توان ویژگی‌های ثابت و قابل‌اتکا برای شناسایی آن تعیین کرد. اما ویژگی‌های نوشتاری که در این راهنما ارائه شده‌اند، عمیقاً در نحوه‌ی آموزش و به‌کارگیری مدل‌های هوش مصنوعی ریشه دارند. هرچند می‌توان آن‌ها را پنهان کرد، اما رهایی کامل از آن‌ها بسیار دشوار خواهد بود. و اگر مردم در شناسایی نوشته هوش مصنوعی آگاه‌تر شوند، این موضوع می‌تواند پیامدهای جالب و گسترده‌ای به همراه داشته باشد.

source
کلاس یوس

توسط petese.ir