همهی ما آن احساس شک خزنده را تجربه کردهایم که مبادا نوشتهای که میخوانیم توسط هوش مصنوعی تولید شده باشد؛ اما تعیین قطعی این موضوع بهطرز شگفتانگیزی دشوار است.
سال گذشته، بسیاری از افراد ادعا میکردند که واژههایی مشخص، میتوانند نشانهی متن تولید شده توسط هوش مصنوعی باشند، اما شواهد این ادعا بسیار اندک هستند و با پیچیدهتر شدن مدلهای زبانی، ردگیری این کلمات بهعنوان نشانههای قابل اتکا دشوارتر شده است.
با این حال، به نظر میرسد که اعضای Wikipedia در شناسایی نوشته تولید شده توسط هوش مصنوعی روشی بسیار دقیق پیدا کردهاند و راهنمای عمومی این گروه با عنوان Signs of AI writing بهترین منبع در این زمینه باشد.
از سال ۲۰۲۳، ویرایشگران Wikipedia تلاش کردهاند تا مدیریت بهتری بر نوشتههای تولید شده توسط هوش مصنوعی داشته باشند؛ پروژهای که آن را Project AI Cleanup نامیدهاند. با وجود میلیونها ویرایش در هر روز، حجم فراوانی از داده برای بررسی وجود دارد و مطابق سنت دیرینهی ویرایشگران Wikipedia، خروجی این تلاشها یک راهنمای عمومی بوده که هم غنی از جزئیات و هم متکی بر شواهد است.
در آغاز، این راهنما چیزی را تأیید میکند که پیشتر نیز میدانستیم: ابزارهای خودکار، در این حوزه تقریباً بیفایدهاند. در عوض، تمرکز راهنما بر الگوهای نوشتاری و ساختارهایی است که در Wikipedia نادرند اما در گسترهی اینترنت فراوان دیده میشوند (و بنابراین در دادهی آموزشی مدلها نیز رایجاند).
طبق این راهنما، متنهای تولیدی هوش مصنوعی زمان زیادی را صرف برجستهسازی اهمیت یک موضوع، معمولاً با عباراتی کلی و مبهم میکنند. همچنین مدلهای هوش مصنوعی بخش زیادی از متن را به توضیح جزئیات مربوط به حضورهای کماهمیت در رسانهها اختصاص میدهند تا موضوع را مهمتر و برجستهتر جلوه دهند؛ رویکردی که بیشتر از یک زندگینامهی شخصی انتظار میرود، نه از یک منبع مستقل.
راهنما به نکتهای بسیار جالب دربارهی ساختارهای پایانی جملات نیز اشاره میکند؛ جایی که مدلها معمولاً ادعاهایی مبهم دربارهی موضوع مطرح میکنند. علاقهمندان دستور زبان این ساختار را وجه وصفی حال (Present Participle) مینامند. تشخیص این الگو کمی دشوار است، اما پس از شناختنش، در جایجای متون قابل مشاهده خواهد بود.
تمایل دیگری نیز از سوی مدلهای هوش مصنوعی برای استفاده از زبان تبلیغاتی مبهم وجود دارد؛ زبانی که در سراسر اینترنت بهشدت رایج است. این مدلها، مناظر را همیشه زیبا، چشماندازها را همواره نفسگیر و بهطور کلی هر چیزی را تمیز و مدرن توصیف میکنند. همانطور که ویرایشگران ویکیپدیا میگویند، چنین نثری بیش از آنکه شبیه نوشتهی دانشنامهای باشد، تداعیکنندهی متن یک آگهی تلویزیونی است.
خواندن کامل این راهنما ارزشمند است. تا قبل از این، تصور میشد که سبک نثر مدلهای زبانی آنقدر سریع تحول مییابد که نمیتوان ویژگیهای ثابت و قابلاتکا برای شناسایی آن تعیین کرد. اما ویژگیهای نوشتاری که در این راهنما ارائه شدهاند، عمیقاً در نحوهی آموزش و بهکارگیری مدلهای هوش مصنوعی ریشه دارند. هرچند میتوان آنها را پنهان کرد، اما رهایی کامل از آنها بسیار دشوار خواهد بود. و اگر مردم در شناسایی نوشته هوش مصنوعی آگاهتر شوند، این موضوع میتواند پیامدهای جالب و گستردهای به همراه داشته باشد.
source
کلاس یوس