مدلهای نوشتاری هوش مصنوعی الگوهای منحصر به فرد و قابل شناسایی از خود بر جای میگذارند.
این الگوها حتی پس از بازنویسی نیز باقی میمانند.
ویرایش “اثر انگشت” قابل شناسایی هوش مصنوعی میتواند محتوا را انسانیتر جلوه دهد.
تحقیقات جدید نشان میدهد که ChatGPT، Claude و سایر سیستمهای هوش مصنوعی “اثر انگشت” متمایزی در نوشتههای خود بر جای میگذارند. در اینجا نحوه استفاده از این دانش برای شناسایی محتوای هوش مصنوعی و بهبود خروجیهای کمکشده توسط هوش مصنوعی آورده شده است.
اثر انگشت هوش مصنوعی: آنچه باید بدانید
پژوهشگران کشف کردهاند که سیستمهای مختلف نوشتاری هوش مصنوعی متنهایی با الگوهای منحصربهفرد و قابل شناسایی تولید میکنند. با تحلیل این الگوها، پژوهشگران به دقت ۹۷٫۱ درصد در تعیین اینکه کدام هوش مصنوعی یک قطعه محتوای خاص را نوشته است، دست یافتند.
مطالعه (لینک PDF) میگوید: “ما دریافتیم که یک طبقهبندیکننده مبتنی بر مدلهای جاسازی متن با تنظیم دقیق ساده روی خروجیهای LLM میتواند دقت بسیار بالایی در این وظیفه به دست آورد. این نشاندهنده وجود واضح ویژگیهای خاص در LLMها است.”
این موضوع به دو دلیل اهمیت دارد:
- برای خوانندگان: از آنجایی که وب به طور فزایندهای با محتوای تولید شده توسط هوش مصنوعی اشباع میشود، دانستن نحوه شناسایی آن به شما در ارزیابی منابع اطلاعاتی کمک میکند.
- برای نویسندگان: درک این الگوها میتواند به شما کمک کند پیشنویسهای تولید شده توسط هوش مصنوعی را بهتر ویرایش کنید تا انسانیتر و معتبرتر به نظر برسند.
نحوه شناسایی محتوای تولید شده توسط هوش مصنوعی بر اساس مدل
هر سیستم اصلی هوش مصنوعی عادات نوشتاری خاصی دارد که آن را لو میدهد. پژوهشگران کشف کردند که این الگوها حتی در محتوای بازنویسی شده نیز باقی میمانند: “این الگوها حتی زمانی که متنها توسط یک LLM خارجی بازنویسی، ترجمه یا خلاصه میشوند، باقی میمانند، که نشان میدهد آنها در محتوای معنایی نیز رمزگذاری شدهاند.”
- ChatGPT
- عبارات مشخصه:
- غالباً از کلمات انتقالی مانند “قطعاً”، “مانند” و “به طور کلی” استفاده میکند.
- گاهی اوقات پاسخها را با عباراتی مانند “در زیر آمده است…” یا “مطمئناً!” شروع میکند.
- به طور دورهای از محدودکنندهها (مانند “معمولاً”، “مختلف”، “به طور عمیق”) استفاده میکند.
- عادات قالببندی:
- از سبکهای پررنگ یا ایتالیک، نقاط گلوله و عناوین برای وضوح استفاده میکند.
- اغلب لیستهای گام به گام یا شمارهگذاری شده صریح را برای سازماندهی اطلاعات درج میکند.
- تمایلات معنایی/سبکی:
- پاسخهای دقیقتر، توضیحی و غنی از زمینه ارائه میدهد.
- لحن نسبتاً رسمی و “توضیحدهنده مفید” را ترجیح میدهد، اغلب جزئیات پسزمینه کامل را ارائه میدهد.
- عبارات مشخصه:
- Claude
- عبارات مشخصه:
- از زبانی مانند “طبق متن”، “بر اساس” یا “در اینجا خلاصه آمده است” استفاده میکند.
- تمایل به استفاده از انتقالهای کوتاهتر دارد: “در حالی که”، “هر دو”، “متن”.
- عادات قالببندی:
- به نقاط گلوله ساده یا لیستهای حداقلی به جای نشانهگذاری پیچیده تکیه میکند.
- اغلب ارجاعات مستقیم به درخواست یا قطعه متن را درج میکند.
- تمایلات معنایی/سبکی:
- توضیحات مختصر و مستقیم ارائه میدهد و به جای جزئیات طولانی، روی نکته کلیدی تمرکز میکند.
- صدای عملی و مختصر را اتخاذ میکند و وضوح را بر تفصیل اولویت میدهد.
- عبارات مشخصه:
- Grok
- عبارات مشخصه:
- ممکن است از کلماتی مانند “به یاد داشته باشید”، “ممکن است”، “اما همچنین” یا “کمک میکند در” استفاده کند.
- گاهی اوقات با “که” یا “جایی که” شروع میکند و جملات مستقیم ایجاد میکند.
- عادات قالببندی:
- از عناوین یا شمارهگذاری استفاده میکند اما ممکن است به ندرت این کار را انجام دهد.
- در مقایسه با ChatGPT، احتمال کمتری دارد که عناصر نشانهگذاری غنی را جاسازی کند.
- تمایلات معنایی/سبکی:
- اغلب در توضیحات کامل است اما از سبک “کاربردی” بیشتری استفاده میکند و دستورالعملهای مستقیم را با یادآوریها ترکیب میکند.
- به شدت به عبارات ظریف مانند “قطعاً” یا “به طور کلی” تکیه نمیکند، بلکه به ارتباط دهندههای واقعیتر تکیه میکند.
- عبارات مشخصه:
- Gemini
- عبارات مشخصه:
- معروف به استفاده از “در زیر”، “مثال”، “به عنوان مثال”، که گاهی اوقات با “به طور خلاصه” همراه میشود.
- ممکن است از اعلانهای تعجب مانند “مطمئناً! در زیر” استفاده کند.
- عادات قالببندی:
- ساختارهای نشانهگذاری کوتاه مانند نقاط گلوله و عناوین گاه به گاه را ادغام میکند.
- گاهی اوقات دستورالعملهای کلیدی را در لیستهای شمارهگذاری شده برجسته میکند.
- تمایلات معنایی/سبکی:
- خلاصههای مختصر را با توضیحات نسبتاً دقیق متعادل میکند.
- لحن واضح و آموزشی را ترجیح میدهد، گاهی اوقات با زبان مستقیم مانند “در اینجا نحوه انجام…”
- عبارات مشخصه:
- DeepSeek
- عبارات مشخصه:
- از کلماتی مانند “حیاتی”، “بهبودهای کلیدی”، “در اینجا یک تجزیه و تحلیل آمده است”، “اساساً”، “و غیره” استفاده میکند.
- گاهی اوقات عبارات انتقالی مانند “در همان زمان” یا “همچنین” را درج میکند.
- عادات قالببندی:
- اغلب از شمارهگذاری و نقاط گلوله برای سازماندهی استفاده میکند.
- ممکن است تأکید درون خطی داشته باشد (مانند “بهبودهای کلیدی”) اما نه همیشه.
- تمایلات معنایی/سبکی:
- پاسخهای عموماً کامل که نکات اصلی یا “تجزیه و تحلیلها” را برجسته میکند.
- سبک نسبتاً توضیحی را حفظ میکند اما میتواند مختصرتر از ChatGPT باشد.
- عبارات مشخصه:
- Llama (نسخه دستورالعمل)
- عبارات مشخصه:
- “شامل”، “مانند”، “توضیح”، “موارد زیر”، که نشاندهنده مثالها یا گسترشها هستند.
- گاهی اوقات به راهنماهای گام به گام یا “نحوه انجام” در متن ارجاع میدهد.
- عادات قالببندی:
- سطوح استفاده از نشانهگذاری متفاوت است؛ اغلب نکات مهم را در لیستهای شمارهگذاری شده یا نقاط گلوله قرار میدهد.
- میتواند شامل عناوین ساده باشد (مانند “## موضوع”) اما احتمال کمتری دارد که از قالببندی پیچیده مانند ChatGPT استفاده کند.
- تمایلات معنایی/سبکی:
- لحن نسبتاً رسمی و آکادمیک را حفظ میکند اما میتواند برای دستورالعملها به مکالمهایتر تبدیل شود.
- گاهی اوقات تحلیل یا زمینه عمیقتر (مانند تعاریف یا پیشینه) را در پاسخ جاسازی میکند.
-
- Gemma (نسخه دستورالعمل)
- عبارات مشخصه:
- عباراتی مانند “بگذارید”، “اگر میدانید” یا “به یاد داشته باشید” اغلب ظاهر میشوند.
- تمایل دارد “در زیر آمده است”، “خاص” یا “جزئیات” را در توضیحات درج کند.
- عادات قالببندی:
- مشابه Llama، اغلب از نقاط گلوله، شمارهگذاری و گاهی عناوین پررنگ استفاده میکند.
- ممکن است انتقالها (مانند “## نکات کلیدی”) را برای بخشبندی محتوا ادغام کند.
- تمایلات معنایی/سبکی:
- دستورالعملهای مستقیم را با جزئیات توضیحی ترکیب میکند.
- اغلب به رویکرد روایی بیشتر علاقه دارد و به نحوه یا چرایی انجام یک کار اشاره میکند.
- عبارات مشخصه:
- Qwen (نسخه دستورالعمل)
- عبارات مشخصه:
- شامل “قطعاً”، “به طور خلاصه” یا “عنوان” برای عناوین است.
- ممکن است با انتقالهایی مانند “جامع”، “مبتنی بر” یا “استفاده مثال” ظاهر شود.
- عادات قالببندی:
- از لیستها (گاهی تو در تو) برای وضوح استفاده میکند.
- به طور دورهای بلوکهای کد کوتاه یا قالببندی قطعه مانند را برای توضیحات فنی درج میکند.
- تمایلات معنایی/سبکی:
- دقیق، با تأکید بر دستورالعملهای گام به گام یا نکات برچسبگذاری شده با گلوله.
- ساختار قابل بازنویسی، به این معنی که اگر درخواست شود، میتواند محتوا را به طور گسترده بازنویسی یا سازماندهی مجدد کند.
- عبارات مشخصه:
- Mistral (نسخه دستورالعمل)
- عبارات مشخصه:
- کلماتی مانند “ایجاد”، “قطعاً”، “موضوع” یا “بله” میتوانند در اوایل پاسخها ظاهر شوند.
- تمایل دارد برای دستورات به افعال مستقیم تکیه کند (مانند “امتحان کنید”، “بسازید”، “تست کنید”).
- عادات قالببندی:
- معمولاً نقاط گلوله مستقیم را بدون نشانهگذاری سنگین اعمال میکند.
- گاهی اوقات عناوین را درج میکند اما اغلب ساختار را حداقلی نگه میدارد.
- تمایلات معنایی/سبکی:
- دستورالعملها یا مرورهای مختصر و مستقیم را ترجیح میدهد.
- بر اختصار تمرکز میکند در حالی که هنوز هدفش کامل بودن است و جزئیات اصلی را به صورت سازماندهی شده ارائه میدهد.
- عبارات مشخصه:
چگونه محتوای تولید شده توسط هوش مصنوعی را انسانیتر کنیم
این مطالعه نشان داد که انتخاب کلمه یک شناسه اصلی متن تولید شده توسط هوش مصنوعی است: “پس از جابجایی تصادفی کلمات در پاسخهای تولید شده توسط LLM، کاهش حداقلی در دقت طبقهبندی مشاهده میکنیم. این نشان میدهد که بخش قابل توجهی از ویژگیهای متمایز در توزیع سطح کلمه رمزگذاری شده است.”
اگر از ابزارهای نوشتاری هوش مصنوعی استفاده میکنید، در اینجا مراحل عملی برای کاهش این الگوهای آشکار آورده شده است:
- آغازهای خود را متنوع کنید: تحقیقات نشان داد که اولین کلمات در محتوای هوش مصنوعی بسیار قابل پیشبینی هستند. جملات ابتدایی را ویرایش کنید تا از آغازگرهای معمولی هوش مصنوعی اجتناب کنید.
- عبارات مشخصه را جایگزین کنید: عبارات خاص مدل ذکر شده در بالا را مراقب باشید و جایگزین کنید.
- الگوهای قالببندی را تنظیم کنید: هر هوش مصنوعی ترجیحات قالببندی متمایزی دارد. اینها را تغییر دهید تا الگوهای قابل تشخیص را بشکنید.
- محتوا را بازسازی کنید: هوش مصنوعی تمایل دارد از سازماندهی قابل پیشبینی پیروی کند. بخشها را مجدداً مرتب کنید تا جریانی منحصربهفردتر ایجاد کنید.
- عناصر شخصی را اضافه کنید: تجربیات، نظرات و بینشهای خاص صنعت خود را که یک هوش مصنوعی نمیتواند تولید کند، وارد کنید.
نکته اصلی
در حالی که این تحقیق بر تمایز مدلهای مختلف هوش مصنوعی تمرکز دارد، همچنین نشان میدهد که چگونه متن تولید شده توسط هوش مصنوعی با نوشته انسانی متفاوت است. با بهبود توانایی موتورهای جستجو در شناسایی محتوای هوش مصنوعی، نوشتن هوش مصنوعی با الگوهای سنگین ممکن است ارزش خود را از دست بدهد. با درک نحوه شناسایی متن هوش مصنوعی، میتوانید محتوایی ایجاد کنید که بالاتر از خروجی متوسط چتبات قرار گیرد و هم برای خوانندگان و هم برای موتورهای جستجو جذاب باشد. ترکیب کارایی هوش مصنوعی با خلاقیت و تخصص انسانی بهترین رویکرد است.
- Gemma (نسخه دستورالعمل)
- talahost.com
- عبارات مشخصه:
Shortlink for this post: https://blog.talahost.com/?p=2288