شناسایی محتوای تولید شده توسط هوش مصنوعی از طریق اثر انگشت.

پژوهشگران دریافتند ابزارهای نوشتن هوش مصنوعی مانند ChatGPT و Claude الگوهای خاصی ایجاد می‌کنند. این الگوها می‌توانند به شما در شناسایی و ویرایش محتوای هوش مصنوعی کمک کنند.

مدل‌های نوشتاری هوش مصنوعی الگوهای منحصر به فرد و قابل شناسایی از خود بر جای می‌گذارند.
این الگوها حتی پس از بازنویسی نیز باقی می‌مانند.
ویرایش “اثر انگشت” قابل شناسایی هوش مصنوعی می‌تواند محتوا را انسانی‌تر جلوه دهد.

تحقیقات جدید نشان می‌دهد که ChatGPT، Claude و سایر سیستم‌های هوش مصنوعی “اثر انگشت” متمایزی در نوشته‌های خود بر جای می‌گذارند. در اینجا نحوه استفاده از این دانش برای شناسایی محتوای هوش مصنوعی و بهبود خروجی‌های کمک‌شده توسط هوش مصنوعی آورده شده است.

اثر انگشت هوش مصنوعی: آنچه باید بدانید

پژوهشگران کشف کرده‌اند که سیستم‌های مختلف نوشتاری هوش مصنوعی متن‌هایی با الگوهای منحصربه‌فرد و قابل شناسایی تولید می‌کنند. با تحلیل این الگوها، پژوهشگران به دقت ۹۷٫۱ درصد در تعیین اینکه کدام هوش مصنوعی یک قطعه محتوای خاص را نوشته است، دست یافتند.

مطالعه (لینک PDF) می‌گوید: “ما دریافتیم که یک طبقه‌بندی‌کننده مبتنی بر مدل‌های جاسازی متن با تنظیم دقیق ساده روی خروجی‌های LLM می‌تواند دقت بسیار بالایی در این وظیفه به دست آورد. این نشان‌دهنده وجود واضح ویژگی‌های خاص در LLMها است.”

این موضوع به دو دلیل اهمیت دارد:

  • برای خوانندگان: از آنجایی که وب به طور فزاینده‌ای با محتوای تولید شده توسط هوش مصنوعی اشباع می‌شود، دانستن نحوه شناسایی آن به شما در ارزیابی منابع اطلاعاتی کمک می‌کند.
  • برای نویسندگان: درک این الگوها می‌تواند به شما کمک کند پیش‌نویس‌های تولید شده توسط هوش مصنوعی را بهتر ویرایش کنید تا انسانی‌تر و معتبرتر به نظر برسند.

نحوه شناسایی محتوای تولید شده توسط هوش مصنوعی بر اساس مدل

هر سیستم اصلی هوش مصنوعی عادات نوشتاری خاصی دارد که آن را لو می‌دهد. پژوهشگران کشف کردند که این الگوها حتی در محتوای بازنویسی شده نیز باقی می‌مانند: “این الگوها حتی زمانی که متن‌ها توسط یک LLM خارجی بازنویسی، ترجمه یا خلاصه می‌شوند، باقی می‌مانند، که نشان می‌دهد آنها در محتوای معنایی نیز رمزگذاری شده‌اند.”

  1. ChatGPT
    • عبارات مشخصه:
      • غالباً از کلمات انتقالی مانند “قطعاً”، “مانند” و “به طور کلی” استفاده می‌کند.
      • گاهی اوقات پاسخ‌ها را با عباراتی مانند “در زیر آمده است…” یا “مطمئناً!” شروع می‌کند.
      • به طور دوره‌ای از محدودکننده‌ها (مانند “معمولاً”، “مختلف”، “به طور عمیق”) استفاده می‌کند.
    • عادات قالب‌بندی:
      • از سبک‌های پررنگ یا ایتالیک، نقاط گلوله و عناوین برای وضوح استفاده می‌کند.
      • اغلب لیست‌های گام به گام یا شماره‌گذاری شده صریح را برای سازماندهی اطلاعات درج می‌کند.
    • تمایلات معنایی/سبکی:
      • پاسخ‌های دقیق‌تر، توضیحی و غنی از زمینه ارائه می‌دهد.
      • لحن نسبتاً رسمی و “توضیح‌دهنده مفید” را ترجیح می‌دهد، اغلب جزئیات پس‌زمینه کامل را ارائه می‌دهد.
  2. Claude
    • عبارات مشخصه:
      • از زبانی مانند “طبق متن”، “بر اساس” یا “در اینجا خلاصه آمده است” استفاده می‌کند.
      • تمایل به استفاده از انتقال‌های کوتاه‌تر دارد: “در حالی که”، “هر دو”، “متن”.
    • عادات قالب‌بندی:
      • به نقاط گلوله ساده یا لیست‌های حداقلی به جای نشانه‌گذاری پیچیده تکیه می‌کند.
      • اغلب ارجاعات مستقیم به درخواست یا قطعه متن را درج می‌کند.
    • تمایلات معنایی/سبکی:
      • توضیحات مختصر و مستقیم ارائه می‌دهد و به جای جزئیات طولانی، روی نکته کلیدی تمرکز می‌کند.
      • صدای عملی و مختصر را اتخاذ می‌کند و وضوح را بر تفصیل اولویت می‌دهد.
  3. Grok
    • عبارات مشخصه:
      • ممکن است از کلماتی مانند “به یاد داشته باشید”، “ممکن است”، “اما همچنین” یا “کمک می‌کند در” استفاده کند.
      • گاهی اوقات با “که” یا “جایی که” شروع می‌کند و جملات مستقیم ایجاد می‌کند.
    • عادات قالب‌بندی:
      • از عناوین یا شماره‌گذاری استفاده می‌کند اما ممکن است به ندرت این کار را انجام دهد.
      • در مقایسه با ChatGPT، احتمال کمتری دارد که عناصر نشانه‌گذاری غنی را جاسازی کند.
    • تمایلات معنایی/سبکی:
      • اغلب در توضیحات کامل است اما از سبک “کاربردی” بیشتری استفاده می‌کند و دستورالعمل‌های مستقیم را با یادآوری‌ها ترکیب می‌کند.
      • به شدت به عبارات ظریف مانند “قطعاً” یا “به طور کلی” تکیه نمی‌کند، بلکه به ارتباط دهنده‌های واقعی‌تر تکیه می‌کند.
  4. Gemini
    • عبارات مشخصه:
      • معروف به استفاده از “در زیر”، “مثال”، “به عنوان مثال”، که گاهی اوقات با “به طور خلاصه” همراه می‌شود.
      • ممکن است از اعلان‌های تعجب مانند “مطمئناً! در زیر” استفاده کند.
    • عادات قالب‌بندی:
      • ساختارهای نشانه‌گذاری کوتاه مانند نقاط گلوله و عناوین گاه به گاه را ادغام می‌کند.
      • گاهی اوقات دستورالعمل‌های کلیدی را در لیست‌های شماره‌گذاری شده برجسته می‌کند.
    • تمایلات معنایی/سبکی:
      • خلاصه‌های مختصر را با توضیحات نسبتاً دقیق متعادل می‌کند.
      • لحن واضح و آموزشی را ترجیح می‌دهد، گاهی اوقات با زبان مستقیم مانند “در اینجا نحوه انجام…”
  5. DeepSeek
    • عبارات مشخصه:
      • از کلماتی مانند “حیاتی”، “بهبودهای کلیدی”، “در اینجا یک تجزیه و تحلیل آمده است”، “اساساً”، “و غیره” استفاده می‌کند.
      • گاهی اوقات عبارات انتقالی مانند “در همان زمان” یا “همچنین” را درج می‌کند.
    • عادات قالب‌بندی:
      • اغلب از شماره‌گذاری و نقاط گلوله برای سازماندهی استفاده می‌کند.
      • ممکن است تأکید درون خطی داشته باشد (مانند “بهبودهای کلیدی”) اما نه همیشه.
    • تمایلات معنایی/سبکی:
      • پاسخ‌های عموماً کامل که نکات اصلی یا “تجزیه و تحلیل‌ها” را برجسته می‌کند.
      • سبک نسبتاً توضیحی را حفظ می‌کند اما می‌تواند مختصرتر از ChatGPT باشد.
  6. Llama (نسخه دستورالعمل)
    • عبارات مشخصه:
      • “شامل”، “مانند”، “توضیح”، “موارد زیر”، که نشان‌دهنده مثال‌ها یا گسترش‌ها هستند.
      • گاهی اوقات به راهنماهای گام به گام یا “نحوه انجام” در متن ارجاع می‌دهد.
    • عادات قالب‌بندی:
      • سطوح استفاده از نشانه‌گذاری متفاوت است؛ اغلب نکات مهم را در لیست‌های شماره‌گذاری شده یا نقاط گلوله قرار می‌دهد.
      • می‌تواند شامل عناوین ساده باشد (مانند “## موضوع”) اما احتمال کمتری دارد که از قالب‌بندی پیچیده مانند ChatGPT استفاده کند.
    • تمایلات معنایی/سبکی:
      • لحن نسبتاً رسمی و آکادمیک را حفظ می‌کند اما می‌تواند برای دستورالعمل‌ها به مکالمه‌ای‌تر تبدیل شود.
      • گاهی اوقات تحلیل یا زمینه عمیق‌تر (مانند تعاریف یا پیشینه) را در پاسخ جاسازی می‌کند.
        1. Gemma (نسخه دستورالعمل)
          • عبارات مشخصه:
            • عباراتی مانند “بگذارید”، “اگر می‌دانید” یا “به یاد داشته باشید” اغلب ظاهر می‌شوند.
            • تمایل دارد “در زیر آمده است”، “خاص” یا “جزئیات” را در توضیحات درج کند.
          • عادات قالب‌بندی:
            • مشابه Llama، اغلب از نقاط گلوله، شماره‌گذاری و گاهی عناوین پررنگ استفاده می‌کند.
            • ممکن است انتقال‌ها (مانند “## نکات کلیدی”) را برای بخش‌بندی محتوا ادغام کند.
          • تمایلات معنایی/سبکی:
            • دستورالعمل‌های مستقیم را با جزئیات توضیحی ترکیب می‌کند.
            • اغلب به رویکرد روایی بیشتر علاقه دارد و به نحوه یا چرایی انجام یک کار اشاره می‌کند.
        2. Qwen (نسخه دستورالعمل)
          • عبارات مشخصه:
            • شامل “قطعاً”، “به طور خلاصه” یا “عنوان” برای عناوین است.
            • ممکن است با انتقال‌هایی مانند “جامع”، “مبتنی بر” یا “استفاده مثال” ظاهر شود.
          • عادات قالب‌بندی:
            • از لیست‌ها (گاهی تو در تو) برای وضوح استفاده می‌کند.
            • به طور دوره‌ای بلوک‌های کد کوتاه یا قالب‌بندی قطعه مانند را برای توضیحات فنی درج می‌کند.
          • تمایلات معنایی/سبکی:
            • دقیق، با تأکید بر دستورالعمل‌های گام به گام یا نکات برچسب‌گذاری شده با گلوله.
            • ساختار قابل بازنویسی، به این معنی که اگر درخواست شود، می‌تواند محتوا را به طور گسترده بازنویسی یا سازماندهی مجدد کند.
        3. Mistral (نسخه دستورالعمل)
          • عبارات مشخصه:
            • کلماتی مانند “ایجاد”، “قطعاً”، “موضوع” یا “بله” می‌توانند در اوایل پاسخ‌ها ظاهر شوند.
            • تمایل دارد برای دستورات به افعال مستقیم تکیه کند (مانند “امتحان کنید”، “بسازید”، “تست کنید”).
          • عادات قالب‌بندی:
            • معمولاً نقاط گلوله مستقیم را بدون نشانه‌گذاری سنگین اعمال می‌کند.
            • گاهی اوقات عناوین را درج می‌کند اما اغلب ساختار را حداقلی نگه می‌دارد.
          • تمایلات معنایی/سبکی:
            • دستورالعمل‌ها یا مرورهای مختصر و مستقیم را ترجیح می‌دهد.
            • بر اختصار تمرکز می‌کند در حالی که هنوز هدفش کامل بودن است و جزئیات اصلی را به صورت سازماندهی شده ارائه می‌دهد.

        چگونه محتوای تولید شده توسط هوش مصنوعی را انسانی‌تر کنیم

        این مطالعه نشان داد که انتخاب کلمه یک شناسه اصلی متن تولید شده توسط هوش مصنوعی است: “پس از جابجایی تصادفی کلمات در پاسخ‌های تولید شده توسط LLM، کاهش حداقلی در دقت طبقه‌بندی مشاهده می‌کنیم. این نشان می‌دهد که بخش قابل توجهی از ویژگی‌های متمایز در توزیع سطح کلمه رمزگذاری شده است.”

        اگر از ابزارهای نوشتاری هوش مصنوعی استفاده می‌کنید، در اینجا مراحل عملی برای کاهش این الگوهای آشکار آورده شده است:

        • آغازهای خود را متنوع کنید: تحقیقات نشان داد که اولین کلمات در محتوای هوش مصنوعی بسیار قابل پیش‌بینی هستند. جملات ابتدایی را ویرایش کنید تا از آغازگرهای معمولی هوش مصنوعی اجتناب کنید.
        • عبارات مشخصه را جایگزین کنید: عبارات خاص مدل ذکر شده در بالا را مراقب باشید و جایگزین کنید.
        • الگوهای قالب‌بندی را تنظیم کنید: هر هوش مصنوعی ترجیحات قالب‌بندی متمایزی دارد. اینها را تغییر دهید تا الگوهای قابل تشخیص را بشکنید.
        • محتوا را بازسازی کنید: هوش مصنوعی تمایل دارد از سازماندهی قابل پیش‌بینی پیروی کند. بخش‌ها را مجدداً مرتب کنید تا جریانی منحصربه‌فردتر ایجاد کنید.
        • عناصر شخصی را اضافه کنید: تجربیات، نظرات و بینش‌های خاص صنعت خود را که یک هوش مصنوعی نمی‌تواند تولید کند، وارد کنید.

        نکته اصلی

        در حالی که این تحقیق بر تمایز مدل‌های مختلف هوش مصنوعی تمرکز دارد، همچنین نشان می‌دهد که چگونه متن تولید شده توسط هوش مصنوعی با نوشته انسانی متفاوت است. با بهبود توانایی موتورهای جستجو در شناسایی محتوای هوش مصنوعی، نوشتن هوش مصنوعی با الگوهای سنگین ممکن است ارزش خود را از دست بدهد. با درک نحوه شناسایی متن هوش مصنوعی، می‌توانید محتوایی ایجاد کنید که بالاتر از خروجی متوسط چت‌بات قرار گیرد و هم برای خوانندگان و هم برای موتورهای جستجو جذاب باشد. ترکیب کارایی هوش مصنوعی با خلاقیت و تخصص انسانی بهترین رویکرد است.

      • talahost.com

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *