سئوکاران: داده‌های ساخت‌یافته برای هوش مصنوعی حیاتی است.

  • یک پست در LinkedIn به این ایده که داده‌های ساختاریافته Schema می‌توانند برای رتبه‌بندی در جستجوی هوش مصنوعی استفاده شوند، انتقاد کرد.

یک پست در لینکدین ایده تاثیرگذاری داده‌های ساختاریافته Schema.org بر خروجی مدل‌های زبان بزرگ (LLM) را زیر سوال برد.

ظاهراً برخی از متخصصان سئو (SEO) برای رتبه‌بندی بهتر در موتورهای جستجوی هوش مصنوعی، استفاده از داده‌های ساختاریافته را توصیه می‌کنند.

تفاوت بین واقعیت و نظر

این موضوع به پدیده‌ی عجیبی در سئو اشاره می‌کند که در آن تمایز بین نظر و واقعیت از بین می‌رود. وقتی کسی می‌گوید «فکر می‌کنم»، این نشانه‌ای است که جمله بعدی یک نظر است. نظرات مهم هستند، زیرا منشأ کشف‌های جدید هستند. اما زمانی که تمایز بین نظر و واقعیت از بین برود و نظرات به عنوان واقعیت پذیرفته شوند، می‌توانند مشکل‌ساز شوند.

یک متخصص سئو می‌پرسد: آیا چیزی را از دست داده‌ام؟

پاتریک استوکس (Patrick Stox) پست زیر را در لینکدین منتشر کرد:

«آیا چیزی را از دست داده‌ام؟ چرا متخصصان سئو فکر می‌کنند نشانه‌گذاری Schema بر خروجی LLM تأثیر می‌گذارد؟»

پاتریک در متن یک توصیه سئو، عبارت «خروجی LLM» را به کار برد، بنابراین به احتمال زیاد به جستجوی ChatGPT و سایر موتورهای جستجوی هوش مصنوعی اشاره دارد.

آیا موتورهای جستجوی هوش مصنوعی داده‌های خود را از داده‌های ساختاریافته دریافت می‌کنند؟

مدل‌های زبان بزرگ (LLM) با متون وب، کتاب‌ها، سوابق دولتی، اسناد حقوقی و سایر داده‌های متنی (و همچنین سایر اشکال رسانه) آموزش داده می‌شوند که سپس برای تولید خلاصه و پاسخ بدون سرقت ادبی از داده‌های آموزشی استفاده می‌شود. این بدان معناست که فکر کردن به بهینه‌سازی محتوای وب برای اینکه خود LLM کاربرانی را به آن وب‌سایت هدایت کند، بی‌فایده است.

موتورهای جستجوی هوش مصنوعی از طریق تولید تقویت‌شده با بازیابی (RAG) بر اساس فهرست‌های جستجو (و گراف‌های دانش) بنا شده‌اند. خود فهرست‌های موتور جستجو از داده‌های خزیده شده، نه داده‌های ساختاریافته Schema، ساخته می‌شوند.

به عنوان مثال، Perplexity AI با استفاده از نسخه‌ای اصلاح‌شده از PageRank در فهرست جستجوی خود، محتوای خزیده‌شده از وب را رتبه‌بندی می‌کند. گوگل و بینگ داده‌های متنی را خزش می‌کنند و کارهایی مانند حذف محتوای تکراری، حذف کلمات توقف و سایر تغییرات در متن استخراج‌شده از HTML را انجام می‌دهند. همچنین، همه صفحات دارای داده‌های ساختاریافته نیستند.

در واقع، گوگل تنها از بخش کوچکی از داده‌های ساختاریافته Schema.org برای تجربیات جستجوی خاص و نتایج غنی استفاده می‌کند که این امر به نوبه خود نوع داده‌های ساختاریافته‌ای را که ناشران استفاده می‌کنند، محدود می‌کند.

علاوه بر این، هر دو خزنده گوگل و بینگ کد HTML را پردازش می‌کنند، سربرگ‌ها، پاورقی‌ها و محتوای اصلی را شناسایی می‌کنند (که از آن‌ها متن را برای اهداف رتبه‌بندی استخراج می‌کنند). اگر قرار باشد به داده‌های ساختاریافته Schema تکیه کنند، چرا باید این کار را انجام دهند؟

ایده‌ی استفاده از داده‌های ساختاریافته Schema.org برای رتبه‌بندی بهتر در یک موتور جستجوی هوش مصنوعی بر اساس واقعیت نیست، بلکه صرفاً حدس و گمان است. یا ممکن است ناشی از یک «بازی تلفن» باشد، جایی که یک نفر چیزی می‌گوید و سپس بیست نفر بعد، آن حرف به چیزی کاملاً متفاوت تبدیل می‌شود.

به عنوان مثال، جونو آلدرسون (Jono Alderson) پیشنهاد کرد که داده‌های ساختاریافته می‌توانند استانداردی باشند که موتورهای جستجوی هوش مصنوعی برای درک بهتر وب از آن استفاده کنند. او نمی‌گفت که موتورهای جستجوی هوش مصنوعی در حال حاضر از آن استفاده می‌کنند، بلکه فقط پیشنهاد می‌کرد که موتورهای جستجوی هوش مصنوعی باید استفاده از آن را در نظر بگیرند و شاید آن پست بیست متخصص سئو بعدتر به یک تئوری کامل تبدیل شده باشد.

متأسفانه، ایده‌های بی‌اساس زیادی در حلقه‌های سئو وجود دارد. روز دیگر دیدم که یک متخصص سئو در رسانه‌های اجتماعی ادعا می‌کند که جستجوی محلی گوگل در پاسخ به پرسش‌های جستجوی «نزدیک من» از آدرس‌های IP استفاده نمی‌کند. تنها کاری که برای آزمایش آن ایده لازم بود، ورود به یک VPN، انتخاب یک مکان جغرافیایی برای آدرس IP و انجام یک پرسش جستجوی «

گوگل حتی یک صفحه پشتیبانی منتشر کرده است که می‌گوید از آدرس IP برای شخصی‌سازی نتایج جستجو استفاده می‌کند، اما افرادی هستند که بر این باورند که این‌طور نیست زیرا برخی از متخصصان سئو مطالعه همبستگی انجام داده‌اند و هنگام پرسش، دوباره به کسی برمی‌گردیم که فریاد می‌زند که گوگل دروغ می‌گوید.

داده‌های ساختاریافته Schema.org و نتایج جستجوی هوش مصنوعی

توصیه‌ی برخی از متخصصان سئو (SEO) به ناشران برای استفاده از داده‌های ساختاریافته Schema.org برای داده‌های آموزشی مدل‌های زبان بزرگ (LLM) نیز منطقی نیست، زیرا داده‌های آموزشی در خروجی LLM ذکر نمی‌شوند، بلکه فقط برای خروجی‌هایی که از وب نشأت می‌گیرند، که خود از یک فهرست جستجو که توسط یک خزنده ایجاد شده، استخراج می‌شوند. همانطور که قبلاً ذکر شد، ناشران تنها از بخش کوچکی از داده‌های ساختاریافته Schema.org استفاده می‌کنند، زیرا خود گوگل نیز تنها از بخش بسیار کوچکی از آن استفاده می‌کند. بنابراین، منطقی نیست که یک موتور جستجوی هوش مصنوعی برای خروجی خود به داده‌های ساختاریافته تکیه کند.

کریستوفر شین، متخصص بازاریابی جستجو (پروفایل لینکدین)، اظهار نظر کرد:

«بعد از خواندن پست شما پاتریک، به همین موضوع فکر می‌کردم. در حال حاضر اینطور آن را تفسیر می‌کنم. فکر می‌کردم LLMها معمولاً پاسخ‌ها را از نتایج جستجوی موتورهای جستجو (SERP) تولید نمی‌کنند، بلکه از تفسیر داده‌ها تولید می‌کنند، درست است؟ اما نشانه‌گذاری داده‌های Schema توسط موتورهای جستجو برای نمایش قطعه‌های غنی و غیره استفاده می‌شود، نه؟ فکر می‌کنم تفاوت کلیدی با Schema و LLMها این است که موتورهای جستجو از Schema برای SERPها استفاده می‌کنند، در حالی که LLMها هنگام ارزیابی تأثیر Schema بر LLMها از تفسیر داده استفاده می‌کنند.»

افرادی مانند کریستوفر شین و پاتریک استوکس به من امید می‌دهند که سئوی کاربردی و معقول هنوز برای عبور از این سردرگمی در تلاش است، پست لینکدین پاتریک اثباتی بر این موضوع است.

همچنین ببینید: بازاریابان دیجیتال شاهد تغییر ماهیت داده‌های ساختاریافته Schema فراتر از سئو هستند

سئوی کاربردی (Pragmatic SEO)

تعریف کاربردی، انجام کارها بر اساس دلایل منطقی و واقع‌بینانه است و نه بر اساس نظراتی که بر اطلاعات ناقص و حدس و گمان استوار هستند.

به عنوان کسی که تقریباً از بدو تولد سئو با آن درگیر بوده است، می‌گویم که فکر نکردن به مسائل، دلیل اتلاف وقت سئوکاران و ناشران در گذشته با مسائل مبهم تعریف‌شده بوده است، کارهای بیهوده‌ای مانند تمرکز بر سیگنال‌های سطحی EAT و غیره انجام می‌دادند. واقعاً دلسردکننده است که به اسناد و بیانیه‌های رسمی اشاره کنید و با عباراتی مانند «گوگل دروغ می‌گوید» مواجه شوید. چنین نگرشی باعث می‌شود فرد بخواهد فریاد بزند.

talahost.com

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *