-
یک پست در LinkedIn به این ایده که دادههای ساختاریافته Schema میتوانند برای رتبهبندی در جستجوی هوش مصنوعی استفاده شوند، انتقاد کرد.
یک پست در لینکدین ایده تاثیرگذاری دادههای ساختاریافته Schema.org بر خروجی مدلهای زبان بزرگ (LLM) را زیر سوال برد.
ظاهراً برخی از متخصصان سئو (SEO) برای رتبهبندی بهتر در موتورهای جستجوی هوش مصنوعی، استفاده از دادههای ساختاریافته را توصیه میکنند.
تفاوت بین واقعیت و نظر
این موضوع به پدیدهی عجیبی در سئو اشاره میکند که در آن تمایز بین نظر و واقعیت از بین میرود. وقتی کسی میگوید «فکر میکنم»، این نشانهای است که جمله بعدی یک نظر است. نظرات مهم هستند، زیرا منشأ کشفهای جدید هستند. اما زمانی که تمایز بین نظر و واقعیت از بین برود و نظرات به عنوان واقعیت پذیرفته شوند، میتوانند مشکلساز شوند.
یک متخصص سئو میپرسد: آیا چیزی را از دست دادهام؟
پاتریک استوکس (Patrick Stox) پست زیر را در لینکدین منتشر کرد:
«آیا چیزی را از دست دادهام؟ چرا متخصصان سئو فکر میکنند نشانهگذاری Schema بر خروجی LLM تأثیر میگذارد؟»
پاتریک در متن یک توصیه سئو، عبارت «خروجی LLM» را به کار برد، بنابراین به احتمال زیاد به جستجوی ChatGPT و سایر موتورهای جستجوی هوش مصنوعی اشاره دارد.
آیا موتورهای جستجوی هوش مصنوعی دادههای خود را از دادههای ساختاریافته دریافت میکنند؟
مدلهای زبان بزرگ (LLM) با متون وب، کتابها، سوابق دولتی، اسناد حقوقی و سایر دادههای متنی (و همچنین سایر اشکال رسانه) آموزش داده میشوند که سپس برای تولید خلاصه و پاسخ بدون سرقت ادبی از دادههای آموزشی استفاده میشود. این بدان معناست که فکر کردن به بهینهسازی محتوای وب برای اینکه خود LLM کاربرانی را به آن وبسایت هدایت کند، بیفایده است.
موتورهای جستجوی هوش مصنوعی از طریق تولید تقویتشده با بازیابی (RAG) بر اساس فهرستهای جستجو (و گرافهای دانش) بنا شدهاند. خود فهرستهای موتور جستجو از دادههای خزیده شده، نه دادههای ساختاریافته Schema، ساخته میشوند.
به عنوان مثال، Perplexity AI با استفاده از نسخهای اصلاحشده از PageRank در فهرست جستجوی خود، محتوای خزیدهشده از وب را رتبهبندی میکند. گوگل و بینگ دادههای متنی را خزش میکنند و کارهایی مانند حذف محتوای تکراری، حذف کلمات توقف و سایر تغییرات در متن استخراجشده از HTML را انجام میدهند. همچنین، همه صفحات دارای دادههای ساختاریافته نیستند.
در واقع، گوگل تنها از بخش کوچکی از دادههای ساختاریافته Schema.org برای تجربیات جستجوی خاص و نتایج غنی استفاده میکند که این امر به نوبه خود نوع دادههای ساختاریافتهای را که ناشران استفاده میکنند، محدود میکند.
علاوه بر این، هر دو خزنده گوگل و بینگ کد HTML را پردازش میکنند، سربرگها، پاورقیها و محتوای اصلی را شناسایی میکنند (که از آنها متن را برای اهداف رتبهبندی استخراج میکنند). اگر قرار باشد به دادههای ساختاریافته Schema تکیه کنند، چرا باید این کار را انجام دهند؟
ایدهی استفاده از دادههای ساختاریافته Schema.org برای رتبهبندی بهتر در یک موتور جستجوی هوش مصنوعی بر اساس واقعیت نیست، بلکه صرفاً حدس و گمان است. یا ممکن است ناشی از یک «بازی تلفن» باشد، جایی که یک نفر چیزی میگوید و سپس بیست نفر بعد، آن حرف به چیزی کاملاً متفاوت تبدیل میشود.
به عنوان مثال، جونو آلدرسون (Jono Alderson) پیشنهاد کرد که دادههای ساختاریافته میتوانند استانداردی باشند که موتورهای جستجوی هوش مصنوعی برای درک بهتر وب از آن استفاده کنند. او نمیگفت که موتورهای جستجوی هوش مصنوعی در حال حاضر از آن استفاده میکنند، بلکه فقط پیشنهاد میکرد که موتورهای جستجوی هوش مصنوعی باید استفاده از آن را در نظر بگیرند و شاید آن پست بیست متخصص سئو بعدتر به یک تئوری کامل تبدیل شده باشد.
متأسفانه، ایدههای بیاساس زیادی در حلقههای سئو وجود دارد. روز دیگر دیدم که یک متخصص سئو در رسانههای اجتماعی ادعا میکند که جستجوی محلی گوگل در پاسخ به پرسشهای جستجوی «نزدیک من» از آدرسهای IP استفاده نمیکند. تنها کاری که برای آزمایش آن ایده لازم بود، ورود به یک VPN، انتخاب یک مکان جغرافیایی برای آدرس IP و انجام یک پرسش جستجوی «
گوگل حتی یک صفحه پشتیبانی منتشر کرده است که میگوید از آدرس IP برای شخصیسازی نتایج جستجو استفاده میکند، اما افرادی هستند که بر این باورند که اینطور نیست زیرا برخی از متخصصان سئو مطالعه همبستگی انجام دادهاند و هنگام پرسش، دوباره به کسی برمیگردیم که فریاد میزند که گوگل دروغ میگوید.
دادههای ساختاریافته Schema.org و نتایج جستجوی هوش مصنوعی
توصیهی برخی از متخصصان سئو (SEO) به ناشران برای استفاده از دادههای ساختاریافته Schema.org برای دادههای آموزشی مدلهای زبان بزرگ (LLM) نیز منطقی نیست، زیرا دادههای آموزشی در خروجی LLM ذکر نمیشوند، بلکه فقط برای خروجیهایی که از وب نشأت میگیرند، که خود از یک فهرست جستجو که توسط یک خزنده ایجاد شده، استخراج میشوند. همانطور که قبلاً ذکر شد، ناشران تنها از بخش کوچکی از دادههای ساختاریافته Schema.org استفاده میکنند، زیرا خود گوگل نیز تنها از بخش بسیار کوچکی از آن استفاده میکند. بنابراین، منطقی نیست که یک موتور جستجوی هوش مصنوعی برای خروجی خود به دادههای ساختاریافته تکیه کند.
کریستوفر شین، متخصص بازاریابی جستجو (پروفایل لینکدین)، اظهار نظر کرد:
«بعد از خواندن پست شما پاتریک، به همین موضوع فکر میکردم. در حال حاضر اینطور آن را تفسیر میکنم. فکر میکردم LLMها معمولاً پاسخها را از نتایج جستجوی موتورهای جستجو (SERP) تولید نمیکنند، بلکه از تفسیر دادهها تولید میکنند، درست است؟ اما نشانهگذاری دادههای Schema توسط موتورهای جستجو برای نمایش قطعههای غنی و غیره استفاده میشود، نه؟ فکر میکنم تفاوت کلیدی با Schema و LLMها این است که موتورهای جستجو از Schema برای SERPها استفاده میکنند، در حالی که LLMها هنگام ارزیابی تأثیر Schema بر LLMها از تفسیر داده استفاده میکنند.»
افرادی مانند کریستوفر شین و پاتریک استوکس به من امید میدهند که سئوی کاربردی و معقول هنوز برای عبور از این سردرگمی در تلاش است، پست لینکدین پاتریک اثباتی بر این موضوع است.
همچنین ببینید: بازاریابان دیجیتال شاهد تغییر ماهیت دادههای ساختاریافته Schema فراتر از سئو هستند
سئوی کاربردی (Pragmatic SEO)
تعریف کاربردی، انجام کارها بر اساس دلایل منطقی و واقعبینانه است و نه بر اساس نظراتی که بر اطلاعات ناقص و حدس و گمان استوار هستند.
به عنوان کسی که تقریباً از بدو تولد سئو با آن درگیر بوده است، میگویم که فکر نکردن به مسائل، دلیل اتلاف وقت سئوکاران و ناشران در گذشته با مسائل مبهم تعریفشده بوده است، کارهای بیهودهای مانند تمرکز بر سیگنالهای سطحی EAT و غیره انجام میدادند. واقعاً دلسردکننده است که به اسناد و بیانیههای رسمی اشاره کنید و با عباراتی مانند «گوگل دروغ میگوید» مواجه شوید. چنین نگرشی باعث میشود فرد بخواهد فریاد بزند.
Shortlink for this post: https://blog.talahost.com/?p=1605