وبلاگ

جستجوی گوگل تحت تأثیر حملات گسترده هرزنامه قرار گرفت

نتایج جستجوی گوگل در روزهای اخیر با حمله هرزنامه‌ای مواجه شده است که می‌توان آن را کاملاً خارج از کنترل توصیف کرد. بسیاری از دامنه ها برای صدها هزار کلمه کلیدی رتبه بندی می شوند که نشان می دهد مقیاس این حمله می تواند به راحتی به میلیون ها عبارت کلیدی برسد.

با کمال تعجب، بسیاری از دامنه ها فقط در 24-48 ساعت گذشته ثبت شده اند.

این اخیراً از طریق یک سری پست توسط بیل هارتزر (پروفایل لینکدین) جایی که او یک نمودار پیوند ایجاد شده توسط ابزار بک لینک Majestic را ارسال کرد که شبکه های پیوند چندین سایت هرزنامه را نشان می داد.

نمودار پیوندی که او ارسال کرد، ده‌ها وب‌سایت را نشان می‌دهد که نزدیک به یکدیگر مرتبط هستند، که یک الگوی نسبتاً معمولی از شبکه‌های پیوند هرزنامه است.

اسکرین شات از یک شبکه با پیوند نزدیک

جستجوی گوگل تحت تأثیر حملات گسترده هرزنامه قرار گرفتتصویر توسط بیل هارتزر از طریق Majesticجستجوی گوگل تحت تأثیر حملات گسترده هرزنامه قرار گرفت

من و بیل در مورد سایت‌های اسپم در فیس‌بوک مسنجر صحبت کردیم و هر دو موافق بودیم که اگرچه ارسال‌کنندگان هرزنامه تلاش زیادی برای ایجاد شبکه‌ای از بک لینک‌ها انجام دادند، اما پیوندها در واقع مسئول رتبه‌بندی بالا نیستند.

بیل گفت:

“به نظر من این تا حدی تقصیر گوگل است که به نظر می رسد بیشتر بر محتوا تاکید می کند تا پیوندها.”

من 100% موافقم که گوگل بیشتر بر محتوا تاکید می کند تا لینک ها. اما من فکر می کنم لینک های هرزنامه وجود دارد تا Googlebot بتواند صفحات هرزنامه را کشف کند و آنها را فهرست کند، البته فقط برای یک یا دو روز.

  خلاصه انجمن جستجوی روزانه: 29 دسامبر 2023

پس از ایندکس شدن، صفحات هرزنامه احتمالاً از دو نقص الگوریتم‌های گوگل استفاده می‌کنند که در ادامه به آن‌ها می‌پردازم.

هرزنامه خارج از کنترل در SERP های گوگل

چندین سایت برای عبارات طولانی رتبه بندی می شوند که رتبه بندی آنها نسبتاً آسان است، و همچنین عباراتی با مؤلفه جستجوی محلی، که رتبه بندی آنها نیز آسان است.

عبارات دم بلند عبارات کلیدی هستند که توسط مردم استفاده می شود، اما بسیار نادر است. Longtail مفهومی است که تقریباً بیست سال است که وجود داشته است و بعداً توسط کتابی به نام The Long Tail در سال 2006 رایج شد: چرا آینده کسب و کار فروش کمتری دارد.

ارسال کنندگان هرزنامه می توانند این عبارات را که به ندرت جستجو می شوند رتبه بندی کنند زیرا رقابت کمی برای این عبارات وجود دارد و رتبه بندی را آسان تر می کند.

بنابراین اگر یک هرزنامه میلیون ها صفحه عبارات طولانی ایجاد کند، آن صفحات می توانند هر روز برای صدها هزار کلمه کلیدی در مدت زمان کوتاهی رتبه بندی کنند.

شرکت‌هایی مانند آمازون از اصل longtail برای فروش صدها هزار محصول در روز استفاده می‌کنند که با فروش یک محصول صد هزار بار در روز متفاوت است.

این همان چیزی است که ارسال کنندگان هرزنامه از آن سوء استفاده می کنند: سهولت رتبه بندی عبارات طولانی.

دومین چیزی که اسپمرها از آن سوء استفاده می کنند، حفره ذاتی در جستجوی محلی است.

الگوریتم جستجوی محلی با الگوریتم رتبه‌بندی کلمات کلیدی غیرمحلی یکسان نیست.

نمونه هایی که برجسته شده اند، انواع Craigslist و کلمات کلیدی مرتبط هستند.

به عنوان مثال عبارت هایی مانند قطعات خودرو Craigslist، اتاق های کریگ لیست برای اجاره، Craigslist برای فروش توسط مالک و هزاران کلمه کلیدی دیگر که اکثر آنها از کلمه Craigslist استفاده نمی کنند.

مقیاس هرزنامه بسیار زیاد است و فراتر از کلمات کلیدی حاوی کلمه “Craigslist” است.

صفحه هرزنامه چگونه به نظر می رسد

با بازدید از صفحات با مرورگر نمی توان دید صفحه هرزنامه چه شکلی است.

  متا از 5 ابزار تبلیغاتی نسل جدید فیسبوک و اینستاگرام رونمایی کرد

من سعی کردم کد منبع سایت های رتبه بندی شده در گوگل را ببینم، اما همه سایت های اسپم به طور خودکار به دامنه دیگری هدایت می شوند.

سپس برای بازدید از وب سایت، URL هرزنامه را در جستجوگر پیوند W3C وارد کردم، اما خزنده W3C نیز نتوانست سایت را ببیند.

بنابراین من عامل کاربر مرورگر خود را به عنوان Googlebot تغییر دادم، اما سایت هرزنامه همچنان مرا هدایت کرد.

این نشان می‌دهد که سایت بررسی نمی‌کند که آیا عامل کاربر Googlebot است یا خیر.

سایت هرزنامه در حال بررسی آدرس های IP Googlebot بود. اگر آدرس IP بازدیدکننده با Google مطابقت داشت، صفحه هرزنامه محتوا را به Googlebot نمایش می‌دهد.

همه بازدیدکنندگان دیگر به دامنه‌های دیگری هدایت شدند که محتوای کلی را نمایش می‌دادند.

برای دیدن HTML وب سایت، مجبور شدم با یک آدرس IP Google از آن بازدید کنم. بنابراین من از تست کننده نتایج غنی گوگل برای بازدید از سایت هرزنامه و ذخیره کد HTML برای صفحه استفاده کردم.

من به بیل هارتزر نشان دادم که چگونه با استفاده از تست کننده Rich Results HTML استخراج کند و او بلافاصله در مورد آن توییت کرد، lol. لعنتی!

Rich Results Tester گزینه ای برای نمایش HTML یک صفحه وب دارد. بنابراین من HTML را کپی کردم، آن را در یک فایل متنی قرار دادم، سپس آن را به عنوان یک فایل HTML ذخیره کردم.

تصویری از کد HTML ارائه شده توسط ابزار Rich Results

جستجوی گوگل تحت تأثیر حملات گسترده هرزنامه قرار گرفتجستجوی گوگل تحت تأثیر حملات گسترده هرزنامه قرار گرفت

سپس فایل HTML را برای حذف هر کد جاوا اسکریپت ویرایش کردم و سپس فایل را دوباره ذخیره کردم.

اکنون توانستم ببینم صفحه وب برای گوگل چگونه به نظر می رسد:

اسکرین شات از صفحه وب اسپم

اسکرین شات از یک صفحه وب هرزنامه رتبه بندی شده در گوگلاسکرین شات از یک صفحه وب هرزنامه رتبه بندی شده در گوگل

یک دامنه برای بیش از 300000 کلمه کلیدی رتبه بندی می شود

بیل صفحه‌گسترده‌ای حاوی فهرستی از عبارات کلیدی را برای من فرستاد که فقط یکی از سایت‌های هرزنامه رتبه‌بندی شده است. یک سایت هرزنامه، فقط یکی از آنها، که برای بیش از 300000 عبارت کلیدی رتبه بندی می شود.

  Facebook Audience Overlap Explained + Ways to Avoid It

اسکرین شات کلمات کلیدی یک دامنه را نشان می دهد

تصویری که نمای نزدیک از یک صفحه گسترده حاوی عبارات کلیدی را نشان می دهدتصویری که نمای نزدیک از یک صفحه گسترده حاوی عبارات کلیدی را نشان می دهد

عبارات کلیدی Craigslist زیادی وجود داشت، اما عبارات دم بلند دیگری نیز وجود داشت که بسیاری از آنها حاوی یک عنصر جستجوی محلی بودند. همانطور که اشاره کردم، رتبه بندی برای عبارات دنباله دار، رتبه بندی برای عبارات جستجوی محلی، و ترکیب هر دو نوع عبارت آسان است، و رتبه بندی برای این عبارات کلیدی بسیار آسان است.

چرا این تکنیک ارسال هرزنامه کار می کند؟

جستجوی محلی از الگوریتم متفاوتی نسبت به الگوریتم غیر محلی استفاده می کند. به عنوان مثال، یک سایت محلی، به طور کلی، برای رتبه بندی برای یک پرس و جو نیازی به لینک های زیادی ندارد. صفحات فقط به انواع مناسب کلمات کلیدی نیاز دارند تا الگوریتم جستجوی محلی را راه اندازی کنند و آن را برای یک منطقه جغرافیایی رتبه بندی کنند.

بنابراین اگر «قطعات خودرو Craigslist» را جستجو کنید، الگوریتم جستجوی محلی را راه‌اندازی می‌کند، و از آنجایی که طولانی است، رتبه‌بندی آن خیلی طول نخواهد کشید.

این یک مشکل مداوم برای چندین سال است. چندین سال پیش، یک وب‌سایت توانست رتبه‌بندی «Rhinoplasty Plano, Texas» را با سایتی حاوی محتوای لاتین رومی قدیمی و عناوین انگلیسی کسب کند. جراحی بینی یک جستجوی محلی طولانی مدت است و پلانو، تگزاس یک شهر نسبتا کوچک است. رتبه بندی این عبارت کلیدی جراحی بینی به قدری ساده بود که وب سایت لاتین زبان توانست به راحتی برای آن رتبه بندی کند.

همانطور که دنی سالیوان در توییتی اذعان کرد، گوگل حداقل از 19 دسامبر از این مشکل هرزنامه آگاه بوده است.

جالب است که ببینیم آیا گوگل بالاخره پس از این همه مدت راهی برای مبارزه با این نوع اسپم ها پیدا می کند یا خیر.

تصویر برجسته توسط Shutterstock/Kateryna Onyshchuk

منبع: https://www.searchenginejournal.com/google-search-overwhelmed-by-massive-spam-attack/504527/