- اسکرین شات از یک شبکه با پیوند نزدیک
- هرزنامه خارج از کنترل در SERP های گوگل
- صفحه هرزنامه چگونه به نظر می رسد
- تصویری از کد HTML ارائه شده توسط ابزار Rich Results
- اسکرین شات از صفحه وب اسپم
- یک دامنه برای بیش از 300000 کلمه کلیدی رتبه بندی می شود
- اسکرین شات کلمات کلیدی یک دامنه را نشان می دهد
- چرا این تکنیک ارسال هرزنامه کار می کند؟
نتایج جستجوی گوگل در روزهای اخیر با حمله هرزنامهای مواجه شده است که میتوان آن را کاملاً خارج از کنترل توصیف کرد. بسیاری از دامنه ها برای صدها هزار کلمه کلیدی رتبه بندی می شوند که نشان می دهد مقیاس این حمله می تواند به راحتی به میلیون ها عبارت کلیدی برسد.
با کمال تعجب، بسیاری از دامنه ها فقط در 24-48 ساعت گذشته ثبت شده اند.
این اخیراً از طریق یک سری پست توسط بیل هارتزر (پروفایل لینکدین) جایی که او یک نمودار پیوند ایجاد شده توسط ابزار بک لینک Majestic را ارسال کرد که شبکه های پیوند چندین سایت هرزنامه را نشان می داد.
نمودار پیوندی که او ارسال کرد، دهها وبسایت را نشان میدهد که نزدیک به یکدیگر مرتبط هستند، که یک الگوی نسبتاً معمولی از شبکههای پیوند هرزنامه است.
اسکرین شات از یک شبکه با پیوند نزدیک
من و بیل در مورد سایتهای اسپم در فیسبوک مسنجر صحبت کردیم و هر دو موافق بودیم که اگرچه ارسالکنندگان هرزنامه تلاش زیادی برای ایجاد شبکهای از بک لینکها انجام دادند، اما پیوندها در واقع مسئول رتبهبندی بالا نیستند.
بیل گفت:
“به نظر من این تا حدی تقصیر گوگل است که به نظر می رسد بیشتر بر محتوا تاکید می کند تا پیوندها.”
من 100% موافقم که گوگل بیشتر بر محتوا تاکید می کند تا لینک ها. اما من فکر می کنم لینک های هرزنامه وجود دارد تا Googlebot بتواند صفحات هرزنامه را کشف کند و آنها را فهرست کند، البته فقط برای یک یا دو روز.
پس از ایندکس شدن، صفحات هرزنامه احتمالاً از دو نقص الگوریتمهای گوگل استفاده میکنند که در ادامه به آنها میپردازم.
هرزنامه خارج از کنترل در SERP های گوگل
چندین سایت برای عبارات طولانی رتبه بندی می شوند که رتبه بندی آنها نسبتاً آسان است، و همچنین عباراتی با مؤلفه جستجوی محلی، که رتبه بندی آنها نیز آسان است.
عبارات دم بلند عبارات کلیدی هستند که توسط مردم استفاده می شود، اما بسیار نادر است. Longtail مفهومی است که تقریباً بیست سال است که وجود داشته است و بعداً توسط کتابی به نام The Long Tail در سال 2006 رایج شد: چرا آینده کسب و کار فروش کمتری دارد.
ارسال کنندگان هرزنامه می توانند این عبارات را که به ندرت جستجو می شوند رتبه بندی کنند زیرا رقابت کمی برای این عبارات وجود دارد و رتبه بندی را آسان تر می کند.
بنابراین اگر یک هرزنامه میلیون ها صفحه عبارات طولانی ایجاد کند، آن صفحات می توانند هر روز برای صدها هزار کلمه کلیدی در مدت زمان کوتاهی رتبه بندی کنند.
شرکتهایی مانند آمازون از اصل longtail برای فروش صدها هزار محصول در روز استفاده میکنند که با فروش یک محصول صد هزار بار در روز متفاوت است.
این همان چیزی است که ارسال کنندگان هرزنامه از آن سوء استفاده می کنند: سهولت رتبه بندی عبارات طولانی.
دومین چیزی که اسپمرها از آن سوء استفاده می کنند، حفره ذاتی در جستجوی محلی است.
الگوریتم جستجوی محلی با الگوریتم رتبهبندی کلمات کلیدی غیرمحلی یکسان نیست.
نمونه هایی که برجسته شده اند، انواع Craigslist و کلمات کلیدی مرتبط هستند.
به عنوان مثال عبارت هایی مانند قطعات خودرو Craigslist، اتاق های کریگ لیست برای اجاره، Craigslist برای فروش توسط مالک و هزاران کلمه کلیدی دیگر که اکثر آنها از کلمه Craigslist استفاده نمی کنند.
مقیاس هرزنامه بسیار زیاد است و فراتر از کلمات کلیدی حاوی کلمه “Craigslist” است.
صفحه هرزنامه چگونه به نظر می رسد
با بازدید از صفحات با مرورگر نمی توان دید صفحه هرزنامه چه شکلی است.
من سعی کردم کد منبع سایت های رتبه بندی شده در گوگل را ببینم، اما همه سایت های اسپم به طور خودکار به دامنه دیگری هدایت می شوند.
سپس برای بازدید از وب سایت، URL هرزنامه را در جستجوگر پیوند W3C وارد کردم، اما خزنده W3C نیز نتوانست سایت را ببیند.
بنابراین من عامل کاربر مرورگر خود را به عنوان Googlebot تغییر دادم، اما سایت هرزنامه همچنان مرا هدایت کرد.
این نشان میدهد که سایت بررسی نمیکند که آیا عامل کاربر Googlebot است یا خیر.
سایت هرزنامه در حال بررسی آدرس های IP Googlebot بود. اگر آدرس IP بازدیدکننده با Google مطابقت داشت، صفحه هرزنامه محتوا را به Googlebot نمایش میدهد.
همه بازدیدکنندگان دیگر به دامنههای دیگری هدایت شدند که محتوای کلی را نمایش میدادند.
برای دیدن HTML وب سایت، مجبور شدم با یک آدرس IP Google از آن بازدید کنم. بنابراین من از تست کننده نتایج غنی گوگل برای بازدید از سایت هرزنامه و ذخیره کد HTML برای صفحه استفاده کردم.
من به بیل هارتزر نشان دادم که چگونه با استفاده از تست کننده Rich Results HTML استخراج کند و او بلافاصله در مورد آن توییت کرد، lol. لعنتی!
Rich Results Tester گزینه ای برای نمایش HTML یک صفحه وب دارد. بنابراین من HTML را کپی کردم، آن را در یک فایل متنی قرار دادم، سپس آن را به عنوان یک فایل HTML ذخیره کردم.
تصویری از کد HTML ارائه شده توسط ابزار Rich Results
سپس فایل HTML را برای حذف هر کد جاوا اسکریپت ویرایش کردم و سپس فایل را دوباره ذخیره کردم.
اکنون توانستم ببینم صفحه وب برای گوگل چگونه به نظر می رسد:
اسکرین شات از صفحه وب اسپم
یک دامنه برای بیش از 300000 کلمه کلیدی رتبه بندی می شود
بیل صفحهگستردهای حاوی فهرستی از عبارات کلیدی را برای من فرستاد که فقط یکی از سایتهای هرزنامه رتبهبندی شده است. یک سایت هرزنامه، فقط یکی از آنها، که برای بیش از 300000 عبارت کلیدی رتبه بندی می شود.
اسکرین شات کلمات کلیدی یک دامنه را نشان می دهد
عبارات کلیدی Craigslist زیادی وجود داشت، اما عبارات دم بلند دیگری نیز وجود داشت که بسیاری از آنها حاوی یک عنصر جستجوی محلی بودند. همانطور که اشاره کردم، رتبه بندی برای عبارات دنباله دار، رتبه بندی برای عبارات جستجوی محلی، و ترکیب هر دو نوع عبارت آسان است، و رتبه بندی برای این عبارات کلیدی بسیار آسان است.
چرا این تکنیک ارسال هرزنامه کار می کند؟
جستجوی محلی از الگوریتم متفاوتی نسبت به الگوریتم غیر محلی استفاده می کند. به عنوان مثال، یک سایت محلی، به طور کلی، برای رتبه بندی برای یک پرس و جو نیازی به لینک های زیادی ندارد. صفحات فقط به انواع مناسب کلمات کلیدی نیاز دارند تا الگوریتم جستجوی محلی را راه اندازی کنند و آن را برای یک منطقه جغرافیایی رتبه بندی کنند.
بنابراین اگر «قطعات خودرو Craigslist» را جستجو کنید، الگوریتم جستجوی محلی را راهاندازی میکند، و از آنجایی که طولانی است، رتبهبندی آن خیلی طول نخواهد کشید.
این یک مشکل مداوم برای چندین سال است. چندین سال پیش، یک وبسایت توانست رتبهبندی «Rhinoplasty Plano, Texas» را با سایتی حاوی محتوای لاتین رومی قدیمی و عناوین انگلیسی کسب کند. جراحی بینی یک جستجوی محلی طولانی مدت است و پلانو، تگزاس یک شهر نسبتا کوچک است. رتبه بندی این عبارت کلیدی جراحی بینی به قدری ساده بود که وب سایت لاتین زبان توانست به راحتی برای آن رتبه بندی کند.
همانطور که دنی سالیوان در توییتی اذعان کرد، گوگل حداقل از 19 دسامبر از این مشکل هرزنامه آگاه بوده است.
بله، قبلاً آن را به تیم تحقیقاتی ارسال کرده ام. در اینجا یک پیش نمایش است. و در حال بررسی است. pic.twitter.com/vJH3EisnXD
– Google SearchLiaison (@searchliaison) 19 دسامبر 2023
جالب است که ببینیم آیا گوگل بالاخره پس از این همه مدت راهی برای مبارزه با این نوع اسپم ها پیدا می کند یا خیر.
تصویر برجسته توسط Shutterstock/Kateryna Onyshchuk
منبع: https://www.searchenginejournal.com/google-search-overwhelmed-by-massive-spam-attack/504527/