آشنایی با گوگل پاندا (google panda)
گوگل پاندا: به سلسله تغیرات اعمالی در فلوچارت نمایش نتایج جستجو در گوگل گفته میشود که از اواخر فوریه ی سال 2011 (اسفند 1389) این تغیرات اعمال شد و کماکان ادامه دارد. هدف از اعمال این تغیرات افزایش رتبه ی سایت های کیفیت بالا و در نتیجه ی آن نمایش آنها در در بالای صفحه ی جستجو و کاهش رتبه ی سایت های کیفیت پایین میباشد.
بر اثر اعمال این تغیرات از سوی شرکت گوگل ، بسیاری از سایت های خبری و شبکه های اجتماعی در جستجوی گوگل در جایگاه های بالا تر نسبت به سایت هایی که با حجم بالایی از تبلیغات و آگهی های مزاحم ایجاد شده بودند قرار گرفت تا جایی که گوگل اعلام کرد، در نسخه ی اول گوگل پاندا چیزی در حدود 12 درصد از تمام نتایج جستجو این موتور جستجوگر در تحت تاثیر این تغیرات قرار گرفته اند.
نحوه ی کار به گونه ای است که، روبات های crawler گوگل،هم زمان با چرخ زدن در اینترنت تمام وب سایت ها و لینک هایی را که به محیطش اضافه میشوند را شناسای می کند و همه ی آن ها را به یک ایندکس بسیار بزرگ اضافه می کند. سپس هر یک از این صفحات که ایندکس میشود از الگوریتمی عبور داده میشود که شاخص های مختلف رده بندی گوگل را شامل می شوند. سپس این شاخص ها هستند که تعیین می کنند که این صفحه در کجای رتبه بندی گوگل قرار گیرد و در کدام صفحه ی نمایش نتایج قرار گیرد. اما جایگاه پاندا در کدام قسمت از این برنامه گوگل قرار دارد؟ پاندا در این الگوریتم در بالا ترین نقطه قرار گرفته و ناخالصی های موجود را جدا میکند.
قبل از این برنامه و پیش از اعمال گوگل پاندا، سایت های کیفیت پایین زیادی وجود داشت که با کپی برداری مطالب مفید و دسته اول از سایت های دیگرف رتبه ی خود را در صفحه ی نمایش نتایج جستجو در گوگل به طور چشم گیری ارتقا داده بودند. اما برنامه ریزی پاندا به گونه ای است که به دنبال مطالب دست اول و تولیدی می باشد و وب سایت هایی را که چنین مطالبی تولید میکنند را ارتقا داده و در رتبه بندی بالاتری قرار میدهدو در مقابل، رتبه ی سایت هایی را که از سایت های دیگر کپی برداری -چه مجاز چه غیر مجاز- می کنند و مطالب کیفیت پایین -دست دوم و...- منتشر میکنند را کاهش می دهد.
با این تفاسیر،آیا گوگل پاندا در راستای منافع کاربران اینترنتی عمل مثبتی انجام داده است؟ نتایج حاصل ازبرخی تحقیقات گویای این مسله است که پاندا در انجام وظیفه ی خود موفق بوده است. مجله ی New Scientist در شماره ی 15 دسامبر 2011 خود این موضوع را مورد برسی قرار داد. در این برسی از تعدادی از کاربران اینترنت خاسته شد در دو مرحله و در ماه های آگوست و مارس 2011، با استفاده از موتور های جستجوگر گوگل و بینگ 50 جستجوی از پیش تعیین شده را انجام دهند تا مشخص گردد این دو موتور جستجو بر طبق گفته ی خود موفق شده اند کاربران اینترنتی را از شر علفزار های محتوا content farm –مطالب بی کیفیت – نجاد دهند یا خیر. علفزار محتوا یا همان content form اصطلاحی است که برای وب سایت هایی به کار برده میشود که تعداد زیادی نویسنده دارندکه بی محابا و بدون در نظر گرفتن کپی رایت و سایر قوانین اخلاقی و حقوقی اقدام به کپی برداری از مطالب تولیدی در سایت های دیگر میکنند. در بیشتر مواقع مطالب منتشر شده در این نوع وب سایت ها بدون ذکر منبع می باشد و اعتبار لازم را نیز برای خاننده فراهم نمیکند و معمولا به گونه ای انتخاب می شوند که با عبارات جستجو شده در موتور های جستجو هم خوانی داشته باشند. هدف این سایت ها تنها جذب کاربران به سوی پیج ها ی خود وبالا بردن بازدید روزانه و در نهایت بالا بردن رتبه ی خو در صفه ی نمایش نتایج جستجو می با شند. لازم به ذکر است هدف اصلی در این نوع سایت ها ، سود جویی از طریق جدب مخاطب و به طبع آن جدب کلیک و در نتیجه آگهی بیشتر است.
جستجو ها ی تعین شده از سوی کارشناسان New Scientist ، در چارچوبه ای با این عبارات انجام شد: ((چگونه برای ماراتون تمرین کنیم؟)) قبل از این، نتایج جستجو برای این گونه از عبارات بیشتر کاربران را به سوی سایت های تبلیغاتی و عموما سایت هایی که هدف اصلی آنها تبلیغات است هدایت می کرد. این گونه سایت ها از نظر کارشناسان New Scientist سایت های کیفیت پایین در نظر گرفته شدند. جالب است بدانید در جستجوی ((چگونه برا ی ماراتون تمرین کنیم ؟)) در ماه مارس 2011 –چند روز بعد از اعمال اولین نسخه ی گوگل پاندا – سایت هایی در 10 رتبه ی اول نمایش نتایج گوگل قرار گرفتند که محل تبلیغ کفش های دوی مارتون، لوازم ورزشی و اجناسی از این دست بودند. اما جستجو های انجام گرفته در ماه آگوست –مرحله بعدی، ینی بعد از شش ماه از معرفی گوگل پاندای اولیه- به روشنی نتایج دیگری مشاهد میشد، رتبه های بالای صفحه ی نتایج جستجوی گوگل در این مرحله در دست سایت های با کیفیت بالا و معتبر بود، مثلا در مورد ((چگونه برای ماراتون تمرین کنم؟))، وب سایت مجله ی دنیای دونده در این مرحله به رتبه ی اول آمد و بالا تر از سایر سایت ها قرار گرفت. با برسی 50 صفحه ی اول جستجوی تمام کاربران، مشخص شد گوگل و بینگ در گزینش کردن وب سایت ها موفق عمل کرده بودند.
اکنون با گدشت چند سال از برسی نيوساينتيست، در صورتي که همان عبارت مربوط به ماراتون را در گوگل جستجو کنيم، خواهيم ديد که نتايج جستجو باز هم دقيق تر شده است } اين جا را ببينيد.{ اين بار وب سايتي که مختص تمرين در دوي ماراتون است (www.marathonrookie.com) از مجله دنياي دونده نيز بالاتر آمده و در رتبه اول نتايج جستجو، نمايش داده شده است. ديگر وب سايت هاي ليست شده در صفحه اول نتايج جستجو نيز وب سايت هاي معتبر و با کيفيت هستند و ديگر خبري از وب سايت هاي تبليغاتي نيست.
مشکل علفزارهاي محتوا، در ميان وب سايت هاي فارسي زبان نيز به وفور وجود دارد و اغلب کاربران را می آزارد. البته شواهد نشان مي دهد طي ماه هاي اخير پانداي گوگل به خوبي در ميان وب سايت هاي فارسي زبان نيز دست به کار شده و کاربران را از دست وب سايت هايي که پر از محتواي نامربوط وآگهي هاي تبليغاتي بودند نجات داده است. پيش از اين، در جستجوي عبارت هاي «عمومي» در گوگل، معمولا به راحتي مي توانستيد از خير چند نتيجه اول صفحه نمايش نتايج جستجو بگذريد، چرا که رتبه هاي بالاي نتايج جستجو اغلب در اختيار وب سايت هاي کيفيت پايين و تبليغاتي بود.
نام برنامه ی گوگل پاندابرگفته از نام خانوادگی یکی از مهندسان خود ناونيت پاندا (Navneet Panda) می باشد. گوگل با توجه به سیاست های خود جزیات زسادی را در باره ی نحوی عملکرد برنامه ی جستجوی پاندا منتشر نمی کند و خب شاید یکی از دلایل موفقیت این شرکت در مقابل سایر رقبا در همین نکته نهفته باشد. با این حال، وبلاگ رسمي وب مستر گوگل بر روي Blogspot تا کنون با وب مسترها مهربان بوده و گاه به گاه نکاتي را در مورد شاخصه هاي مورد نظر پاندا در دست چين کردن و رتبه بندي وب سايت ها منتشر مي کند. به طور مثال در بخشي از يکي از پست هاي اين وبلاگ آمده است:
«محتواي کيفيت پايين در بخش هايي از سايت مي تواند روي رتبه کل سايت تاثير بگذارد.»
بر اساس اين متن،گوگل به این نکته اشاره میکند که بدون شک بايد فکري به حال محتواي کيفيت پايين که ممکن است مدت ها قبل بر روي وب سايت خود منتشر کرده ايد نيز باشيد؛ يا آنها را اصلاح کنيد يا براي هميشه از روي وب سايت خود حذف کنيد.
گوگل در اکثر مواقع بدون اطلاع قبلي به کاربران الگوريتم پاندا را به روز رسانی مي کند و پس از آن معمولا از طريق گفته هاي غيررسمي مي توان از اين مسئله باخبر شد در نهایت با تاخير مي توان تاييد مسئولان گوگل در مورد آپديت جديد اين الگوريتم را گرفت. وب مسترها هميشه تغييرات و آپديت هاي پانداي گوگل را رصد مي کنند. اما چرا اطلاع از زمان آپديت هاي گوگل پاندا براي وب مسترها از اهميت بالايي برخوردار است؟ در اين ميان نکته مهمي وجود دارد و آن تفاوت در عملکرد الگوريتم پاندا نسبت به الگوريتم کلي جستجو در گوگل است. در حالت عادي با اضافه شدن يک لينک به يک وب سايت، روبات هاي crawler گوگل به آن سر مي زنند و آن را ايندکس مي کنند. اين موضوع در مورد سايت هايي که رتبه بالايي دارند بلافاصله انجام مي شود و سايت هايي که رتبه پايين تري دارند، معمولا از يک تا چند روز بايد صبر کنند تا لينک آن ها نيز ايندکس شود و در نتايج جستجو نمايش داده شود.
به سوال قبل باز می گردیم؛ چرا اطلاع از زمان آپديت هاي گوگل پاندا براي وب مسترها اهميت دارد؟ همانطور که اشاره شد پاندا عملکردي متفاوت دارد؛ پاندا با هر بار به روز رسانی سري به وب سايت ها مي زند و بر اساس شاخصه هاي خود (که ممکن است به روز شده باشند يا نه) وب آن ها را رتبه بندي مي کند. در اين زمان، وب سايت هاي زيادي ارتقاء پيدا مي کنند و بسياري نيز مورد غضب پاندا قرار مي گيرند و سقوط مي کنند. تا آپديت بعدي پاندا - که طبق سابقه گاهي ممکن است از چند روز تا دو ماه متغير باشد - وب سايت هايي که دچار کاهش بازديد شده اند بايد خود را با شاخصه هاي پاندای جدید و به روز شده به روز کنند تا بار ديگر رتبه خود را به دست آورند.
اگر بخواهيم فراز و فرود های وب سايت ها را در اثر آپديت هاي گوگل پاندا ببينيم، بد نيست به بررسي انجام شده توسط وب سايت searchmetrics.com در مورد تاثير آپديت 2.5 پاندا که در اواخر سپتامبر 2011 از سوي گوگل اعمال شد نگاهي داشته باشيم. در اين آپديت هم مثل آپديت هاي قبلي، برخي وب سايت هاي امريکايي جزء بازنده ها بودند و برخي ديگر جزء برنده هاي ميدان جستجو. در تصوير زير آدرس دومين برخي از اين وب سايت ها آمده است. همچنين درصد رشد و يا سقوط آن ها نيز مشخص شده است.
در مورد شاخصه های مد نظر پاندا ساعت ها میتوان سخن گفت. اما در عين حال شايد بتوان نکات کلي و اصلي در اين زمينه که بايد به نوعي در اداره يک وب سايت از آن ها فاصله گرفت را به طور خلاصه اينگونه بر شمرد؛ هر چند اين ليست را به هيچ وجه نمي توان ليستي کامل دانست:
استفاده بيش از حد از تبليغات
متاتگ ها و تگ هاي نامناسب در وب سايت
استفاده بيش از حد از يک تگ يا تگ هاي نامربوط در يک صفحه که اغلب کاربران را گمراه می کند
لينک هاي منقطع (به طور مثال لينک هايي که به خطاي 404 منتهي مي شوند)
محتواي کيفيت پايين در کل وب سايت
محتواي کيفيت پايين در بخشي از وب سايت
زمان کوتاه حضور هر کاربر بر روي وب سايت
مشکلات فني وب سايت
استفاده از قالب هاي آماده
نکاتي که بايد در مورد شاخصه هاي مدنظر گوگل پاندا رعايت کرد، در حوزه SEO يا «بهينه سازي وب سايت براي موتورهاي جستجو» قرار مي گيرد. نکته مهم آن که اکنون ديگر زمان فريب گوگول با استفاده از ترفندهاي خاص بهينه سازي به پايان رسيده است. بدون شک پانداي گوگل باهوش تر از هميشه در بالاترين نقطه الگوريتم جستجوي گوگل نشسته و کار جداسازي لينک ها را انجام مي دهد و همواره مخاطب و خوراکي که به او ارائه مي دهد را بيش از هر چيز ديگر مد نظر قرار مي دهد. و بیش از بیش به رفاه حال کاربر امنیت میدهد.