গুগল ইনডেক্স সমস্যা ও সমাধান

 বিভিন্ন গ্রুপে অনেকেই গুগলে পোস্ট ইনডেক্স না হওয়ার সমাধান চাচ্ছেন। প্রথমে গুগল এলগারিদম সম্পর্কে বলি। গুগল বট বা ক্রাউলার আপনার সাইটে সর্বোচ্চ ৪৮ ঘণ্টা পর পর আসে। যখন গুগল বট আপনার ওয়েবসাইট আসে তখন ৪/৪০০/৪ লাখ কয়টা পোস্ট ইনডেক্স করবে সেটার জন্য একটা Crawler Budget থাকে। আপনার সাইটের জন্য বাজেট কয়টা এটা আপনি কেন কেউই বলতে পারবে না। আরও নিশ্চিত হতে চাইলে moz dot com সাইটে গুগলের আপডেট সম্পর্কে দেখতে পারেন। কিছু আপডেটের পাশে "Unconfirmed" লেখা মানে এই আপডেট সম্পর্কে Moz নিজেই নিশ্চিত না। গুগল তাদের এলগারিদম কারো সাথেই শেয়ার করে না। প্রথম কথা আপনার সাইটের Crawler Budget (যেটা আপনি জানেন না) এর থেকে বেশি পোস্ট লিখলে লাভ নাই গুগল বট যতটা বাজেটে আছে ওই কয়টাই ইনডেক্স করবে। এখন আসেন আপনি যদি প্রতিদিন ১টা পোস্ট লিখেন সেটাও গুগল ইনডেক্স করে না কেন?
গুগল ইনডেক্স সমস্যা ও সমাধান, গুগল ইনডেক্স, গুগল ক্রাউলার, গুগল ক্রাউল, বিং ইনডেক্স, ইয়াহু ইনডেক্স, robot.txt, সাইটম্যাপ

বিভিন্ন গ্রুপে অনেকেই গুগলে পোস্ট ইনডেক্স না হওয়ার সমাধান চাচ্ছেন। প্রথমে গুগল এলগারিদম সম্পর্কে বলি। গুগল বট বা ক্রাউলার আপনার সাইটে সর্বোচ্চ ৪৮ ঘণ্টা পর পর আসে। যখন গুগল বট আপনার ওয়েবসাইট আসে তখন ৪/৪০০/৪ লাখ কয়টা পোস্ট ইনডেক্স করবে সেটার জন্য একটা Crawler Budget থাকে। আপনার সাইটের জন্য বাজেট কয়টা এটা আপনি কেন কেউই বলতে পারবে না। আরও নিশ্চিত হতে চাইলে moz dot com সাইটে গুগলের আপডেট সম্পর্কে দেখতে পারেন। কিছু আপডেটের পাশে "Unconfirmed" লেখা মানে এই আপডেট সম্পর্কে Moz নিজেই নিশ্চিত না। গুগল তাদের এলগারিদম কারো সাথেই শেয়ার করে না। প্রথম কথা আপনার সাইটের Crawler Budget (যেটা আপনি জানেন না) এর থেকে বেশি পোস্ট লিখলে লাভ নাই গুগল বট যতটা বাজেটে আছে ওই কয়টাই ইনডেক্স করবে। এখন আসেন আপনি যদি প্রতিদিন ১টা পোস্ট লিখেন সেটাও গুগল ইনডেক্স করে না কেন?

আমি একদম শুরু থেকে সবকিছু বলবো। পোস্টে অনেক জানা বিষয়ও থাকবে যাতে নতুন যারা ব্লগিং করছে তাদের সমস্যা না হয়।

কাজ-০১ঃ robot.txt

এটা আপনার সাইটে থাকা আবশ্যক। এটার কমান্ডের মধ্যে "User agent: *" এই লেখাটা ঠিক রাখতে হবে। এখানে অনেকে * উঠিয়ে দিয়ে google search console দেয়। এখানে * না দিলে Bing বা Semrush (যারা র‍্যাংক ট্রাক করেন) বট আপনার সাইটে জীবনেও আসতে পারবে না। ফলে বিং, ইয়াহু দুইটাতেই ইনডেক্স হবে না। (বিং আর ইয়াহুর সার্চ রেজাল্ট একই)। robot.txt generate করার পর এখানে আপনি কোন কিছু করবেন না। সোজা সাইটম্যাপে সাবমিট করবে + ব্লগারের সেটিংসে Custom robot.txt তে সেইভ করবেন। সাইটের পোস্ট ৫০০+ হয়ে গেলে তখন এই কমান্ডের শেষে max-results=500 এটা 1000 করে দিবেন।

কাজ-০২ঃ Custom robots header tags

  • Home page tags: All & noodp এই দুইটা অপশন সিলেক্ট করে সেইভ করবেন।
  • Archive and search page tags: noindex & noodp এই দুইটা অপশন সিলেক্ট করে সেইভ করবেন। এখানে noindex কেন দিতে হয় অনেকে জানেন না। ইউটিউবে ভিডিও দেখেন দিয়ে দেন। আবার অনেকে দেন না। অনেকে দেখবেন পোস্ট দেয় খুব ভালো SEO করায় তার সাইট গুগলে সার্চ করলে প্রথম আলো, বিবিসি এর মতো মেইন টাইটেলের নিচে সাইটের আরও কিছু লিংক শো করে। তারা মূলত noindex অপশন অফ রাখছে অথবা আগে অফ ছিল ওইসময় গুগল বট Archive পেইজকে/ ক্যাটাগরি ক্রাউল করে গিয়েছে। এগুলোর রেজাল্টই মূলত কয়েক মাস শো করে এবং ল্যান্ডিং পেইজ হিসেবে কাজ করে। তবে কেউ চাইলে ব্লগারে schema code ব্যবহার করে নির্দিষ্ট পোস্ট শো করাতে পারে কিন্তু ক্যাটাগরি না। সেটা আলাদা বিষয়। এটা noindex না রাখলে বড় ধরণের বাজে ইফেক্ট পড়তে পারে সাইটে। কারণ আপনার ক্যাটাগরি ইনডেক্স করতে গিয়ে ক্রাউলিং বাজেট নষ্ট হবে ফলে পোস্ট ইনডেক্স করবে না। তাই অভিজ্ঞ ব্লগাররা এটা noindex দিয়ে রাখতে বলে।
  • Post and page tags: All & noodp এই দুইটা অপশন সিলেক্ট করে সেইভ করবেন।

এখানে আপনি সব সেটিংস আপনার সাইটে এভাবে সেইভ করে রাখলে আপনার সব পোস্ট এইভাবেই বটকে আলাউ গুগল ইনডেক্স করতে আলাউ করবে।

আরও পড়তে পারেনঃ কিভাবে অনলাইনে ইনকাম করা যায়?

                                 মস্তিষ্ক কিভাবে কাজ করে
                                 চাকরিপ্রার্থীরা যেভাবে চাকরির জন্য সিভি (CV) উপস্থাপন করবে

কাজ-০৩ঃ আপনার সাইটে অবশ্যই সাইট ম্যাপ থাকতে হবে। গুগল বা বিং যে ক্রাউলার সাইটে আসুক না কেন প্রথমে আপনার robot.txt কমান্ড দেখে এরপরেই আপনার সাইটম্যাপ খুঁজে। সাইটম্যাপ থাকলে বট সহজেই বুঝতে পারবে আপনি নতুন কী পোস্ট দিয়েছেন, পুরাতন কোন পোস্ট আপডেট করেছেন। সাইটম্যাপ না থাকলে এটি সাইটে সব পোস্ট ঘুরতে থাকবে এবং আপনার Crawl Budget অপচয় হবে।

অনেকে url inspection দিয়ে মনে করেন পোস্ট ইনডেক্স হয়ে গেছে। এটা দেওয়ার অর্থ আপনি গুগলের বটকে আমন্ত্রণ জানিয়েছেন আসবে কিনা সেটা ক্রাউলারের সিদ্ধান্ত। আমি url inspection করার সাথে সাথে পোস্ট ইনডেক্স হয়ে যায়। ভিজিটর প্রচুর থাকলে আর ইউনিক কনটেন্ট দিলে গুগলেরই তাড়া থাকবে আপনার পোস্ট ইনডেক্স করার।

এগুলো করার পর যদি ইনডেক্স না হয় তাহলে যা করবেন

১. আপনার পোস্টে ইন্টার্নাল লিংকিং করবেন। পোস্টের কোন জায়গাতে এমন লিংক রেফার করবেন না যেখানে গেলে 404 page শো করে। সেক্ষেত্রে গুগল পোস্ট ইনডেক্স করবে না।

২. কপিরাইট কনটেন্ট দিলে পোস্ট ইনডেক্স করতে চায় না। পাশাপাশি শুরুতেই এমন কনটেন্ট লিখতে যাবেন না যেটা নিয়ে অনেক বড় বড় সাইট প্রচুর তথ্যবহুল কনটেন্ট লিখেছে। এটা চেক করতে "allintitleঃজাতীয় পরিচয়পত্র ডাউনলোড" এভাবে সার্চ করলে কতজন তাদের টাইটেল হিসেবে এটা ব্যবহার করেছে দেখতে পাবেন। যদি ১৫০ এর বেশি রেজাল্ট শো করে তবে সেইটা নিয়ে না লেখাই ভালো।

৩. পোস্ট করার সাথে সাথে নিশ রিলেটেড ৪-৫টা গ্রুপে পোস্ট শেয়ার করবেন। ২০-২৫ জন ভিজিটর আনার ট্রাই করবেন। আবার নিজেই বিভিন্ন ইমেইল দিয়ে ১০০ বার পোস্ট ভিজিট করার প্রয়োজন নেই।

৪. নিম্ন মানের কনটেন্ট লিখলে। যেমনঃ গুগল ট্রান্সলেটর ব্যবহার করে, উইকিপিডিয়া থেকে কপি-পেস্ট + এডিটিং করে ইউনিক বানানো হলে, কিওয়ার্ড ডেনসিটি মেইনটেন না করলে ইত্যাদি।

এরপরেও যদি পোস্ট ইনডেক্স না হয় কী করবেন?

সাইটের সবকিছু ঠিকঠাক থাকলে পোস্ট ইনডেক্স করা না করা গুগল ক্রাউলারের উপর নির্ভর করে। তবে আপনার কোন পোস্টকে ইনডেক্স না করলে ক্রাউল বাজেট নষ্ট না করে ক্রাউলারকে সেই পোস্টে আবার পাঠাতে পারবেন। এরজন্য কোন কোন পোস্টকে গুগল ইনডেক্স করছে না সেগুলোর লিংক নিন। পরে ১০০ ওয়ার্ডের একটা ইউনিক আর্টিকেল (গুগলে নেই এমন টপিক হলে ভালো) লিখে সেখানে ইনডেক্স না হওয়া সর্বোচ্চ ৩টা (এর বেশি ইনডেক্স না হলে একই প্রসেসে আরেকটা পোস্ট লিখবেন) পোস্ট লিংকিং করুন। এখন ক্রাউলার যখন আপনার এই আর্টিকেলে আসবে তখন এই ৩টা লিংকেও সে যাবে কোন Adult, Alcohol, Broken Link etc রিলেটেড পোস্টের লিংকিং করেছেন কিনা চেক করতে। ফলে আপনার ইনডেক্স না হওয়া পোস্টের বাজেট নষ্ট না করেই গুগল বটকে পাঠাতে পারবেন। এই জাতীয় কিছু কৌশল করেই সব পোস্ট দ্রুত ইনডেক্স করাতে পারবেন।

শেয়ার
আজকের সেরা খবর গতকালের সেরা খবর
6 জন মতামত দিয়েছেন
কমেন্ট করতে ক্লিক করুন
comment url