การจัดการ URL Parameter เพื่อป้องกันปัญหา Duplicate Content

การจัดการ URL Parameter เพื่อป้องกันปัญหา Duplicate Content

เว็บไซต์อีคอมเมิร์ซที่มีสินค้าจริงแค่ 100 ชิ้น อาจมีหน้าเว็บปรากฏในสายตาของ Google เป็น 1,000 หรือ 10,000 หน้าได้โดยที่คุณไม่รู้ตัว สาเหตุหลักของปรากฏการณ์หน้าเว็บงอกเองนี้เกิดจากสิ่งที่เรียกว่า URL Parameter ค่ะ เช่น เวลาลูกค้ากดกรองสินค้าตาม สี ตามราคา หรือกดเรียงลำดับจากน้อยไปมาก URL ด้านบนจะเปลี่ยนไป เช่น ?color=red, ?sort=price_asc ในสายตาของมนุษย์ หน้าเว็บมันก็คือหน้าเดิมที่เปลี่ยนการแสดงผลนิดหน่อย แต่ในสายตาของ Robot มันมองว่า นี่คือคนละ URL กัน = คนละหน้ากัน แต่ดันมีเนื้อหาเหมือนกันเป๊ะ สิ่งนี้นำไปสู่ปัญหา Duplicate Content ที่ทำให้คะแนน SEO ของคุณถูกหารแบ่ง และทำให้อันดับร่วงกราวรูด บทความนี้จะพาไปดูวิธีจัดการเจ้าตัวปัญหา URL Parameter ให้อยู่หมัด เพื่อกู้คืนพลัง SEO กลับมาค่ะ

ทำไม URL Parameter ถึงน่ากลัวสำหรับ SEO

ทำไม URL Parameter ถึงน่ากลัวสำหรับ SEO

ก่อนจะไปแก้ ต้องเข้าใจความเสียหายก่อนค่ะ เมื่อ Google เจอ URL ที่มีเนื้อหาซ้ำกันหลายๆ เวอร์ชัน เช่น หน้าเสื้อยืดธรรมดา กับ หน้าเสื้อยืด ?session_id=123 จะเกิดปัญหา 3 อย่าง

  1. Crawl Budget รั่วไหล Google Bot มีโควตาในการเข้ามาเก็บข้อมูลเว็บเราจำกัด แทนที่จะเอาเวลาไปเก็บหน้าสินค้าใหม่ๆ ดันต้องเสียเวลาไปเก็บหน้า Parameter ไร้สาระพวกนี้
  2. Keyword Cannibalization  Google จะงงว่าตกลงหน้าไหนคือหน้าหลักที่ควรเอาไปติดอันดับ สุดท้ายเลยไม่ให้ติดอันดับสักหน้า หรือสลับกันขึ้นๆ ลงๆ
  3. Link Juice เจือจาง ถ้ามีคนลิงก์มาหาเว็บเรา แต่บางคนลิงก์ไปหน้าหลัก บางคนลิงก์ไปหน้าที่มี Parameter พลังของ Backlink นั้นจะถูกกระจายออกไป ไม่รวมเป็นหนึ่งเดียว
วิธีที่ 1 ใช้ Canonical Tag

วิธีที่ 1 ใช้ Canonical Tag 

นี่คือวิธีที่ Google แนะนำและได้ผลดีที่สุดค่ะ Canonical Tag คือโค้ด HTML บรรทัดเล็กๆ ที่เราเอาไปแปะไว้ในส่วน <head> ของหน้าเว็บ เพื่อบอก Google ว่า ไม่ว่าเธอจะเข้ามาที่ URL ไหน เช่น ?sort=price ขอให้รู้ไว้ว่า หน้าต้นฉบับตัวจริงคือ URL นี้นะ

ตัวอย่างการทำงาน

สมมติหน้าหลักคือ example.com/shoes

แต่ลูกค้ากดเรียงราคา URL กลายเป็น example.com/shoes?sort=low-to-high

ในหน้าที่มี ?sort=low-to-high เราต้องติด Canonical Tag ว่า:

<link rel=”canonical” href=”https://example.com/shoes” />

เพียงเท่านี้ Google ก็จะเมินหน้า Parameter และเทคะแนน SEO ทั้งหมดไปให้หน้าหลักหน้าเดียวค่ะ

วิธีที่ 2 ตั้งค่าใน Robots.txt 

ถ้าคุณมั่นใจว่า Parameter บางตัว “ไม่มีประโยชน์เลยในทาง SEO” และไม่ต้องการให้ Google เข้ามายุ่งเลย เช่น Parameter ที่ใช้เก็บ Session ID ?sid=… หรือ Parameter สำหรับการค้นหาภายในเว็บ ?q=…

คุณสามารถสั่งบล็อกผ่านไฟล์ Robots.txt ได้เลยค่ะ

คำสั่งเช่น Disallow: /*?sid=

ข้อควรระวัง วิธีนี้จะทำให้ Google ไม่เข้ามาเก็บข้อมูลหน้านั้นเลย ซึ่งดีต่อ Crawl Budget แต่ข้อเสียคือ Google จะไม่เห็น Link Equity ที่ส่งผ่านหน้านั้นมา ดังนั้นควรใช้เฉพาะกับ Parameter ที่ไม่สำคัญจริงๆ เท่านั้นค่ะ

วิธีที่ 3 ใช้ Noindex Tag

สำหรับหน้า Filter บางประเภทที่เรายังอยากให้ Google เข้ามาสำรวจลิงก์สินค้าข้างใน แต่ไม่อยากให้เอาหน้ารวม Filter นั้นไปติดอันดับ เราสามารถใช้ Meta Tag noindex ได้ค่ะ

เช่น หน้ากรองสินค้า ราคา 500-1,000 บาท เราอาจจะติด <meta name=robots content=noindex, follow>

แปลว่า Google จ๋า เธอเข้ามาหน้านี้ได้นะ ตามลิงก์สินค้าในหน้านี้ไปได้เลย แต่ห้ามเอาหน้ากรองราคานี้ไปโชว์ในผลการค้นหานะ วิธีนี้ช่วยลดปัญหา Duplicate Content ในหน้าผลการค้นหาได้ดีมาก โดยไม่ตัดโอกาสในการเก็บข้อมูลสินค้าภายใน

จัดระเบียบบ้าน ให้ Google เดินสะดวก

จัดระเบียบบ้าน ให้ Google เดินสะดวก

การจัดการ URL Parameter ไม่ใช่แค่เรื่องทางเทคนิคที่น่าปวดหัว แต่เป็นเรื่องของ การจัดระเบียบบ้าน ให้ Google Bot เข้าใจโครงสร้างเว็บเราได้ง่ายที่สุดค่ะ หลักการจำง่ายๆ คือ 1 เนื้อหา ควรมี 1 URL เท่านั้น ถ้าจำเป็นต้องมีหลาย URL ต้องรีบชี้แจงแถลงไขให้ Google รู้ผ่าน Canonical Tag ทันที เมื่อเรากำจัดหน้าซ้ำๆ ออกไปได้ Google ก็จะมองเห็นคุณภาพเนื้อหาที่แท้จริงของเว็บเรา และมอบอันดับที่ดีขึ้นให้เป็นรางวัลค่ะ

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *


ติดต่อ "แว่นTalk"