Sitemap và robots.txt là hai công cụ nền tảng giúp Google hiểu, lập chỉ mục và điều hướng website WordPress của bạn hiệu quả hơn. Dù là blog cá nhân hay website doanh nghiệp, nếu thiếu chúng, bạn đang làm SEO mà bỏ sót “la bàn định hướng” cho công cụ tìm kiếm.
Bài viết này sẽ hướng dẫn bạn tạo sitemap XML và file robots.txt chuẩn SEO bằng cách dễ hiểu và dễ thực hiện nhất trên WordPress.
📄 1. Sitemap XML là gì và tại sao cần?
Sitemap XML là một file chứa danh sách tất cả các trang quan trọng trên website của bạn – từ bài viết, trang tĩnh đến sản phẩm, hình ảnh…
Google dùng sitemap để:
- Biết được những trang nào cần thu thập dữ liệu (crawling)
- Ưu tiên lập chỉ mục (indexing) những trang mới
- Hiểu cấu trúc nội dung, từ đó cải thiện thứ hạng
Một website có sitemap chuẩn sẽ tăng khả năng xuất hiện trên Google, đặc biệt với site mới hoặc có cấu trúc phức tạp.
🛠 2. Tạo sitemap với plugin SEO (Rank Math, Yoast…)
Phổ biến nhất là dùng plugin SEO để tạo sitemap tự động:
- Rank Math SEO: sitemap tại
yourdomain.com/sitemap_index.xml
- Yoast SEO: sitemap tại
yourdomain.com/sitemap_index.xml
Cách bật sitemap:
- Cài và kích hoạt plugin Rank Math hoặc Yoast
- Vào SEO > Sitemap Settings
- Tùy chọn bật/tắt các loại nội dung (bài viết, trang, sản phẩm…)
- Lưu lại và kiểm tra đường dẫn sitemap
Bạn có thể gửi sitemap này lên Google Search Console để Google lập chỉ mục dễ hơn.
🤖 3. File robots.txt – định hướng cho bot Google
robots.txt là file văn bản giúp bạn:
- Cho phép / chặn bot truy cập vào các phần nhất định của website
- Chỉ định đường dẫn sitemap XML
Ví dụ file robots.txt cơ bản:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://yourdomain.com/sitemap_index.xml
Ý nghĩa:
User-agent: *
áp dụng cho tất cả botDisallow: /wp-admin/
chặn bot vào trang quản trịAllow: /wp-admin/admin-ajax.php
cho phép AJAX hoạt động bình thườngSitemap:
là khai báo link sitemap chính thức
🧰 4. Tạo hoặc chỉnh sửa robots.txt trong WordPress
Cách 1: Tạo file robots.txt thủ công
- Truy cập hosting hoặc FTP
- Tạo file
robots.txt
tại thư mục gốc (public_html) - Dán nội dung cần thiết và lưu lại
Cách 2: Dùng plugin SEO
- Với Rank Math: SEO > General Settings > Edit robots.txt
- Với Yoast: Tools > File Editor > robots.txt
Bạn có thể chỉnh sửa ngay trong Dashboard mà không cần truy cập hosting.
🔍 5. Những đoạn lệnh robots.txt hữu ích
Một số lệnh phổ biến giúp tối ưu crawl:
Chặn thư mục plugin, theme, file riêng tư:
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /private-folder/
Cho phép Google AdsBot hoặc Bingbot truy cập riêng:
User-agent: AdsBot-Google
Allow: /
User-agent: Bingbot
Disallow: /temp/
Không nên chặn toàn bộ WordPress:
Nhiều người lầm tưởng rằng chặn càng nhiều càng tốt, nhưng nếu bạn chặn
/wp-content/
, hình ảnh và CSS của bạn có thể không được lập chỉ mục.
📤 6. Gửi sitemap lên Google Search Console
- Truy cập: https://search.google.com/search-console
- Chọn website của bạn
- Menu bên trái → Sơ đồ trang web
- Nhập phần đuôi của sitemap (ví dụ:
sitemap_index.xml
) - Nhấn “Gửi”
Google sẽ quét và cập nhật trạng thái sitemap trong vài giờ hoặc vài ngày tùy vào mức độ cập nhật nội dung của website.
🧠 7. Những lưu ý quan trọng
- Không nên chặn Google bot trong robots.txt, trừ khi bạn muốn ẩn nội dung đặc biệt
- Không có sitemap không làm website mất index, nhưng có sitemap sẽ tăng tốc lập chỉ mục
- Cập nhật sitemap nếu bạn có thay đổi lớn trong cấu trúc web (ví dụ chuyển nhiều bài sang ẩn/private)
🚀 Kết luận
Sitemap và robots.txt là hai công cụ SEO kỹ thuật dễ thực hiện nhưng mang lại hiệu quả lớn. Chúng giúp Google hiểu bạn đang có gì, muốn ưu tiên trang nào, từ đó đưa nội dung của bạn đến với người tìm kiếm nhanh và chính xác hơn.
Đừng để website WordPress của bạn “mất phương hướng” trước Googlebot – hãy trang bị bản đồ (sitemap) và biển chỉ đường (robots.txt) ngay hôm nay.