Tổng quan về robots.txt cho Xenforo

Thảo luận trong 'SEO for XenForo' bắt đầu bởi VXF, 28/5/13.

1votes
5/5, 1 vote

  1. VXF

    VXF Be like no other .. Staff Member

    Bài viết:
    1,277
    Likes :
    2,175
    Một trong những điều quan trọng để website của bạn có thể đạt thứ hạng cao khi tìm kiếm (Google) là bạn phải thiết lập cho mình một file Robots.txt đúng chuẩn.

    [​IMG]

    Vậy file Robots.txt là gì?
    Khi một search engine vào website của bạn vào tìm kiếm (Crawler), nó sẽ tìm một file đặc biệt trước tiên, đó là file robots.txt. File robots.txt cho search engine đó biết rằng, website này có thể index hoặc không (tùy theo lệnh được viết trong file robots.txt).

    Thực chất, file robots.txt là một tập tin văn bản đơn giản (không chứa mã HTML) được đặt trong thư mục gốc của web site, ví dụ: http://vxf.vn/robots.txt.

    Robots.txt hoạt động bằng cách xác định một user-agent và một command cho user-agent này.

    Các tham số có trong file robots.txt
    - User-agent: khai báo tên search engine mà bạn muốn thiết lập khu vực truy cập với nó. VD: Googlebot
    - Disallow: là khu vực mà bạn muốn khoanh vùng không cho phép search engine truy cập.
    - Crawl-Delay: thông số này xác định thời gian (tính bằng giây) search phải đợi trước khi chuyển sang site tiếp theo. Điều này sẽ có ích để ngăn chặn các search engine load server tùy tiện.
    - Dấu # được sử dụng trước các dòng cần comment.

    Tại sao bạn nên sử dụng Robots.txt?
    - Ngăn chặn search engine tìm kiếm các trang bạn không mong muốn (có thể là nội dung riêng tư) hiển thị trong kết quả tìm kiếm.
    - Ngăn chặn search engine tìm kiếm các thông tin "rác" (không có ích về nội dung). Do SE luôn luôn có bot truy cập vào toàn bộ website của bạn để thu thập thông tin. Bằng cách sử dụng robots.txt để loại bỏ "rác", bạn sẽ giúp SE tập trung thu thập chính xác nội dung của website, giảm thiểu các index không cần thiết. Khi chất lượng nội dung của website tăng lên thì các từ khóa cũng sẽ được đánh giá cao trên SE.

    Làm thế nào để tạo ra một file robots.txt?
    Rất đơn giản, bạn có thể mở chương trình Notepad hay bất cứ chương trình soạn thảo văn bản nào, lưu file với tên robots.txt là xong.

    File Robots.txt "chuẩn" (do mình đã nghiên cứu và sử dụng cho VXF.VN)
    Mã:
    User-agent: *
    Disallow: /account/
    Disallow: /admin.php
    Disallow: /ajax/
    Disallow: /conversations/
    Disallow: /find-new/
    Disallow: /forums/-/
    Disallow: /forums/tweets/
    Disallow: /goto/
    Disallow: /help/
    Disallow: /login/
    Disallow: /lost-password/
    Disallow: /misc/style?*
    Disallow: /misc/quick-navigation-menu?*
    Disallow: /online/
    Disallow: /posts/
    Disallow: /threads/tera-tweet-from-*
    Disallow: /credits/
    Disallow: /register/
    Disallow: /search/
    Disallow: /members/
    Disallow: /member-map/
    Disallow: /attachments/
    Allow: /
    Những lưu ý khi tạo file robots.txt
    Khi các bạn tạo và sử dụng robots.txt cho website cần chú ý các điểm sau:
    - Không thay đổi trật tự của các dòng lệnh (User-agent luôn ở trên).
    - Phân biệt chữ hoa chữ thường.
    - Không được viết thiếu khoảng trắng.
    - Không nên chèn thêm bất kỳ ký tự nào khác ngoài các cú pháp ở trên.
    - Mỗi một câu lệnh nên viết trên 1 dòng.
    - Không được để khoảng trắng ở đầu dòng.
    Alucar
    Ghi rõ nguồn khi www.vxf.vn khi trích dẫn lại bài viết này.
     

    Các file đính kèm:

    Đang tải...
  2. Hạnh Lux

    Hạnh Lux Verified User

    Bài viết:
    495
    Likes :
    107
    Admin cho hỏi là mình copy và paste y hệt như của bác thì có sao ko? liệu có gì trục trặc ko ?
     
  3. Mr.iCoder

    Mr.iCoder VIP Member

    Bài viết:
    523
    Likes :
    497
    Thanks anh :D
     
  4. Mr.Bo

    Mr.Bo Member

    Bài viết:
    116
    Likes :
    16
    chắc ko có vấn đề, cơ bản file robot là như nhau, bác so lại thư mục của bác và xóa một số ko cần thiết
     
  5. congmanh333

    congmanh333 Member

    Bài viết:
    256
    Likes :
    56
    Bác admin đã nói đây là file robot bác ấy nghiên cứu là tối ưu nhất, không thay đổi trật tự các dòng lệnh, vậy có nên xóa không
    Và có 1 vấn đề admin cho mình hỏi
    Link của diễn đàn mình có dạng : tenmien/forum
    Link trong 1 box là : tenmien/forum/forums
    Vậy có nên giữ lại dòng này không : Disallow: /forums/-/
     
  6. Lê Tí

    Lê Tí Well-Known Member

    Bài viết:
    1,450
    Likes :
    620
    thêm link sitemap vào file robots.txt :D
     
  7. congmanh333

    congmanh333 Member

    Bài viết:
    256
    Likes :
    56
    Có cần thiết không khi sitemap đã gửi lên google thông qua google webmaster
     
  8. dangit

    dangit Member

    Bài viết:
    94
    Likes :
    19
    Cách tạo cái này ntn các cụ nhỉ
     
  9. congmanh333

    congmanh333 Member

    Bài viết:
    256
    Likes :
    56
     
  10. VXF

    VXF Be like no other .. Staff Member

    Bài viết:
    1,277
    Likes :
    2,175
    Vẫn giữ lại bạn nhé. dòng đó có tác dụng là chặn các trang (đánh dấu forum đã đọc)
    Lưu ý là up file robots vào trong thư mục forum nhé.


    Sitemap đã submit ở Google Webmaster rồi Tí
     
    congmanh333 thích bài này.
  11. Lê Tí

    Lê Tí Well-Known Member

    Bài viết:
    1,450
    Likes :
    620
    e đọc vài bài hd thấy nó bẩu thế nên tiện e cm theo, Sờ EO thì e còn biết chứ SEO thì e chịu :">
     
    kaizencoming thích bài này.
  12. kaizencoming

    kaizencoming Member

    Bài viết:
    636
    Likes :
    127
    Mình thắc mắc có những thư mục ko muốn người khác biết để vào robot.txt có tiện ko Alucar ?
     
  13. ku Hiệu

    ku Hiệu Lì Lắm Luôn

    Bài viết:
    1,345
    Likes :
    862
    các lệnh này khi thêm vào Other disallowed pages
    của Robots.txt options tích hợp khi cài sitemap sẽ phải thêm thế nào đây anh admin bự
     

    Các file đính kèm:

    • 1.jpg
      1.jpg
      Kích thước:
      100 KB
      Đọc:
      0
  14. antv

    antv Member

    Bài viết:
    429
    Likes :
    99
    tại mình up rồi mà ko thấy giống trong ảnh nhỉ, hay phải cài thêm sitemap ?
     
  15. ku Hiệu

    ku Hiệu Lì Lắm Luôn

    Bài viết:
    1,345
    Likes :
    862
    Mình dùng 1.2.7b
    nó có cái này mới ;)
     
    antv thích bài này.
  16. Lê Tí

    Lê Tí Well-Known Member

    Bài viết:
    1,450
    Likes :
    620
    robots.php ;))
     
  17. hungnx2504

    hungnx2504 Member

    Bài viết:
    193
    Likes :
    43
    "Allow: /" ý nghĩa của nó là gì thế bác??
     
  18. thuatdl

    thuatdl Member

    Bài viết:
    672
    Likes :
    182
    Cho phép con bọ chui vào tất cả các thư mục còn lại, trừ những thư mục đã Disallow ở trên. :)
     
    hungnx2504 thích bài này.
  19. ytuongquang

    ytuongquang Member

    Bài viết:
    54
    Likes :
    11
    Mình thấy các lệnh trong robot admin đã thay đổi rồi, không còn như trên post 1 nữa?
     
  20. vương võ quốc

    vương võ quốc Member

    Bài viết:
    176
    Likes :
    34
    kaka áp dụng ngay luôn nek
     
comments powered by Disqus

Chia sẻ trang này

Đang tải...