Rewrite URL cho Website - kỹ thuật và bài học từ vụ lừa trên Dân Trí

Thứ tư - 21/10/2009 09:41

Quy luật hoạt động của site có Rewrite URL

Quy luật hoạt động của site có Rewrite URL
Các Website "động" như http://mangvn.org đều sử dụng một hệ quản trị nội dung (CMS) mà theo đó nó có khả năng trình bày các bài viết linh hoạt. Tuy nhiên các ứng dụng này thường sinh ra các địa chỉ bài viết không thân thiện với người dùng. Để khắc phục tình trạng này các kỹ thuật viên sử dụng công nghệ Rewrite để "làm đẹp" chúng. Nhưng đôi khi kỹ thuật cũng mang lại những phiền toái mà nạn nhân của vụ lừa liên quan đến Rewrite chính là báo Dân Trí.
Đầu đuôi vụ việc:

Sự việc xảy ra vào sáng 19/10 khi Dân trí đăng tải bài viết Những cô gái xinh đẹp SNSD sôi động trên sân khấu Thủ đôvới link gốc là http://dantri.com.vn/c23/s23-356979/nhung-co-gai-xinh-dep-snsd-soi-dong-tren-san-khau-thu-do.htm

 

Kẻ xấu sau đó đã thay đổi cụm từ mở rộng “nhung-co-gai-xinh-dep-snsd-soi-dong-tren-san-khau-thu-do” thành một cụm từ khác, tạo ra đường link ảo gây hiểu nhầm cho bạn đọc. Khi bạn đọc vào tiêu đề thật của bài thì thấy nội dung đăng tải là hoàn toàn lành mạnh.

 

Chúng tôi xin cung cấp thêm thông tin để bạn đọc hiểu được phần nào sự việc:

 

Tại sao có thể cố ý thay đổi URL mà vẫn hiển thị được nội dung?

 

URL được hiểu nôm na là địa chỉ dẫn người dùng đến chính xác nội dung cần tìm thông qua các tham số định danh. Tương tự như việc bạn hỏi địa chỉ để tìm đến nhà ai đó. Bạn được người chỉ dẫn cung cấp rất nhiều thông tin, trong đó chỉ có một vài thông tin chính giúp bạn đến đúng địa điểm. Các thông tin phụ khác bạn có thể bỏ qua.

 

Máy chủ web cũng vậy. Ví dụ với đường link: http://www.tinnhanhblog.com/article/Nguocchieu/7324/dinh-chinh

 

phần “/article/Nguocchieu/7324/dinh-chinh” được hiểu là các tham số, trong đó tham số định danh (phần khai báo bắt buộc) là: “/article/Nguocchieu/7324”, phần còn lại sẽ bị máy chủ web bỏ qua. Khi nhận được đường dẫn, máy chủ web chỉ cần đọc tham số định danh để nhận diện xem người dùng cần tìm nội dung nào thì sẽ trả về đúng nội dung đó.

 

Trong đường dẫn trên, người dùng có thể thay tham số “dinh-chinh” bằng bất kỳ từ hay cụm từ nào mà không ảnh hưởng việc chỉ dẫn đến nội dung chính xác.

 

Ngược lại, nếu người dùng thay đổi bất kỳ ký tự nào trong phần khai báo bắt buộc “/article/Nguocchieu/7324” sẽ không nhận được kết quả.


Trích dẫn từ thông báo của báo Dân Trí ngày 19 tháng 10 năm 2009:
http://dantri.com.vn/c20/s20-357023/i.htm
Xin lỗi của TinnhanhBlog tới báo Dân Trí:
http://www.tinnhanhblog.com/article/Nguocchieu/7324/dinh-chinh

Kỹ thuật Rewrite URL là gì?

Website của Dân Trí gặp hiện tượng trên là do sử dụng kỹ thuật Rewrite URL. Đây là một kỹ thuật nhằm "Ghi lại URL" để làm đẹp địa chỉ trang Web. Kỹ thuật này là một trong những thủ thuật SEO URL nhằm tối ưu hóa URL cho các công cụ tìm kiếm.

Để làm đẹp URL, các kỹ thuật viên thường đưa thêm tiêu đề bài viết vào URL cho nó thân thiện và dễ nhận biết (Có tác dụng kích thích rank cao trên Google Search). Tuy nhiên với đa số các máy chủ Website, thông số này hầu như không có tác dụng gì và do đó nó có thể tùy ý sửa đổi mà không gây lỗi. Lợi dụng điều này người ta có thể sử dụng URL của bạn để làm trò đùa cho người khác. Đây là một trong những lý do bạn không nên đưa thông số title của bài viết vào URL nếu không có biện pháp ngăn chặn. Mặt khác, Rewrite không còn là một yếu tố quan trọng với Google nữa vì hiện giờ Google đã quá quen thuộc với các dạng URL của Web "động" như http://mangvn.org/nukeviet/modules.php?name=News&op=viewst&sid=696.

Thực hiện ReWrite URL như thế nào ?

Trong kỹ thuật Rewrite URL, người ta sử dụng file .htaccess đặt ở thư mục gốc của hệ thống Website (sử dụng máy chủ Unix/Linux). Nội dung của file này ghi lại "quy luật" chuyển đổi địa chỉ thật của bài viết thành một địa chỉ ảo cho đẹp mắt hơn.

Ví dụ:
Nội dung file .htaccess như sau:
RewriteEngine On
RewriteRule ^([^/]*)/([^/]*)/([^/]*)\.html$ /nukeviet/modules.php?name=&op=&sid= [L]


Sau khi đặt file này vào thư mục gốc của Website thì địa chỉ gốc (Thật):
http://mangvn.org/nukeviet/modules.php?name=News&op=viewst&sid=696
... có thể truy cập bằng link (Ảo):
http://mangvn.org/News/viewst/696.html

Rõ ràng địa chỉ mới đẹp mắt hơn, ngắn gọn hơn. Và theo lý thuyết thì các máy tìm kiếm sẽ xếp hạng một bài viết có địa chỉ kiểu 2 cao hơn kiểu 1.
P/S:
Cả link ảo và link thật đều có hiệu lực.
Cảnh báo:
Kỹ thuật này phải được áp dụng liên tục và lâu dài trên một website và chỉ nên thực hiện trên 1 site mới. Việc thay đổi có thể khiến Website rớt hạng thê thảm.
Công cụ:
Bạn đọc quan tâm đến kỹ thuật Rewrite và muốn áp dụng cho Website của mình thì có thể sử dụng công cụ Rewrite URL - Tối ưu hóa địa chỉ web: http://mangvn.org/nukeviet/modules.php?name=NukeViet_Tools&file=Rewriteurl
 

Tác giả: admin mangvn.org

Tổng số điểm của bài viết là: 4 trong 2 đánh giá

Xếp hạng: 2 - 2 phiếu bầu
Click để đánh giá bài viết

Những tin mới hơn

Những tin cũ hơn

Logo và tên gọi NukeViet

Tên gọi: NukeViet phát âm là [Nu-Ke-Việt], đây là cách đọc riêng, không phải là cách phát âm chuẩn của tiếng Anh. Ý nghĩa: NukeViet là từ ghép từ chữ Nuke và Việt Nam. Sở dĩ có tên gọi này là vì phiên bản 1.0 và 2.0 của NukeViet được phát triển từ mã nguồn mở PHP-Nuke. Mặc dù từ phiên bản 3.0,...

Thăm dò ý kiến

Lợi ích của phần mềm nguồn mở là gì?

Thống kê truy cập
  • Đang truy cập39
  • Máy chủ tìm kiếm8
  • Khách viếng thăm31
  • Hôm nay17,110
  • Tháng hiện tại554,585
  • Tổng lượt truy cập99,504,760
Left-column advertisement
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây