Rewrite URL cho Website - kỹ thuật và bài học từ vụ lừa trên Dân Trí

Thứ tư - 21/10/2009 09:41

Quy luật hoạt động của site có Rewrite URL

Quy luật hoạt động của site có Rewrite URL
Các Website "động" như http://mangvn.org đều sử dụng một hệ quản trị nội dung (CMS) mà theo đó nó có khả năng trình bày các bài viết linh hoạt. Tuy nhiên các ứng dụng này thường sinh ra các địa chỉ bài viết không thân thiện với người dùng. Để khắc phục tình trạng này các kỹ thuật viên sử dụng công nghệ Rewrite để "làm đẹp" chúng. Nhưng đôi khi kỹ thuật cũng mang lại những phiền toái mà nạn nhân của vụ lừa liên quan đến Rewrite chính là báo Dân Trí.
Đầu đuôi vụ việc:

Sự việc xảy ra vào sáng 19/10 khi Dân trí đăng tải bài viết Những cô gái xinh đẹp SNSD sôi động trên sân khấu Thủ đôvới link gốc là http://dantri.com.vn/c23/s23-356979/nhung-co-gai-xinh-dep-snsd-soi-dong-tren-san-khau-thu-do.htm

 

Kẻ xấu sau đó đã thay đổi cụm từ mở rộng “nhung-co-gai-xinh-dep-snsd-soi-dong-tren-san-khau-thu-do” thành một cụm từ khác, tạo ra đường link ảo gây hiểu nhầm cho bạn đọc. Khi bạn đọc vào tiêu đề thật của bài thì thấy nội dung đăng tải là hoàn toàn lành mạnh.

 

Chúng tôi xin cung cấp thêm thông tin để bạn đọc hiểu được phần nào sự việc:

 

Tại sao có thể cố ý thay đổi URL mà vẫn hiển thị được nội dung?

 

URL được hiểu nôm na là địa chỉ dẫn người dùng đến chính xác nội dung cần tìm thông qua các tham số định danh. Tương tự như việc bạn hỏi địa chỉ để tìm đến nhà ai đó. Bạn được người chỉ dẫn cung cấp rất nhiều thông tin, trong đó chỉ có một vài thông tin chính giúp bạn đến đúng địa điểm. Các thông tin phụ khác bạn có thể bỏ qua.

 

Máy chủ web cũng vậy. Ví dụ với đường link: http://www.tinnhanhblog.com/article/Nguocchieu/7324/dinh-chinh

 

phần “/article/Nguocchieu/7324/dinh-chinh” được hiểu là các tham số, trong đó tham số định danh (phần khai báo bắt buộc) là: “/article/Nguocchieu/7324”, phần còn lại sẽ bị máy chủ web bỏ qua. Khi nhận được đường dẫn, máy chủ web chỉ cần đọc tham số định danh để nhận diện xem người dùng cần tìm nội dung nào thì sẽ trả về đúng nội dung đó.

 

Trong đường dẫn trên, người dùng có thể thay tham số “dinh-chinh” bằng bất kỳ từ hay cụm từ nào mà không ảnh hưởng việc chỉ dẫn đến nội dung chính xác.

 

Ngược lại, nếu người dùng thay đổi bất kỳ ký tự nào trong phần khai báo bắt buộc “/article/Nguocchieu/7324” sẽ không nhận được kết quả.


Trích dẫn từ thông báo của báo Dân Trí ngày 19 tháng 10 năm 2009:
http://dantri.com.vn/c20/s20-357023/i.htm
Xin lỗi của TinnhanhBlog tới báo Dân Trí:
http://www.tinnhanhblog.com/article/Nguocchieu/7324/dinh-chinh

Kỹ thuật Rewrite URL là gì?

Website của Dân Trí gặp hiện tượng trên là do sử dụng kỹ thuật Rewrite URL. Đây là một kỹ thuật nhằm "Ghi lại URL" để làm đẹp địa chỉ trang Web. Kỹ thuật này là một trong những thủ thuật SEO URL nhằm tối ưu hóa URL cho các công cụ tìm kiếm.

Để làm đẹp URL, các kỹ thuật viên thường đưa thêm tiêu đề bài viết vào URL cho nó thân thiện và dễ nhận biết (Có tác dụng kích thích rank cao trên Google Search). Tuy nhiên với đa số các máy chủ Website, thông số này hầu như không có tác dụng gì và do đó nó có thể tùy ý sửa đổi mà không gây lỗi. Lợi dụng điều này người ta có thể sử dụng URL của bạn để làm trò đùa cho người khác. Đây là một trong những lý do bạn không nên đưa thông số title của bài viết vào URL nếu không có biện pháp ngăn chặn. Mặt khác, Rewrite không còn là một yếu tố quan trọng với Google nữa vì hiện giờ Google đã quá quen thuộc với các dạng URL của Web "động" như http://mangvn.org/nukeviet/modules.php?name=News&op=viewst&sid=696.

Thực hiện ReWrite URL như thế nào ?

Trong kỹ thuật Rewrite URL, người ta sử dụng file .htaccess đặt ở thư mục gốc của hệ thống Website (sử dụng máy chủ Unix/Linux). Nội dung của file này ghi lại "quy luật" chuyển đổi địa chỉ thật của bài viết thành một địa chỉ ảo cho đẹp mắt hơn.

Ví dụ:
Nội dung file .htaccess như sau:
RewriteEngine On
RewriteRule ^([^/]*)/([^/]*)/([^/]*)\.html$ /nukeviet/modules.php?name=&op=&sid= [L]


Sau khi đặt file này vào thư mục gốc của Website thì địa chỉ gốc (Thật):
http://mangvn.org/nukeviet/modules.php?name=News&op=viewst&sid=696
... có thể truy cập bằng link (Ảo):
http://mangvn.org/News/viewst/696.html

Rõ ràng địa chỉ mới đẹp mắt hơn, ngắn gọn hơn. Và theo lý thuyết thì các máy tìm kiếm sẽ xếp hạng một bài viết có địa chỉ kiểu 2 cao hơn kiểu 1.
P/S:
Cả link ảo và link thật đều có hiệu lực.
Cảnh báo:
Kỹ thuật này phải được áp dụng liên tục và lâu dài trên một website và chỉ nên thực hiện trên 1 site mới. Việc thay đổi có thể khiến Website rớt hạng thê thảm.
Công cụ:
Bạn đọc quan tâm đến kỹ thuật Rewrite và muốn áp dụng cho Website của mình thì có thể sử dụng công cụ Rewrite URL - Tối ưu hóa địa chỉ web: http://mangvn.org/nukeviet/modules.php?name=NukeViet_Tools&file=Rewriteurl
 

Tác giả: admin mangvn.org

Tổng số điểm của bài viết là: 4 trong 2 đánh giá

Xếp hạng: 2 - 2 phiếu bầu
Click để đánh giá bài viết

Những tin mới hơn

Những tin cũ hơn

Giới thiệu về Công ty cổ phần phát triển nguồn mở Việt Nam

Công ty cổ phần phát triển nguồn mở Việt Nam (VINADES.,JSC) là công ty mã nguồn mở đầu tiên của Việt Nam sở hữu riêng một mã nguồn mở nổi tiếng và đang được sử dụng ở hàng ngàn website lớn nhỏ trong mọi lĩnh vực. Wbsite đang hoạt động chính thức: http://vinades.vn/ Ra đời từ hoạt động của tổ chức...

Thăm dò ý kiến

Lợi ích của phần mềm nguồn mở là gì?

Thống kê truy cập
  • Đang truy cập202
  • Máy chủ tìm kiếm10
  • Khách viếng thăm192
  • Hôm nay20,052
  • Tháng hiện tại20,052
  • Tổng lượt truy cập114,519,877
Left-column advertisement
  • Thông báo phát hành NukeViet 4.6.00

    NukeViet 4.6.00 là phiên bản tiếp theo của NukeViet CMS dựa trên kế thừa các chức năng của dòng 4.5 và yêu cầu máy chủ hỗ trợ php 7.4 trở lên. Đây cũng là bản cập nhật bảo mật rất quan trọng được khuyến nghị cho toàn bộ người dùng.
  • Thông báo bảo mật dòng NukeViet 4.5.x

    Dòng NukeViet 4.5.x đã bước vào giai đoạn duy trì cuối vòng đời. Trang này ghi nhận liên tục các vấn đề bảo mật và cách chúng tôi xử lý để giữ an toàn cho những website còn ở lại trên dòng 4.5.x đến tháng 7 năm 2027. Chúng tôi vẫn nỗ lực bảo vệ bạn ở mức tốt nhất có thể trên nền tảng này — nhưng nếu có điều kiện, hãy lên kế hoạch chuyển sang phiên bản mới hơn để được bảo vệ tận gốc.
  • Sinh viên ĐH Bách khoa Hà Nội giúp tìm ra lỗ hổng bảo mật của NukeViet

    Nguyễn Quang Bằng, sinh viên năm 4 ngành Khoa học Máy tính tại Đại học Bách Khoa Hà Nội, vừa được nền tảng CMS mã nguồn mở NukeViet vinh danh sau khi phát hiện và báo cáo một lỗ hổng bảo mật nghiêm trọng.
  • Thông báo phát hành NukeViet 4.5.08

    NukeViet 4.5.08 là Phiên bản tiếp theo của dòng NukeViet 4.5, đây là bản cập nhật bảo mật quan trong được đề xuất cho toàn bộ người dùng.
  • Thông tin chính thức về CVE-2025-8772, CVE-2024-36531 và CVE-2024-36528

    Phản hồi chính thức của đội code về các lỗ hổng bảo mật mới của NukeViet CMS được công bố trong năm 2024-2025 và hướng dẫn bảo vệ an toàn cho website của bạn trước các nguy cơ khai thác hoặc tấn công khác.
  • Thông báo phát hành NukeViet 4.5.07

    NukeViet 4.5.07 là Phiên bản tiếp theo của dòng NukeViet 4.5, trọng tâm là xử lý các vấn đề xoay quanh trình soạn thảo CKEditor 5 và tính năng block tùy chỉnh trong giao diện
  • Hướng dẫn tiếp tục sử dụng trình soạn thảo CKEditor 4 trên NukeViet 4.5 các phiên bản từ 4.5.07 về...

    Từ NukeViet 4.5.07 các website cài mới hoặc nâng cấp lên đều được tự động gỡ bỏ CKEditor 4 để đảm bảo tối đa tính bảo mật lâu dài. Nếu bạn có nhiều module hoặc ứng dụng vẫn cần phải dùng nó mà không muốn nâng cấp có thể làm theo hướng dẫn này để tiếp tục sử dụng.
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây