Vỏ quýt dày có móng tay nhọn!

Thứ tư - 27/09/2006 11:45
Nhân bàn về bảo vệ mã nguồn trang web bằng phần mềm HTML Power3.1 tôi xin chỉ ra các cách mà bạn có thể dùng để khám phá bí mật của một trang web được bảo vệ, sau đó là Vọc tất cả các tài nguyên từ đó về. Bất kể đó là nhạc , phim, các liên kết, các file Flash bạn yêu thích hay là một đoạn mã nguồn trên đó!.... Các Webmaster mới nhập cuộc hay đã có kinh nghiệm cũng nên đọc bài viết này để biết cách tự bảo vệ tài nguyên trên Web của mình, hạn chế sao chép tràn lan!
Chúng ta thường cố gắng bảo vệ mã nguồn trang Web do mình làm ra nhưng cũng cố công đi xem mã nguồn trang của các trang web khác. Lý do để bảo vệ hay xem mã nguồn có nhiều nguyên nhân nhưng tựu chung thì đều là việc giằng co giữa bảo vệ và khai thác tài nguyên trên mạng Internet.

Nếu bạn là một "thi sĩ Vọc" chắc hẳn bạn đã từng click chuột phải vào một trang web nào đó để rồi "View Source" xem mã nguồn của nó và vọc tài nguyên của nó về. Ví dụ trang đó có bài hát rất hay mà không thể tải về. Chẳng lẽ mỗi lần muốn nghe lại phải vào mạng? Tốt nhất là xem mã nguồn để biết địa chỉ của nó ở đâu rồi tải về!

Nhưng mọi chuyện đâu có đơn giản như thế! Các webmaster hầu như đã có biện pháp phòng ngừa người dùng xem mã nguồn của họ bằng nhiều cách khác nhau. Và nếu bạn thường xuyên tải nhạc, tải phần mềm, làm Web... thì chắc hẳn bạn đã từng gặp (nếu không nói là thường xuyên gặp) những trang Web thuộc dạng bị cấm đánh dấu văn bản (bôi đen-copy), cấm chuột phải, cấm Save... Thậm chí là che dấu cả thanh trạng thái (để dấu địa chỉ liên kết!).

Phương thức bảo vệ phổ biến là chèn một đoạn mã Java Script bảo vệ vào trang Web. Ví dụ như đoạn mã không cho chọn văn bản, cấm chuột phải....

Tùy theo phương thức che dấu khác nhau mà ta có cách phân loại khác nhau. Nhưng theo tôi, trên quan điểm :"Làm thế nào để vọc được tài nguyên của một trang Web", tôi chia các trang web được bảo vệ ra làm hai loại:

Loại 1: Bảo vệ không toàn diện. Ví dụ:Trang tin tức Việt nam, trang tải phần mềm của huynhdiep...

Loại 2: Bảo vệ toàn diện. Ví dụ một số ít trang nghe nhạc Online.


Loại thứ nhất là loại không được áp dụng các biện pháp bảo vệ một cách đầy đủ. Tức là với người dùng có kinh nghiệm thì họ vẫn có thể qua mặt Webmaster mà tải về những gì họ thích! Loại này hoặc là của những Webmaster không chuyên, hoặc chưa có kinh nghiệm, hoặc chỉ muốn hạn chế một phương thức sao chép nào đó mà thôi.

Những trang bị xếp vào loại này bao gồm các trang thiếu một trong các biện pháp bảo vệ sau:

-Chống Chuột phải (ít khi thiếu vì đây là phương thức phổ biến)
-Chống Bôi đen-Copy (thỉnh thoảng có trang thiếu)
-Che giấu dòng hiển thị trên thanh trạng thái (một số trang thiếu)
-Không cho "save as..." (hiếm trang cấm)
-Không cho "Edit with Microsoft FrontPage" (ít trang làm được)
-Không cho xem bằng menu View>Source. (một số ít trang có)
-Bảo vệ thư mục gốc.(Một số trang quên không đề phòng-->Cực kỳ tai hại)

Tương ứng với từng trường hợp Web thiếu bảo vệ mà chúng ta có các cách sau để "làm thịt" chúng. (Ở đây tôi đưa ra tình huống là trang đó chỉ thiếu một biện pháp bảo vệ, các biện pháp khác đủ cả!):

-Click chuột phải để chọn một trong những menu bật lên (Xem mã nguồn, copy địa chỉ,lưu lại máy...)
-Bôi đen và nhấn CTRL+C để copy(sau đó dán vào đâu đó để lưu trữ hoặc xem địa chỉ thực của liên kết...)
-Đưa chuột đến liên kết và xem địa chỉ được hiển thị dưới dòng trạng thái. (Chép ra giấy rồi gõ trực tiếp vào ô Address.)
-Từ menu File, chọn "save as" để lưu vào và xử lý !
-Nhấn vào nút: "Edit with Microsoft FrontPage". để xử lý bằng FrontPage
-Từ menu View>Source để xem mã nguồn.
-Vào thư mục gốc của Web bằng cách tìm địa chỉ thực của trang đó, Ví dụ thay vì truy cập trang http://www.hue.vnn.vn/luutru/pictures/suutap.htm bạn có thể chỉ gõ: http://www.hue.vnn.vn/luutru/ để vào thư mục gốc của trang này. Tùy sắp xếp của nhà tạo Web mà bạn sẽ thấy các thư mục con hay các file sắp xếp theo tên, ngày sửa chữa và dung lượng các file.


Tùy vào sự linh hoạt trong cách sử dụng các biện pháp trên mà bạn có thể "Cuỗm" về máy mình nhiều hay ít tài nguyên trên Web!

Cũng nhân tiện nói về nhạc Flash, tôi xin trình bày cách để các bạn có thể "hốt" toàn bộ kho nhạc Flash của một trang web được coi là bảo vệ rất kỹ về máy của bạn. Có thể nói tải Flash là một trong những hình thức tải khó nhất vì bản thân các file Flash cũng có những điều đặc biệt rồi.

Hẳn bạn đã biết đến trang thiepviet.com với những bức thiệp Flash tuyệt đẹp và rất ý nghĩa. Nhưng những người làm Web lại chỉ cho phép bạn Xem online mà không cho phép tải về máy. Có thể coi những file Flash này là được bảo vệ tương đối kỹ vì bản thân các File Flash đã không cho lưu bằng cách Click chuột phải lên file Flash cũng như đánh dấu-copy nó. Hơn nữa thiepviet.com còn bảo vệ tài nguyên của mình bàng các biện pháp khác như: Server đặt ở nơi khác, Tên file thuộc loại siêu dài(trên 20 ký tự)... và vì thế không ít người mặc dù rất thích chúng mà vẫn phải chấp nhận xem online.

Nếu chỉ với những vấn đề trên thì cũng chỉ qua mặt được những người không biết về HTML, còn với những đối tượng hay vọc vạch; các webmaster của những Forum, Web cá nhân... thì đó chỉ là "chuyện nhỏ như con thỏ". Họ dễ dàng tìm ra địa chỉ các file này bằng cách xem mã nguồn của chúng (Click chuột phải, chọn View Source hoặc nhấn Alt+V sau đó nhấn phím C . Tiếp theo bạn nhấn F3 để tìm kiếm, gõ cụm ký tự cần tìm là ".swf " rồi nhấn Enter để tìm kiếm. Kết quả tìm thấy sẽ được đánh dấu. Bạn copy toàn bộ dòng địa chỉ trong nháy kép dẫn tới file này, dán vào thanh địa chỉ của trình duyệt và nhấn Enter để xem kết quả)

Và tôi sẽ không nói phần này nếu mọi chuyện chỉ có thế. Bởi vì mặc dù không lưu trực tiếp được File Flash từ cửa sổ trình duyệt thì bạn cũng coi như đã đoạt được nó (Bạn có thể dùng nó như một phần trên trang Web của mình hoặc ghi địa chỉ đó lên trang web cá nhân, sau đó chọn thẻ Save target As... trong menu chuột phải để tải về máy.). Và có lẽ Webmaster của thiệp Việt cũng biết điều này và vì thế mỗi khi bạn tải một File về thì sẽ có một phần phụ đi kèm mà có lẽ bạn sẽ không muốn xem. Đó là mỗi khi bật file này lên thì sẽ có một phần "Phụ đề" hiện ra và khóa file này lại, đại thể là: "Thành thật xin lỗi vì sự bất tiện này nhưng bạn chỉ có thể xem thiệp trên Thiepviet.com và các Website mà thiepviet cho phép!" sau đó file ngừng chạy mặc dù bạn tải về là một file đầy đủ. Chính vì thế thiep viet vẫn được xếp vào trang Web loại 2: bảo vệ toàn diện.

Loại 2 là loại mà hầu như "bất khả xâm phạm". Tức là được bảo vệ đến tận "chân răng", không một kiểu người dùng nào có thể xâm phạm được. Nhưng cuộc sống là đấu tranh, không có gì được coi là toàn mĩ và trình duyệt Internet không phải là không có kẽ hở, nhỏ thôi nhưng cũng đủ để một số người lọt qua! Trong phần này tôi sẽ hướng dẫn các bạn khai thác tài nguyên Web một cách tận gốc hoàn toàn hợp pháp.

Web vốn là tài liệu không được bảo vệ cao cho lắm (nếu bảo vệ cao thì thà rằng cấm người ta truy cập luôn cho tiện). Cụ thể là mặc dù bạn bị cấm tải về nhưng thực ra những gì bạn thấy trên trình duyệt thì chính là những cái mà máy tính của bạn đã tải về rồi mà bạn không biết (nếu máy chưa tải về thì làm sao bạn xem được?). Vậy câu hỏi đặt ra là nếu tải về rồi thì máy tính đặt nó ở đâu? Trước khi trả lời câu hỏi này thì bạn có bao giờ tự hỏi xem tại sao sau mỗi lần duyệt Web thì dung lượng ổ C lại tăng lên? và Tại sao lại phải chạy Disk Clear up? Đó là vì mỗi khi bạn truy cập một trang Web thì các thành phần của nó được lưu thành những File tạm lên trên máy tính của bạn giúp cho lần sau bạn truy cập nhanh hơn( vì thực ra trình duyệt sẽ lấy thông tin trên máy thay vì lấy nó trên mạng). Kẽ hở là ở đó! Và chuyện cấm xem mã nguồn, cấm tải File trên Web trở thành câu chuyện giống như kiểu: tôi trao cho anh cái bánh và cấm anh dùng nó! Điều này thật phi lý (nhưng đôi khi lại có lý ví dụ như trường hợp của ThiepViet.)

Và việc cần phải làm của bạn là tìm cho ra nơi giấu các file tạm đó! Với Win98, nó được cất trong thư mục có đường dẫn là: C:WindowsTemporary Internet Files. Trong Win XP phức tạp hơn, nó ở: C:Documents and SettingsTên người dùng hiện tạiLocal SettingsTemporary Internet Files.

Bạn không thể xem trực tiếp các file trong thư mục này mà phải copy vào một thư mục khác trong ổ cứng rồi xử lý chúng!

-Với Web, để xem mã nguồn của trang nào đó bạn chỉ việc Click chuột phải vào File HTML trang đó, chọn Edit(hoặc Open with>Notepad/Wordpad) thế là xong.

-Riêng đối với các file Flash được bảo vệ, bí quyết là ở chỗ trước khi copy nó sang thư mục khác, từ cửa sổ Internet Explorer của trang chứa file Flash đang xem bạn hãy chọn File>Work offline để tạm thời ngắt kết nối, như vậy sẽ chỉ có một số rất ít các file Flash bị khóa! Để tránh copy các file tạp nham bạn nên xếp chúng ở dạng Detail, chọn kiểu Type và chỉ copy file có type là: Shockwave Flash Object.

Nhân tiện bật mí luôn cho bạn biết là Trình Duyệt Internet Explorer 5.0 trở lên có hỗ trợ xem định dạng .swf. Có thể nói IE là công cụ thuộc dạng siêu màn ảnh rộng, siêu nét chỉ có mỗi nhược điểm là không có thanh trượt để điều khiển File Flash nên đành phải xem từ đầu đến cuối vậy! Do đó nếu bạn nào không có Macromedia Flash Player thì vẫn có thể yên tâm mà thưởng thức với IE. Để mở file Flash bằng Internet Explorer bạn click chuột phải lên file .swf >Open with>Chose Program... Tại cửa sổ Open with bạn chọn Internet Explorer, Để lần sau máy tính biết tự mở IE mỗi khi Click đúp vào File .swf thì bạn chọn thêm "Always use the Selected Program to open this kind of file" > OK.

Với thủ thuật này, bất kể Web loại nào bạn cũng có thể "xơi tái" nó ngon ơ hoàn toàn "hợp lệ".

Như đã nói ở trên, tôi đã liệt kê ra 7 biện pháp cần để bảo vệ tài nguyên Web trong đó biện pháp thứ 7_Bảo vệ thư mục gốc là biện pháp đơn giản nhất nhưng nếu thiếu thì hậu quả thật thê thảm. Đơn cử như trường hợp của một trang web, tôi vào thư mục gốc của nó bằng cách đã nêu và chỉ cần dùng phương pháp truy cập trực tiếp trong 50' mà tôi tải gần như hết thư viện Flash của trang này về (khoảng160 file-tổng dung lượng khoảng 60MB). Nếu ai đó sử dụng công cụ hỗ trợ tải thì không biết các trang Web đó còn sống được bao lâu? Trong khi biện pháp bảo vệ cực đơn giản: đặt một trang tên là index.htm tại thư mục gốc. Như vậy thay vì người truy cập có thể "khoắng" cả lô Website thì họ chỉ có thể vào được trang index này!

Nguồn tin: http://mangvn.org

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

Giới thiệu về NukeViet

Giới thiệu khái quát NukeViet là một ứng dụng trên nền web có thể sử dụng vào nhiều mục đích khác nhau. Phiên bản đang được phát hành theo giấy phép phần mềm tự do nguồn mở có tên gọi đầy đủ là NukeViet CMS gồm 2 phần chính là phần nhân (core) của hệ thống NukeViet và nhóm chức năng quản trị nội...

Thăm dò ý kiến

Bạn biết gì về NukeViet 4?

Thống kê truy cập
  • Đang truy cập111
  • Máy chủ tìm kiếm6
  • Khách viếng thăm105
  • Hôm nay23,630
  • Tháng hiện tại376,133
  • Tổng lượt truy cập52,442,828
 
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây