reCAPTCHA - Công cụ chống Spam 2 trong 1

Chủ nhật - 16/05/2010 12:59
Nếu bạn từng sử dụng các dịch vụ website, mạng xã hội chắc hẳn bạn từng tiếp xúc với CAPTCHA. Còn nếu bạn yêu thích tạo web, từng sở hữu hoặc quản lý một website động thì chắc hẳn bạn từng chịu vấn nạn Spam, cái bạn phải cần đến CAPTCHA để bảo vệ website của mình. Bài viết này sẽ giới thiệu với bạn một công cụ chống Spam cực kỳ hiệu quả, đó là reCAPTCHA.
CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) là công cụ phân biệt người (với công cụ tự động của máy tính) nhằm tránh việc nó có thể tự động thực hiện các thao tác tới hệ thống như: gửi dữ liệu hoặc đăng nhập... có thể gây hại cho hệ thống. reCAPTCHA cũng là một hệ thống tạo CAPTCHA nhưng thú vị ở chỗ bạn không cần phải mất công lập trình các thuật toán mà nó đã được đảm nhiệm bởi server chính, bạn có thể sử dụng hoàn toàn miễn phí mà vẫn cực kỳ hiệu quả trong việc chống Spam.

reCAPTCHA được phát triển bởi trường đại học Carnegie Mellon. Nó hiện đang được sử dụng ở hàng trăm ngàn website. Nó là giải pháp ưu việt hơn CAPTCHA truyền thống và nhiều người ưa chuộng vì các lý do:

  • Được xây dựng sẵn, Hoàn toàn miễn phí.
  • Dễ dàng tích hợp và sử dụng, không mất công lập trình, cải tiến code để đối phó với công nghệ spam.
  • Có thêm âm thanh của CAPTCHA dành cho người khiếm thị.

ReCAPTCHA khác biệt và độc đáo ở chỗ trong khi nó cung cấp cho bạn sử dụng miễn phí thì đồng thời bạn cũng giúp nó số hóa một khối lượng khổng lồ các cuốn sách tại máy chủ của nó. Vậy là một công đôi việc và đó là lý do vì sao reCaptcha phục vụ bạn miễn phí mà nó vẫn tồn tại đến ngày nay như một công cụ chống spam hiệu quả. Vậy họ đã làm như thế nào ?

Như bạn biết, sách báo cũ muốn số hóa và chuyển thành dạng văn bản có thể chỉnh sửa thì phải được Scan từ giấy, sau đó chuyển qua cho phần mềm nhận dạng thành các ký tự trên máy tính. Do hạn chế của việc scan lại từ các trang giấy cũ, các loại font chữ khác nhau... nên việc nhận dạng không hề dễ dàng. Ví dụ:

captcha
Do hạn chế của lập trình mà công nghệ nhận dạng chữ tự động OCR (Optical C-haracter Recognition) không thực sự chính xác khi đọc các chữ, trong khi khả năng nhận dạng chữ của con người tốt hơn nhiều (đặc biệt là đối với chữ viết tay). Những người viết reCAPTCHA đã rất thông minh khi đưa ra ý tưởng sử dụng sức mạnh cộng đồng từ "công vô ích" để chuyển đổi thành "công có ích" phục vụ cho chính nó.

Cách hoạt động của reCAPTCHA cực kỳ đơn giản. reCAPTCHA lấy trong cơ sở dữ liệu của nó những từ mà OCR đã bó tay và kết hợp với một từ nó đã biết. Cho hiển thị ra màn hình và yêu cầu người dùng gõ cả 2 từ. Sau đó nó sẽ kiểm tra từ nó đã biết, nếu từ nó biết đúng với từ người dùng gõ vào, nó sẽ kết luận rằng từ kia cũng đúng và đưa vào CSDL số hóa của nó.

Như vậy nó đã thực hiện một công đôi việc: vừa thỏa mãn yêu cầu của Website là chứng thực người sử dụng, vừa giúp bản thân nó số hóa một lượng lớn văn bản. Quả là siêu thông minh.

Nhận ra lợi ích của reCAPTCHA, Tháng 9 năm 2009, Google đã mua công nghệ này phục vụ cho việc thay thế hệ thống CAPTCHA cũ kỹ của mình (đang bị các hacker qua mặt). Đồng thời cái mà Google đang nhắm đến chính là công cụ này sẽ giúp họ đẩy nhanh quá trình số hóa lượng lớn tài liệu trong kho sách điện tử của mình. Thật là một mũi tên trúng 2 đích.

Để sử dụng reCAPTCHA cho website của mình, bạn cần đăng ký một tài khoản tại đây: https://www.google.com/recaptcha/admin
Hệ thống sẽ đưa bạn đến trang login của Google, bạn hãy login bằng tài khoản Gmail, login xong bạn chỉ cần khai báo địa chỉ website của bạn để nhận mã đăng ký. Mỗi website có một mã đăng ký và chỉ có thể sử dụng sau khi đã đăng ký.

Để sử dụng cho site của mình, bạn sử dụng các mẫu lập trình ở đây: http://code.google.com/apis/recaptcha

 Tags: n/a

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

Giới thiệu về Công ty cổ phần phát triển nguồn mở Việt Nam

Công ty cổ phần phát triển nguồn mở Việt Nam (VINADES.,JSC) là công ty mã nguồn mở đầu tiên của Việt Nam sở hữu riêng một mã nguồn mở nổi tiếng và đang được sử dụng ở hàng ngàn website lớn nhỏ trong mọi lĩnh vực. Wbsite đang hoạt động chính thức: http://vinades.vn/ Ra đời từ hoạt động của tổ chức...

Thăm dò ý kiến

Lợi ích của phần mềm nguồn mở là gì?

Thống kê truy cập
  • Đang truy cập103
  • Máy chủ tìm kiếm5
  • Khách viếng thăm98
  • Hôm nay24,593
  • Tháng hiện tại867,957
  • Tổng lượt truy cập49,060,037
  • Thông báo phát hành NukeViet 4.3.07

    NukeViet 4.3.07 tiếp tục là bản tiếp theo của thế hệ NukeViet 4.3. Phiên bản này tập trung vào sửa lỗi và thực hiện một số tối ưu hệ thống đồng thời bổ sung một vài tính năng nhỏ.
  • Người sử dụng sẽ sớm có thể cài đặt NukeViet tự động từ Softaculous

    NukeViet sẽ sớm có thể cài đặt tự động từ các control panel phổ biến như cPanel, DirectAdmin, Plesk thông qua Softaculous
  • Breadcrumbs

    Breadcrumbs được biết đến như một thành phần rất quan trọng trong hệ thống navigation cuả website gần như vào bất cứ website nào bạn cũng thấy sự hiện diện của nó. Mục tiêu nhằm cung cấp cho khách hàng những liên kết để quay lại trang trước cấp cao hơn. Và tiện theo dõi vị trí hiện tại của mình trên trang
  • Thông báo phát hành NukeViet 4.3.06

    NukeViet 4.3.06 tiếp tục là bản tiếp theo của thế hệ NukeViet 4.3. Thêm chức năng gửi lại email kích hoạt tài khoản chờ duyệt, chức năng cấu hình CORS, tùy chọn chèn logo cho mỗi lần upload và hỗ trợ các nhà phát triển debug các câu lệnh SQL là những điểm mới đáng chú ý ở phiên bản này.
  • Một số tính năng mới của NukeViet 4.3.06

    Thêm chức năng gửi lại email kích hoạt tài khoản chờ duyệt, chức năng cấu hình CORS, tùy chọn chèn logo cho mỗi lần upload và hỗ trợ các nhà phát triển debug các câu lệnh SQL là những điểm mới đáng chú ý ở NukeViet 4.3.06
  • Đọc, hiểu đúng báo cáo của Google PageSpeed Insights

    PageSpeed Insights là công cụ của Google dành cho các nhà phát triển web giúp phân tích nội dung của trang web, sau đó tạo đề xuất nhằm giúp trang đó hoạt động nhanh hơn. Tuy nhiên đọc và hiểu các báo cáo này như thế nào? Ứng dụng đến đâu... lại là chuyện mà chúng ta phải bàn!
  • Thông báo phát hành NukeViet 4.3.05

    NukeViet 4.3.05 tiếp tục là bản tiếp theo của thế hệ NukeViet 4.3. Gỡ bỏ các nội dung liên quan đến Google Plus và tính năng kiểm duyệt thông tin chỉnh sửa của thành viên là điểm nổi bật tại phiên bản này.
 
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây