Free Online OCR - Nhận dạng ký tự tiếng Việt từ file ảnh, PDF

Chủ nhật - 27/12/2009 16:26

Free Online OCR - Nhận dạng ký tự tiếng Việt từ file ảnh, PDF

Dịch vụ trực tuyến miễn phí này sẽ giúp bạn chuyển văn bản tiếng Việt trong một file ảnh thành file doc hay text một cách chính xác hơn nhờ hỗ trợ nhiều ngôn ngữ khác nhau, trong đó có tiếng Việt.
Giao diện Free Online OCR đơn giản, dễ sử dụng

Có không ít phần mềm cũng như dịch vụ trực tuyến giúp bạn trích xuất text từ ảnh, nhưng tìm một công cụ có hỗ trợ tiếng Việt thì không phải dễ. Free Online OCR là một trong số ít dịch vụ nhận dạng ký tự có hỗ trợ tiếng Việt cùng với 28 ngôn ngữ khác như Anh, Pháp, Hà Lan, Đức, Nga, Ý, Tây Ban Nha, Thụy Điển...

Free Online OCR hỗ trợ trích xuất text các file ảnh có định dạng jpeg, png, gif, bmp and tiff và file pdf một cách nhanh chóng và hiệu quả. Vẫn còn một chút hạn chế đối với các file ảnh: dung lượng cho mỗi file không được quá 1 MB, nhưng file pdf thì có thể lên đến 10 MB. Kết quả sau khi xuất ra sẽ được lưu thành 2 file doc và txt để bạn lựa chọn tải về.

Để sử dụng dịch vụ, trước tiên bạn truy cập vào trang chủ tại địa chỉ NewOCR.com (không cần đăng ký thành viên), bấm chọn Choose File hoặc Browse(tùy theo trình duyệt web) và chỉ đường dẫn đến file cần trích xuất. Tiếp theo, chọn ngôn ngữ cần trích xuất cho file ở mục Language of the document.

Để có kết quả tốt, nên chọn ngôn ngữ cùng với file gốc. Nếu muốn thay đổi kích cỡ, bạn định phần trăm tỷ lệ ở mục Resize. Riêng mục Rotate có 4 tùy chọn là No Change (giữ nguyên không thay đổi), Counterclockwise 900 (xoay ngược chiều kim đồng hồ 900), Clockwise 900 (xoay theo chiều kim đồng hồ 900) và 1800 (xoay 1800). Sau cùng, bấm Send File để website tiến hành upload và chuyển đổi.

Tốc độ làm việc của dịch vụ rất nhanh, và file sau khi được trích xuất cho kết quả rất tốt. Nội dung được trích xuất ra gần như là không bị lỗi về vấn đề font. Chú ý ở khung bên phảihttp://mangvn.org/nukeviet/admin/admin.php?op=adminnews phía dưới dòng GET FILE sẽ là 2 biểu tượng của định dạng doc (trang văn bản có hình) và txt (trang văn bản không hình), bạn lựa chọn định dạng phù hợp và bấm vào đó để tải về.

Nếu muốn làm việc tiếp với file khác, bấm chọn Upload New File và thực hiện các bước tương tự như trên. Ngoài ra bạn có thể sử dụng các dịch vụ ở mục Share this để chia sẻ file với mọi người.

Bài viết liên quan:

Nguồn tin: Tuổi trẻ Online & LBVMVT

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

Những tin mới hơn

Những tin cũ hơn

Giới thiệu về NukeViet CMS

CMS là gì? CMS là từ viết tắt từ Content Management System. Theo wikipedia Định nghĩa. Hệ quản trị nội dung, cũng được gọi là hệ thống quản lý nội dung hay CMS (từ Content Management System của tiếng Anh) là phần mềm để tổ chức và tạo môi trường cộng tác thuận lợi nhằm mục đích xây dựng một hệ...

Thăm dò ý kiến

Bạn biết gì về NukeViet 4?

Thống kê truy cập
  • Đang truy cập171
  • Máy chủ tìm kiếm4
  • Khách viếng thăm167
  • Hôm nay38,959
  • Tháng hiện tại337,399
  • Tổng lượt truy cập94,684,052
Left-column advertisement
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây