<!DOCTYPE html>
    <html lang="vi" xmlns="http://www.w3.org/1999/xhtml" prefix="og: http://ogp.me/ns#">
    <head>
<title>VietOCR 1.5&#x3A; Nhận dạng ký tự tiếng Việt một cách hoàn hảo.</title>
<meta name="description" content="VietOCR 1.5&#x3A; Nhận dạng ký tự tiếng Việt một cách hoàn hảo. - Savefile - Tin Tức -...">
<meta name="author" content="MangVN">
<meta name="copyright" content="MangVN [admin@vinades.vn]">
<meta name="generator" content="NukeViet v4.5">
<meta name="viewport" content="width=device-width, initial-scale=1">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta property="og:title" content="VietOCR 1.5: Nhận dạng ký tự tiếng Việt một cách hoàn hảo.">
<meta property="og:type" content="website">
<meta property="og:description" content="Savefile - Tin Tức - https&#x3A;&#x002F;&#x002F;mangvn.org&#x002F;savefile&#x002F;Thu-thuat-Phan-mem&#x002F;VietOCR-15-Nhan-dang-ky-tu-tieng-Viet-mot-cach-hoan-hao-734.html">
<meta property="og:site_name" content="MangVN">
<meta property="og:url" content="https://mangvn.org/savefile/Thu-thuat-Phan-mem/VietOCR-15-Nhan-dang-ky-tu-tieng-Viet-mot-cach-hoan-hao-734.html">
<link rel="shortcut icon" href="https://mangvn.org/favicon.ico">
<link rel="canonical" href="https://mangvn.org/savefile/Thu-thuat-Phan-mem/VietOCR-15-Nhan-dang-ky-tu-tieng-Viet-mot-cach-hoan-hao-734.html">
<link rel="alternate" href="https://mangvn.org/rss/" title="Tin Tức" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Tin-nhanh-Cong-nghe/" title="Tin Tức - Tin nhanh Công nghệ" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Virut-Hacker-Bao-mat/" title="Tin Tức - Virut, Hacker & Bảo mật" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/CNTT/" title="Tin Tức - CNTT" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Vien-thong/" title="Tin Tức - Viễn thông" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/May-tinh/" title="Tin Tức - Máy tính" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Dien-thoai/" title="Tin Tức - Điện thoại" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/May-anh/" title="Tin Tức - Máy ảnh" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Thu-thuat-Phan-mem/" title="Tin Tức - Thủ thuật - Phần mềm" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Phan-mem-Tin-hoc/" title="Tin Tức - Phần mềm Tin học" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Thu-thuat-tin-hoc/" title="Tin Tức - Thủ thuật tin học" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Thiet-ke-Web/" title="Tin Tức - Thiết kế Web" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Kien-thuc-co-ban/" title="Tin Tức - Kiến thức cơ bản" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/PHP-HTML-JavaScript/" title="Tin Tức - PHP, HTML & JavaScript" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Quang-cao-tang-thu-nhap/" title="Tin Tức - Quảng cáo tăng thu nhập" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Tao-Web-bang-NukeViet/" title="Tin Tức - Tạo Web NukeViet" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Ban-tin-an-ninh/" title="Tin Tức - Bản tin an ninh" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Tin-tuc-NukeViet/" title="Tin Tức - Tin tức NukeViet" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Nhan-vat-su-kien/" title="Tin Tức - Nhân vật & sự kiện" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Huong-dan-su-dung/" title="Tin Tức - Hướng dẫn sử dụng" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/He-thong-NukeViet-20/" title="Tin Tức - Hệ thống NukeViet 2.0" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/He-thong-NukeViet-10/" title="Tin Tức - Hệ thống NukeViet 1.0" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/NukeViet-co-ban/" title="Tin Tức - NukeViet cơ bản" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Web-Internet/" title="Tin Tức - Web & Internet" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Thu-thuat-Internet/" title="Tin Tức - Thủ thuật Internet" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Dich-vu-tien-ich/" title="Tin Tức - Dịch vụ & tiện ích" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Website-nen-vao/" title="Tin Tức - Website nên vào" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Thong-tin-khuyen-mai/" title="Tin Tức - Thông tin khuyến mại" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/thuong-mai-dien-tu/" title="Tin Tức - Thương mại điện tử" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Hau-truong/" title="Tin Tức - Hậu trường" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Blog-Admin/" title="Tin Tức - Blog Admin" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Cong-tac-vien/" title="Tin Tức - Cộng tác viên" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Chuyen-cong-nghe/" title="Tin Tức - Chuyện công nghệ" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Chuyen-kinh-doanh/" title="Tin Tức - Chuyện kinh doanh" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Cuoc-song-quanh-ta/" title="Tin Tức - Cuộc sống quanh ta" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Cuoi-thu-gian/" title="Tin Tức - Cười thư giãn" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Lang-nghe-va-suy-ngam/" title="Tin Tức - Lắng nghe và suy ngẫm" type="application/rss+xml">
<link rel="alternate" href="https://mangvn.org/rss/Kien-thuc-Song/" title="Tin Tức - Kiến thức Sống" type="application/rss+xml">
<link rel="preload" as="style" href="https://mangvn.org/assets/css/font-awesome.min.css" type="text/css">
<link rel="preload" as="style" href="https://mangvn.org/themes/default/css/bootstrap.min.css" type="text/css">
<link rel="preload" as="style" href="https://mangvn.org/themes/default/css/style.css" type="text/css">
<link rel="preload" as="style" href="https://mangvn.org/themes/default/css/style.responsive.css" type="text/css">
<link rel="preload" as="style" href="https://mangvn.org/themes/default/css/news.css" type="text/css">
<link rel="preload" as="style" href="https://mangvn.org/themes/default/css/custom.css" type="text/css">
<link rel="preload" as="script" href="https://mangvn.org/assets/js/jquery/jquery.min.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/assets/js/language/vi.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/assets/js/DOMPurify/purify3.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/assets/js/global.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/assets/js/site.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/themes/default/js/news.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/themes/default/js/main.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/themes/default/js/custom.js" type="text/javascript">
<link rel="preload" as="script" href="https://mangvn.org/themes/default/js/bootstrap.min.js" type="text/javascript">
<link rel="stylesheet" href="https://mangvn.org/assets/css/font-awesome.min.css">
<link rel="stylesheet" href="https://mangvn.org/themes/default/css/bootstrap.min.css">
<link rel="stylesheet" href="https://mangvn.org/themes/default/css/style.css">
<link rel="stylesheet" href="https://mangvn.org/themes/default/css/style.responsive.css">
<link rel="StyleSheet" href="https://mangvn.org/themes/default/css/news.css">
<link rel="stylesheet" href="https://mangvn.org/themes/default/css/custom.css">
<style type="text/css">
	body{background: #fff;}
</style>
    </head>
    <body>
<div id="print">
	<div id="hd_print">
		<h2 class="pull-left">MangVN</h2>
		<p class="pull-right"><a title="MangVN" href="https://mangvn.org/">https://mangvn.org</a></p>
	</div>
	<div class="clear"></div>
	<hr />
	<div id="content">
		<h1>VietOCR 1.5: Nhận dạng ký tự tiếng Việt một cách hoàn hảo.</h1>
		<ul class="list-inline">
			<li>Chủ nhật - 27/12/2009 16:20</li>
			<li class="hidden-print txtrequired"><em class="fa fa-print">&nbsp;</em><a title="In ra" href="javascript:;" onclick="window.print()">In ra</a></li>
			<li class="hidden-print txtrequired"><em class="fa fa-power-off">&nbsp;</em><a title="Đóng cửa sổ này" href="javascript:;" onclick="window.close()">Đóng cửa sổ này</a></li>
		</ul>
		<div class="clear"></div>
		<div id="hometext">
			Sau nhiều lần nâng cấp, phiên bản mới của VietOCR (xây dựng trên nền Tesseract OCR) đã có thêm nhiều tính năng đáng giá như: hỗ trợ chế độ quét tích hợp, nhận dạng ký tự tiếng Việt trên nhiều dạng ảnh (bmp, jpg, tiff, png), hỗ trợ các tài liệu ảnh nhiều trang và cơ chế xử lý hậu kỳ, giúp khắc phục một số lỗi về ngữ nghĩa, chính tả sau khi xử lý.
		</div>
		<div id="bodytext" class="clearfix">
			chương trình hoàn toàn miễn phí. Dung lượng: 4,2MB. Tải tại đây: <a href="https://mangvn.org/nukeviet/modules.php?name=Files&go=view_file&lid=1450" target="_blank">http://mangvn.org/nukeviet/modules.php?name=Files&amp;go=view_file&lid=1450</a>
<br />
<p>&nbsp;</p>So với một số phần mềm nhận dạng văn bản tiếng Việt
như: VnDOCR, VietOCR thuộc vào hàng “ngon, bổ” và miễn phí. Tốc độ biên
dịch nội dung nhanh, giao diện đơn giản, dễ sử dụng và mức độ chính xác
có thể đạt hơn 80%.
<p>VietOCR bao gồm hai phiên bản: phiên bản GUI Form chạy
trên Windows (hỗ trợ cả 32/64bit) và phiên bản Swing GUI (sử dụng Java)
có thể hoạt động trên nhiều hệ điều hành khác nhau như: Windows, Linux,…</p>
<p>VietOCR có thể sử dụng như một trình nhận dạng ký tự
quang học độc lập (xử lý các file ảnh, dữ liệu sẵn có) hoặc kết hợp với
chức năng quét để xử lý các tài liệu được nạp từ bên ngoài. </p>
<p>Thao tác xử lý văn bản được chia thành các loại:</p>
<p>1. Nhận dạng tài liệu ảnh: </p>
<p>Thông thường khi quét xong một tài liệu văn bản, file
thu được sẽ được lưu dưới dạng một tài liệu ảnh và không thể xử lý (xoá
text, nhập liệu, chỉnh sửa nội dung,…) như ban đầu. VietOCR sẽ có nhiệm
vụ chuyển đổi các tài liệu này sang văn bản để bạn có thể xử lý dễ
dàng. VietOCR hỗ trợ khá nhiều định dạng ảnh như: jpg, bmp, png, tiff,
tuy nhiên không hỗ trợ định dạng gif.</p>
<p>Để sử dụng chương trình, bạn cần cài đặt thêm gói <a onclick="return onLinkClick(this)" href="http://www.microsoft.com/downloads/details.aspx?familyid=A5C84275-3B97-4AB7-A40D-3802B2AF5FC2" height="800" width="1200" resizable="yes" toolbar="yes" titlebar="yes" scrollbars="yes" menubar="yes" statusbar="yes" location="yes">Visual C++ 2008 SP1</a> (nếu&nbsp;chưa&nbsp;cài đặt vào hệ thống), sau đó truy cập menu <em>File &gt; Open</em>, trong phần <em>File of types</em> bạn chọn là <em>All Image Files</em> và nạp vào file văn bản cần xử lý. Xong, nhấn nút <em>Open</em>.</p>
<p>Tiếp đến, trên giao diện chính, bạn sẽ nhìn thấy hai
khu vực: khu vực nằm bên trái chứa nội dung của file tài liệu vừa mới
thêm vào, khung bên phải sẽ là tài liệu sau khi trích xuất từ file ảnh.
Khi phần nội dung đã được nạp xong, bạn nhấn đề mục <em>OCR Language</em> (góc trên bên phải màn hình) và chọn <em><strong>Vietnamese</strong></em>. Sau đó, nhấn nút <em>OCR</em>để bắt đầu quá trình biên dịch nội dung, tốc độ nhanh hay chậm còn tùy
thuộc vào độ dài, ngắn của văn bản và tốc độ xử lý của máy tính.</p>
<p>&nbsp;</p>Sau
khi biên dịch xong, bạn sẽ có ngay phần dữ liệu dạng text, có thể xoá
hay thay đổi một cách dễ dàng. Một điểm hay của VietOCR, đó là khả năng
tích hợp bộ gõ tiếng Việt (hoạt động dựa trên bộ gõ Unikey), cho phép
bạn dễ dàng thay đổi nội dung văn bản có dấu mà không cần bộ gõ Unikey
thường trực nơi khay hệ thống. Để định bộ gõ trong VietOCR, bạn truy
cập menu <em>Settings &gt; Viet Input Method</em> và chọn một trong các kiểu gõ: VNI, Telex, VIQR với Font mặc định là Unicode được tích hợp sẵn.
<p>Trường hợp chỉ muốn nhận dạng riêng một khu vực nào
đó, bạn giữ trái chuột và rê vào vùng văn bản mà bạn muốn trích xuất.
Khi đó, chỉ nội dung của vùng này sẽ được hiển thị bên khung phải màn
hình. Nếu muốn biên dịch tài liệu nhiều trang, bạn truy cập menu <em>Command &gt; OCR All Pages.</em></p>
<p>Để “thử” kiểm tra khả năng nhận diện văn bản của
chương trình trên các định dạng khác nhau, người viết đã sử dụng thư
viện mẫu văn bản có sẵn<em> (C:&#92;Program Files&#92;VietUnicode&#92;VietOCR.NET&#92;samples) </em>và
dùng chương trình MS Paint của Windows để lưu lại thành các định dạng
khác nhau như: PNG, JPG và BMP (256 bit) từ file gốc có định dạng .TIFF</p>
<p>Kết quả, cả ba trường hợp đều nhận dạng được văn bản
khá chuẩn xác. Tuy nhiên một số dấu câu chưa đúng và một vài từ vẫn còn
sai chính tả, không rõ nghĩa nhưng mức độ biên dịch so với bản gốc là
khá chuẩn.</p>
<p>2. Cài đặt máy quét:</p>
<p>Nếu nhu cầu của bạn là xử lý các tài liệu bên ngoài
thông qua hệ thống quét của chương trình, nhất thiết bạn phải cài đặt
thêm máy quét. Để làm việc này, bạn truy cập vào thư mục cài đặt của
VietOCR, tìm và sao chép file <em><strong>WIAAut.dll</strong></em><em>(C:&#92;Program Files&#92;VietUnicode&#92;VietOCR.NET) vào thư mục C:&#92;Windows&#92;System32.</em></p>
<p>Sau đó, bạn vào <em>Start &gt; Run</em>, gõ lệnh <em><strong>regsvr32 C:&#92;Windows&#92;System32&#92;WIAAut.dll</strong></em>để đăng ký thư viện này với Windows. Khi đăng ký xong, bạn cài driver
cho máy quét và bắt đầu tiến trình xử lý văn bản như trên.</p>
<p><strong>Lưu ý:</strong></p>
<p>- Trong quá trình biên dịch, đôi lúc bạn sẽ gặp phải thông báo lỗi <strong><em>Attemp to read or write protected memory</em></strong>,
một trong những nguyên nhân gây ra lỗi này là do văn bản đã định sai
hướng (lệch hướng đi, thay vì nằm ngang, văn bản đã chuyển sang hướng
đứng), bạn chỉ việc nhấn nút <em>Rotate</em>&nbsp;<img hspace="0" border="1" src="http://nhipsongso.tuoitre.com.vn/ImageView.aspx?ThumbnailID=385621" hyperlink="" /> vài lần cho đúng hướng là xong.</p>
<p>- Nếu không có máy quét và bạn vẫn muốn “trải nghiệm” tính năng của phần mềm, bạn có thể tải tiện ích <em>ImagePrinter</em>,
giúp bạn chuyển đổi bất kỳ tài liệu nào sang bốn định dạng hỗ trợ sẵn
của chương trình (bmp, png, tiff, jpg). Trường hợp nếu muốn chuyển giao
diện chương trình sang tiếng Việt, bạn truy cập menu <em>Settings &gt; User Interface Language</em>, chọn <em>Vietnamese</em>.</p>
<p>Cũng tương tự quá trình nhận dạng tài liệu ảnh ở trên,
trong trường hợp này tài liệu quét sẽ được chia thành hai dạng để kiểm
tra: dạng văn bản thuần (text) và văn bản kèm hình ảnh. Quá trình xử lý
và biên dịch được thực hiện như bước 1. Kết quả chương trình nhận dạng
tốt với các văn bản thuần và gặp phải tình trạng lỗi OCR Operation với
các tài liệu có kèm hình ảnh. Việc thực hiện này cũng xảy ra với các
định dạng khác.</p>
<p>Một điều lưu ý với các bạn, để quá trình nhận dạng ảnh
được chính xác, độ phân giải của bản quét phải đạt chuẩn 300dpi, không
mờ, càng sạch và rõ càng tốt.</p>
<p>3. Xử lý tài liệu PDF:</p>
<p>Ngoài khả năng nhận dạng các tài liệu ảnh, VietOCR còn
có khả năng xử lý các tài liệu PDF. Để có thể sử dụng được tính năng
này trong VietOCR, bạn cần cài đặt thêm gói GPL GhostScript 8.7. Sau
khi cài xong, bạn thực hiện việc xử lý tương tự các bước trên (với các
tài liệu PDF có chứa hình ảnh, kết quả vẫn bị lỗi như trường hợp hai).</p>
<p>Nhìn chung, VietOCR có khả năng xử lý văn bản tiếng
Việt tốt, độ chính xác khá cao và tương thích với nhiều định dạng ảnh
khác nhau trong điều kiện văn bản thuần (không chứa hình ảnh), bạn có
thể dùng văn bản sau khi xử lý để phục vụ cho công việc mà không phải
tốn thời gian chỉnh sửa nhiều.</p>
<br />
		</div>
				<div id="author">
						<p>
				<strong>Nguồn tin:</strong>
				Báo Tuổi Trẻ Online&#x002F; HUY TRẦN - ECHIP
			</p>
		</div>
	</div>
	<div id="footer" class="clearfix">
		<div id="url">
			<strong>URL của bản tin này: </strong><a href="https://mangvn.org/savefile/Thu-thuat-Phan-mem/VietOCR-15-Nhan-dang-ky-tu-tieng-Viet-mot-cach-hoan-hao-734.html" title="VietOCR 1.5: Nhận dạng ký tự tiếng Việt một cách hoàn hảo.">https://mangvn.org/savefile/Thu-thuat-Phan-mem/VietOCR-15-Nhan-dang-ky-tu-tieng-Viet-mot-cach-hoan-hao-734.html</a>

		</div>
		<div class="clear"></div>
		<div class="copyright">
			&copy; MangVN
		</div>
		<div id="contact">
			<a href="mailto:admin@vinades.vn">admin@vinades.vn</a>
		</div>
	</div>
</div>
        <div id="timeoutsess" class="chromeframe">
            Bạn đã không sử dụng Site, <a onclick="timeoutsesscancel();" href="https://mangvn.org/#">Bấm vào đây để duy trì trạng thái đăng nhập</a>. Thời gian chờ: <span id="secField"> 60 </span> giây
        </div>
        <div id="openidResult" class="nv-alert" style="display:none"></div>
        <div id="openidBt" data-result="" data-redirect=""></div>
<div id="run_cronjobs" style="visibility:hidden;display:none;"><img alt="cron" src="/index.php?second=cronjobs&amp;p=l2akESE8" width="1" height="1" /></div>
<script src="https://mangvn.org/assets/js/jquery/jquery.min.js"></script>
<script>var nv_base_siteurl="/",nv_lang_data="vi",nv_lang_interface="vi",nv_name_variable="nv",nv_fc_variable="op",nv_lang_variable="language",nv_module_name="news",nv_func_name="savefile",nv_is_user=0, nv_my_ofs=-4,nv_my_abbr="EDT",nv_cookie_prefix="nv4c_b41EI",nv_check_pass_mstime=1738000,nv_area_admin=0,nv_safemode=0,theme_responsive=1,nv_recaptcha_ver=2,nv_recaptcha_sitekey="6LfaEikpAAAAAB7BnT8L5ijh2CCG0esJquuWj9ZJ",nv_recaptcha_type="image",XSSsanitize=1;</script>
<script src="https://mangvn.org/assets/js/language/vi.js"></script>
<script src="https://mangvn.org/assets/js/DOMPurify/purify3.js"></script>
<script src="https://mangvn.org/assets/js/global.js"></script>
<script src="https://mangvn.org/assets/js/site.js"></script>
<script src="https://mangvn.org/themes/default/js/news.js"></script>
<script src="https://mangvn.org/themes/default/js/main.js"></script>
<script src="https://mangvn.org/themes/default/js/custom.js"></script>
<script type="application/ld+json">
        {
            "@context": "https://schema.org",
            "@type": "Organization",
            "url": "https://mangvn.org",
            "logo": "https://mangvn.org/uploads/logo-mangvn.png"
        }
        </script>
<script src="https://mangvn.org/themes/default/js/bootstrap.min.js"></script>
</body>
</html>