2.2. OCR TRÊN ANDROID: TEXT GRABBER VÀ TEXT FAIRY

 

Thân chào các bạn,

Trở lại với chủ đề về các thiết bị Android, hôm nay, tôi xin giới thiệu với các bạn công nghệ OCR và hai ứng dụng tiêu biểu trên hệ điều hành này là: Text Fairy (miễn phí) và Text Grabber (trả phí).

1. OCR là gì?

OCR viết tắt của "Optical Character Recognition" là công nghệ mà ta quét hoặc chụp chữ trên giấy hay trên bảng rồi chuyển vào máy xử lý cho ra chữ có thể soạn thảo được.

Công nghệ này giúp ta tiết kiệm được thời gian nhập liệu. Nó cũng giúp người khiếm thị tiếp cận được với nguồn sách phong phú của nhân loại.
Có nhiều công ti nghiên cứu và viết phần mềm dựa trên công nghệ này nhưng tôi thường dùng các sản phẩm của ABBYY. Vì ABBYY Fine-Reader 11 trở lên đã nhận dạng được tiếng Việt và tôi rất hi vọng ứng dụng với tính năng tương tự của hãng Text Grabber trên Android cũng sớm hỗ trợ tiếng Việt. Chúng ta có thể cân nhắc mua ứng dụng Text Grabber tại

https://play.google.com/store/apps/details?id=com.abbyy.mobile.textgrabber.full

Từ đó ta có thể đề nghị ABBYY bổ sung OCR tiếng Việt cho Text Grabber. Ngoài ra, Text Grabber cũng có chức năng dịch rất hữu ích giúp ta chụp một đoạn văn tiếng nước ngoài rồi dịch sang tiếng Việt. Khá thú vị phải không các bạn.

Nếu chưa sẵn sàng để sở hữu Text Grabber thì chúng ta hãy cùng tìm hiểu ứng dụng Text Fairy nhé.

2. Cài Đặt Text Fairy từ CH Play

- Tìm và kích hoạt CH Play trên màn hình chủ hoặc trong phần ứng dụng

- Tìm và kích hoạt nút "tìm kiếm" - thường ở góc trên bên phải của màn hình.

- Nhập: “Text Fairy” rồi tìm và kích hoạt nút tìm kiếm - thường nằm ở góc dưới bên phải màn hình.

- Tìm và kích hoạt: “Text Fairy (OCR text scanner) Renard Wellnitz…” thường sẽ là kết quả đầu tiên.

- Lần lượt tìm và kích hoạt nút cài đặt và nút chấp nhận. Khi có thông báo "đã cài đặt Text Fairy (OCR text scanner)”, ấn nút Home để thoát khỏi CH Play. Việc cài đặt Text Fairy đã hoàn tất.

3. Mô tả giao diện Text Fairy

- Tìm và kích hoạt Text Fairy, menu chính của ứng dụng sẽ xuất hiện. Ta không cần quan tâm. Ấn nút Back để thoát menu, thường sẽ thoát luôn khỏi ứng dụng.

- Tìm và kích hoạt Text Fairy một lần nữa. Ta sẽ thấy giao diện chính của ứng dụng. Rất tiếc đây là giao diện tiếng Anh. Giao diện bao gồm:

+ Góc trên bên trái màn hình, ngay dưới thanh trạng thái là nút "Open main menu" - nút mở menu chính của ứng dụng.

+ Kế bên phải là nút "The helpful Text Fairy" - nút trợ giúp

+ Chiếu thẳng qua gần với góc trên bên phải màn hình lần lượt là nút "Make a new photo" - chụp hình và nút "Pick an image from the gallery" - chọn hình từ bộ sưu tập.

+ Phần giữa, chếch về bên trái là nút "Download your language" - tải ngôn ngữ của bạn.

+ Những phần còn lại chỉ là những thông báo hoặc chỉ dẫn không quan trọng cho lắm.

4. Thêm ngôn ngữ cần nhận dạng vào Text Fairy

- Tìm và kích hoạt nút "Download your language"

- Tìm và kích hoạt ngôn ngữ cần tải. Ở đây là Vietnamese.

* Lưu ý: ngôn ngữ nào có "download" ở cuối thì khi kích hoạt sẽ được tải về máy, ngôn ngữ nào có "delete" ở cuối thì khi kích hoạt sẽ xóa khỏi máy. Ở lần đầu sử dụng ta nên tìm xóa Deutsch để tiết kiệm bộ nhớ.

5. Cách chụp và nhận dạng một văn bản:

a. Ở phần này, quan trọng nhất là làm sao để chụp được đầy đủ và rõ ràng trang văn bản cần nhận dạng. Hiện nay, trên thị trường có những dụng cụ như: Standscan Pro hay Giraffe Reader hỗ trợ việc này nhưng chưa có ở Việt Nam và giá cũng khá cao. Thực chất chúng chỉ là những chiếc hộp hay khung giúp xác lập và cố định khoảng cách giữa điện thoại và trang giấy nhằm chụp được bức hình tốt nhất.

Các bạn đọc hiểu tiếng Anh có thể tham khảo cách làm các dụng cụ tương tự tại:

http://www.makeuseof.com/tag/build-smartphone-document-scanner/

Cách hiện nay tôi vẫn làm là đặt cùi chỏ tay cầm điện thoại với lòng bàn tay ngửa trên cùng mặt phẳng và gần cạnh dưới của trang giấy. Ta có thể điều chỉnh vị trí cùi chỏ, khớp chỏ và khớp cổ tay để điện thoại chụp được hình tốt nhất. Chất lượng chụp phụ thuộc vào cảm giác và sự rèn luyện của bạn.

b. Các bước chụp và nhận dạng văn bản:

- Tìm và kích hoạt nút "Make a new photo" ứng dụng máy ảnh sẽ xuất hiện

- Xác lập và cố định vị trí hợp lý của điện thoại.

- Tìm và kích hoạt nút "chụp" để chụp hình trang giấy.

- Tìm và kích hoạt nút "Thử lại" nếu cần chụp lại, nút "OK" nếu đã vừa ý.

- Tìm và kích hoạt "danh sách thả xuống…”. Danh sách ngôn ngữ sẽ hiện ra. Tìm và kích hoạt ngôn ngữ cần nhận dạng.

- Tìm và kích hoạt nút "Start" thường ở góc dưới bên phải màn hình; chờ hệ thống xử lý.

- Nếu thành công thì một hộp soạn thảo giữa màn hình bao gồm đoạn văn bản vừa được nhận dạng sẽ xuất hiện. Ta có thể đọc. Ta cũng có thể thực hiện một vài tác vụ khác như: xóa, chép và chia sẻ văn bản, tạo file pdf… khi kích hoạt nút "thêm tùy chọn"

- Nếu hộp soạn thảo không xuất hiện mà thay vào đó là một thông báo thì việc nhận dạng không thành công, thường là do hình chụp không tốt.

- Tìm và kích hoạt nút "OK", ấn nút trở về rồi tiến hành lại các bước.

6. Lời kết:

Những lợi ích của công nghệ OCR nhận dạng văn bản là không phải bàn cãi, đặc biệt OCR có thể giúp người khiếm thị tự đọc tài liệu thư từ... Nhưng làm thế nào để chụp hình đầy đủ và rõ nét trang giấy là một việc không hề đơn giản với người khiếm thị. Nó đòi hỏi sự rèn luyện và tính kiên nhẫn của người dùng. Ngoài ra, Text Fairy là một ứng dụng tốt nhưng theo tôi nó vẫn còn kém xa Text Grabber.

Hi vọng bài viết này sẽ có ích với các bạn.

Nguyễn Đức Anh Minh
Giáo viên Tin học tại Trung tâm Bảo trợ Khiếm thị Nhật Hồng
Email: Anhminh3011@gmail.com

Chia sẻ bài này qua: