Tesseract là một công cụ nhận dạng ký tự quang học cho các hệ điều hành khác nhau. Đây là phần mềm miễn phí, được phát hành theo Giấy phép Apache, Phiên bản 2.0 và sự phát triển đã được Google tài trợ từ năm 2006.
Năm 2006, Tesseract được coi là một trong những công cụ OCR nguồn mở chính xác nhất hiện có.
Repository: https://github.com/tesseract-oc/tesseract
Bước 1: Tìm các gói yum có sẵn:
yum list|grep tesseract
Bước 2: Cài đặt tesseract:
yum install tesseract -y
Bước 3: Check lại xem cài ok chưa:
tesseract -v