# 테서랙트(Tesseract) 광학 문자 인식(OCR, Optical Character Recognition) 엔진으로, 이미지나 스캔된 문서에서 텍스트를 추출하는 데 사용됩니다. 테서랙트는 무료 오픈 소스 소프트웨어로, Google이 개발하고 관리하고 있습니다. 이 OCR 엔진은 여러 언어를 지원하며, 높은 정확도로 텍스트를 추출할 수 있습니다. 1. **다양한 언어 지원**: 테서랙트는 다양한 언어에 대한 문자 인식을 지원합니다. 이를 통해 다국어 문서나 다국어 텍스트를 처리할 수 있습니다. 2. **높은 정확도**: 테서랙트는 많은 양의 훈련 데이터와 머신 러닝 알고리즘을 사용하여 높은 정확도로 텍스트를 추출합니다. 3. **텍스트 형식 지원**: 이미지, PDF, 스캔된 문서 등 다양한 형식의 ..