microsoft/trocr-base-printed

El modelo TrOCR-base-printed es un modelo de reconocimiento óptico de caracteres (OCR) basado en arquitectura vision-encoder-decoder, especializado en transcribir texto impreso a partir de imágenes recortadas de líneas de texto. Ha sido entrenado para la tarea de OCR de texto impreso, ampliamente estudiada en investigación de visión-lenguaje. Este modelo está alojado en la plataforma de Hugging Face, que actúa como repositorio y ecosistema para la distribución de modelos de inteligencia artificial preentrenados y listos para su uso en producción o investigación.

En el contexto de la Cátedra, este modelo se incluye como una selección orientada a tareas de visión por computador, específicamente para la digitalización mediante OCR de documentos administrativos escaneados, con un enfoque académico y experimental.

Puedes consultar el modelo desde este link: https://huggingface.co/microsoft/trocr-base-printed

Data and Resources

This dataset has no data

Additional Info

Field Value
Last Updated June 16, 2026, 06:43 (UTC)
Created June 16, 2026, 06:43 (UTC)
algorithm TrOCR
authors [{"id":"7977e0b3-6ee7-442f-82f6-80086d33df0e","role":"principal","type":"user"}]
framework pytorch
library_requirements transformers, torch, Pillow
marketplace_author_id 7977e0b3-6ee7-442f-82f6-80086d33df0e
marketplace_id b44f5f87-ea23-44cc-9a8f-81148dc5f061
resource_type model
short_description Base TrOCR para el reconocimiento óptico de caracteres (OCR) de texto impreso a partir de imágenes recortadas de líneas de texto.
task_type other