Reconocer y capturar texto en distintas secuencias de comandos
Cuando utilice la acción del ratón, puede capturar texto de la pantalla aunque dicho texto sea solo una imagen: una fotografía, por ejemplo. MultiTerm Widget realiza el reconocimiento óptico de caracteres (OCR) en la pantalla.
Por qué y cuándo se efectúa esta tarea
Puede mejorar el reconocimiento de caracteres escritos en otros idiomas y alfabetos descargando e instalando datos de aprendizaje específicos del idioma.
La configuración de fábrica del widget está optimizada para reconocer los caracteres en inglés. Puesto que el inglés no suele incluir algunos caracteres (por ejemplo, á a ä â), es posible que el software no los reconozca correctamente sin el aprendizaje.
Los datos de aprendizaje ofrecen al software del widget un conjunto diferente de caracteres de referencia. La página de Google tesseract-ocr tiene datos de aprendizaje adecuados para muchos idiomas y alfabetos.
Procedimiento
- En el navegador, diríjase a la documentación de Tesseract.
- Descargue el paquete de aprendizaje adecuado tal como se describe en esa página. Por ejemplo, para el alemán, descargue
deu.traineddata. - Cambie el nombre del archivo descomprimido por
generic.traineddata. - Asegúrese de que MultiTerm Widget se detenga.
- En el Explorador de Windows, vaya a la carpeta de instalación de MultiTerm Widget. Por norma general, es %archivosdeprograma%\SDL\SDL MultiTerm\MultiTerm16.
- Cambie el nombre del archivo existente
generic.traineddata(por ejemplo, porgeneric.traineddata.save) y copie el archivo descargadogeneric.traineddataa esta carpeta. - Reinicie MultiTerm Widget.