Reconocer y capturar texto en distintas secuencias de comandos

Cuando utilice la acción del ratón, puede capturar texto de la pantalla aunque dicho texto sea solo una imagen: una fotografía, por ejemplo. MultiTerm Widget realiza el reconocimiento óptico de caracteres (OCR) en la pantalla.

Por qué y cuándo se efectúa esta tarea

Puede mejorar el reconocimiento de caracteres escritos en otros idiomas y alfabetos descargando e instalando datos de aprendizaje específicos del idioma.

La configuración de fábrica del widget está optimizada para reconocer los caracteres en inglés. Puesto que el inglés no suele incluir algunos caracteres (por ejemplo, á a ä â), es posible que el software no los reconozca correctamente sin el aprendizaje.

Los datos de aprendizaje ofrecen al software del widget un conjunto diferente de caracteres de referencia. La página de Google tesseract-ocr tiene datos de aprendizaje adecuados para muchos idiomas y alfabetos.

Procedimiento

  1. En el navegador, diríjase a la documentación de Tesseract.
  2. Descargue el paquete de aprendizaje adecuado tal como se describe en esa página. Por ejemplo, para el alemán, descargue deu.traineddata.
  3. Cambie el nombre del archivo descomprimido por generic.traineddata.
  4. Asegúrese de que MultiTerm Widget se detenga.
  5. En el Explorador de Windows, vaya a la carpeta de instalación de MultiTerm Widget. Por norma general, es %archivosdeprograma%\SDL\SDL MultiTerm\MultiTerm16.
  6. Cambie el nombre del archivo existente generic.traineddata (por ejemplo, por generic.traineddata.save) y copie el archivo descargado generic.traineddata a esta carpeta.
  7. Reinicie MultiTerm Widget.