Segmentación y procesamiento en elementos

Entender cómo realiza Trados Studio la segmentación y procesa en elementos un archivo de origen es clave para usar las memorias de traducción de manera eficaz. Al abrir un archivo, el software utiliza la configuración de tipo de archivo para realizar una segmentación inicial. A continuación, utiliza las reglas de segmentación de la TM (teniendo en cuenta algunas configuraciones del tipo de archivo) para hacer otra segmentación.

El software utiliza las reglas de segmentación de la TM (o, si se utiliza una secuencia de TM, la primera TM de la secuencia). Después de la segmentación, el software utiliza la configuración de la TM para reemplazar texto con elementos donde proceda («procesar en elementos»).

Segmentación de párrafo

Al abrir un archivo en Trados Studio, el software divide el archivo en párrafos mediante las reglas indicadas en la configuración de tipo de archivo. Cada tipo de archivo tiene diferentes reglas para delimitar párrafos. Por ejemplo, en archivos de texto delimitado simple, el carácter de nueva línea presenta un salto de párrafo, pero en los archivos HTML, las etiquetas como <p> introducen párrafos, y el carácter de una nueva línea es un espacio en blanco equivalente a un espacio. Para los tipos de archivo que utilizan etiquetas (por ejemplo, HTML y XML), se puede especificar que una etiqueta sea una etiqueta de «estructura» para indicar que delimita párrafos.

Segmentación de frase

Las reglas de segmentación son propiedades de la TM (en recursos de idioma). Se puede especificar la segmentación basada en párrafo, en cuyo caso Trados Studio no realiza ninguna segmentación más. Sin embargo, por lo general se suele especificar segmentación basada en frase, en cuyo caso el software utiliza las reglas de segmentación para dividir los párrafos en segmentos.

Las reglas de segmentación son expresiones regulares que reconocen patrones de caracteres que marcan el final de las frases. Ejemplo: un punto seguido por un espacio en blanco, por lo general, marca el final de una frase.

Cuando el software segmenta un párrafo, también tiene en cuenta la siguiente configuración:

  • Si se reconocen las abreviaturas y los sustantivos tras ordinal con punto. Si se reconocen, entonces algunos segmentos pueden contener puntos. (Este reconocimiento es una propiedad de los recursos de idioma de las TM).
  • Sugerencias de segmentación. Una sugerencia de segmentación indica si el software debe tratar la etiqueta como una indicación de un salto de segmento («excluir») o incluir la etiqueta en un segmento («incluir»). Sugerencias de segmentación es una configuración de tipo de archivo para una etiqueta.

Los segmentos producidos por la segmentación de frase son los que el traductor verá en el editor. El software compara cada segmento con las unidades de traducción en las TM, para ver si hay una coincidencia.

Procesar en elementos

Procesar en elementos es una etapa después de la segmentación. El software divide un segmento en elementos cuando va a empezar a buscar una coincidencia para dicho segmento. En la TM, el texto se almacena como elementos.

La configuración de la TM determina lo que constituye un elemento. Por ejemplo, si la memoria de traducción considera las fechas como una variable, 12 January 1900 se considerará un elemento, pero si no se reconocen las fechas como variables, se tratará como tres elementos: 12, January y 1900.

Cuando un segmento de texto presentado contiene variables, una TM puede encontrar una coincidencia basándose en un patrón en lugar de en las palabras exactas. Por ejemplo, si se reconocen las fechas como variables, los segmentos siguientes se tratarán como idénticos:

He arrived on 1 January 1900
He arrived on 2 February 2012

A pesar de que la configuración de la memoria de traducción especifica qué patrones de texto se procesan en elementos, la manera en que el editor de traducción controla las variables (por ejemplo, si localiza automáticamente fechas) depende de la configuración del proyecto, y no de la configuración de la memoria de traducción.