Mantener los datos en elementos y unidades de traducción de la memoria de traducción
La información básica en una memoria de traducción (TM) es el conjunto de segmentos de origen y sus traducciones. Cada combinación de segmentos de texto de origen y texto traducido se denomina unidad de traducción (TU). Excepto en el caso de los PerfectMatch, una memoria de traducción no especifica relaciones entre unidades de traducción. Cada unidad de traducción tiene datos asociados (como el autor) denominados campo.
Algunos textos son almacenados tal cual, mientras que otros, como las fechas, suelen almacenarse en forma de elementos. Cuando el texto se almacena como elemento, la TM puede emparejar textos de origen que son esencialmente iguales, pero tienen valores diferentes para los elementos (por ejemplo frases que son idénticas, excepto que mencionan fechas distintas).
Texto almacenado como elementos
Cuando el texto se reconoce como variable, la memoria de traducción lo almacena en forma de elemento. Utilizar elementos ayuda a que la memoria de traducción encuentre coincidencia en los dos segmentos siguientes (suponiendo que la memoria de traducción reconoce los números como variables):
He comprado 5 manzanas. (en la TM)
He comprado 10 manzanas. (en el texto de origen)
Uso de índices trigram de concordancia e idiomas no basados en caracteres
En los idiomas que no tienen separación de palabras, o para cualquier idioma si la búsqueda de concordancia está seleccionada, la TM indexa cada tres letras consecutivas (trigram o tri-gram) y utiliza este contenido indexado para buscar coincidencias.
Por ejemplo, si el texto de origen es:
The cat sat on the mat.
La memoria de traducción habrá creado índices para:
The
he
e c
ca
cat
y así sucesivamente.