Reglas de segmentación

Las reglas de segmentación definen cómo divide Trados Studio los párrafos del texto de origen en segmentos. A menudo, un segmento es idéntico a una frase, en cuyo caso las reglas especifican los patrones de texto que constituyen una oración.

En Trados Studio, las reglas de segmentación se especifican en términos de expresiones regulares. Estas expresiones regulares definen patrones de caracteres que marcan el final de las frases. Consulte a continuación una descripción de las expresiones regulares que se utilizan en las reglas de segmentación predeterminadas. Las reglas de segmentación son recursos de idioma, por lo que se pueden agregar, editar y eliminar en el recurso de idioma correspondiente. La definición de salto de segmento tiene dos partes:

Antes del salto
Un patrón para el texto inmediatamente antes de la interrupción del segmento.
Después del salto
Otro patrón de texto que define el texto inmediatamente después del salto.

Solo se crea un salto de segmento si hay texto coincidente con el patrón Antes del salto y lo sigue inmediatamente el texto que coincide con el patrón Después del salto, y no coincide con ninguna de las excepciones a las reglas.

Excepciones a las reglas

Una excepción a la regla tiene la misma forma que una regla de segmentación. Si el texto coincide con una excepción a la regla, no se crea el salto de segmento. Una excepción a la regla habitual es la de la letra minúscula para la regla de segmentación de punto final. En ella se establece que si la letra que sigue a un punto es minúscula, no se crea un salto de segmento.

Varias reglas de segmentación

Se puede tener más de una regla de segmentación, como por ejemplo, una regla para definir la segmentación donde hay dos puntos, y otra regla para cuando hay un punto.

En cualquier proyecto, para la misma combinación de idiomas, se pueden utilizar varias memorias de traducción principales con diferentes reglas de segmentación.

Otras configuraciones que afectan al nivel de segmentación de la frase

  • Lista de Abreviaturas. Contiene una lista de abreviaturas que finalizan con un punto (.), por ejemplo, etc. El punto al final de etc. no necesariamente marca el final de una oración, aunque podría hacerlo, por casualidad.
  • Lista de Sustantivos tras ordinal con punto. Al igual que las abreviaturas, en el caso de los sustantivos tras ordinal con punto este no necesariamente marca el final de un segmento. Por ejemplo, si April... es un sustantivo tras ordinal con punto, la frase 23. April significa 23 de abril, no 23 seguido de una frase que empieza con Abril....

Acerca de las expresiones regulares utilizadas en las reglas de segmentación predeterminadas

Las expresiones regulares utilizadas en las reglas de segmentación predeterminadas hacen uso extensivo de las categorías Unicode. Las que se usan son las siguientes

\p{Ll}
Letras minúsculas
\p{Pe}
Cualquier tipo de corchete de cierre
\p{Pf}
Cualquier comilla de cierre
\p{Po}
Cualquier carácter de puntuación excepto guiones, corchetes, comillas o conectores (subrayado)
\uFFFF
Caracteres Unicode. Por ejemplo, \u002C es una coma y \u003A son dos puntos.