Especificar expresiones regulares para el filtro de pantalla avanzada

Las expresiones regulares (RegEx) son potentes fórmulas de búsqueda que pueden localizar patrones complejos de caracteres dentro de textos. En Trados Studio puede utilizar expresiones regulares para filtrar los segmentos que coincidan con un determinado patrón. Trados Studio utiliza la sintaxis .NET para las expresiones regulares.

Por qué y cuándo se efectúa esta tarea

Para especificar una expresión regular para el campo Origen o Destino del filtro de pantalla avanzada:

Procedimiento

  1. En la vista Editor, abra la ficha Ver y seleccione Filtro de visualización avanzado 2.0.
    Para mostrar siempre la ventana Filtro de pantalla avanzada 2.0, seleccione el botón Ocultar automáticamente.
  2. Abra la ficha Contenido e introduzca sus expresiones regulares en el campo Origen o Destino.
  3. En el menú desplegable de la derecha, seleccione Y u O para combinar los filtros de búsqueda en Origen y Destino. Mientras que AND es un filtro más estricto que muestra solo los segmentos que coinciden con los criterios de origen y de destino, la condición O muestra segmentos que coinciden con los criterios de origen o de destino.
  4. Active la opción Expresión regular. En caso contrario, Trados Studio interpretará los patrones de caracteres de los campos de contenido de Origen y Destino como caracteres literales.
  5. Si su RegEx de origen o de destino contiene referencias inversas, active la opción Referencia inversa. Trados Studio admite referencias inversas con nombres y números en el siguiente formato: ${group name} y $1.
  6. En el campo Información de estructura del documento, especifique si desea restringir los resultados a tipos de segmento específicos. Por ejemplo, escriba H o heading para mostrar sólo los segmentos de título.
  7. Para filtrar los resultados del segmento por contenido de etiqueta, active Buscar en texto y contenido de etiqueta o Buscar solo en contenido de etiqueta. La primera opción busca contenido de atributos de etiqueta así como contenido traducible dentro de etiquetas, mientras que la segunda opción solo busca contenido de atributos de etiqueta como font=Curier New.
  8. Active la opción Distingue entre mayúsculas y minúsculas si desea que coincidan las mayúsculas y minúsculas exactas de la expresión regular. De forma predeterminada, Studio ignora la distinción entre mayúsculas y minúsculas. Por ejemplo, la RegEx ^T dará como resultado segmentos que empiezan por una T tanto minúscula como mayúscula.
  9. Aplique los filtros adicionales disponibles en las fichas Atributos del filtro, Comentarios, Estructura del documento, Segmento, Color y Ejemplos.
    Aparece un icono de marca de verificación junto a cada ficha que contiene filtros adicionales tenidos en cuenta para la búsqueda actual. Puede ver los filtros que se han aplicado y los resultados de la búsqueda en la barra de estado situada en la parte inferior del filtro de pantalla avanzada.

Ejemplo

Ejemplos de expresiones regulares
ResultadoExpresión regularExplicación

Mostrar todos los segmentos con diferente uso de mayúsculas en origen y destino

Origen: [A-Z]

Destino:^[a-z]

Asegúrese de activar la opción Distingue entre mayúsculas y minúsculas. De lo contrario, el motor de expresiones regulares encuentra cadenas tanto en minúsculas como en mayúsculas para ambos patrones.

El símbolo de intercalación ^ indica el comienzo de un segmento.

[A-Z] describe el intervalo de todas las letras mayúsculas, mientras que [a-z], el de todas las letras minúsculas.

Mostrar todos los segmentos con puntuación final diferente en origen y destino

Origen: \.$

Destino:[^.]$

Estas expresiones encuentran todos los pares de segmentos que terminan con un punto en el texto de origen pero no en el destino.

En la primera expresión, $ indica el final de una cadena o segmento, y la barra diagonal inversa (\) seguida del punto indica un punto literal.

En la segunda expresión, el símbolo de intercalación dentro del conjunto marca la negación, por lo que [^.] indica cualquier carácter que no sea un punto.

Puede modificar esta expresión para buscar otros signos de puntuación. Por ejemplo, las siguientes RegEx encuentran todos los segmentos que terminan con un signo de interrogación en el origen pero no en el destino:

  • RegEx de origen: ?$
  • RegEx de destino: [^?]$
Construcciones de referencia inversa para expresiones regulares

Las referencias inversas reutilizan las subcoincidencias identificadas anteriormente en la misma expresión regular (RegEx) o en la RegEx de reemplazo correspondiente. Las referencias inversas son útiles cuando necesita repetir una secuencia de caracteres como /(abc)(abc)(abc) en la misma RegEx o en la RegEx de reemplazo correspondiente. En lugar de copiar el grupo de caracteres (abc) varias veces, puede volver a utilizarlo insertando referencias inversas al original.

Puede utilizar referencias inversas con nombres y números en el siguiente formato:
SintaxisExpresión regularExplicación
  • \k<name>
  • \number

al hacer referencia a un componente anterior de la misma RegEx

  • (?<x> abc ) = \k<x> coincide con abc=abc
  • "(abc) = \1" coincide con "abc=abc"
  • ${group name}
  • 1$

al hacer referencia a un componente de una RegEx correspondiente

(?<TheBoy>Jack) and (?<TheGirl>Jill) coincide con Jack and Jill en el segmento de origen [EN]: ¡Jack y Jill subían esa colina de nuevo!

En la RegEx de destino, puede reutilizar las coincidencias identificadas por los grupos <TheBoy> y <TheGirl> con una referencia posterior etiquetada o numerada:

  • ${TheBoy} e ${TheGirl}
  • $1 e $2

Ambos coincidirán con Jack e Jill en el segmento de destino [IT]: Jack e Jill salirono di nuovo su quella collina!

Caracteres especiales para expresiones regulares

Los metacaracteres son las unidades básicas de las expresiones regulares (RegEx). Los caracteres de las RegEx se entienden como metacaracteres con un significado especial o como caracteres normales con un significado literal.

A continuación se muestran algunos metacaracteres comunes de RegEx y ejemplos de qué cadenas coincidirán en un segmento.

MetacarácterDescripciónEjemplo de RegExCoincidencia
\Carácter de escape. Cancela el significado especial de cualquier metacarácter de esta lista que siga inmediatamente a la barra invertida y, en su lugar, coincide con el carácter literal.«www\.rws\.com» «www.netwrix.com» pero no «www,rws,com».
\bDefine el límite de una palabra. \bstud«stud» y «studio» pero no «tradosstudio».
\wCoincide con cualquier carácter de palabra. \w «I»«D» «S» «1», «3» en «ID S1.3»
\WCoincide con cualquier

carácter que no sea alfanumérico.

\W« », «.» en «ID S1.3»
\dCoincide con cualquier carácter numérico; equivalente a [0-9] Studio\d\d«Studio21»
\DCoincide con cualquier carácter no numérico; equivalente a [ 0-9] Studio\D«Studio-»
\sCoincide con cualquier carácter de espacio en blanco (espacio, tabulación, salto de línea o salto de página).Trados\sStudio«Trados Studio» y «Trados (tab) Studio»
\SCoincide con cualquier carácter que no sea de espacio en blanco.Studio\S«StudioT» y «Studio1»
\rCoincide con un carácter de retorno de carro.
\tCoincide con un carácter de tabulación.
.Coincide con cualquier carácter individual excepto un carácter de nueva línea. Entre corchetes, el punto es literal. Por ejemplo: a.c coincide con abc, etc., pero [a.c] solo coincide con a, . o c.«t.....»«to RWS» en «Welcome to RWS».
[ ]Crea una clase de caracteres, que le permite hacer coincidir cualquiera de los conjuntos de caracteres que especifique.

Puede utilizar- para especificar un intervalo de caracteres. Por ejemplo, [a-z] coincide con cualquier letra minúscula.

[au]«a» en «Trados», «u» en «Studio».
^Coincide con la posición inicial de un segmento.

También puede buscar cualquier carácter que no esté en una clase de caracteres determinada agregando ^ al principio de una clase de caracteres. Por ejemplo, [^0-9] coincide con cualquier carácter que no sea un número.

^[^a-z0-9]Cualquier carácter al principio del segmento que no sea una letra minúscula ni tampoco un número.

Asegúrese de activar la opción Distingue entre mayúsculas y minúsculas. De lo contrario, el motor de expresiones regulares busca cadenas que no empiecen por una letra o un número.

*Coincide con el elemento anterior cero o más veces.\d*\.\d «.0»,«19.9»,«219.9».
?Coincide con el elemento anterior cero o una vez. Resulta útil para buscar caracteres opcionales.colo?r «Color»»«color».
+Coincide con el elemento anterior una o más veces.be+«bee» en «been» «bent».
|Coincide con cualquier elemento separado por la barra vertical |.th(e|is|at) «the»,«this» en «this is the day».
{n}Coincide con el carácter de la izquierda exactamente n veces.be{2}«bee» pero no «be»
( )Crea un grupo y «recuerda» la sección coincidente de la cadena. Los grupos se pueden utilizar referencias inversas o para extraer una subcadena.

Origen: (?<TheBoy>Jack) y (?<TheGirl>Jill)

Destino: ${TheBoy} e ${TheGirl}

Jack and Jill en el segmento de origen [EN]: ¡Jack y Jill subían esa colina de nuevo!

En la RegEx de destino, puede reutilizar las coincidencias identificadas por los grupos <TheBoy> y <TheGirl> con una referencia posterior etiquetada o numerada:

  • ${TheBoy} e ${TheGirl}
  • $1 e $2

Ambos coincidirán con «Jack e Jill» en el segmento de destino [IT]: Jack e Jill salirono di nuovo su quella collina!

$
  • Sustituye la subcadena coincidente por nombre de grupo o grupo.
  • Cuando se utiliza como último carácter de un patrón, fija una coincidencia al final de una cadena.

Para hacer coincidir un símbolo $ literal, utilice \$ o enciérrelo dentro de una clase de caracteres, como en [$].

< >Captura la subexpresión coincidente en un grupo con nombre.(?<double>\w)\k<double> «ee» en «deep»
-Intervalo de caracteres: Coincide con cualquier carácter individual del intervalo del primero al último.[A-Z] «A» «B» en «AB123»
Recursos útiles