Reguläre Ausdrücke für den erweiterten Anzeigefilter angeben
Reguläre Ausdrücke (RegEx) sind leistungsstarke Suchformeln, mit denen komplexe Zeichenmuster in Texten gefunden werden können. In Trados Studio können Sie reguläre Ausdrücke verwenden, um nach Segmenten zu filtern, die einem bestimmten Muster entsprechen. Trados Studio verwendet die .NET-Syntax für reguläre Ausdrücke.
Warum und wann dieser Vorgang ausgeführt wird
So geben Sie einen regulären Ausdruck im Feld Quelle oder Ziel des erweiterten Anzeigefilters an:
Prozedur
Beispiel
- Beispiele für reguläre Ausdrücke
-
Ergebnis Regulärer Ausdruck Beschreibung Alle Segmente mit unterschiedlicher Groß- und Kleinschreibung in Ausgangs- und Zielsprache anzeigen
Ausgangssprache:
^[A-Z]Zielsprache:
^[a-z]Stellen Sie sicher, dass die Option Groß-/Kleinschreibung beachten aktiviert ist. Andernfalls findet die RegEx-Engine Zeichenfolgen sowohl in Klein- als auch in Großbuchstaben für beide Muster.
Das Zirkumflex-Zeichen (^) signalisiert den Anfang eines Segments.
[A-Z] beschreibt den Bereich aller Großbuchstaben, während [a-z] den Bereich aller Kleinbuchstaben beschreibt.
Alle Segmente mit unterschiedlicher Interpunktion am Satzende in Quelle und Ziel anzeigen
Ausgangssprache:
\.$Zielsprache:
[^.]$Diese Ausdrücke finden alle Segmentpaare, die mit einem Punkt im Ausgangstext, aber nicht im Zieltext enden. Im ersten Ausdruck signalisiert das
$-Symbol das Ende einer Zeichenfolge oder eines Segments, und der Backslash (\) gefolgt vom Punkt signalisiert einen unverändert angezeigten Punkt.Im zweiten Ausdruck kennzeichnet das Zirkumflex-Zeichen innerhalb der Gruppe eine Negation.
[^.]steht somit für ein beliebiges Zeichen, das kein Punkt ist.Sie können diesen Ausdruck ändern, um nach anderen Interpunktionszeichen zu suchen. Die folgenden regulären Ausdrücke finden beispielsweise alle Segmente, die mit einem Fragezeichen im Ausgangssegment, aber nicht im Zielsegment enden:
- RegEx in AS:
?$ - RegEx in ZS:
[^?]$
- RegEx in AS:
- Rückverweis-Konstrukte für reguläre Ausdrücke
-
Rückverweise verwenden Submatches erneut, die zuvor in demselben regulären Ausdruck (RegEx) oder im entsprechenden Ersatz-RegEx erkannt wurden. Rückverweise sind nützlich, wenn Sie eine Zeichenfolge wie z. B.
/(abc)(abc)(abc)(abc)im selben RegEx oder über den entsprechenden Ersatz-RegEx wiederholen müssen. Anstatt die Zeichengruppe(abc)mehrmals zu kopieren, können Sie sie wiederverwenden, indem Sie Rückverweise in die ursprüngliche Gruppe einfügen.Sie können sowohl benannte als auch nummerierte Rückverweise im folgenden Format verwenden:Syntax Regulärer Ausdruck Beschreibung \k<Name>\Zahl
bei Bezugnahme auf eine vorherige Komponente desselben regulären Ausdrucks
(?<x> abc ) = \k<x>entsprichtabc=abc"(abc) = \1"entspricht"abc=abc"
${group name}$1
Bezugnahme auf eine Komponente eines entsprechenden regulären Ausdrucks
(?<TheBoy>Jack) and (?<TheGirl>Jill)entsprichtJack and Jillim Ausgangssegment [EN]:Jack and Jill went up that hill again!Im RegEx in der Zielsprache können Sie die von den Gruppen <TheBoy> und <TheGirl> erkannten Übereinstimmungen mit einem benannten oder nummerierten Rückverweis wiederverwenden:
${TheBoy} e ${TheGirl}$1 e $2
Beide entsprechen
Jack e Jillim Zielsegment [IT]:Jack e Jill salirono di nuovo su quella collina!
- Sonderzeichen für reguläre Ausdrücke
-
Metazeichen sind die Bausteine regulärer Ausdrücke (RegEx). Zeichen in regulären Ausdrücken sind entweder Metazeichen mit einer besonderen Bedeutung oder normale Zeichen mit einer unverändert bleibenden Bedeutung.
Im Folgenden finden Sie einige gängige RegEx-Metazeichen und Beispiele dafür, welchen Zeichenfolgen in einem Segment diese entsprechen würden.
Metazeichen Beschreibung RegEx-Beispiel Match \Escape-Zeichen. Hebt die besondere Bedeutung von Metazeichen in dieser Liste auf, die unmittelbar auf den Backslash folgen und stattdessen dem unverändert angezeigten Zeichen entsprechen. "www\.rws\.com""www.netwrix.com"aber nicht"www,rws,com".\bDefiniert eine Wortgrenze. \bstud"stud"und"studio", aber nicht"tradosstudio".\wSymbolisiert jedes beliebige alphabetisches Zeichen. \w"I""D""S""1","3"in "ID S1.3"\WSymbolisiert jedes beliebige nicht-alphabetisches Zeichen.
\W" " ,"." in "ID S1.3"\dSymbolisiert eine beliebige Ziffer; wie [0-9]Studio\d\d"Studio21"\DSymbolisiert alles außer Ziffern; wie [^0-9]Studio\D"Studio-"\sSymbolisiert ein beliebiges Leerzeichen (ein Leerzeichen, einen Tabulator, einen Zeilenumbruch oder einen Formularvorschub). Trados\sStudio"Trados Studio"und"Trados(Tab)Studio"\SSymbolisiert ein beliebiges Zeichen, das kein Leerzeichen ist. Studio\S"StudioT"und"Studio1"\rSymbolisiert manuelle Zeilenschaltungen. \tSymbolisiert ein Tabulatorzeichen. .Steht für jedes beliebige Zeichen mit Ausnahme des Zeilenvorschubs „\n“. Innerhalb von eckigen Klammern ist der Punkt ein unverändert bleibendes Zeichen. Beispiel: a.centsprichtabcusw., aber[a.c]entspricht nura,." oderc."b.....""bei RWS"in"Willkommen bei RWS".[ ]Erstellt eine Zeichenklasse, mit der Sie nach einem Zeichen suchen können, das einer Gruppe angehört. Sie können
-verwenden, um eine Gruppe von Zeichen anzugeben.[a-z]findet beispielsweise einen beliebigen Kleinbuchstaben.[au]"a"in"Trados","u"in"Studio".^Signalisiert die Startposition eines Segments. Sie können auch nach einem beliebigen Zeichen suchen, das nicht in einer angegebenen Zeichenklasse enthalten ist, indem Sie am Anfang einer Zeichenklasse
^hinzufügen. Beispielsweise entspricht[^0-9]einem beliebigen Zeichen, das keine Ziffer ist.^[^a-z0-9]Ein beliebiges Zeichen am Anfang des Segments, das kein Kleinbuchstabe und auch keine Ziffer ist. Stellen Sie sicher, dass die Option Groß-/Kleinschreibung beachten aktiviert ist. Andernfalls sucht die RegEx-Engine nach Zeichenfolgen, die nicht mit einem Buchstaben oder einer Ziffer beginnen.
*Entspricht dem vorherigen Element null oder mehrere Male. \d*\.\d".0","19.9","219.9".?Entspricht dem vorherigen Element null oder einmal. Dieses Zeichen ist nützlich, um optionale Zeichen zu finden. colo?r"color""colour".+Entspricht dem vorherigen Element mindestens einmal. be+"bee"in"been""bent".|Sucht ein beliebiges Element, das durch den senkrechten Strich (|) getrennt ist. th(e|is|at)"the","this"in"this is the day".{n}Entspricht dem Zeichen links von diesem Metazeichen genau n-mal.be{2}"bee", aber nicht"be"( )Erstellt eine Gruppe und „merkt sich“ den passenden Abschnitt der Zeichenfolge. Gruppen können für Rückverweise oder zum Extrahieren einer Teilzeichenfolge verwendet werden. Ausgangssprache: (?<TheBoy>Jack) and (?<TheGirl>Jill)Zielsprache: ${TheBoy} e ${TheGirl}
Jack and Jillim Ausgangssegment [EN]:Jack and Jill went up that hill again!Im RegEx in der Zielsprache können Sie die von den Gruppen <TheBoy> und <TheGirl> erkannten Übereinstimmungen mit einem benannten oder nummerierten Rückverweis wiederverwenden:
${TheBoy} e ${TheGirl}$1 e $2
Beide entsprechen
"Jack e Jill"im Zielsegment [IT]:Jack e Jill salirono di nuovo su quella collina!$- Ersetzt die Teilzeichenfolge, die der Gruppe oder dem Gruppennamen entspricht.
- Wenn dieses Zeichen als letztes Zeichen eines Musters verwendet wird, verankert das Zeichen eine Übereinstimmung am Ende einer Zeichenfolge.
Um ein Literal
$zu finden, verwenden Sie\$oder schließen Sie das $-Zeichen innerhalb einer Zeichenklasse ein, wie in[$].< >Erfasst den passenden Unterausdruck in einer benannten Gruppe. (?<double>\w)\k<double>"ee"in"deep"-Zeichenbereich: Findet ein beliebiges Zeichen im Bereich vom ersten bis zum letzten Zeichen. [A-Z]"A""B"in"AB123" - Hilfreiche Ressourcen
-
- RegExBuddy ist ein Programm, mit dem Sie reguläre Ausdrücke testen, erstellen, dekodieren und debuggen können. Das Programm enthält auch eine Bibliothek mit häufig verwendeten regulären Ausdrücken.
- A competitive edge ist ein hilfreicher Blogbeitrag zur Verwendung regulärer Ausdrücke in Trados Studio.
- Regular expressions for beginners ist ein Blog zum Einstieg in reguläre Ausdrücke.
- Introducing regular expressions ist ein Online-Buch von Michael Fitzgerald, das die Grundlagen regulärer Ausdrücke erklärt.
- Rückverweis-Konstrukte in regulären Ausdrücken