Reguläre Ausdrücke für den erweiterten Anzeigefilter angeben

Reguläre Ausdrücke (RegEx) sind leistungsstarke Suchformeln, mit denen komplexe Zeichenmuster in Texten gefunden werden können. In Trados Studio können Sie reguläre Ausdrücke verwenden, um nach Segmenten zu filtern, die einem bestimmten Muster entsprechen. Trados Studio verwendet die .NET-Syntax für reguläre Ausdrücke.

Warum und wann dieser Vorgang ausgeführt wird

So geben Sie einen regulären Ausdruck im Feld Quelle oder Ziel des erweiterten Anzeigefilters an:

Prozedur

  1. Öffnen Sie in der Editoransicht die Registerkarte Ansicht und wählen Sie Erweiterter Anzeigefilter 2.0 aus.
    Damit das Fenster Erweiterter Anzeigefilter 2.0 immer angezeigt wird, wählen Sie die Schaltfläche Automatisch ausblenden aus.
  2. Öffnen Sie die Registerkarte Inhalt und geben Sie die gewünschten regulären Ausdrücke im Feld Quelle und/oder Ziel ein.
  3. Wählen Sie im Drop-down-Menü auf der rechten Seite AND oder OR aus, um die Suchfilter für Quelle und Ziel zu kombinieren. Die Einschränkung mit dem Filter AND ist stärker, da nur die Segmente angezeigt werden, die sowohl den ausgangs- als auch den zielsprachlichen Kriterien entsprechen. Mit der Bedingung OR werden Segmente zurückgegeben, die entweder den ausgangs- oder den zielsprachlichen Kriterien entsprechen.UNDODERQuelle-Zielsuche-Filter
  4. Aktivieren Sie die Option Regulärer Ausdruck. Andernfalls interpretiert Trados Studio die Zeichenmuster in den Feldern Quelle und Ziel als normale Wörter.
  5. Wenn der reguläre Ausdruck für Ihre Quelle oder Ihr Ziel Rückverweise enthält, aktivieren Sie die Option Rückverweis. Trados Studio unterstützt benannte und nummerierte Rückverweise im folgenden Format: ${group name} und $1.
  6. Geben Sie im Feld DSI-Information an, ob Sie die Ergebnisse auf bestimmte Segmenttypen beschränken möchten. Geben Sie beispielsweise H oder heading ein, um nur Titelsegmente anzuzeigen.
  7. Um Segmentergebnisse nach Tag-Inhalten zu filtern, aktivieren Sie entweder die Option Suche in Text und Tag-Inhalten oder Nur in Tag-Inhalten suchen. Die erste Option sucht nach Tag-Attributinhalten sowie nach zu übersetzenden Inhalten innerhalb von Tags, während die zweite Option nur nach Tag-Attributinhalten wie z. B. Font=Courier New sucht.
  8. Aktivieren Sie die Option Groß-/Kleinschreibung beachten, wenn die Groß-/Kleinschreibung des unverändert angezeigten Zeichens in Ihrem regulären Ausdruck beachtet werden soll. Standardmäßig ignoriert Studio Groß-/Kleinschreibung. Der reguläre Ausdruck ^T gibt beispielsweise Segmente zurück, die sowohl mit einem kleinen als auch mit einem großen T beginnen.
  9. Wenden Sie beliebige zusätzliche Filter an, die auf den Registerkarten Filterattribute, Kommentare, Dokumentstruktur, Segment, Farbe und Stichproben verfügbar sind.
    Neben jeder Registerkarte, die zusätzliche Filter enthält, welche für die aktuelle Suche berücksichtigt werden, wird ein Häkchen angezeigt. Die angewendeten Filter und die Suchergebnisse werden unten im erweiterten Anzeigefilter in der Statusleiste angezeigt.

Beispiel

Beispiele für reguläre Ausdrücke
ErgebnisRegulärer AusdruckBeschreibung

Alle Segmente mit unterschiedlicher Groß- und Kleinschreibung in Ausgangs- und Zielsprache anzeigen

Ausgangssprache: ^[A-Z]

Zielsprache: ^[a-z]

Stellen Sie sicher, dass die Option Groß-/Kleinschreibung beachten aktiviert ist. Andernfalls findet die RegEx-Engine Zeichenfolgen sowohl in Klein- als auch in Großbuchstaben für beide Muster.

Das Zirkumflex-Zeichen (^) signalisiert den Anfang eines Segments.

[A-Z] beschreibt den Bereich aller Großbuchstaben, während [a-z] den Bereich aller Kleinbuchstaben beschreibt.

Alle Segmente mit unterschiedlicher Interpunktion am Satzende in Quelle und Ziel anzeigen

Ausgangssprache: \.$

Zielsprache: [^.]$

Diese Ausdrücke finden alle Segmentpaare, die mit einem Punkt im Ausgangstext, aber nicht im Zieltext enden.

Im ersten Ausdruck signalisiert das $-Symbol das Ende einer Zeichenfolge oder eines Segments, und der Backslash (\) gefolgt vom Punkt signalisiert einen unverändert angezeigten Punkt.

Im zweiten Ausdruck kennzeichnet das Zirkumflex-Zeichen innerhalb der Gruppe eine Negation. [^.] steht somit für ein beliebiges Zeichen, das kein Punkt ist.

Sie können diesen Ausdruck ändern, um nach anderen Interpunktionszeichen zu suchen. Die folgenden regulären Ausdrücke finden beispielsweise alle Segmente, die mit einem Fragezeichen im Ausgangssegment, aber nicht im Zielsegment enden:

  • RegEx in AS: ?$
  • RegEx in ZS: [^?]$
Rückverweis-Konstrukte für reguläre Ausdrücke

Rückverweise verwenden Submatches erneut, die zuvor in demselben regulären Ausdruck (RegEx) oder im entsprechenden Ersatz-RegEx erkannt wurden. Rückverweise sind nützlich, wenn Sie eine Zeichenfolge wie z. B. /(abc)(abc)(abc)(abc) im selben RegEx oder über den entsprechenden Ersatz-RegEx wiederholen müssen. Anstatt die Zeichengruppe (abc) mehrmals zu kopieren, können Sie sie wiederverwenden, indem Sie Rückverweise in die ursprüngliche Gruppe einfügen.

Sie können sowohl benannte als auch nummerierte Rückverweise im folgenden Format verwenden:
SyntaxRegulärer AusdruckBeschreibung
  • \k<Name>
  • \Zahl

bei Bezugnahme auf eine vorherige Komponente desselben regulären Ausdrucks

  • (?<x> abc ) = \k<x> entspricht abc=abc
  • "(abc) = \1" entspricht "abc=abc"
  • ${group name}
  • $1

Bezugnahme auf eine Komponente eines entsprechenden regulären Ausdrucks

(?<TheBoy>Jack) and (?<TheGirl>Jill) entspricht Jack and Jill im Ausgangssegment [EN]: Jack and Jill went up that hill again!

Im RegEx in der Zielsprache können Sie die von den Gruppen <TheBoy> und <TheGirl> erkannten Übereinstimmungen mit einem benannten oder nummerierten Rückverweis wiederverwenden:

  • ${TheBoy} e ${TheGirl}
  • $1 e $2

Beide entsprechen Jack e Jill im Zielsegment [IT]: Jack e Jill salirono di nuovo su quella collina!

Sonderzeichen für reguläre Ausdrücke

Metazeichen sind die Bausteine regulärer Ausdrücke (RegEx). Zeichen in regulären Ausdrücken sind entweder Metazeichen mit einer besonderen Bedeutung oder normale Zeichen mit einer unverändert bleibenden Bedeutung.

Im Folgenden finden Sie einige gängige RegEx-Metazeichen und Beispiele dafür, welchen Zeichenfolgen in einem Segment diese entsprechen würden.

MetazeichenBeschreibungRegEx-BeispielMatch
\Escape-Zeichen. Hebt die besondere Bedeutung von Metazeichen in dieser Liste auf, die unmittelbar auf den Backslash folgen und stattdessen dem unverändert angezeigten Zeichen entsprechen."www\.rws\.com" "www.netwrix.com" aber nicht "www,rws,com".
\bDefiniert eine Wortgrenze. \bstud"stud" und "studio", aber nicht "tradosstudio".
\wSymbolisiert jedes beliebige alphabetisches Zeichen. \w "I""D" "S" "1", "3" in "ID S1.3"
\WSymbolisiert jedes beliebige

nicht-alphabetisches Zeichen.

\W" " ,"." in "ID S1.3"
\dSymbolisiert eine beliebige Ziffer; wie [0-9] Studio\d\d"Studio21"
\DSymbolisiert alles außer Ziffern; wie [^0-9] Studio\D"Studio-"
\sSymbolisiert ein beliebiges Leerzeichen (ein Leerzeichen, einen Tabulator, einen Zeilenumbruch oder einen Formularvorschub).Trados\sStudio"Trados Studio" und "Trados (Tab) Studio"
\SSymbolisiert ein beliebiges Zeichen, das kein Leerzeichen ist.Studio\S"StudioT" und "Studio1"
\rSymbolisiert manuelle Zeilenschaltungen.
\tSymbolisiert ein Tabulatorzeichen.
.Steht für jedes beliebige Zeichen mit Ausnahme des Zeilenvorschubs „\n“. Innerhalb von eckigen Klammern ist der Punkt ein unverändert bleibendes Zeichen. Beispiel: a.c entspricht abc usw., aber [a.c] entspricht nur a, . " oder c ."b.....""bei RWS" in "Willkommen bei RWS".
[ ]Erstellt eine Zeichenklasse, mit der Sie nach einem Zeichen suchen können, das einer Gruppe angehört.

Sie können- verwenden, um eine Gruppe von Zeichen anzugeben. [a-z] findet beispielsweise einen beliebigen Kleinbuchstaben.

[au]"a" in "Trados" , "u"in "Studio".
^Signalisiert die Startposition eines Segments.

Sie können auch nach einem beliebigen Zeichen suchen, das nicht in einer angegebenen Zeichenklasse enthalten ist, indem Sie am Anfang einer Zeichenklasse ^ hinzufügen. Beispielsweise entspricht [^0-9] einem beliebigen Zeichen, das keine Ziffer ist.

^[^a-z0-9]Ein beliebiges Zeichen am Anfang des Segments, das kein Kleinbuchstabe und auch keine Ziffer ist.

Stellen Sie sicher, dass die Option Groß-/Kleinschreibung beachten aktiviert ist. Andernfalls sucht die RegEx-Engine nach Zeichenfolgen, die nicht mit einem Buchstaben oder einer Ziffer beginnen.

*Entspricht dem vorherigen Element null oder mehrere Male.\d*\.\d ".0" ,"19.9" ,"219.9" .
?Entspricht dem vorherigen Element null oder einmal. Dieses Zeichen ist nützlich, um optionale Zeichen zu finden.colo?r "color""colour".
+Entspricht dem vorherigen Element mindestens einmal.be+"bee" in "been" "bent".
|Sucht ein beliebiges Element, das durch den senkrechten Strich (|) getrennt ist.th(e|is|at) "the" ,"this" in "this is the day".
{n}Entspricht dem Zeichen links von diesem Metazeichen genau n-mal.be{2}"bee", aber nicht "be"
( )Erstellt eine Gruppe und „merkt sich“ den passenden Abschnitt der Zeichenfolge. Gruppen können für Rückverweise oder zum Extrahieren einer Teilzeichenfolge verwendet werden.

Ausgangssprache: (?<TheBoy>Jack) and (?<TheGirl>Jill)

Zielsprache: ${TheBoy} e ${TheGirl}

Jack and Jill im Ausgangssegment [EN]: Jack and Jill went up that hill again!

Im RegEx in der Zielsprache können Sie die von den Gruppen <TheBoy> und <TheGirl> erkannten Übereinstimmungen mit einem benannten oder nummerierten Rückverweis wiederverwenden:

  • ${TheBoy} e ${TheGirl}
  • $1 e $2

Beide entsprechen "Jack e Jill" im Zielsegment [IT]: Jack e Jill salirono di nuovo su quella collina!

$
  • Ersetzt die Teilzeichenfolge, die der Gruppe oder dem Gruppennamen entspricht.
  • Wenn dieses Zeichen als letztes Zeichen eines Musters verwendet wird, verankert das Zeichen eine Übereinstimmung am Ende einer Zeichenfolge.

Um ein Literal $ zu finden, verwenden Sie \$ oder schließen Sie das $-Zeichen innerhalb einer Zeichenklasse ein, wie in [$].

< >Erfasst den passenden Unterausdruck in einer benannten Gruppe.(?<double>\w)\k<double> "ee" in "deep"
-Zeichenbereich: Findet ein beliebiges Zeichen im Bereich vom ersten bis zum letzten Zeichen.[A-Z] "A" "B" in "AB123"
Hilfreiche Ressourcen