Konfigurieren der Einstellungen für den älteren Prozessor für eingebettete Inhalte

Die Seite Eingebettete Inhalte (älter) steht für Dateitypen zur Verfügung, die noch die ältere Verarbeitung eingebetteter Inhalte verwenden. Dies ist ein generischer Prozessor, der nicht zwischen den verschiedenen Arten eingebetteter Inhalte unterscheidet. Infolgedessen können Sie keine benutzerdefinierte Extrahierung festlegen.

Warum und wann dieser Vorgang ausgeführt wird

Ältere eingebettete Inhalte sind für die folgenden Dateitypen verfügbar: Microsoft Excel, Java-Ressourcen, XML: Beliebiges XML und neue Dateitypen (ältere eingebettete Inhalte).

Prozedur

  1. Legen Sie fest, für welche Projekte Sie Dateityp-Einstellungen konfigurieren möchten:
    • Navigieren Sie für das aktuelle Projekt zur Ansicht Projekte und wählen Sie auf der Registerkarte Start die Option Projekteinstellungen aus.
    • Für alle zukünftigen Projekte: Gehen Sie zu Datei > Optionen.
  2. Erweitern Sie die Baumstruktur Dateitypen und wählen Sie den Dateityp Microsoft Excel, Java-Ressourcen, XML: Beliebiges XML und neue Dateitypen (ältere eingebettete Inhalte).
  3. Aktivieren Sie auf der Seite Eingebettete Inhalte Ihres Dateityps das Kontrollkästchen Verarbeitung eingebetteter Inhalte aktivieren.
  4. Wählen Sie Dokumentstruktur > Hinzufügen..., um Extraktionsregeln basierend auf Dokumentstruktur-Informationen zu erstellen. Stellen Sie sicher, dass die Dokumentstruktur-Informationen, die Sie hier angeben, von einer Parser-Regel auf der Seite Parser Ihres Dateityps abgedeckt sind. Trados Studio kann nur eingebettete Inhalte extrahieren, die vom Dateityp-Parser erkannt werden.
  5. Fügen Sie Tag-Definitionsregeln hinzu, um festzulegen, wie die eingebetteten Inhalte behandelt werden sollen, die im Feld Dokumentstruktur-Informationen definiert sind.
    Tag-Typ
    Platzhalter

    Konvertiert eingebettete Inhalte in eigenständige (Platzhalter-) Tags.

    Tag-Paar

    Identifiziert Tag-Paare (ein Start-Tag und ein End-Tag) in eingebetteten Inhalten.

    Regulärer Ausdruck für das Start-Tag (Platzhalter)

    Hierbei handelt es sich um einen regulären Ausdruck, der eingebettete Inhalte identifiziert und jede Instanz in ein Platzhalter-Tag konvertiert. Um beispielsweise alle <br>-HTML-Tags (Zeilenumbruch) in Platzhalter-Tags zu konvertieren, geben Sie <br.*?> ein.

    Regulärer Ausdruck für das Start-Tag und Regulärer Ausdruck für das End-Tag (Tag-Paar)

    Hierbei handelt es sich um reguläre Ausdrücke, die eingebettete Inhalte anhand von Start- und End-Tags identifizieren. Die Start- und End-Tags können Inhalte umschließen oder aber für sich stehen.

    Bei der Verarbeitung wird zunächst versucht, das Tag-Paar zuzuordnen, bevor zu den einzelnen Tag-Ausdrücken weitergegangen wird. Das heißt, es wird nach Textabschnitten gesucht, die mit dem Start-Tag-Ausdruck beginnen und mit dem End-Tag-Ausdruck enden, bevor einzelne Start- und End-Tags einander zugeordnet werden.

    Geben Sie beispielsweise Folgendes ein, damit alle <tr>...</tr>-HTML-Tag-Paare (Tabellenzeile) identifiziert werden:
    • Start-Tag: <tr.*?>
    • End-Tag: </tr>
    Groß-/Kleinschreibung ignorieren

    Wenn Sie dieses Kontrollkästchen aktivieren, wird die Groß-/Kleinschreibung Ihrer definierten Tags nicht beachtet, wenn die eingebetteten Inhalte identifiziert werden.

    Übersetzen

    Nicht zu übersetzen bedeutet, dass der vom Tag-Paar eingeschlossene Inhalt dem Übersetzer als gesperrter Inhalt angezeigt wird.

    Text in Tag-Paaren kann „zu übersetzen“ oder nicht zu übersetzen sein. Platzhalter-Tags sind nicht zu übersetzen.

    Formatierung

    Sie können ändern, wie die eingebetteten Inhalte in der Ansicht Editor angezeigt werden.

  6. In den Erweiterten Einstellungen wird festgelegt, wie Tags angezeigt werden.
    Innerhalb von Text fungiert das Tag als Wortende

    Diese Option ändert das Verhalten der Cursor-Platzierung im Editorfenster.

    Bei Auswahl dieser Option behandelt der Editor das Tag als Wort, zu dem er navigieren kann. Drückt man beispielsweise im Editor die Tastenkombination Strg+Pfeil nach links, wird der Cursor an den Anfang des Tags gesetzt, und bei Strg+Pfeil nach rechts wird der Cursor an das Ende des Tags gesetzt.

    Zeilenumbruch nach dem Tag

    Die Auswahl dieser Option bedeutet, dass ein Zeilenumbruch nach diesem Tag nicht das Ende eines Segments anzeigt. Beispiel:

    Pflück' Deine Rosenknospen, solange sie blüh'n,<br>

    Die Zeiten im Fluge verwehen: <br>

    Und die gleiche Blume die heute Dir lacht <br>

    Wird morgen schon vergehen.

    Tags stellen ausschließlich Formatierungen dar und können im Editor ausgeblendet werden

    Bei Auswahl dieser Option wird der Text korrekt formatiert, und Standard-Formatierungs-Tags (z. B. fett, kursiv und Schriftart) werden nicht angezeigt.

    Wenn diese Option ausgewählt ist, sind Tags nicht zwangsläufig immer ausgeblendet. Der Benutzer kann die Einstellungen im Editor so ändern, dass die Anzeige des Tags erzwungen wird.

    Tag repräsentiert den Text

    Nur Platzhalter- (eigenständige) Tags.

    Ein Tag kann ein Textäquivalent haben. Zum Beispiel verfügt das Entity-Tag &quot; über das Textäquivalent ".

    Segmentierungshinweis
    Ein Segmentierungshinweis ist eine Eigenschaft eines Tags, welche der Software hilft, die Datei besser zu segmentieren, wenn diese in ein übersetzbares Format umgewandelt wird. Er legt fest, ob das Tag innerhalb eines Segments oder außerhalb des Segments ist oder ob ein Segmentierungsumbruch erzwungen werden soll. Wählen Sie eine der folgenden Optionen aus:
    EinschließenBei Auswahl dieser Option wird das Tag auch dann im Editor angezeigt, wenn es keinen zugehörigen Text hat. Diese Option benötigen Sie nur in seltenen Fällen.
    Innerhalb von Segmenten mit Text

    Hat das Tag zugehörigen Text, wird das Tag bei Auswahl dieser Option im Editor angezeigt.

    Beispiel: Das Tag steht für ein Fußnotenzeichen. Wenn dies der Fall ist, muss der Übersetzer die Möglichkeit haben, das Markierungs-Tag auf ein anderes Wort im selben Satz zu verschieben. Daher sollte das Tag in den Text eingeschlossen werden.

    Ausschließen

    Bei Auswahl dieser Option verwendet die Software das Tag oder das Tag-Paar nach Möglichkeit zur Segmentierung des Texts. Werden <p>...</p> oder <br>-Tags beispielsweise mit Ausschließen markiert, verwendet die Software bei XML-Dokumenten mit eingebettetem HTML-Code die HTML-Tags <p>...</p> und <br>, um das Dokument zu segmentieren. Diese Segmentierung erfolgt zusätzlich zur Segmentierung, die bereits auf den eingebetteten XML-Code angewendet wird.

    Kann außerhalb von Segmenten stehen, Nicht definiert

    Diese beiden Optionen sind im Grunde gleich. Der Editor bestimmt, ob das Tag Teil des Texts ist.