Konfigurieren der Einstellungen für den älteren Prozessor für eingebettete Inhalte
Die Seite Eingebettete Inhalte (älter) steht für Dateitypen zur Verfügung, die noch die ältere Verarbeitung eingebetteter Inhalte verwenden. Dies ist ein generischer Prozessor, der nicht zwischen den verschiedenen Arten eingebetteter Inhalte unterscheidet. Infolgedessen können Sie keine benutzerdefinierte Extrahierung festlegen.
Warum und wann dieser Vorgang ausgeführt wird
Ältere eingebettete Inhalte sind für die folgenden Dateitypen verfügbar: Microsoft Excel, Java-Ressourcen, XML: Beliebiges XML und neue Dateitypen (ältere eingebettete Inhalte).
Prozedur
- Legen Sie fest, für welche Projekte Sie Dateityp-Einstellungen konfigurieren möchten:
- Navigieren Sie für das aktuelle Projekt zur Ansicht Projekte und wählen Sie auf der Registerkarte Start die Option Projekteinstellungen aus.
- Für alle zukünftigen Projekte: Gehen Sie zu Datei > Optionen.
- Erweitern Sie die Baumstruktur Dateitypen und wählen Sie den Dateityp Microsoft Excel, Java-Ressourcen, XML: Beliebiges XML und neue Dateitypen (ältere eingebettete Inhalte).
- Aktivieren Sie auf der Seite Eingebettete Inhalte Ihres Dateityps das Kontrollkästchen Verarbeitung eingebetteter Inhalte aktivieren.
- Wählen Sie Dokumentstruktur > Hinzufügen..., um Extraktionsregeln basierend auf Dokumentstruktur-Informationen zu erstellen. Stellen Sie sicher, dass die Dokumentstruktur-Informationen, die Sie hier angeben, von einer Parser-Regel auf der Seite Parser Ihres Dateityps abgedeckt sind. Trados Studio kann nur eingebettete Inhalte extrahieren, die vom Dateityp-Parser erkannt werden.
Anmerkung: Die Verarbeitung eingebetteter Inhalte für Excel-Dateitypen funktioniert nur, wenn „Cell“ als Dokumentstruktur-Information definiert wird. Es ist nicht erforderlich, weitere Strukturinformationen hinzuzufügen.
- Fügen Sie Tag-Definitionsregeln hinzu, um festzulegen, wie die eingebetteten Inhalte behandelt werden sollen, die im Feld Dokumentstruktur-Informationen definiert sind.
Tag-Typ Platzhalter Konvertiert eingebettete Inhalte in eigenständige (Platzhalter-) Tags.
Tag-Paar Identifiziert Tag-Paare (ein Start-Tag und ein End-Tag) in eingebetteten Inhalten.
Regulärer Ausdruck für das Start-Tag (Platzhalter) Hierbei handelt es sich um einen regulären Ausdruck, der eingebettete Inhalte identifiziert und jede Instanz in ein Platzhalter-Tag konvertiert. Um beispielsweise alle
<br>-HTML-Tags (Zeilenumbruch) in Platzhalter-Tags zu konvertieren, geben Sie<br.*?>ein.Regulärer Ausdruck für das Start-Tag und Regulärer Ausdruck für das End-Tag (Tag-Paar) Hierbei handelt es sich um reguläre Ausdrücke, die eingebettete Inhalte anhand von Start- und End-Tags identifizieren. Die Start- und End-Tags können Inhalte umschließen oder aber für sich stehen.
Bei der Verarbeitung wird zunächst versucht, das Tag-Paar zuzuordnen, bevor zu den einzelnen Tag-Ausdrücken weitergegangen wird. Das heißt, es wird nach Textabschnitten gesucht, die mit dem Start-Tag-Ausdruck beginnen und mit dem End-Tag-Ausdruck enden, bevor einzelne Start- und End-Tags einander zugeordnet werden.
Geben Sie beispielsweise Folgendes ein, damit alle<tr>...</tr>-HTML-Tag-Paare (Tabellenzeile) identifiziert werden:- Start-Tag:
<tr.*?> - End-Tag:
</tr>
Groß-/Kleinschreibung ignorieren Wenn Sie dieses Kontrollkästchen aktivieren, wird die Groß-/Kleinschreibung Ihrer definierten Tags nicht beachtet, wenn die eingebetteten Inhalte identifiziert werden.
Übersetzen Nicht zu übersetzen bedeutet, dass der vom Tag-Paar eingeschlossene Inhalt dem Übersetzer als gesperrter Inhalt angezeigt wird.
Text in Tag-Paaren kann „zu übersetzen“ oder nicht zu übersetzen sein. Platzhalter-Tags sind nicht zu übersetzen.
Formatierung Sie können ändern, wie die eingebetteten Inhalte in der Ansicht Editor angezeigt werden.
- Start-Tag:
- In den Erweiterten Einstellungen wird festgelegt, wie Tags angezeigt werden.
Innerhalb von Text fungiert das Tag als Wortende Diese Option ändert das Verhalten der Cursor-Platzierung im Editorfenster.
Bei Auswahl dieser Option behandelt der Editor das Tag als Wort, zu dem er navigieren kann. Drückt man beispielsweise im Editor die Tastenkombination Strg+Pfeil nach links, wird der Cursor an den Anfang des Tags gesetzt, und bei Strg+Pfeil nach rechts wird der Cursor an das Ende des Tags gesetzt.
Zeilenumbruch nach dem Tag Die Auswahl dieser Option bedeutet, dass ein Zeilenumbruch nach diesem Tag nicht das Ende eines Segments anzeigt. Beispiel:
Pflück' Deine Rosenknospen, solange sie blüh'n,
<br>Die Zeiten im Fluge verwehen:
<br>Und die gleiche Blume die heute Dir lacht
<br>Wird morgen schon vergehen.
Tags stellen ausschließlich Formatierungen dar und können im Editor ausgeblendet werden Bei Auswahl dieser Option wird der Text korrekt formatiert, und Standard-Formatierungs-Tags (z. B. fett, kursiv und Schriftart) werden nicht angezeigt.
Wenn diese Option ausgewählt ist, sind Tags nicht zwangsläufig immer ausgeblendet. Der Benutzer kann die Einstellungen im Editor so ändern, dass die Anzeige des Tags erzwungen wird.
Tag repräsentiert den Text Nur Platzhalter- (eigenständige) Tags.
Ein Tag kann ein Textäquivalent haben. Zum Beispiel verfügt das Entity-Tag
"über das Textäquivalent ".Segmentierungshinweis Ein Segmentierungshinweis ist eine Eigenschaft eines Tags, welche der Software hilft, die Datei besser zu segmentieren, wenn diese in ein übersetzbares Format umgewandelt wird. Er legt fest, ob das Tag innerhalb eines Segments oder außerhalb des Segments ist oder ob ein Segmentierungsumbruch erzwungen werden soll. Wählen Sie eine der folgenden Optionen aus:Einschließen Bei Auswahl dieser Option wird das Tag auch dann im Editor angezeigt, wenn es keinen zugehörigen Text hat. Diese Option benötigen Sie nur in seltenen Fällen. Innerhalb von Segmenten mit Text Hat das Tag zugehörigen Text, wird das Tag bei Auswahl dieser Option im Editor angezeigt.
Beispiel: Das Tag steht für ein Fußnotenzeichen. Wenn dies der Fall ist, muss der Übersetzer die Möglichkeit haben, das Markierungs-Tag auf ein anderes Wort im selben Satz zu verschieben. Daher sollte das Tag in den Text eingeschlossen werden.
Ausschließen Bei Auswahl dieser Option verwendet die Software das Tag oder das Tag-Paar nach Möglichkeit zur Segmentierung des Texts. Werden
<p>...</p>oder<br>-Tags beispielsweise mit Ausschließen markiert, verwendet die Software bei XML-Dokumenten mit eingebettetem HTML-Code die HTML-Tags<p>...</p>und<br>, um das Dokument zu segmentieren. Diese Segmentierung erfolgt zusätzlich zur Segmentierung, die bereits auf den eingebetteten XML-Code angewendet wird.Kann außerhalb von Segmenten stehen, Nicht definiert Diese beiden Optionen sind im Grunde gleich. Der Editor bestimmt, ob das Tag Teil des Texts ist.
- Ältere Verarbeitung eingebetteter Inhalte konfigurieren
Die Seite Eingebettete Inhalte (älter) steht für Dateitypen zur Verfügung, die noch die ältere Verarbeitung eingebetteter Inhalte verwenden. Es handelt sich dabei um eine generische Verarbeitung, die eingebettete Inhalte vom Dateityp-Parser extrahieren lässt und nicht zwischen den Typen der eingebetteten Inhalte unterscheidet. Dies hindert Sie daran, benutzerdefinierte Extraktions- und Anzeigeeinstellungen für verschiedene Arten von eingebetteten Inhalten festzulegen.