Erkannte Tokens

Ein erkanntes Token ist ein kurzes Textstück in einem definierten Satz von Formaten, das vom Translation Memory (TM) als einzelnes Wort behandelt wird.

Tokens, die erkannt werden können, sind:
  • Datumsangaben
  • Zeitangaben
  • Zahlen (in Ziffern)
  • Maßeinheiten
  • Akronyme und URLs
  • Variablen
  • Inline-Tags

Wenn beispielsweise Datumsangaben in einem TM als erkannte Tokens aktiviert sind, erkennt das TM Montag, 1. Januar 1900 als ein Wort.

Wo die Erkennung von Tokens aktiviert oder deaktiviert wird

Sie aktivieren oder deaktivieren die Erkennung von Tokens, indem Sie die allgemeinen Eigenschaften eines TMs bearbeiten.

Diese Einstellungen beeinflussen, wie das TM den Ausgangstext in Tokens analysiert. Die Einstellungen für erkannte Tokens geben Textmuster an, die das TM als Tokens erkennt, und geben auch den Typ des Tokens an.

Für einige Typen von erkannten Tokens können Sie eine Regel bereitstellen, die das TM verwendet, um Vorkommen des Tokens im Ausgangstext zu übersetzen. Bei diesen Regeln, die im Folgenden beschrieben werden, handelt es sich um Regeln für die Auto-Lokalisierung.

Wie das TM die Einstellung zur Erkennung von Tokens verwendet

Wenn eine Übersetzungseinheit (ÜE) zu einem Translation Memory (TM) hinzugefügt wird, durchsucht das TM die ÜE nach erkannten Tokens. Wenn z. B. Datumsangaben aktiviert sind, analysiert es die ÜE auf Datumsangaben. Wenn die Erkennung dieses Tokens für das TM nicht aktiviert ist, erkennt das TM die Tokens nicht. Wenn Sie z. B. die Erkennung von Daten später aktivieren, analysiert das TM nicht sofort alle vorhandenen ÜE nach Daten. Sie müssen das TM erneut indexieren. Wenn Sie das TM neu indizieren, scannt das TM vorhandene ÜE nach aktuell erkannten Tokens.

Wenn neuer Text für eine Übersetzung angezeigt wird, segmentiert das TM den Text und prüft dann auf erkannte Tokens, d. h. es sucht innerhalb eines Segments nur nach erkannten Tokens.

Wie erkannte Tokens bei der Übersetzung behandelt werden

Für einige erkannte Tokens ist der vorgeschlagene Zieltext identisch mit dem Ausgangstext:
  • Inline-Tags
  • Akronyme
  • URLs
  • Variablen
Für die verbleibenden erkannten Tokens wird die Übersetzung durch die automatische Lokalisierung der Quelle erstellt. Zu diesen Tokens gehören:
  • Datumsangaben
  • Zeitangaben
  • Zahlen (in Ziffern)
  • Maßeinheiten

Wo die automatischen Lokalisierungsregeln für erkannte Tokens geändert werdengeändert

Die Regeln für die automatische Lokalisierung werden in den Projekteinstellungen festgelegt.

Wo die Einstellungen für erkannte Tokens geändert werden

Wenn ein TM Ausgangstext analysiert, verwendet es die Einstellungen für erkannte Tokens. Wenn das TM ein Token innerhalb eines übereinstimmenden Segments erkennt, wird das gesamte Segment übersetzt.

Wenn das Token nicht Teil eines übereinstimmenden Segments ist, wird der Übersetzungsvorschlag bereitgestellt (z. B. ein Datum in der Zielsprache).

Sie können diese Einstellungen unter den Sprachressourcen-Einstellungen und auch direkt für jedes TM unter den TM-Einstellungen festlegen. Wie erwartet überschreiben alle Einstellungen, die direkt für ein Translation Memory angegeben sind, die allgemeinen Einstellungen.