Segmentierungsregeln

Segmentierungsregeln legen fest, wie ein Translation Memory (TM) oder ein Projekt Ausgangstext in Segmente unterteilt.

Segmentierungsregeln sind anpassbare Sprachressourcen, die durch die regulären Ausdrücke definiert werden, die ein Segment angeben. Oft ist ein Segment identisch mit einem Satz. Für diesen Fall werden in den regulären Ausdrücken Textmuster festgelegt, die einen Satz bilden.

Die Definition eines Segmentendes ist zweiteilig:

  • Vor dem Segmentende: Ein Muster für den Text unmittelbar vor dem Segmentende.
  • Nach dem Segmentende: Ein anderes Muster, das den Text unmittelbar nach dem Segmentende definiert.

Ein Segmentende wird nur dann erstellt, wenn ein Teil des Texts dem Muster Vor dem Segmentende entspricht und direkt darauf ein Text nach dem Muster Nach dem Segmentende folgt.

Mehrere Regeln

Vielleicht möchten Sie mehrere Segmentierungsregeln festlegen, beispielsweise eine Regel zur Segmentierung nach einem Doppelpunkt und eine andere Regel zur Segmentierung nach einem Punkt.

In einem Projekt können mehrere Haupt-TMs mit derselben Sprachkombination, aber unterschiedlichen Segmentierungsregeln verwendet werden.

Andere Sprachressourcen, die sich auf die Segmentierung auswirken

  • Liste mit Abkürzungen: Diese Liste enthält Abkürzungen, die mit einem Punkt (.) enden, zum Beispiel etc. Der Punkt am Ende von etc. markiert nicht notwendigerweise das Ende eines Satzes, kann dies jedoch gelegentlich tun.
  • Liste mit Ordinalsubstantiven: Wie bei Abkürzungen markiert auch bei Ordinalsubstantiven ein Punkt nicht unbedingt das Ende eines Segments. Folgen auf ihn einige Substantive, bedeutet eine Reihe von Ziffern, gefolgt von einem Punkt (z. B. 23.), die Ordinalzahl (23.), nicht das Ende eines Satzes. Beispiel: 23. April.

Regeln, die Ausnahmen angeben

Darüber hinaus wird auch dann, wenn der Text diese Regeln erfüllt und zudem mit den Ausnahmeregeln übereinstimmt, kein Segmentende erstellt. Möglicherweise möchten Sie eine Ausnahme für die Verwendung von Punkten in einem Satz definieren.

Sie sollten keine Punkte (.) in Dateinamen verwenden.