Présentation du processus de segmentation

Les paramètres de segmentation définissent comment une mémoire de traduction (MT) ou un projet divise le texte source en segments.

Les règles de segmentation sont définies dans la section Ressources linguistiques des paramètres de la MT. Vous pouvez également définir les règles de segmentation utilisées par Trados GroupShare lorsqu'aucune mémoire de traduction n'est applicable : ces règles sont définies dans un modèle de ressources linguistiques, dont l'emplacement est spécifié dans les paramètres du projet.

Règles de segmentation

Les règles de segmentation sont définies par les expressions régulières qui spécifient un segment.

Le plus souvent, un segment correspond à une phrase, auquel cas l'expression régulière définit les modèles de texte qui constituent une phrase.

Dans un même projet, pour la même paire de langues, vous pouvez utiliser plusieurs MT principales avec des règles de segmentation différentes.

Règles spécifiant des exceptions

Liste des abréviations. Elle recense les abréviations se terminant par un point (.), comme « etc. » dont le point ne marque pas nécessairement la fin d'une phrase.

Liste des séparateurs de nombres. Comme les abréviations, les séparateurs de nombres constituent des cas où un point ne marque pas nécessairement la fin d'un segment : lorsqu'il est suivi de noms, un ensemble de chiffres suivi d'un point (par exemple 23.) indique un nombre ordinal (23e), pas la fin d'une phrase. Par exemple 23. Avril peut signifier à partir du 23 avril. La liste des séparateurs de nombres constitue la liste de ces noms.

Exemple : Une règle de segmentation simple

\.+[\p{Pe}\p{Pf}\p{Po}"]*

Cette expression régulière spécifie un segment de manière plutôt simpliste. Elle fait correspondance tous les caractères avec un signe de ponctuation qui ferme le segment.

Les signes de ponctuation fermants, de finalisation et autre, sont des catégories Unicode définies pour les codes suivants :

\p{Pe} indique une ponctuation fermante.

\p{Pf} spécifie la ponctuation finale d'une citation.

\p{Po} spécifie les autres signes de ponctuation.

Pour plus d'information, voir par exemple, Énumération UnicodeCategory.