Règles de segmentation
Les règles de segmentation définissent comment une mémoire de traduction (MT) ou un projet divise le texte source en segments.
Les règles de segmentation sont des ressources linguistiques personnalisables, définies par les expressions régulières qui spécifient un segment. Le plus souvent, un segment correspond à une phrase, auquel cas l'expression régulière définit les modèles de texte qui constituent une phrase.expressions régulièressegment
Un saut de segment se définit selon deux critères :
- Avant le saut de ligne : Un modèle pour le texte immédiatement avant le saut de segment.
- Après le saut de ligne : Un autre modèle de texte qui définit le texte immédiatement après le saut de segment.
Un saut de segment est créé uniquement si du texte correspond au modèle avant le saut segment et est immédiatement suivi de texte correspondant au modèle après le saut de segment.
Règles multiples
Vous pouvez avoir besoin d'un certain nombre de règles de segmentation, par exemple, une règle de segmentation pour définir la segmentation lorsqu'il y a deux points et une autre règle de segmentation lorsqu'il y a un point.
Dans un même projet, pour la même paire de langues, vous pouvez utiliser plusieurs MT (principales) avec des règles de segmentation différentes.
Autres ressources linguistiques affectant la segmentation
- Liste des abréviations : la liste contient des abréviations qui se terminent par un point (.), par exemple, etc. Le point à la fin de etc. ne marque pas nécessairement la fin d'une phrase, bien qu'il puisse le faire, dans certains cas.
- Liste des séparateurs de nombres : comme les abréviations, les séparateurs de nombres fournissent des cas où un point ne marque pas nécessairement la fin d'un segment. Lorsqu'il est suivi de noms, un ensemble de chiffres suivi d'un point (par exemple 23.) indique un ordinal (23ème), pas la fin d'une phrase. Par exemple 23. Avril peut signifier à partir du 23 avril.
Règles spécifiant des exceptions
En outre, même si le texte satisfait à ces règles, si le texte présente également une correspondance avec les règles d'exception, aucun saut de segment n'est créé. Vous pouvez définir une exception pour l'utilisation d'un point dans une phrase, par exemple :
Vous ne devez pas utiliser de points (.) dans les noms de fichiers.