Segmentation

Studio traite les fichiers en vue de leur traduction en divisant le texte en segments. Un segment peut être un paragraphe ou une phrase. Les signes de ponctuation sont utilisés pour déterminer où finit chaque segment. Ce processus appelé « segmentation » affecte la façon dont le texte s'affiche dans l'Éditeur à l'ouverture d'un document.

Lorsqu'un fichier est ouvert dans l'Éditeur Studio, il passe par trois niveaux de segmentation :

  1. Segmentation basée sur la structure
  2. Segmentation basée sur des règles
  3. Segmentation basée sur les balises imbriquées

Segmentation basée sur la structure

Ce premier niveau de segmentation consiste à diviser le fichier d'entrée selon des éléments de structure définis. Ce processus varie en fonction du type de fichier utilisé et des paramètres définis par l'utilisateur (p. ex. les règles de structure de l'analyseur XML).

Segmentation basée sur des règles

Une fois que le document est divisé en unités de paragraphe, un autre niveau de segmentation est appliqué en fonction des règles de segmentation de la mémoire de traduction. L'utilisateur peut définir des caractères ou des modèles d'expression régulière (RegEx) devant faire office de séparateurs de phrases. La segmentation basée sur des règles s'applique à tous les types de fichiers et dépend de la mémoire de traduction par défaut.

Les règles de segmentation peuvent être modifiées dans les paramètres de la mémoire de traduction.

Segmentation basée sur les balises imbriquées

La troisième et dernière couche de segmentation utilise des indices de segmentation pour produire la forme finale du segment. Les indices de segmentation définissent le comportement requis pour une balise d'espace réservé ou une paire de balises figurant à la limite d'un segment (au début ou à la fin). Au cours de cette phase, Trados Studio décide si le contenu (texte + balises + espaces réservés) divisé en segments est traduisible ou non modifiable. Les indices de segmentation suivants sont utilisés :

  • Inclure
  • Exclure
  • Inclure avec le texte
  • Peut exclure