Segmentation et marquage

Comprendre comment Trados Studio segmente, puis marque un fichier source est indispensable à une utilisation efficace des MT. Lorsque vous ouvrez un fichier, le logiciel utilise les paramètres de type de fichier pour effectuer une première segmentation. Il utilise ensuite les règles de segmentation de la MT (en tenant compte de certains paramètres de type de fichier) pour poursuivre la segmentation.

Le logiciel utilise les règles de segmentation de la MT (ou, si vous utilisez une séquence de MT, de la première MT de la séquence). Après la segmentation, le logiciel utilise les paramètres de la MT pour remplacer le texte par des jetons, le cas échéant (marquage).

Segmentation au paragraphe

Lorsque vous ouvrez un fichier dans Trados Studio, le logiciel divise le fichier en paragraphes à l'aide des règles fournies dans les paramètres du type de fichier. Chaque type de fichier obéit à des règles différentes pour la délimitation des paragraphes. Par exemple, dans les fichiers texte délimités simples, le caractère de nouvelle ligne introduit un saut de paragraphe mais, dans les fichiers HTML, c'est la balise <p> qui introduit un paragraphe, tandis que le caractère de nouvelle ligne équivaut à un espace. Pour les types de fichiers utilisant des balises (par exemple HTML et XML), vous pouvez définir une balise comme étant une balise de structure pour indiquer qu'elle délimite les paragraphes.

Segmentation à la phrase

Les règles de segmentation sont des propriétés de la MT (sous ressources linguistiques). Vous pouvez spécifier une segmentation par paragraphe, auquel cas Trados Studio n'effectue pas de segmentation plus approfondie. Il est toutefois plus courant d'utiliser une segmentation par phrase, auquel cas le logiciel utilise les règles de segmentation pour diviser les paragraphes en segments.

Les règles de segmentation sont des expressions régulières qui reconnaissent les modèles de caractères marquant la fin des phrases. Exemple : un point suivi d'un espace marque généralement la fin d'une phrase.

Lorsque le logiciel segmente un paragraphe, il tient également compte des paramètres suivants :

  • Si les abréviations et les séparateurs de nombres sont reconnus. S'ils le sont, certains segments peuvent contenir des points. (Cette reconnaissance est une propriété des ressources linguistiques de la MT.)
  • Conseils de segmentation. Un conseil de segmentation indique si le logiciel doit traiter la balise comme une indication d'un saut de segment (exclure) ou inclure la balise dans un segment (inclure). Les conseils de segmentation sont comme un paramètre de type de fichier pour une balise.

Les segments produits par la segmentation à la phrase sont ceux que le traducteur verra dans l'éditeur. Le logiciel compare chaque segment avec les unités de traduction dans les MT pour voir s'il existe une correspondance.

Marquage

Le marquage intervient après la segmentation. Le logiciel divise le segment en jetons lorsqu'il s'apprête à rechercher une correspondance pour un segment. Dans la MT, le texte est stocké sous forme de jetons.

Les paramètres de la MT déterminent ce qui constitue un jeton. Par exemple, si la MT considère les dates comme des transposables, l'élément 12 janvier 1900 est traité comme un seul jeton, mais si les dates ne sont pas reconnues comme des transposables, il est considéré comme trois jetons distincts : 12, janvier et 1900.

Si un segment de texte présenté contient des transposables, une MT peut trouver une correspondance fondée sur un modèle et non des mots exacts. Par exemple, si les dates sont reconnues comme des transposables, les segments suivants sont considérés comme identiques :

He arrived on 1 January 1900
He arrived on 2 February 2012

Bien que les paramètres de la MT spécifient quels modèles de texte sont marqués, la façon dont l'éditeur de traduction gère les transposables (par exemple s'il localise automatiquement les dates ou non) dépend des paramètres du projet et non de ceux de la MT.