XML v2 custom settings

The XML 2 custom file type has the *.xml extension.

Detection

When configuring the Parser section of the XML 2 custom file type, you can edit all the Parser rules manually from scratch, or adjust the Parser rules from an uploaded file and preview the results.

SettingInstruction
Root element namesType an element name and select plus sign.
xsi:schemaLocation URIsType a declaration.
DOCTYPE declaration element namesType a declaration.
Namespace declaration (xmlns) URIsType a namespace declaration and select plus sign.
xPath rulesType an XPath rule and select plus sign.

Note that if you choose to upload an *.xml file via the Using rules generation with a dynamic preview, the fields are automatically populated with information from the *.xml file, but you can still add or delete values.

Parser

OperationsInstruction
Add a rule manuallyParsing rules define how elements are handled. To add a rule:
  1. Select Add New Rule.
  2. Under Rule select either XPath rules or Element rules, and then select By manually defining the rules. If you select XPath rules, enter a value in the XPath field, if you selected Element rules, enter an element and its attribute.
  3. Under Properties, select Basic Settings and edit the following:
    • Translate: Yes (default), No, Inherit.
    • Tag Type: Structure (default), Inline.
    • Whitespace: Inherit from Parent (default), Always preserve, Always normalize, Normalize unless xml:space='preserve'
  4. Under Properties, select Advanced Settings and edit the following:
    • SID XPATH - Leave the field empty, as this option is only used by WorldServer. For more information about SID, consult the WorldServer documentation.
    • Segmentation Hint - This option is available only if you work with inline tags and only if you specified the extraction rule (segmentation hint) in the Embedded Content section of your file type. Select one of the available options: May Exclude (default), Include, Include With Text, Exclude.
    • Length restrictions - Specify a minimum length and a maximum length.
  5. This option is available only if you work with inline tags. Under Formatting, specify: the size, the color, the position (Inherit, Normal, Superscript, Subscript), and the style (Bold, Italic, Strikethrough, Underline).
  6. This option is available only if you work with structure tags. Under Structure Information:
    1. Select Add new.
    2. Under Properties, select one of the available structure elements from the Name list, and then specify a code, an identifier, a description, color.
    3. Under Formatting, specify: the size, the color, the position (Inherit, Normal, Superscript, Subscript), and the style (Bold, Italic, Strikethrough, Underline).
  7. Select Save.
Add a rule based on an uploaded *.xml file of maximum 1MBParsing rules define how elements are handled. To add a rule:
  1. Select Add New Rule.
  2. Under Rule select either XPath rules, and then select Using rules generation with a dynamic preview. Save the file type and consult the Preview tab populated with the information and default rules from your uploaded *.xml file. In the file preview, you can perform several operations:
    • Hover a start tag and have the end tag highlighted automatically. The rule opens on the right-hand side of the Preview tab, with the default rules pre-populated.
    • Hover a start tag and consult the most important information displayed in a text box displayed inline.
    • Consult the translatable text displayed in bold and the untranslatable text displayed in gray.
    • Continue adding, editing, or deleting the rules, as instructed below.
  3. Under Properties, select and edit the basic settings:
    • Translate: Yes (default), No, Inherit.
    • Tag Type: Structure (default), Inline.
    • Whitespace: Inherit from Parent (default), Always preserve, Always normalize, Normalize unless xml:space='preserve'
  4. Under Properties, select Advanced Settings and edit the following:
    • SID XPATH - Leave the field empty, as this option is only used by WorldServer. For more information about SID, consult the WorldServer documentation.
    • Segmentation Hint - This option is available only if you work with inline tags and only if you specified the extraction rule (segmentation hint) in the Embedded Content section of your file type. Select one of the available options: May Exclude (default), Include, Include With Text, Exclude.
    • Length restrictions - Specify a minimum length and a maximum length.
  5. This option is available only if you work with inline tags. Under Formatting, specify: the size, the color, the position (Inherit, Normal, Superscript, Subscript), and the style (Bold, Italic, Strikethrough, Underline).
  6. This option is available only if you work with structure tags. Under Structure Information:
    1. Select Add new.
    2. Under Properties, select one of the available structure elements from the Name list, and then specify a code, an identifier, a description, color.
    3. Under Formatting, specify: the size, the color, the position (Inherit, Normal, Superscript, Subscript), and the style (Bold, Italic, Strikethrough, Underline).
  7. When finished, select Done and then select Save.

Writer settings

ParamètreInstruction
Indicateur d’ordre des octets (BOM) Unicode UTF-8Dans la liste, choisissez une option pour déterminer comment l’indicateur d’ordre des octets (BOM) est géré pendant la traduction : Conserver; ne pas ajouter si absent à l’origine, Conserver : ajouter si absent à l’origine, Supprimer si présent.
Valeurs d’attribut xml:lang et langDans la liste, choisissez une option pour déterminer comment « lang » est géré pendant la traduction : Modifier la langue source correspondante en langue cible, Toujours modifier la langue cible, Ne pas modifier.

Whitespace settings

ParamètreInstruction
Espace dans un contenuDécidez comment traiter les espaces pendant la traduction : Normaliser sauf si xml:space=’preserve’; Toujours conserver; Toujours normaliser.
Normaliser les espaces dans les balisesCochez la case pour vous assurer que l’espace est normalisé dans les balises.

Namespace settings

ParamètreInstruction
Résolution des espaces de nomsDécidez comment vous souhaitez utiliser les espaces de noms : Utiliser les espaces de noms si déclarés dans le document, Toujours utiliser un préfixe, même lorsque l’espace de nom est déclaré.
Espaces de nomsAjoutez un préfixe et un URI pour votre espace de nom, puis sélectionnez le signe plus.

Validation

ParamètreInstruction
Effectuer la validation de schéma et de DTD durant la détection de fichierDécidez comment valider les schémas et les fichiers DTD :
  • Traiter tous les avertissements de validation en tant qu’erreurs d’analyse de fichier
  • Consigner l’avertissement si aucune DTD et aucun schéma n’est détecté
Effectuer la validation de schéma durant la vérification de la traduction
Spécifier le schéma manuellementActivez cette option pour spécifier les schémas manuellement. Décidez comment utiliser les schémas :
  • Appliquer à tous les documents XML
  • Appliquer uniquement aux documents pour lesquels aucune DTD et aucun schéma ne sont spécifiés
Schémas principauxConservez les valeurs par défaut ou ajoutez d’autres fichiers.
DTD et schémas dépendantsConservez les valeurs par défaut ou ajoutez d’autres fichiers.

Entity settings

ParamètreInstruction
Activer la conversion des entitésLes paramètres d'entités spécifient si les caractères spéciaux sont convertis dans leur entité HTML correspondante. Cochez ou décochez la case selon que vous souhaitez activer ou non la conversion d'entité.
Convertir les références d'entités numériques en balises d'espaces réservés imbriquéesCochez ou décochez la case selon que vous souhaitez activer ou non la conversion d'entité numérique.
Ignorer la conversion dans le contenu verrouilléCochez ou décochez la case selon que vous souhaitez ignorer la conversion du contenu verrouillé.
Ajouter une entitéCliquez sur le signe plus, ajoutez le caractère et décidez de cocher ou non les cases à cocher suivantes.
  • LIRE EN TANT QUE CARACTÈRE : lorsque l’option est activée, spécifie les entités qui sont converties pendant l’analyse et les caractères correspondants.
  • LIRE EN TANT QUE CARACTÈRE : lorsque l’option est activée, ce paramètre spécifie les caractères convertis pendant l’écriture et les caractères correspondants.
Modifier une entitéAjustez les valeurs données.

Embedded Content

ParamètreInstruction
Traiter le contenu incorporé Cochez la case pour activer le traitement du contenu incorporé. Spécifiez ensuite une méthode de traitement : Dans l'élément CDATA avec; Défini par les règles d'analyseur; Défini par les informations de structure du document.
Dans l'élément CDATA avec :CDATA désigne les données de caractères et fait référence à une partie du contenu d'élément marquée pour être interprétée littéralement, comme des données textuelles, au lieu de contenu marqué. Si vous activez cette option, cette entité interprète l'élément : Embedded Content Plain Text v 1.0.0.0.
Défini par les règles d'analyseurPour ajouter une règle d'analyseur :
  1. Dans les listes RÈGLE D'ANALYSEUR et IDENTIFIANT DU PROCESSEUR INCORPORÉ, sélectionnez l'une des valeurs disponibles.
  2. Sélectionnez le signe plus.
Défini par les renseignements sur la structure du document - Renseignements sur la structure du documentDans la liste Informations sur la structure du document, sélectionnez l'une des valeurs disponibles, puis sélectionnez le signe plus.
Défini par les renseignements sur la structure du document - Règles de définition des balisesSi vous choisissez l'élément de balise dans la liste Informations sur la structure du document ci-dessus, ajoutez une règle de définition de balise :
  1. Sélectionnez Ajouter une nouvelle règle.
  2. Dans la liste Type de balise, choisissez une valeur : Espace réservé ou Paire de balises.
  3. Dans le champ Expression régulière, saisissez l'expression régulière.
  4. Cochez la case Ignorer la casse pour ignorer la casse du contenu identifié. Sinon, conservez la valeur par défaut (décochez la case).
  5. Dans la liste Conseil de segmentation, choisissez une valeur pour déterminer le type de segmentation : Peut exclure (par défaut), Inclure, Inclure avec le texte, Exclure. La valeur que vous spécifiez ici est disponible lorsque vous configurez une règle d’analyseur sous Analyseur > Ajouter une nouvelle règle > Propriétés > Paramètres avancés > Conseil de segmentation. Consultez cette rubrique pour découvrir le résultat de chaque conseil de segmentation.
  6. Sélectionnez Enregistrer.