旧版内嵌内容处理器的设置配置

内嵌内容(旧版)页面可用于仍使用旧版内嵌内容处理器的文件类型。此为常规处理器,不区分内嵌内容的类型。因此您无法指定自定义提取。

关于此任务

旧版内嵌内容适用于下列文件类型:Microsoft ExcelJava 资源XML:任何 XML 以及新建(旧版内嵌内容)文件类型

过程

  1. 决定您想要为哪些项目配置文件类型设置:
    • 对于活动项目,请转到项目视图,然后在主页选项卡上选择项目设置
    • 对于所有未来项目,请转到文件 > 选项
  2. 展开文件类型结构树,然后选择相关的文件类型:Microsoft ExcelJava 资源XML:任何 XML 以及新建(旧版内嵌内容)文件类型
  3. 在文件类型的内嵌内容页面上,选中启用内嵌内容处理复选框。
  4. 选择文档结构 > 添加...以创建基于文档结构信息的提取规则。确保您在此处指定的文档结构信息包含在您的文件类型解析器页面上的解析器规则中。Trados Studio 只能提取文件类型解析器识别的内嵌内容。
  5. 添加标记定义规则以指定如何处理文档结构信息框中所定义的内嵌内容。
    标记类型
    占位符

    将内嵌内容转换为独立(占位符)标记。

    标记对

    识别内嵌内容中的标记对(一个开始标记和一个结束标记)。

    开始标记表达式(占位符)

    这是用于识别内嵌内容并将每个出现的内嵌内容转换为占位符标记的正则表达式。例如,要将所有 HTML <br>(换行符)标记转换为占位符标记,请输入 <br.*?>

    开始标记表达式和结束标记表达式(标记对)

    这些是按开始和结束标记识别内嵌内容的正则表达式。开始和结束标记可能含有一些内容或不含内容。

    处理器将尝试匹配标记对,然后再尝试匹配每个标记表达式。即,它将查找任何以开始标记表达式开始并以结束标记表达式结束的文本部分,然后尝试匹配单个开始和结束标记。

    例如,要识别所有 HTML <tr>...</tr>(表格行)标记对,请输入:
    • 开始标记<tr.*?>
    • 结束标记</tr>
    忽略大小写

    选中此框后,当标识内嵌内容时,并不考虑定义标签的字母大小写。

    翻译

    不可译是指标记对之间的内容向译员显示为锁定内容。

    标记对中的文本可以是可翻译或不可译。占位符标记为不可译

    格式

    您可以编辑内嵌内容在编辑器视图中的显示方式。

  6. 高级设置可指定标记的显示方式。
    标记在文本中充当词语结尾

    此选项会更改编辑器窗口中的光标定位行为。

    选择后,编辑器将标记视为单词,以利于导航。例如,在编辑器中,按 Ctrl+向左箭头将使光标移至标记开始,按 Ctrl + 向右箭头则会使光标移至标记结束。

    文本行可在标记之后换行

    选择此选项即表示,此标记之后的换行符并不代表句段的结束。例如:

    Gather ye rosebuds while ye may,<br>

    Old Time is still a-flying: <br>

    And this same flower that smiles to-day <br>

    To-morrow will be dying.

    标记仅代表格式并可以在编辑器中隐藏

    选择此选项后,文本将应用正确格式,但不会显示标准的格式标记(如粗体、斜体和字体类型)。

    选择此选项并不意味着标记始终为隐藏状态;用户可以更改编辑器设置,以显示该标记。

    标记代表文本

    仅限占位符(独立)标记。

    标记可以具有对等文本。例如,实体标记 &quot; 含有对等文本 "。

    断句提示
    断句提示是标记的属性,有助于软件将文件转换为可翻译格式时断开文件:无论是定位句段内或句段外的标记,还是强迫断句。请选择以下选项之一。
    包含选择此选项后,即使标记不含相关文本,编辑器中也会显示该标记。通常很少选择此选项。
    包含文本

    选择此选项后,若标记含有相关文本,则编辑器中将显示该标记。

    示例:标记指定脚注标记。此情况下,译员需要将标记移至同一句子中的另一个词语处,从而使标记包含在文本中。

    排除

    选择此选项后,软件将尽可能使用标记或标记对来分割文本。例如,若 <p>...</p><br> 标记为排除,则在 XML 文档包含嵌入的 HTML 代码时,软件将使用 HTML 标记 <p>...</p><br> 来分割文档。除了已应用至嵌入 XML 代码的断句规则外,此断句规则也将应用。

    可以排除,未定义

    这两个选项实质上相同。编辑器确定标记是否属于文本的一部分。