分節規則

分節規則は、SDL Trados Studio で原文テキストの段落を分節に分割する方法を定義します。多くの場合、分節は文と同一であり、その場合、規則は文を構成するテキスト パターンを指定します。

Trados Studio では、分節規則は正規表現で指定されます。その正規表現で、文の末尾を示す文字列のパターンが定義されます。既定の分節規則として使用される正規表現の説明は、次を参照してください。分節規則は言語リソースであり、適切な言語リソースの下で追加、編集、削除できます。分節分割の定義は、次の 2 つの部分で定義されます。

分節の前
分節が分割される直前のテキスト パターン。
分節の後
分節が分割される直後のテキストを定義する、もう 1 つのテキスト パターン。

分節が分割されるのは、あるテキストが分節の前のパターンに一致し、その直後に分節の後のパターンに一致するテキストが続き、例外規則のいずれにも一致しない場合だけです。

例外規則

例外規則の形式は分節規則と同じです。テキストが例外規則と一致すると、分節は分割されません。一般的な例外規則の 1 つに、終止符分節規則に関する小文字例外規則があります。これは、終止符の後の次の文字が小文字の場合、分節は分割されないというものです。

複数の分節規則

たとえば、コロンがある箇所で分節を定義する規則と、終止符がある箇所を扱うもう 1 つの規則のように、複数の分節規則を持つことができます。

言語ペアが同じである任意の 1 つのプロジェクトで、分節規則が異なる複数のメインの TM を使用できます。

文レベルの分節に影響を及ぼす他の設定

  • 略語のリスト。「etc.」など、終止符 (.) で終了する略語のリストが含まれています。etc. の末尾の終止符は、必ずしも文の末尾を示しているわけではありません (ただし、文の末尾にある場合もあります)。
  • 序数詞のリスト。略語と同様に序数詞も、終止符が必ずしも分節の末尾を示すわけではない事例を構成します。たとえば、Avril... が序数詞である場合、「23.April」は「23rd April」(4 月 23 日) という意味で、「23」の後に「April...」で始まる文章が続いているわけではありません。

既定の分節規則で使用される正規表現について

既定の分節規則で使用される正規表現では、Unicode カテゴリが積極的に活用されています。使用されているものは次のとおりです。

\p{Ll}
小文字
\p{Pe}
任意の種類の閉じ括弧
\p{Pf}
任意の種類の閉じ引用符
\p{Po}
ダッシュ、括弧、引用符、または接続文字 (アンダースコア) 以外の任意の句読文字
\uFFFF
Unicode 文字。たとえば、\u002C はカンマで、\u003A はコロンです。