GB/T 40035-2021.Basic requirements for bilingual parallel corpus processing service.
1范围
GB/T 40035规定了双语平行语料加工服务的基本要求、加工流程、服务内容和数据安全等内容。
GB/T 40035适用于以原文和译文为对象的、以文字为表达形式的数字化双语语料加工服务,其他数字化文本的语料加工也可参照使用,也适用于对语料对齐工具的评价。
2规范性引用文件
本文件没有规范性引用文件。
3术语和定义
下列术语和定义适用于本文件。
3.1
文本 text
以字符、符号、词、短语、段落、句子、表格或其他字符排列形成的数据,用于表达意义,其解释基本上取决于读者对于某种自然语言或人工语言的知识。
[来源:GB/T 4894-2009.4.1.1.2.4]
3.2
语料 corpus
语言材料或资料。
3.3
双语平行语料 bilingual parallel corpus
由两种语言构成,并在篇章、段落、句子或其他级别平行对齐的语料(3.2)。
3.4
原文 source language text
源语言文本(3.1)。
[来源:GB/T 19363.1-2008,3.4, 有修改]
3.5
译文 target language text
目标语言文本(3.1)。
[来源:GB/T 19363.1-2008,3.5, 有修改]