Глоссарий
Глоссарий по терминологии систем автоматизации перевода
- "идеально совпадающий" сегмент
- Сегмент, для которого найдено полное контекстное совпадение в предыдущей версии переводимого документа, и перенесенный из этого документа в текущий. Такие сегменты, как правило, не требуют дополнительной проверки и редактирования.
- "идеальное" совпадение
- Форма полного контекстного совпадения: сравнение сегмента осуществляется не с TM, а с предыдущей версией документа, сохраненного в двуязычном формате (ttx)
- MT
- в системе SDL TRADOS: аббревиатура Multiterm, терминологической базы данных
- TBX
- Стандарт в формате XML для обмена терминологическими базами данных (terminology database), созданными в различных системах.
- TMX
- Стандарт в формате XML для обмена базами перевода (translation memory), созданными в различных системах.
- автоматический перевод
- автоматический перевод текста с одного естественного языка на другой, выполняемый лингвистическим ПО
- автоподстановка слов
- режим автоматической подстановки слов из словаря специального формата по мере набора текста
- Автораспространение
автоподстановка текста - режим автоматической подстановки текста выполненного перевода во все последующие повторяющиеся сегменты
- анализ
- функция, позволяющая получить данные о соответствии выбранной базы переводов тексту (количество полных совпадений, повторяющихся сегментов и т.п.) – то есть оценить объем работы, статистику перед переводом
- база переводов
память переводов - база переводов и ассоциированная с ней нейронная сеть, а также название лингвистичекой технологии
- дата изменения
- средство фильтрации, позволяет видеть дату изменения единицы перевода
- дата создания
- средство фильтрации, позволяет видеть дату создания единицы перевода
- двуязычное извлечение терминологии
- обработка текстов с целью выделения терминологии и переводов из текстов на двух языках
- единица перевода
- единица хранения в базе ТМ, состоит из исходного сегмента и его перевода
- замена
- элемент сегмента, который может потребовать применения специальных правил обработки в тексте перевода (с учетом формата представления) – дата, единица измерения и т.п.
- идентификатор пользователя
- средство фильтрации, позволяет видеть авторство единицы перевода (ФИО переводчика, название компании) или источник создания (например, alignment)
- извлечение терминологии
- обработка текстов с целью выделения терминов (тексты на одном языке) и их переводов (тексты на двух языках)
- индекс нечетких соответствий
- автоматически создаваемый индекс нечетких совпадений для поиска
- исходный сегмент
- сегмент на языке оригинала
- Лицензия клиентского доступа
CAL - лицензия на одного пользователя (клиента) на серверное программное обеспечение. Как правило, одна сетевая лицензия включает в себя несколько лицензий клиентского доступа; это количество определяет максимально возможное число единовременно подключенных к серверу пользователей.
- минимально допустимое значение соответствия
минимально допустимый уровень соответствия - приемлемый уровень соответствия сегментов обрабатываемого текста сегментам выбранной базыпереводов (в SDL TRADOS по умолчанию – 70%), все сегменты со значением ниже установленного будут обрабатываться как сегменты, не найденные в ТМ (unknown segments)
- многозначная единица перевода
- единица перевода (translation unit), в которой исходному сегменту могут соответствовать несколько переводов
- неизвестный сегмент
- сегмент в обрабатываемом тексте, не найденный в выбранной базе ТМ (абсолютно новый или не соответствующий установленному значению соответствия (match value))
- нечеткое соответствие
нечеткое совпадение - частичное совпадение текущего сегмента обрабатываемого текста и сегмента выбранной базы переводов
- одноязычное извлечение терминологии
- обработка текстов с целью выделения терминологии из текстов на одном языке
- перевод с помощью компьютера
- процесс перевода с применением лингвистического программного обеспечения (в первую очередь - систем translation memory)
- повтор
- сегмент, для которого отсутствует соответствие в выбранной TM, и встречающийся в данном тексте более одного раза
- повторяющееся совпадение
- полное совпадение сегмента обрабатываемого текста с сегментом ТМ, встречающееся в данном тексте более одного раза
- проектный пакет
подпроект - пакет проекта
- подстановочный элемент
- элемент сегмента, который вставляется в перевод без изменений – цифровые обозначения, графические изображения и т.п.
- поиск соответствий
- поиск соответствий в выбранной базе ТМ на уровне выделенного фрагмента текста (части слова, слова или сочетания слов)
- полное контекстное совпадение
- Более высокая степень совпадения, чем полное совпадение (100% match), требующая в качестве дополнительного условия полного контекстного совпадения - на уровне 100% должны совпадать с TM два предшествующих сегмента и два последующих сегмента
- полное совпадение
- полное совпадение сегмента обрабатываемого текста с сегментом в базе переводов
- правила перевода замен
- выбор формата представления замен (substitution) в тексте перевода
- правила сегментации
- правила, описывающие разбиение исходного текста на сегменты с целью сравнения их с базой ТМ (в стандартном случае задают пунктуацию конца предложения)
- Предварительный перевод
Претрансляция - выполнение перевода (сравнения) текста с выбранной базой ТМ (автоматический перевод всех сегментов с указанным значением совпадения, пополнение ТМ, разметка unknown segments и т.д.)
- проверка качества (перевода)
- процесс оценки качества выполненного перевода на соответствие различным критериям (терминология, стиль, формат и пр.)
- проект
- совокупность данных о переводе данного документа или группы документов (выбранная база ТМ, терминологический словарь, участники, специальные настройки, ресурсы и т.п.)
- распознавание терминов
- автоматический поиск терминов по терминологической базе системы SDL Multiterm, выполняемый в среде перевода.
- сегмент
- единица обрабатываемого текста (в большинстве случаев – предложение), на уровне которой происходит поиск и обработка в системе ТМ
- серверная память переводов
- хранится на сервере, доступна всем пользователям, в том числе через Интернет или Интранет
- система класса Translation Memory
- лингвистическое программное обеспечение, работающее с базами данных особого формата, в которых хранятся единицы перевода (translation unit) – исходные сегменты (segment) и их переводы, а также дополнительная информация (например, идентификатор пользователя (User ID) для переводчика, дата создания (Creation Date) и дата изменения (Change Date) единицы перевода, информация о том, как часто использовалась данная единица перевода). С помощью механизма нечеткого поиска (fuzzy matching) система распознает не только полностью совпадающие (exact match), но и подобные сегменты (fuzzy match). База данных сохраняет единицы перевода (translation unit) в искуственной нейронной сети, которая обеспечивает быстрый поиск и обработку сегментов.
- система управления процессом перевода
- программное обеспечение, позволяющее решать задачи управления в процессе профессионального перевода
- система управления терминологией
- программное средство для работы с терминами, представленными в определенном формате (например, SDL Multiterm)
- словарная статья
статья - единица хранения в терминологической базе данных (termbase)
- соответствие отсутствует
- для данного сегмента текста не найдено ни одного соответствия в выбранной базе переводов с установленным минимальным значением совпадения (minimummatch value)
- соответствие
совпадение - соответствие сегмента текста сегменту выбранной базы ТМ
- Сопоставление
выравнивание
синхронизация - создание и пополнение базы переводов путем обработки уже выполненных переводов (тех переводов, которые были выполнены до появления в распоряжении пользователя программы TM); в SDL TRADOS выполняется с помощью функции Align (автоматический анализ исходного текста и текста перевода и импорт результатов объединения в TM)
- Среда перевода
- редактор, в котором выполяется перевода и редактирование документов
- степень соотвествия
степень совпадения - уровень соответствия сегмента обрабатываемого текста сегменту выбранной базы переводов
- тексты с повторениями
- тексты, характеризующиеся высокой степенью повторяемости сегментов
- терминологическая база
- термины определенной предметной области, представленные в определенном формате (например, SDL Multiterm)
- Технология upLIFT
upLift - интеллектуальные соответствия на уровне слов и словосочетаний
Новая технология создания памяти переводов автоматически выстраивает связи на уровне фрагментов (слов и словосочетаний) и сохраняет их в памяти.
При переводе осуществляется автоматический поиск совпадений на уровне фрагментов, если стандартный поиск выдает неточные совпадения или отсутствие совпадений. А функция автоматического редактирования неточных совпадений позволяет сократить время на работу с такими сегментами, используя проверенные ресурсы. - управление процессом перевода
- организация профессионального процесса перевода с применением программных средств
- управление терминологией
- процесс создания и поддержки терминологии по определенной предметной области в определенном формате
- файловая база переводов
- хранится локально или на сетевом ресурсе, доступна другим пользователям только в рамках локальной сети
- целевой сегмент
- сегмент на языке перевода
- штраф
- понижение значения соответствия (match value) при наличии в тексте сегментов особого вида (специальное форматирование, автоматический перевод и т.п.)
- Штраф за несоответствие сегмента фильтру
- Понижение значения соответствия (match value) сегментам, не соответствующим заданным критериям фильтрации (например, установлен фильтр по полю атрибутов)
perfect match unit |
perfect match|PM |
MT |
TBX |
TMX |
automated translation|AT |
AutoSuggest |
Auto-propagation|autopropagation |
analyse |
translation memory|TM |
Change Date |
Creation Date |
bilingual term extraction |
translation unit|TU |
substitution |
User ID |
terminology extraction |
fuzzy index |
source language segment |
Client access license|CAL |
minimum match value |
multiple translation unit |
unknown segment |
fuzzy match |
monolingual term extraction |
CAT|Computer Aided Translation |
repetition |
repetition match |
project package |
placeable |
concordance search |
context match |
exact match |
substitution localisation |
segmentation rules |
pretranslation |
QA|quality assurance |
project |
term recognition |
segment |
server-based translation memory |
translation memory system |
TMS|Translation Management System |
terminology management system |
entry |
No Match |
match |
alignment |
Translation Environment |
match value |
repetitive texts |
TB|termbase |
upLIFT |
translation management |
terminology management |
file-based translation memory |
target language segment |
penalty |
Filter Penalties |