3 совета для облегчения перевода PDF-файлов
Лукаш Словак24.02.2020
Переводчикам
Время чтения: 4 мин.
Каждый переводчик, наверное, сталкивался с нередактируемым документом, например, PDF, JPG, PNG или даже бумажным текстом, нуждающимся в переводе. К счастью, в настоящее время существуют программы, которые могут помочь нам в этом и облегчить нашу работу.
Они называются OCR, что означает оптическое распознавание символов. Программа OCR — хороший инструмент для решения проблем, но только в том случае, если вы можете эффективно ее использовать. Как избежать того, чтобы программа OCR создавала больше проблем, чем решений? Узнаем в этой статье.
Для чего на самом деле хороши программы OCR?Программное обеспечение для оптического распознавания символов, или OCR для краткости, преобразует текст и другое содержимое в редактируемый формат .
Давайте возьмем практический пример : клиент предоставляет вам отсканированные инструкции по эксплуатации в формате PDF (и, к сожалению, они недоступны в редактируемом формате). Настоящие инструкции по эксплуатации содержат некопируемый текст, таблицы и изображения. На первый взгляд очень много цифр и повторов. Вы предпочтете использовать инструмент CAT, а не переводить текст, переписывая все из PDF в MS Word. Это заняло бы много времени, и вы могли бы сделать ошибку или даже непреднамеренно опустить часть текста. Поэтому вы выбираете программу OCR, потому что она автоматически распознает текст, таблицы и изображения, а также преобразует и форматирует результат в docx (MS Word). Отлично, не так ли? Ну да и нет…
Вывод никогда не будет идеальнымКогда вы открываете файл в MS Word, вы часто можете обнаружить, что текст беспорядочный, программа вставила дополнительные разрывы разделов и столбцы, он полон текстовых полей вместо простых абзацев, изображения неправильно обрезаны, а текст содержит странные символы. Что дальше?
Обратите внимание, что автоматический вывод OCR никогда не будет идеальным . Перед преобразованием в MS Word необходима подготовка. Вы должны немного помочь программе и определить, какие части документа являются таблицами (если программа определила их неправильно), что такое непрерывный текст, где находятся изображения и т. д.
Качество документа также играет роль — если скан размыт, программа может неправильно распознать текст (например, вместо « За » она может прочитать « 8за »), знаки препинания, буквы или даже целые слова может отсутствовать. Вот почему многие программы OCR включают проверку орфографии .
По сути, чем сложнее документ, тем больше времени нужно потратить на настройку самого процесса распознавания. Но в конце концов, вы будете вознаграждены за потраченное время.
Корректировки, которые необходимо внести после преобразования в MS WordДаже если вы вполне довольны выводом в Word, ваша работа еще не завершена. Хотя это может показаться контрпродуктивным, в большинстве случаев мы рекомендуем начинать с , очищая форматирование . Весь текст, числа и таблицы будут сохранены, а только форматирование будет удалено. Затем формат может быть отредактирован в соответствии с требованиями вашего клиента.
Рекомендуем ориентироваться на следующие советы:
Начните с общих настроек
Прежде чем приступить к изменению шрифта и размера маркеров, определите основные элементы, такие как абзацы, размер страницы и разделы. Почему? Возможно, вам знакома такая ситуация: после удаления лишнего раздела текст перемещается на четыре страницы вперед, появляется новая колонка и по неизвестной причине удаляется каждое третье изображение.
Будьте проще
Сократите количество разделов и создайте автоматически нумерованные списки (это также относится к оглавлению и автоматическим стилям заголовков). Не забывайте о верхних и нижних колонтитулах документа.
Думай как программа CAT
Адаптация текста к процессу перевода. Если вы не подготовите документ тщательно, а затем импортируете неотредактированный файл в CAT-инструмент , весь документ может просто развалиться при его экспорте – текст будет отображаться в неправильных местах (если он отображается вообще) и вы потратите гораздо больше времени на его редактирование, чем планировали.
Не забывайте правильно отделять текст от цифр и использовать скрытые таблицы вместо нескольких вкладок. Этот метод позволит вам правильно разделить абзацы предварительно переведенных чисел (инструменты CAT обычно могут делать это только в том случае, если числовые данные правильно сегментированы, то есть отделены от непрерывного текста).
Кроме того, по возможности избегайте текстовых полей, так как они палки о двух концах. С одной стороны, их можно разместить в любом месте страницы, а с другой стороны, они негибкие. Поэтому, если перевод длиннее исходного текста, после экспорта перевода из CAT-инструмента их размер необходимо вручную изменить в MS Word для отображения всего переведенного текста.
Как вы уже догадались, форматирование — это наука, которой должен овладеть каждый переводчик. Все, что требуется, — это немного практики — отформатировав несколько десятков документов, вы справитесь намного лучше, чем программа OCR.
OCR, встроенный в CAT-инструменты
Большинство современных CAT-инструментов позволяют своим пользователям «переводить» PDF-файлы напрямую, выполняя OCR во время создания проекта. Несмотря на экономию времени по сравнению с ручным распознаванием текста и форматированием текста, это может привести к плохо сегментированному тексту или даже к непоследовательному форматированию файла на целевом языке. Мы рекомендуем проверять качество вывода для каждого файла перед тем, как приступить к переводу. Вы можете сделать это в большинстве инструментов CAT, псевдопереведя документ и создав окончательный файл на целевом языке, чтобы увидеть, соответствует ли результат тому, что вы и ваш клиент ожидаете.
Какую программу выбрать?Программы OCR имеют разные параметры обработки, скорости распознавания, типы лицензий (аренда/постоянная лицензия), а также онлайн- и офлайн-версии. При использовании онлайн-версий и бесплатных сервисов OCR будьте осторожны с личными данными и конфиденциальными документами. Что касается платных офлайн-программ, то мы рекомендуем, например, ABBYY FineReader.
Вы находите тему программ OCR интересной и хотите узнать больше? Дайте нам знать!
Вам нравится наш блог?
Поделись!
« Самые длинные слова на 20+ языках
Как предотвратить потерю и неправильное использование данных »
ubah pdf to jpg высокого качества【jav88.tv】смотреть бесплатно — Перевод на английский — примеры китайский
Эти примеры могут содержать нецензурные слова, основанные на вашем поиске.
Эти примеры могут содержать разговорные слова на основе вашего поиска.
2) 使用 CD 命令 改变 路径 到 到 PDF к JPG 的 目录 ((需要 先 改变 当前 驱动器 驱动器)。 右击 PDF к JPG 快捷 图标并 点击 «属性» 项 , 可以 【起始 起始 图标并 点击 «位置】栏找到该路径。
измените текущий путь к PDF на папку программы JPG с помощью команды «cd» (возможно, сначала потребуется изменить текущий диск). Щелкните правой кнопкой мыши PDF в JPG ярлык и выберите пункт меню «Свойства», вы найдете путь в поле [Начать в].
上海东方泵业(集团)有限公司 — Высокое качество
Текущее местоположение: Главная > Техническая поддержка > Высокое качество
佩珀代因大學也位列其它排名,包括學生定期祈禱(Студенты регулярно молятся)和高生活品質( High Quality of Life)㹂一丄姀姀幀两丄姀
Пеппердин фигурировала в других списках, включая «Студенты регулярно молятся» и «9».0006 Высокое Качество Жизни».
高品质木纹砖引领消费升级/ ВЫСОКОЕ КАЧЕСТВО
Потребление высококачественного деревянного кирпича Обновление/ВЫСОКОЕ КАЧЕСТВО
它 没有 比 更 容易! 使用 使用 jpg в PDF Конвертер , 您 在 几 秒 钟 钟 内 漂亮 的 的 PDF 文档 忘记 过于 复杂 的 应用 与 无 意义 的 有 这个 应用 你 你 你 你 你 你 你 你 你 你 你 你成为生产力的顶峰.
Сохранить как PDF — из любого места — конвертировать текст, Word, Excel, OpenOffice, LibreOffice и другие файлы в PDF — все в одном PDF Converter 203
,开始免费的 PDF to Word 转换进程。
Нажмите здесь, чтобы начать процесс бесплатного онлайн-преобразования PDF в Word.
使用 U 品原音 Upscaler 功能以提高 U 品原音 (Ultra 9)0006 High Quality
Используйте функцию масштабирования UHQ (Ultra High Quality ), чтобы улучшить звук до UHQA (Ultra High Quality Audio) и приблизить звук к исходному.
最后,我们还提供了一个方便的工具栏按钮,使您可操作 PDF в Excel
Наконец, мы также предоставляем удобную кнопку панели инструментов, которая выполняет Функция конвертера PDF в Excel для вас.
Сплошные документы , 家 文档 处理 产品 的 领先 公司 , 今天 发布 了 款 款 Твердый преобразователь PDF до Слово V4 的 更新 此 此 更新 是 本 在 业界 领先 的 PDF до Слово 软件。 在 领先 的 .
Solid Documents, ведущий поставщик служебных продуктов для работы с документами, объявила сегодня об обновлении Solid Converter PDF в
Word v4, ведущего в отрасли программного обеспечения компании для преобразования PDF в Word.这种情况,无须安装 PTH 到您打算部署的计算机。并且您需要购买 PDF to HTML 可分发 医虀ョ係
В этом случае НЕ нужно устанавливать PTH на ПК, на которые вы хотите выполнить развертывание. И вы должны приобрести PDF в HTML Redistributable CLI, нажмите здесь, чтобы узнать больше деталей.
Твердый преобразователь PDF до Слово V4 和 Solid PDF Инструменты V2 均 能力 在 上 百 种 语言 环境 中转换 的 能力 , 迄今 为止 仅 在 英文 和 中 可 用。。 但 为止 仅 英文 和 俄文 可 用。。。 但 却 在 和 俄文 可
Solid Converter PDF to Word v4 и Solid PDF Tools v2 способны конвертировать документы на сотнях языков, но до сих пор пользовательский интерфейс был доступен только на английском и русском языках.
Часы 故事 来自 乡亲 您 守 在酒吧 在 high 您的饲料.
Посмотрите историй от людей, которых вы наблюдаете в баре 9 числа.0006 максимум вашей ленты.
PDF до HTML 用来 以 批量 快速 转换 转换 PDF 文档 为 html 网页。 必 安装 安装 adobe acrobat 或 即 可 工作 工作 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 ((((、 巧 等 特点。。 会 在 输出 输出 html 文件 保留 保留 Pdf 文件 原始 文本 、 格式 布局 ((多 多)。 , 支持 转换 限制 的 的 Pdf 文件 例如 不 不允许拷贝内容、保存为文本及页面提取的 PDF 。
PDF в HTML используется для быстрого преобразования файлов PDF в веб-страницы HTML в пакетном режиме. Он работает без Adobe Acrobat или Adobe Reader и имеет интерфейс командной строки (CLI), удобный интерфейс, небольшой размер, возможность точного и быстрого преобразования.
文件应为高分辨率的tif, PDF 或 JPG 格式.
Файлы должны быть в формате tif с высоким разрешением, pdf или jpg .
如果 您 尚 下载 该 软件 , 请 即 获取 PDF до Слово 免费 试用。 一旦 一旦 您 购买 我们 的 软件 软件 将 通过 邮件 收到 解锁 密码。 您 打开 打开 软件 , 通过 邮件 解锁 密码。 当输入 您 解锁 信息。 请务必 使用 与 您 购买 时 所 用 电子 邮件。 届时 , 所有 限制 均 将 并且 , 您 可 立即 将 您 的 PDF 文件 转换 为。 将 您 的 PDF
Ограничения пробной версии: 15-дневная пробная версия, водяной знак на выходе Word (бесплатная загрузка от pdf до word становится полной рабочей версией при разблокировке с приобретенной лицензией). Точечные выпуски (например, .) бесплатны, если у вас уже есть лицензия на программу. Обновления: Посмотреть политику обновления и специальные предложения Размер загрузки: 113 МБ Скачать
本网站不隶属于 Airport City
Чтобы отфильтровать все сообщения о подарках Airport City Free to Fly по кликам и именам, посетите страницу Airport City Free to Fly Item Filter.
Android TV 也包含一个 Смотреть Далее
Домашний экран телевизора Android также включает часы Watch 9.0007 Следующая строка, которая заполняется программами из приложений в зависимости от привычек просмотра пользователем.
多媒体 中控 会议 中控 中控 Wii to TV VGA до Видео 高铁 显示 ПК TO TV до PC 模拟 转 高清 数字 采集 长车后拉 视频 编码 编码 编码 编码 编码 编码 编码 编码 编码
MS1830 Преобразователь PC в TV (VGA в AV/SV)
《 Бесплатно для Играть》礼包的内容如下:
Free to Play Pack будет включать следующее:
Спутник TV для ПК 是 顶级 领先 Satellite PC TV 一 软件 , 运行 时间 最 长 长 Смотреть TV на ПК 软件 七 , 每 个 版本 多 年 的 不断 提高 软件 的 比 的 版本 多 多 年 年 不断 提高 的 素质 更.