Конвертировать DOCX в TXT онлайн ⭐️ DocTranslator
Войти через Google
Используйте свою учетную запись Google для входа в DocTranslator.
Больше не нужно запоминать пароли. Вход быстрый, простой и безопасный.
Продолжать
Upload and convert your file
Drag and drop files here, or browse your computer
Используйте DocTranslator для преобразования файла DOCX в файл TXT!
Что такое DOCX?
Файл DOCX представляет собой текстовый документ Microsoft Word. Как правило, вы можете открывать файлы DOCX с помощью Microsoft Word, OpenOffice, LibreOffice, Google Docs и Word Viewer.
Файлы DOCX обычно содержат форматированный текст, но могут также включать изображения, таблицы, диаграммы и другие элементы.
Что такое ТХТ?
Файл TXT представляет собой стандартный текстовый документ, содержащий обычный текст. Его можно открыть и отредактировать в любом текстовом редакторе или текстовом редакторе. Файлы TXT чаще всего создаются Microsoft Notepad и Apple TextEdit, которые представляют собой базовые текстовые редакторы, поставляемые в комплекте с Windows и macOS соответственно.
Файлы TXT представляют собой простые текстовые документы, которые практически не содержат форматирования. Они используются для хранения заметок, пошаговых инструкций, рукописей и другой текстовой информации.
Перевод и интерпретация
Заверенный перевод — это переведенный документ с приложением заявления. Переводчик подписывает заявление, которое нотариально заверяется. Заявление подтверждает, что перевод точен. Для записи актов гражданского состояния потребуется апостиль или свидетельство о подлинности для использования за границей.
Устные и письменные переводчики не нуждаются в лицензиях.
Наш рабочий процесс
Шаг 1
Подготовьте документы. Отсканируйте или сфотографируйте все документы, которые вы хотите, чтобы мы переводили.
Шаг 2
Закажите и оплатите онлайн. Загрузите свои файлы и заполните нашу простую онлайн-форму. Оплачивайте онлайн любой кредитной или дебетовой картой.
Шаг 3
Получите перевод. Машинный перевод будет готов к загрузке через 2-3 минуты! Не нужно ждать дни.
Что мы можем сделать
Пользователи DocTranslator.com могут быстро перевести любую банковскую выписку, будь то MS Word, PDF, Excel или PowerPoint, с английского на испанский и обратно. Всего DocTranslator поддерживает более 100 языков, включая английский, испанский, французский, немецкий, португальский, итальянский, японский, кантонский, китайский и корейский.
Насколько точно вы переводите свой DOCX?
После просмотра этого видео на YouTube вы будете точно знать, как быстро и легко преобразовать документ в файл любого другого типа.
Переводчик документов
DocTranslator.com — это инструмент автоматического перевода документов, который преобразует любой файл PDF, Word или Excel на более чем 100 языков. Созданный с учетом простоты, этот инструмент предлагает самые низкие цены на Земле, начиная с 0,001 доллара США за слово. Это в 60 раз дешевле самой конкурентоспособной цены, которую предлагают люди, живущие в самой малоизвестной и дешевой части мира.
Ценности, которыми мы живем
Сотрудничество с нашими партнерами
Страсть к результатам
Постоянное улучшение
Доверено
Ведущие организации по всему миру доверяют Doc Translator
750 +
Переводы за последний год
0 /5
Уровень удовлетворенности клиентов
2000
Профессиональные члены команды
Переводчик документов
Хотите попробовать?
Зарегистрируйте бесплатную учетную запись и начните переводить свои документы уже сегодня!
производительность — Python-docx. Конвертируем .docx в .txt
Вопрос задан
Изменён 6 лет 8 месяцев назад
Просмотрен 997 раз
Здравствуйте, уважаемые участники сообщества.
Хотел бы задать вам вопрос по теме одной из сторонних библиотек, а именно python-docx. Суть заключается в том, что требуется взять .docx файл и сконвертировать в .txt, но как бы я ни старался сделать это, 160кб файл .docx конвертируется 4.5 минуты. Возможно я что-то делаю не так, не уверен. В моей задаче файл состоит из одной, многостраничной таблицы и я просто беру, циклом пробегаюсь по всем строкам таблицы, сохраняя каждую ячейку в файл, примерно вот так:rowses = [] for table in document.tables: rowses += table.rows for row in rowses: s = "" for cl in row.cells: s += cl.text s += " " text_file.write(s + '\n')
Но этот алгоритм работает уж сильно долго, знаете ли вы другие, более быстрые способы? или возможно, я что-то делаю не так… Надеюсь на вашу помощь, спасибо.
- python
- производительность
- docx
Это старая проблема с docx — github issue. Все плохо из-за того, что как-то очень криво извлекаются ячейки из массива с ячейками.
В качестве обхода можно потыркать потрошки библиотеки:
from docx import Document doc = Document("doc.docx") text_getter = lambda cell: cell.text for table in doc.tables: CELLS = table._cells column_count = table._column_count for row in table.rows: row_index = row._tr.tr_idx print("Номер строки: ", row_index) text_row = CELLS[row_index * column_count: (row_index + 1) * column_count] print(' '.join(map(text_getter, text_row)))
Вы не привели примеров таблиц, поэтому я тестировал на самой простой — создал большую, но очень простую десятистраничную таблицу и запустил (на всякий случай — ссылка на файл: dropbox). Время работы отличается разительно — как видите, я залез в защищенные поля и использовал иначе, чем в библиотеке. Вот пример того, как обрабатываются ячейки для таблицы в библиотеке:
@property def _cells(self): """ A sequence of |_Cell| objects, one for each cell of the layout grid. If the table contains a span, one or more |_Cell| object references are repeated. """ col_count = self._column_count cells = [] for tc in self._tbl.iter_tcs(): for grid_span_idx in range(tc.grid_span): if tc.vMerge == ST_Merge.CONTINUE: cells.append(cells[-col_count]) elif grid_span_idx > 0: cells.append(cells[-1]) else: cells.append(_Cell(tc, self)) return cells
Как видно, каждый раз, когда вы извлекаете текст из ячейки, эти самые ячейки читаются из файла заново. Все ячейки из всей таблицы — крайнее расточительство. Альтернативно можно просто считать ячейки один раз и сохранить их в массив, что и было сделано мной в примере — ячейки читаются один раз и сохраняются в
.
1
Зарегистрируйтесь или войдите
Регистрация через Google
Регистрация через Facebook
Регистрация через почту
Отправить без регистрации
Почта
Необходима, но никому не показывается
Отправить без регистрации
ПочтаНеобходима, но никому не показывается
Нажимая на кнопку «Отправить ответ», вы соглашаетесь с нашими пользовательским соглашением, политикой конфиденциальности и политикой о куки
Поддержка файлов документов | Lokalise Docs
Lokalise позволяет работать с файлами документов — буквально с теми, которые не основаны на ключе-значении.
Эта функция доступна в плане Essential и выше.
В Lokalise, благодаря новой поддержке файлов документов, вы можете загружать, переводить и скачивать файлов DOCX, PPTX, IDML и HTML .
Обратите внимание, что если вам нужно перевести текстовый документ ( .doc
, .rtf
, .pdf
или любой другой аналогичный формат), вы можете заказать профессиональный перевод, как описано в соответствующей статье (обязательно выберите поставщика Gengo ).
Index
Project type differences
How to start
Uploading the documents
Project dashboard overview
Editor overview
Images
Различия типов проектов
Редактор проектов для типов файлов документов немного отличается от стандартного редактора пар «ключ-значение» Lokalise. Основные параметры остались прежними, однако есть некоторые ограничения:
Меньше интеграций (некоторые платформы не поддерживают формат DOCX).
Меньше вариантов загрузки и выгрузки.
Невозможность добавления новых ключей/абзацев или удаления существующих в редакторе.
Многоязычный просмотр недоступен для документов проектов.
С чего начать
Чтобы начать использовать эту новую функцию, вам необходимо создать новый проект и выбрать тип проекта Документы .
Загрузка документов
Откройте свой проект и перейдите на страницу Загрузка :
Импортируйте или перетащите файл, который хотите загрузить, и при необходимости выберите любые другие соответствующие параметры. В контексте файлов документов абзацы считаются ключами. Один абзац = один ключ .
Обзор информационной панели проекта
Проекты типа документа отображаются так же, как и проекты локализации программного обеспечения. На панели инструментов вы можете видеть общий прогресс вашего проекта, а также языков. Но есть небольшое изменение: вы можете отслеживать прогресс каждого документа в проекте отдельно. Кроме того, вы можете переименовывать и удалять отдельные документы:
Обзор редактора
Редактор проекта позволяет добавлять новые языки, выполнять переводы и отслеживать ход перевода.
Несмотря на то, что невозможно добавить новые ключи, вы можете добавить новые абзацы . Для этого:
Откройте исходный файл DOCX.
Внесите необходимые изменения.
Загрузить измененный файл, выбрав опцию заменить измененные значения .
Ваши переводы останутся в безопасности — все останется прежним, за исключением новых добавленных абзацев.
Тот же подход можно применить и к другим документам, например к презентациям PowerPoint: просто откройте его, внесите необходимые изменения и снова загрузите измененный файл. Обратите внимание, однако, что если вы изменили порядок абзацев в своем документе и загрузили с заменить измененные значения опция включена, результат может быть неожиданным.
Изображения
Наша платформа позволяет загружать документы без изменения структуры документа. Изображения будут загружены в Lokalise, даже если они не будут отображаться в редакторе. Вы вернете изображения в нужные места при экспорте файла.
СРОЧНО НУЖНА ПОМОЩЬ! Файл .docx, сохраненный из длинного файла SDLXLIFF в Studio, не открывается в Microsoft Word. Как мы можем решить эту проблему? — 2. Студия Традос — Студия Традос
Здравствуйте,
Мы только что закончили перевод длинного документа Word (>2 000 сегментов) в Studio 2019 SR1 версии 15.1.2.4878.
Когда мы сохранили длинный файл SDLXLIFF (более 2000 сегментов) с помощью команды «сохранить цель как» (Shift+F12) как
документ WORD (.docx), казалось, что Studio быстро справилась с этим процессом, . .. слишком быстро, на самом деле.
Когда мы дважды щелкнули полученный перевод, файл DOCX с целевого языка, появилось сообщение об ошибке.
См. следующий снимок экрана:
Короче говоря, MS WORD не только просто не откроет файл, но и
нам не ясно, что пошло не так и как мы можем исправить проблему.
Несмотря на то, что мы не знали, что именно делать, мы вернулись в Studio, в представлении РЕДАКТОРА,
и прочесали более 2000 исходных и целевых сегментов: мы нашли пару пустых целевых сегментов.
Мы исправили их и думали, что определили проблему. Во второй раз мы сохранили SDLXLIFF как документ WORD,
, но снова при попытке открыть полученный файл DOCX появилось то же самое сообщение об ошибке.
Нам действительно нужно исправить это, потому что мы должны доставить перевод очень скоро.
Помогите пожалуйста.
Заранее спасибо,
Кристиан
- 2700000Z» data-yesvotes=»0″ data-novotes=»0″ data-url=»https://community.rws.com/product-groups/trados-portfolio/trados-studio/f/studio/25322/urgent-help-needed-the-docx-saved-from-a-long-sdlxliff-in-studio-won-t-open-in-microsoft-word-how-can-we-solve-this/77303″>
Привет, Кристиан Блуэн,
Вы пробовали удалить существующий файл целевого слова перед созданием нового? Я знаю, это звучит глупо, но во многих случаях это помогает.
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
Привет, Кристиан, 9 лет0003
Ошибка, которую вы получаете от Word, указывает на проблему в одном из нижних колонтитулов. Скорее всего, проблема связана с автоматическим полем. Возможно, проблем может быть больше, но это первая проблема, с которой он столкнулся, и невозможно будет сказать, есть ли другие, пока она не будет решена.
Если бы я устранял эту проблему, я бы сначала попытался удалить все нижние колонтитулы в исходном коде, а затем сохранить отдельную чистую копию и запустить ее обратно через TM. Если вы еще этого не сделали, вам потребуется сначала обновить TM из файла xliff с помощью пакетной задачи «Обновление основных TM». Возможно, вам придется вводить некоторые совпадения вручную, но подавляющее большинство должно появиться при предварительном переводе только что созданного исходного файла с использованием той же ПП.
Я бы также на этом этапе запустил задачу проверки, чтобы найти отсутствующие теги в цели. Эту ошибку можно получить, даже если все теги скопированы, но если теги отсутствуют, они вполне могут быть причиной. В частности, прямоугольные непарные теги вызывают проблемы при отсутствии или несоответствии, поскольку они представляют конкретные элементы файла Word. Я бы посоветовал установить параметры тега на «Идентификатор тега» на вкладке «Вид» в Studio, чтобы быть уверенным, что теги в источнике соответствуют цели и не были скопированы из другого сегмента.
Сделав все это, сохраните цель как и попробуйте открыть. Если исправили, отлично! Просто нужно опубликовать нижние колонтитулы обратно из источника и перезаписать их переводом. Если вы получили другое сообщение об ошибке, опубликуйте его, чтобы кто-нибудь мог посмотреть.
Best,
Richard
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
Спасибо, Оливье, за быстрый ответ. Я получил 2 других ответа/предложения. Я очень благодарен за помощь. Поскольку у нас много работы, я даю себе день или два, чтобы поэкспериментировать с тремя предложениями. Я буду держать вас в курсе.
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
rws.com/product-groups/trados-portfolio/trados-studio/f/studio/25322/urgent-help-needed-the-docx-saved-from-a-long-sdlxliff-in-studio-won-t-open-in-microsoft-word-how-can-we-solve-this/77338″>Спасибо, Ричард, за быстрый и подробный ответ. Я получил 2 других ответа/предложения. Я очень благодарен за помощь. Поскольку у нас много работы, я даю себе день или два, чтобы поэкспериментировать с тремя предложениями. Я буду держать вас в курсе.
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
Christian Blouin
Еще одна мысль… какую версию Office вы используете? Возможно, файл можно открыть в последней версии Microsoft Office. Я видел эту проблему раньше, когда целевой файл нельзя было открыть в более ранних версиях, но если вы откроете его в последней версии и сохраните, его можно будет открыть и в более ранних версиях.
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
9700000Z» data-yesvotes=»0″ data-novotes=»0″ data-url=»https://community.rws.com/product-groups/trados-portfolio/trados-studio/f/studio/25322/urgent-help-needed-the-docx-saved-from-a-long-sdlxliff-in-studio-won-t-open-in-microsoft-word-how-can-we-solve-this/77361″>Оливье ден Харти сказал:
заполните свой новый тм двуязычным файлом
Привет, Оливье!
Когда вы говорите «двуязычный файл», вы имеете в виду экспортированный файл для двуязычного просмотра? Если это так, не могли бы вы объяснить, как это сделать? Я понятия не имею, как заполнить новый тм экспортированным файлом для двуязычного просмотра.
Заранее спасибо.
Sílvia
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
Привет, Кристиан, ты можешь попробовать Экспорт для двуязычного просмотра. Затем создайте новый проект с новым тм, повторно импортируйте исходный документ, заполните новый тм двуязычным файлом, предварительно переведите и снова экспортируйте документ Word.
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
Спасибо, Тило, за быстрый ответ. Я получил 2 других ответа/предложения. Я очень благодарен за помощь. Поскольку у нас много работы, я даю себе день или два, чтобы поэкспериментировать с тремя предложениями. Я буду держать вас в курсе.
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!
Здравствуйте, Пол,
Очень рад, что вы откликнулись и предложили помощь. Конечно же, Пол, вы совершенно правы… еще раз!
Все это время мы пытались открыть файл DOCX на компьютере, где он был переведен и на котором был установлен MS Office 2007 !!
На всех других наших машинах установлена последняя версия MS Office, то есть 2019 года.. Сразу после того, как я прочитал ваш ответ, я открыл тот же файл на одной из наших других рабочих станций (MS Office 2019), и это сработало. У Word было несколько подсказок/вопросов, я нажал YES, и файл открылся. И да, старый MS Word 2007 смог открыть тот самый файл DOCX. Время для вашего вопроса идеальное: пару дней назад мы купили новый настольный компьютер взамен этой старой машины, но у меня просто еще не было времени сделать замену
Большое спасибо, Пол.
Christian
Перевод
Обзор документации: помогите нам предложить вам лучшую документацию!