Преобразование Word в HTML в Python | DOCX в HTML
Преобразование Word в HTML требуется в различных случаях, например, для встраивания содержимого документа на веб-страницы. В этой статье вы узнаете, как конвертировать документы MS Word DOCX или DOC в HTML с помощью Python. Кроме того, вы узнаете, как динамически управлять преобразованием Word в HTML, используя различные параметры.
- API конвертера Python Word в HTML
- Преобразование документа Word в HTML
- Настроить преобразование Word в HTML
API конвертера Python Word в HTML
Чтобы преобразовать документы Word в HTML, мы будем использовать Aspose.Words for Python. Это мощный и многофункциональный API для создания документов Word и управления ими. Кроме того, он обеспечивает высокоточное преобразование документов Word в другие форматы. Aspose.Words for Python доступен на PyPI, и вы можете установить его с помощью следующей команды pip.
pip install aspose-words
Преобразование документа Word в HTML в Python
Ниже приведены шаги для преобразования документа Word в файл HTML с помощью Python.
- Загрузите документ Word, используя класс Document.
- Создайте объект класса HtmlSaveOptions.
- Включите экспорт ресурсов шрифтов с помощью свойства HtmlSaveOptions.exportfontresources.
- Преобразуйте документ Word в HTML, используя метод Document.save().
В следующем примере кода показано, как преобразовать файл DOCX в HTML в Python.
import aspose.words as aw # Load the document from disk doc = aw.Document("Document.docx") # Enable export of fonts options = aw.saving.HtmlSaveOptions() options.export_font_resources = True # Save the document as HTML doc.save("Document.html", options)
Настройте преобразование Word в HTML в Python
Aspose.Words for Python также предоставляет различные параметры для настройки преобразования Word в HTML. Например, вы можете конвертировать документы с двусторонней информацией, указать папку для сохранения файлов ресурсов и так далее.
Преобразование документа Word с двусторонней информацией
HTML не поддерживает все функции, предоставляемые MS Word, поэтому для имитации документа Word в HTML нам необходимо сохранить дополнительную информацию, называемую двусторонней информацией. Ниже приведены шаги, чтобы включить экспорт информации о передаче данных в преобразовании Word в HTML.
- Загрузите документ Word, используя класс Document.
- Создайте объект класса HtmlSaveOptions и задайте для свойства HtmlSaveOptions.exportroundtripinformation значение true.
- Преобразуйте документ Word в HTML с помощью метода Document.save() и передайте имя HTML-файла и HtmlSaveOptions в качестве параметров.
В следующем образце кода показано, как экспортировать информацию о цикле приема-передачи при преобразовании Word в HTML.
import aspose.words as aw # Load the document from disk doc = aw.Document("Document.docx") # Enable round-trip information saveOptions = aw.saving.HtmlSaveOptions() saveOptions.export_roundtrip_information = True # Save the document as HTML doc.save("Document.html", saveOptions)
Word в HTML: укажите папку для ресурсов
Вы также можете указать папку, в которой хотите хранить все ресурсы, такие как изображения, файлы CSS и шрифты. Для этого вы можете использовать свойство HtmlSaveOptions.exportfontresources. Вы также можете указать отдельные папки для шрифтов и изображений, используя свойства HtmlSaveOptions.fontsfolder и HtmlSaveOptions.imagesfolder соответственно. Ниже приведены шаги по использованию отдельной папки для сохранения ресурсов при преобразовании Word в HTML.
- Загрузите документ Word, используя класс Document.
- Создайте объект класса HtmlSaveOptions и установите для свойства HtmlSaveOptions.exportfontresources значение true.
- Укажите имя папки ресурсов с помощью свойства HtmlSaveOptions.resourcefolder.
- Преобразуйте документ Word в HTML с помощью метода Document.save() и передайте имя HTML-файла и HtmlSaveOptions в качестве параметров.
В следующем примере кода показано, как указать папку ресурсов при преобразовании Word в HTML.
import aspose.words as aw # Load the document from disk doc = aw.Document("Document.docx") # Specify resource folder saveOptions. export_font_resources = True saveOptions.resource_folder = docs_base.artifacts_dir + "Resources" saveOptions.resource_folder_alias = "http:#example.com/resources" # Save the document as HTML doc.save("Document.html", saveOptions)
Получите бесплатную лицензию API
Вы можете получить временную лицензию, чтобы использовать Aspose.Words for Python без ограничений на пробную версию.
Вывод
В этой статье вы узнали, как конвертировать документы Word в HTML с помощью Python. Кроме того, вы видели, как динамически настраивать преобразование Word в HTML. Кроме того, вы можете изучить другие возможности Aspose.Words для Python с помощью документации. Также вы можете задать свои вопросы на нашем форуме.
Смотрите также
- Преобразование файлов Word в PDF с помощью Python
- Создавайте документы Word на Python без MS Office
Информация: вас может заинтересовать другой Python API (Aspose.Slides for Python через NET), который позволяет вам преобразовывать презентации в изображения и импортировать изображения в презентации.
Онлайн-конвертер DOCX в HTML | Бесплатные приложения GroupDocs
Вы также можете конвертировать DOCX во многие другие форматы файлов. Пожалуйста, смотрите полный список ниже.
DOCX TO PDF Конвертер (Портативный документ)
DOCX TO HTM Конвертер (Файл языка гипертекстовой разметки)
DOCX TO MHTML Конвертер (MIME-инкапсуляция совокупного HTML)
DOCX TO MHT Конвертер (MIME-инкапсуляция совокупного HTML)
DOCX TO XPS Конвертер (Спецификация документа Open XML)
DOCX TO TEX Конвертер (Исходный документ LaTeX)
DOCX TO PPT Конвертер (Презентация PowerPoint)
DOCX TO PPS Конвертер (Слайд-шоу Microsoft PowerPoint)
DOCX TO PPTX Конвертер (Презентация PowerPoint Open XML)
DOCX TO PPSX Конвертер (Слайд-шоу PowerPoint Open XML)
DOCX TO ODP Конвертер (Формат файла презентации OpenDocument)
DOCX TO OTP Конвертер (Шаблон графика происхождения)
DOCX TO POTX Конвертер (Открытый XML-шаблон Microsoft PowerPoint)
DOCX TO POT Конвертер (Шаблон PowerPoint)
DOCX TO POTM Конвертер (Шаблон Microsoft PowerPoint)
DOCX TO PPTM Конвертер (Презентация Microsoft PowerPoint)
DOCX TO PPSM Конвертер (Слайд-шоу Microsoft PowerPoint)
DOCX TO FODP Конвертер (Плоская XML-презентация OpenDocument)
DOCX TO EPUB Конвертер (Формат файла цифровой электронной книги)
DOCX TO MOBI Конвертер (Электронная книга Mobipocket)
DOCX TO AZW3 Конвертер (Kindle eBook format)
DOCX TO TIFF Конвертер (Формат файла изображения с тегами)
Преобразовать DOCX TO TIF (Формат файла изображения с тегами)
Преобразовать DOCX TO JPG (Файл изображения Объединенной группы экспертов по фотографии)
Преобразовать DOCX TO JPEG (Изображение в формате JPEG)
Преобразовать DOCX TO PNG (Портативная сетевая графика)
Преобразовать DOCX TO GIF (Графический файл формата обмена)
Преобразовать DOCX TO BMP (Формат растрового файла)
Преобразовать DOCX TO ICO (Файл значка Майкрософт)
Преобразовать DOCX TO PSD (Документ Adobe Photoshop)
Преобразовать DOCX TO WMF (Метафайл Windows)
Преобразовать DOCX TO EMF (Расширенный формат метафайла)
Преобразовать DOCX TO DCM (DICOM-изображение)
Преобразовать DOCX TO WEBP (Формат файла растрового веб-изображения)
Преобразовать DOCX TO JP2 (Основной файл изображения JPEG 2000)
Преобразовать DOCX TO EMZ (Расширенный сжатый метафайл Windows)
Преобразовать DOCX TO WMZ (Метафайл Windows сжат)
Преобразовать DOCX TO SVGZ (Сжатый файл масштабируемой векторной графики)
Преобразовать DOCX TO TGA (Тарга Графика)
Преобразовать DOCX TO PSB (Файл изображения Adobe Photoshop)
Преобразовать DOCX TO SVG (Файл масштабируемой векторной графики)
Преобразовать DOCX TO DOC (Документ Microsoft Word)
Преобразовать DOCX TO DOCM (Документ Microsoft Word с поддержкой макросов)
DOCX TO DOCX Преобразование (Документ Microsoft Word с открытым XML)
DOCX TO DOT Преобразование (Шаблон документа Microsoft Word)
DOCX TO DOTM Преобразование (Шаблон Microsoft Word с поддержкой макросов)
DOCX TO DOTX Преобразование (Шаблон документа Word Open XML)
DOCX TO RTF Преобразование (Расширенный текстовый формат файла)
DOCX TO ODT Преобразование (Открыть текст документа)
DOCX TO OTT Преобразование (Открыть шаблон документа)
DOCX TO TXT Преобразование (Формат обычного текстового файла)
DOCX TO MD Преобразование (Уценка)
DOCX TO XLS Преобразование (Формат двоичного файла Microsoft Excel)
DOCX TO XLSX Преобразование (Электронная таблица Microsoft Excel Open XML)
DOCX TO XLSM Преобразование (Электронная таблица Microsoft Excel с поддержкой макросов)
DOCX TO XLSB Преобразование (Двоичный файл электронной таблицы Microsoft Excel)
DOCX TO ODS Преобразование (Открыть электронную таблицу документов)
DOCX TO XLTX Преобразование (Открытый XML-шаблон Microsoft Excel)
DOCX TO XLT Преобразование (Шаблон Microsoft Excel)
DOCX TO XLTM Преобразование (Шаблон Microsoft Excel с поддержкой макросов)
DOCX TO TSV Преобразование (Файл значений, разделенных табуляцией)
DOCX TO XLAM Преобразование (Надстройка Microsoft Excel с поддержкой макросов)
DOCX TO CSV Преобразование (Файл значений, разделенных запятыми)
DOCX TO FODS Преобразование (Плоская XML-таблица OpenDocument)
DOCX TO SXC Преобразование (Электронная таблица StarOffice Calc)
Word to HTML Software Обзоры, демонстрация и цены
О программе Word to HTML
Word to HTML позволяет предприятиям преобразовывать документы PDF и Microsoft Word в файлы HTML. Он предлагает множество функций, таких как оптическое распознавание символов (OCR), редактирование текста, хранение документов, совместная работа, экспорт данных и многое другое. Word to HTML позволяет предприятиям оптимизировать операции по очистке, преобразованию и сжатию данных с помощью единой платформы. Он позволяет пользователям создавать и редактировать документы, настраивать рабочие процессы и создавать подписи электронной почты в режиме реального времени. Цены доступны для ежемесячной или годовой подписки, а поддержка предоставляется по телефону, электронной почте и другим онлайн-мерам.
Word to HTML Цены
Персональный — 10 долларов в месяц или 90 долларов в год Бизнес — 20 долларов в месяц или 180 долларов в год. Enterprise — 100 долл. США в месяц или 900 долл. США в год
Начальная цена:
10,00 долл. США в месяц
Бесплатная пробная версия:
Доступно
Бесплатная версия:
Доступно
Слайд 1 из 3
Слайд 1 из 3
Word Word Word Word.
в HTML-обзорыОбщий рейтинг
Разбивка рейтингов
Второстепенные рейтинги
простота использования
Поддержка клиентов
стоимость денег
Функциональность
Наиболее полезные обзоры для Word to HTML
1-5 из 23 Обзоров
ABID
Verified Reviewer
15191. 10 000 сотрудников
Ежедневное использование более 2 лет
Источник отзыва: Capterra
Мы пригласили этого рецензента оставить честный отзыв и предложили символическое поощрение в качестве благодарности.
Общий рейтинг:
Простота использования
стоимость денег
поддержка клиентов
Функциональность
Отзыв июнь 2022
Невероятно файл в HTML. Это очень полезно и должно иметь программное обеспечение, потому что оно дает нам отличную поддержку в нескольких выходных форматах. Я настоятельно рекомендую это программное обеспечение всем, кто ищет эффективный инструмент для совместной работы.
PROS
Word to PDF — это очень быстрое программное обеспечение, которое может конвертировать word, pdf и другие форматы в коды HTML без каких-либо хлопот и трудностей. Интерфейс очень понятный, а функции и инструменты очень простые. Перетаскивание этого программного обеспечения очень полезно, потому что с его помощью мы можем быстро и эффективно выполнять нашу работу. Мы также можем создавать подписи электронной почты с логотипами, а также экспортировать HTML в Word или PDF.
ПРОТИВ
Все работает очень хорошо для меня, но единственное, что делает это программное обеспечение более мощным, это добавление большего количества форматов, функций и инструментов в это невероятное программное обеспечение.
Проверенный рецензент
Вещательные СМИ, более 10 000 сотрудников
Используется ежедневно менее 2 лет
Источник обзора: Capterra
Никаких стимулов не было предложено
Общий рейтинг:
простота использования
Стоимость денег
поддержка клиентов
Функциональность
ОБЗОР ФЕВРАЛЯ 2023
«Слово TO HTML» — это лучшее из «Freshideas».
Ирландская компания веб-приложений и дизайна)ФАНТАСТИЧЕСКИЙ . . . FRESH IDEAS делает большую работу.
ПРОФЕССИОНАЛЫ
Предоставляя решения для более чем 10 000 сервисных запросов каждый месяц мировому сообществу в режиме онлайн, Freshideas.ie Ltd вложила все свои мозги в работу над преобразованием Word в HTML и предложила программное обеспечение мирового класса, которое очень легко развернуть в интегрировать
CONS
Для меня все работает отлично, но добавление в приложение дополнительных форматов, функций и инструментов было бы невероятной идеей, чтобы сделать приложение еще более мощным.
Причины перехода с Word на HTML
Программа Adobe слишком дорогая, но предоставляет широкий набор инструментов. Первая страница устарела.
Фред
Подтвержденный рецензент
Розничная торговля, 1 сотрудник
Используется еженедельно менее 6 месяцев
Источник отзыва: Capterra
Этот обзор был отправлен автоматически. Поощрение не предлагалось
ОБЩАЯ ОЦЕНКА:
ПРОСТОТА ИСПОЛЬЗОВАНИЯ
СООТНОШЕНИЕ ЦЕНЫ
ФУНКЦИОНАЛЬНОСТЬ
Отзыв написан в июле 2021 г.
Слово в HTML в жизни программиста
Это здорово, потому что я могу делать свой HTML-файл быстрее, чем раньше, и экономить свое время. С бесплатной версией все очень хорошо, я рассматриваю профессиональную версию, если мы хотим сделать все в одном месте.
PROS
Итак, мне очень нравится использовать этот конвертер, потому что он очень прост в использовании, мы можем скопировать файл Word, файл Excel, даже из блокнота. Это может быть необходимо, когда нам нужно обновить или создать длинные HTML-файлы для моего личного веб-сайта, работы и т. д. Мне нравится, что мы можем сохранять в облаке, и он быстро загружается. Процесс очень прост, вы пишете в виде простого текста, используя заголовок (разные типы), введение, основную часть и заключение. Наконец, я использую, потому что быстрее создать HTML с этим сайтом.
ПРОТИВ
Ну, у меня редко возникают проблемы с тем, что я работаю над своим сайтом с адаптивным дизайном. и иногда мне нужно редактировать в редакторе HTML.
Причина выбора Word для HTML
Потому что это проще в использовании и мне не нужна IDE для начала
Дэвид
Управление образованием, 1001-5000 сотрудников
Источник обзора: Capterra
8 был приглашен нами представить честный обзор и предложил номинальный стимул в качестве благодарности.ОБЩАЯ ОЦЕНКА:
ПРОСТОТА ИСПОЛЬЗОВАНИЯ
ОТЧЕТНОСТЬ
ФУНКЦИОНАЛЬНОСТЬ
Отзыв от августа 2021 г. год в карантине (2020/2021), я использовал это в академических целях. Я преподаватель в университете и колледже. Я всегда использовал онлайн-форматы для обучения, и в последние месяцы они действительно усилились. Использование такого продукта было действительно полезно, чтобы убедиться, что тексты и изображения чистые и четкие при использовании с нашими обучающими приложениями. Также здорово сохранять уникальные типы шрифтов, такие как заголовки, подзаголовки и основной текст, чтобы использовать универсальную модель дизайна для учащихся с различными потребностями. Есть несколько продуктов, которые делают подобные вещи, и я баловался некоторыми из них. Хотя я бы в конечном итоге рекомендовал этот пункт, я должен сначала услышать потребности человека или команды. Тем не менее, вы можете использовать некоторые функции бесплатно и посмотреть, подходят ли они вам. Использование более продвинутых функций или работа с более длинными текстовыми строками стоит около 10 долларов в месяц.
PROS
Этот продукт очень нагляден, поэтому вам не нужно прокручивать текст или разбираться в кодировании любого уровня. Он использует функцию перетаскивания. Он очень хорошо работает с опцией сохранения HTML в Microsoft Word и очищает его, если что-то становится неправильным. Существует «Visual Email Designer», и я думаю, что это элемент в этом продукте, который может повлиять на выбор этого продукта среди других вариантов. «Визуальный дизайнер электронной почты» немного напоминает мне интерфейс веб-дизайна Wix или даже, возможно, похож на приложение, такое как Illustrator (но не такое продвинутое). Вы можете перетаскивать, сжимать, расширять, обрезать изображения, текст и видео. Существует также TinyMCE, поэтому он не просто конвертирует Word в HTML, но вы также можете конвертировать другие типы текстов. Для небольших объемов текста и минимального редактирования вы можете использовать этот продукт бесплатно.
ПРОТИВ
Это довольно солидный продукт, но мне трудно оправдать цену в 10 долларов. Как я указал в плюсах, я думаю, что есть некоторые удобные функции, и для людей, которые не хотят суетиться и хотят чистый метод, проверьте это, но знайте, что есть множество подобных продуктов, таких как Convertio, который является та же стоимость и предлагает больше типов преобразования, но не имеет такого же сложного редактора. Некоторые предлагают больше функций, другие — меньше, но есть много вариантов.
nicholas
Компьютерное программное обеспечение, 1 сотрудник
Используется еженедельно в течение менее 2 лет
Источник отзыва: Capterra
Этот обзор был отправлен в органическом порядке. Стимул не был предложен
Общий рейтинг:
Простота использования
Стоимость денег
поддержка клиентов
Функциональность
ОБЗОР ИЮНЯ 2022
СЛОВО. работоспособность и аккуратность сотрудников. Текстовые процессоры содержат программное обеспечение для механического исправления типичных ошибок и выявления орфографических ошибок, повышая общую скорость и снижая количество ошибок.
PROS
Итак, мне действительно нравится использовать этот конвертер, потому что он очень прост в использовании, мы можем воспроизвести файл Word, документ Excel, даже из блокнота. Это может быть жизненно важно, когда нам нужно заменить или создать длинные HTML-документы для моего непубличного веб-сайта в Интернете, вакансий и многих других. Мне нравится, что мы можем хранить данные в облаке, и они быстро загружаются. Техника очень проста, вам лучше написать в виде простого текста использование заголовка (разного вида), введения, наиболее важного элемента и конца. Наконец, я пользуюсь тем, что быстрее создаю HTML с этой веб-страницей.
ПРОТИВ
Понимание пользовательского интерфейса слишком сложно, и мне нужно время, чтобы его понять.
Причины перехода с Word на HTML
Word на HTML предоставил мне более простой пользовательский интерфейс, чем LibreOffice Writer, что заставило меня изменить свои предпочтения.
Прочитать все 23 отзыва
word-break — CSS: каскадные таблицы стилей
Свойство CSS word-break
определяет, будут ли разрывы строк появляться там, где текст переполнял бы поле содержимого.
/* Значения ключевых слов */ разрыв слова: обычный; слово-разрыв: разбить все; Word-break: сохранить все; слово-разрыв: слово-разрыв; /* устарело */ /* Глобальные значения */ Word-break: наследовать; разрыв слова: начальный; разрыв слова: вернуться; разрыв слова: возврат слоя; разрыв слова: не установлен;
Свойство word-break
задается как одно ключевое слово, выбранное из списка значений ниже.
Значения
-
нормальный
Использовать правило разрыва строки по умолчанию.
-
универсальный
Во избежание переполнения разрывы слов должны быть вставлены между любыми двумя символами (за исключением китайского/японского/корейского текста).
-
универсальный
Разрывы слов не следует использовать для текста на китайском, японском и корейском языках (CJK). Поведение текста, отличного от CJK, такое же, как и для обычного
-
ключевое слово
Устаревший Имеет тот же эффект, что и
word-break: normal
иoverflow-wrap: везде
, независимо от фактического значения свойстваoverflow-wrap
.
Примечание: В отличие от word-break: break-word
и overflow-wrap: break-word
(см. overflow-wrap
), word-break: break-all
создаст разрыв точно в том месте, где текст в противном случае переполнил бы свой контейнер (даже если размещение всего слова на отдельной строке отменило бы необходимость в разрыве).
Примечание: Хотя word-break: break-word
устарел, при указании он имеет тот же эффект, что и word-break: normal
и overflow-wrap: везде
— независимо от фактического значения свойства overflow-wrap
.
Initial value | normal |
---|---|
Applies to | all elements |
Inherited | yes |
Вычисленное значение | как указано |
Тип анимации | дискретный |
word-break =
normal |
все для хранения |
разлом |
break-word
HTML
1.
<р> Это длинный и почетный калифрагилистический экспириальный Тауматавакатангихангакоауауотаматеатурипукакапикимаунгахоронукупокайвенуакитанатаху グレートブリテンおよび北アイルランド連合王国という言葉は本当に長い言葉 <р>2.разрыв слова: обычный
разрыв слова: разбить все
<р> Это длинный и почетный калифрагилистический экспириальный Тауматавакатангихангакоауауотаматеатурипукакапикимаунгахоронукупокайвенуакитанатаху グレートブリテンおよび北アイルランド連合王国という言葉は本当に長い言葉 <р>3.word-break: сохранить все
<р> Это длинный и почетный калифрагилистический экспириальный Тауматавакатангихангакоауауотаматеатурипукакапикимаунгахоронукупокайвенуакитанатаху グレートブリテンおよび北アイルランド連合王国という言葉は本当に長い言葉 <р>4.слово-разрыв: разрыв-слово
<р> Это длинный и почетный калифрагилистический экспириальный Тауматавакатангихангакоауауотаматеатурипукакапикимаунгахоронукупокайвенуакитанатаху グレートブリテンおよび北アイルランド連合王国という言葉は本当に長い言葉
CSS
.узкий { отступ: 10 пикселей; граница: сплошная 1px; ширина: 500 пикселей; поле: 0 авто; размер шрифта: 20px; высота строки: 1,5; межбуквенный интервал: 1px; } .нормальный { разрыв слова: обычный; } .breakAll { слово-разрыв: разбить все; } .сохранить все { Word-break: сохранить все; } .breakWord { слово-разрыв: слово-разрыв; }
Спецификация |
---|
Текстовый модуль CSS, уровень 3 # word-break-property |
Таблицы BCD загружаются только в браузере
с включенным JavaScript.