Как преобразовать документ Word в чистый, отзывчивый веб-сайт HTML 5
Microsoft Word и подобное программное обеспечение для обработки текстов, такое как LibreOffice, отлично подходят для написания и форматирования документов, предназначенных для печати, но не так хороши для создания веб-сайтов HTML из этих документов: они генерируют неоптимальный одностраничный код HTML/CSS, который не оптимизирован для разных размеров экрана и устройств, таких как смартфоны.
Используя возможности импорта и экспорта инструмента создания справки, такого как HelpNDoc (бесплатного для личного использования), чрезвычайно легко преобразовать документ Word в полнофункциональный многостраничный адаптивный веб-сайт HTML 5 . Давайте углубимся в…
Импорт документа Word
Средство импорта документов HelpNDoc может импортировать документы Microsoft Word DocX , Doc и RTF , среди прочих. Он даже может разделить эти документы на несколько тем или объединить несколько документов в один веб-сайт.
Когда HelpNDoc открыт, просто используйте меню File
, затем Импорт
Действие, чтобы открыть диалоговое окно «Импорт файлов и папок». Оттуда можно импортировать:
- Один файл документа , который при желании можно разделить на несколько тем;
HelpNDoc может разбивать документы Word на основе размеров шрифта или уровней структуры заголовков. Затем он автоматически воссоздает иерархию документа в оглавлении проекта. - Папка, содержащая несколько документов , которая создает одну тему для каждого документа;
HelpNDoc анализирует папку и импортирует все выбранные документы один за другим. Для каждого из них создается новая тема. - Сочетание обоих , поскольку всегда можно импортировать дополнительные документы или папки в существующий проект HelpNDoc.
Бонус: реорганизация и очистка проекта
HelpNDoc включает в себя все инструменты, необходимые для очистки, структурирования и обогащения содержимого проекта, такие как мощное оглавление, библиотека и редакторы тем .
Посмотрите, как легко управлять темами в HelpNDoc…
Созданный проект можно расширить благодаря простому пользовательскому интерфейсу HelpNDoc:
- Темы можно перемещать, переименовывать или удалять из таблицы содержание;
- Элементы библиотеки всего проекта (такие как изображения, фильмы, документы…) могут быть обновлены и разделены между темами;
- Анализатор проектов можно использовать для выявления распространенных проблем, таких как неработающие гиперссылки, неиспользуемые элементы библиотеки, орфографические ошибки…
- И многое другое…
Преобразование в веб-сайт HTML
HelpNDoc может создавать несколько выходных форматов из одного файла проекта: адаптивных веб-сайтов HTML , файлы справки CHM и Qt, документы Word и PDF, электронные книги ePub и Kindle, документы Markdown…
Создание полностью адаптивного веб-сайта HTML 5 из вашего проекта HelpNDoc чрезвычайно просто0022 Создать справку кнопка И вуаля! Через несколько секунд ваш статический, полнофункциональный многостраничный веб-сайт HTML 5 готов . HelpNDoc не ограничивается внешним видом, который он создает по умолчанию: вывод HTML можно легко настроить или полностью переопределить с помощью пользовательского шаблона. Стандартный шаблон HelpNDoc включает в себя несколько параметров настройки для быстрого и простого управления внешним видом . К ним относятся: Если этого недостаточно, Вывод HelpNDoc основан на шаблонах , которые представляют собой программируемые скрипты , управляющие тем, как именно генерируется контент : всегда можно создать свой собственный HTML-шаблон и полностью настроить структуру, макет, дизайн вашего веб-сайта… в соответствии с вашими предпочтениями или фирменным стилем. Если вы когда-нибудь хотели преобразовать документы Word в полнофункциональные многостраничные веб-сайты, загрузите бесплатно HelpNDoc прямо сейчас и следуйте инструкциям, описанным в этой статье. Затем вы можете узнать больше о богатом наборе функций HelpNDoc, таких как возможность экспорта ваших проектов в электронные книги ePub или Kindle, документы PDF и многое другое… Документация HTML
Он включает в себя интерактивное оглавление и индексные деревья, а также поисковую систему. Он автоматически адаптируется ко всем размерам экрана, от небольших смартфонов до телевизоров с высоким разрешением. Это даже зависит от контекста, так что вы можете легко перенаправить своих читателей на нужную тему!
Его можно просмотреть с помощью встроенного веб-сервера HelpNDoc, и, когда он будет удовлетворен, его можно загрузить на ваш собственный веб-сервер без каких-либо изменений. Бонус: настройка созданного веб-сайта HTML
Попробуйте сами
См. также
Метки: докX HTML Импортировать советы и рекомендации
Примите свою лень: автоматическое преобразование документов Word в страницы условий и положений
Современные одностраничные приложения (SPA) часто встраивают страницы условий и положений в само приложение для придания ему гладкости и современности. Хотя это обеспечивает отличный пользовательский интерфейс, для разработчиков может быть утомительным и трудоемким преобразование длинных документов Microsoft Word с официальной копией в HTML/JSX, которые могут быть встроены в компонент условий и положений или модальное окно. Но не волнуйтесь, коллега-разработчик! С некоторыми утилитами macOS и оболочки вы можете позволить компьютеру справиться с тяжелой работой, чтобы вы могли сосредоточиться на чем-то более важном.
Простое использование некоторых встроенных программ командной строки в macOS сделает свое дело, преобразуя документ Word в чистый HTML, который вы можете вставить в свой компонент условий и положений! Давайте посмотрим, как и почему.
Ларри Уолл, создатель языка программирования Perl, утверждал, что лень — одно из основных достоинств хорошего программиста. Это то, что заставляет программистов «писать облегчающие работу программы, которые другие люди сочтут полезными». И действительно, хороший инженер «приложит огромные усилия, чтобы снизить общий расход энергии», найдя возможности сделать процессы более эффективными.
Исходя из этого, я бы сказал, что основным достоинством программирования является способность определять, какие задачи являются механическими, повторяющимися и лучше делегировать их компьютеру, а какие вместо этого требуют человеческого творчества, решения проблем и изобретательности. У нас будет время и энергия для последней категории только в том случае, если мы найдем способ позволить компьютерам справляться со скучными, повторяющимися вещами.
Это неизбежно. При разработке нового SPA наступит день, когда вам или вашему товарищу по команде будет назначен билет на создание встроенной страницы условий и положений или модального окна.
Самый кропотливый подход — вручную скопировать каждый абзац, добавить любое жирное и курсивное форматирование и обернуть его соответствующими тегами HTML. Это может занять некоторое время, если это длинный документ Word! И это будет не приятно. Наши инстинкты лени должны сработать примерно сейчас.
Мы можем сделать этот процесс менее ручным с помощью этого изящного расширения VS Code. Это позволит нам обернуть каждый абзац или предложение текста в соответствующий
,
/
или
/
теги. Но это все еще довольно ручной процесс копирования, вставки и форматирования. Как мы можем полностью автоматизировать это?
Хорошие новости! macOS поставляется с инструментом командной строки под названием textutil
, который отлично справляется с преобразованием документов в различные форматы. Он может преобразовать документ Word в HTML с помощью одной команды терминала:
textutil -convert html -strip terms.docx
. Это возьмет ваш документ Word, удалит все метаданные и преобразует его в базовую разметку HTML. Абзацы будут завернуты в
теги, а также теги форматирования полужирным шрифтом и курсивом. Больше не нужно самостоятельно просматривать документ абзац за абзацем, чтобы создать разметку. И он даже работает с другими форматами документов, такими как файлы .txt и .rtf. Радость!
Одна проблема! textutil
создает для вас некоторые базовые стили CSS на основе исходного документа Word и прикрепляет очень общие имена классов, такие как
и Apple-converted-space
, по-видимому, к каждому создаваемому им тегу. Но вы, вероятно, не хотите, чтобы эти сгенерированные имена классов загрязняли вашу разметку. Мало того, что это выглядит уродливо и трудно читаемо, так еще и эти очень общие имена классов могут конфликтовать с другими классами в вашем приложении, что приводит к непредвиденным последствиям.
К сожалению, textutil
не имеет какой-либо встроенной опции для подавления этих имен классов. Конечно, мы могли бы вручную удалить все классы из сгенерированной разметки, но мы не хотим этого делать.
Не бойтесь — мы можем очистить HTML, который дает нам textutil
sed
, инструмент оболочки для работы с текстом, встроенный в Bash и Zsh. Мы направим HTML-код, сгенерированный textutil
, в sed
, удалим все имена классов и сохраним результат в файл. 9″]*» (поясняется ниже). Затем мы заменим текст, соответствующий этому шаблону, текстом между двумя последними косыми чертами — здесь это пустая строка. И мы будем делать это для каждого вхождения с глобальным модификатором /g
. То есть мы просто удалим текст, соответствующий шаблону, по всему документу. Об этом странном регулярном выражении… sed
не имеет тех возможностей регулярных выражений, с которыми вы знакомы в современных языках, таких как JavaScript. У него нет ленивого сопоставления, а это означает, что если вы попытаетесь сопоставить 9«]*»/ даст нам необходимое ленивое сопоставление — фактически
на диалекте регулярных выражений JavaScript. Ленивое сопоставление для ленивых программистов!
После запуска вывода textutil
с помощью этой команды sed
у нас будет хорошая, чистая разметка без всех случайных имен классов.
Опираясь на эту технику, мы могли бы пойти еще дальше и удалить ненужные теги
и все остальное, от чего мы хотели бы избавиться от вывод textutil
.
Наконец, мы сохраним очищенный HTML в файл. Последний сценарий командной строки: textutil -convert html -strip -stdout terms.docx | sed 's/]*"//g' > output.html
, который (1) преобразует документ Word в HTML с помощью textutil
, (2) удаляет имена классов, которые textutil
добавляет к каждому тегу с sed
и (3) сохраняет очищенный HTML-код в файл.