Html из ворда, картинки, таблицы
Нашел контент для сайта - например книгу в ПДФ или Дежавю, хочется быстро опубликовать для людей - так чтобы читаемо было и удобно с навигацией. Что делать?
Я пока нашел такое решение:
- ПДВ в Ворд через распозновалку типа ФайнРидер
- Ворд 2007 сохранить как HTML - образуется каталог с картинками
- Продолжаю "работать" в ворде, в сохраненном в HTML файле - допустим это большой документ с содержанием и главами и параграфами, содержание делаю отдельной страницей или в вордпрессе или в редакторе HTML типа ДримВивер(сразу индекс-файлом в соответствующей папке - например здесь: http://byrim.com/spravochnik/index.html)
- в каталоге с картинками при хтмл-сохранении ворда файлы дублируются в пнг формате - не привык с ним работать, поэтому убираю лишние файлы и загоняю их на сервак и на локале тоже они остаются - на всякий случай :)
- по параграфно или по темам копирую с ворда текст с картинками в буфер обмена, копирую его в сервис типа:
http://www.word-to-html.ru/ - там оптимально(по их мнению, но не по моему:)) выдается хтмл код "с понтом без мусора" - мента в коде точно нет, но мусор в виде невидимых переходов на новую строку, к сожалению, остается, да и параграфов сильно много, но всё равно на порядок чище, чем если бы использовали вордовский код хтмл! Да и таблицы по другому лень делать - так быстрее!
- потом оптимизированный код вставляю в "вордпресс" или в ДримВивер, последнему на переходы строки наплевать, а вордпресс у меня обычно установлен с функцией если есть хоть невидимый переход строки - то он сработает, поэтому если сильно хочется - то убираю невидимые ненужные переходы в редактируемом документе вордпресса
- в картинках меняю путь - там какой-то ни такой, но зато имя картинки почти совпадает(этим и пользуюсь или имя беру из локальной папки картинок - копии уже отправленной на сервак), а путь делаю какой надо, дописываю титл и алт для возможной раскрутки...
- если копируемый фрагмент из ворда без картинок и таблиц - просто копирую его в блокнот, убираю непонятный ХТМЛу пробел с крючком, потом в вордпресс - так точно мусора нет.
До этого метода создания хтмл документов из ворда я пользовался или копированием картинки из ворда в фотошоп - но это для ворда "меньше чем 2003" или принтскрином - в фотошоп - там обрезание и сохранение - не самый легкий путь... Принтскрин - единственное пока решение, если картинки малых размеров в пдф, дежавю, ворде - так при увеличенном масштабе принтскриню, копирую в фотошоп, обрезаю - получаю больше размер - фишка работает, если качество картинок при увеличении масштаба не страдает...
Рашид
4.08.11г.