как убрать из HTML все лишнее автоматом?
- 06.06.12, 13:26
Нужна программа, которая из огромного HTML файла (сотворенным вордом) уберет все лишее - а это 99%, но при этом совершенно не затронет разметку страницы, ибо она как шаблон используется программой для подстановки туда данных и вывода на печать. Разметка выверялась до миллиметра нужно просто убрать все лишнее. Сделать страницу заново не предлагать.
Питання закрите
1
Повернутися до відповідей
kt315
13:52, 06.06.2012
Если это некое решение "генератора отчетов", то уж лучше это сделать через Excel. А вообще это решение через "нетоместо".
"все лишнее" - это как ?
берешь последовательный потоковый редактор вроде sed юниксоидного, в файл параметров для sed заносишь шаблоны "всеголишнего" на удаление (замена на пробел), и усе.
Для таких целей можешь посмотреть решение в налоговом OPZ - там инф по шаблону заносится в поля pdf
Doppler
1 17:12, 06.06.2012
спасибо. Нет. Это протокол медицинского исследования довольно сложного содержания, подогнанный под формат А4. С логотипами, рисунками, графиками. И все должно бытьна своем месте.
kt315
2 21:04, 06.06.2012 Відповідь на 1 от Doppler
формы для заполнения налоговой тоже достаточно сложные (а тем более pdf как раз для этого и прдназначен - оформления док-ов с различной инф.)
Есть еще формат PostScript - тоже адобовский. Там уж идеально можно все задать, в том числе и графику. Посмотри книжечку ISBN 5-272-00197-4 - там есть пример как рисовать, в том числе и графики
:))) Удачи.
Doppler
3 21:13, 06.06.2012 Відповідь на 2 от kt315
Это не ответ на вопрос, а флуд.
kt315
4 22:08, 06.06.2012 Відповідь на 3 от Doppler
ну, если совет использовать полиграфический формат - флуд ...
Тогда исходя из постановки вопроса надо не "удалять все лишнее" (какой критерий правда непонятно), а изобретать парсер и "выбирать нужное", что более реально.
Doppler
5 22:23, 06.06.2012 Відповідь на 4 от kt315
Файл после многократной правки вордом имеет размер 200Кб. Выглядит идеально. Но при посылке на печать вешает комп на минут пять задумчивости. 200Кб разобрать вручную - это только за пять штук баксов. И то, если сильно попросят. Я бы и сам заплатил. Серьезно. Не столько конечно, но сто баксов бы отвалил, если бы меня результат устроил.
kt315
6 09:09, 07.06.2012 Відповідь на 5 от Doppler
не понял. так проблема в пяти минутах ?
И зачем вордовский файл (или может имеется ввиду вордпресс ?) выгонять в HTML для распечатки.
Как вариант можно для ускорения использовать "умный" принтер, а не дешевые "печаталки" вроде HP1220, или попробовать поднастроить очередь печати и ее режим, приоритетность. Или "печатать" не в HTML а в TIFF, который будет быстро печататься на любом принтере (Microsoft Office Document Image Writer или нечто подобное).
Doppler
7 10:07, 07.06.2012 Відповідь на 6 от kt315
вопрос в том, что "время-деньги". Пациент должен долго ждать заключения и создавать проблемы остальным. В идеале нужно чтобы заключение вылазило из принтера через 3 секунды.
kt315
8 13:17, 07.06.2012 Відповідь на 7 от Doppler
как сказал бы дохтур, надо бороться не с последствиями, а искать причины.
А причина "тормоза" может быть, например, в неудачной реализации допустим графики. Воткнули логотип с векторной графикой и штриховкой полигона - вот ОНО и "отрисовывает " эту штриховку 5 минут, хотя достаточно нарисовать один раз вставку в формате PNG или GIF - и будет счастье :)
Я бы "покоцал" исходный файл ворд и поотлавливал "тормоз" напредмет его оптимальной реализации.
Корпорации любят вставлять дебильные логотипы, которые грузятся долго.
Doppler
9 13:21, 07.06.2012 Відповідь на 8 от kt315
спасиб. трогать нежелательно. на пару миллиметров слетит разметка и все сточки поедут. А рисунки и так все жипежные и бмпэшные.