htmlStripper, инструмент для удаления html-тегов

Позвольте представить мое новое чудо — htmlStripper.
Сей инструмент предназначен для удаления из текста всех html-тегов.

Зачем оно надо? В ряде ситуаций может мозникнуть необходимость очистить текст от html-тегов для его дальнейшей обработки.

Скачать htmlStripper можно тут.

Использование: htmlStripper.exe http://page/url > C:\text.txt
Для пользователей Linux: mono htmlStripper.exe http://page/url > ./text.txt

Исходный код опубликован под лицензией GPL и доступен для всех желающих здесь.

Поблагодарить автора

Оставить комментарий

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>