Позвольте представить мое новое чудо — htmlStripper.
Сей инструмент предназначен для удаления из текста всех html-тегов.
Зачем оно надо? В ряде ситуаций может мозникнуть необходимость очистить текст от html-тегов для его дальнейшей обработки.
Скачать htmlStripper можно тут.
Использование: htmlStripper.exe http://page/url > C:\text.txt
Для пользователей Linux: mono htmlStripper.exe http://page/url > ./text.txt
Исходный код опубликован под лицензией GPL и доступен для всех желающих здесь.
