Функция на C# для удаления из текста всех HTML-тегов.
public string StripHTML(string str)
{
// буфер для хранения результата
string strippedString;
try
{
string pattern = "<.*?>";
// удаляем HTML-теги
strippedString = Regex.Replace(str, pattern, string.Empty);
}
catch
{
strippedString = string.Empty;
}
return strippedString;
}
Пример использования функции можно посмотреть в инструменте htmlStripper.
|
|
Webmoney Z163628999150, R617151845974
|
> запорется на тэгах, которые написаны более чем на одной строчке
Почему? Обрабатываем текст как единую строку и всё будет нормально.
> Я такое как-то уже делал
Своим вариантом не поделитесь?
22:28
По идее, такая задача должна решаться грамотным удалением одних тэгов и заменой других.
Я такое как-то уже делал