Удаление тегов из текста

Категория: C# Комментариев: 2

Функция на C# для удаления из текста всех HTML-тегов.

public string StripHTML(string str)
{
	// буфер для хранения результата
	string strippedString;
	try
	{
		string pattern = "<.*?>";
		// удаляем HTML-теги
		strippedString = Regex.Replace(str, pattern, string.Empty);
	}
	catch
	{
		strippedString = string.Empty;
	}
	return strippedString;
}

Пример использования функции можно посмотреть в инструменте htmlStripper.

Автор: Кто-то   @   10 февраля 2010 Комментариев: 2
Метки : ,

Поблагодарить автора

Webmoney Z163628999150, R617151845974

Комментариев: 2

Комментарии
мая 21, 2010
22:28
#1 Жук :

:) Плохая функция. Удалит все что можно в лучшем случае, запорется на тэгах, которые написаны более чем на одной строчке, в худшем.

По идее, такая задача должна решаться грамотным удалением одних тэгов и заменой других.

Я такое как-то уже делал ;)

Автор мая 28, 2010
12:37

> запорется на тэгах, которые написаны более чем на одной строчке

Почему? Обрабатываем текст как единую строку и всё будет нормально.

> Я такое как-то уже делал

Своим вариантом не поделитесь? ;)

оставить комментарий

Предыдущая запись
«
Следующая запись
»