Удаление тегов из текста

Категория: C# Комментариев: 2

Функция на C# для удаления из текста всех HTML-тегов.

public string StripHTML(string str)
{
	// буфер для хранения результата
	string strippedString;
	try
	{
		string pattern = "<.*?>";
		// удаляем HTML-теги
		strippedString = Regex.Replace(str, pattern, string.Empty);
	}
	catch
	{
		strippedString = string.Empty;
	}
	return strippedString;
}

Пример использования функции можно посмотреть в инструменте htmlStripper.

Автор: Кто-то   @   10 февраля 2010 Комментариев: 2
Метки : ,

Поблагодарить автора

Webmoney Z163628999150, R61715184597

Комментариев: 2

  • Жук

    :) Плохая функция. Удалит все что можно в лучшем случае, запорется на тэгах, которые написаны более чем на одной строчке, в худшем.

    По идее, такая задача должна решаться грамотным удалением одних тэгов и заменой других.

    Я такое как-то уже делал ;)

  • Кто-то

    > запорется на тэгах, которые написаны более чем на одной строчке

    Почему? Обрабатываем текст как единую строку и всё будет нормально.

    > Я такое как-то уже делал

    Своим вариантом не поделитесь? ;)


Leave a reply

;) :| :x :twisted: :) 8O :( :roll: :P :oops: :o :mrgreen: :lol: :idea: :D :evil: :cry: 8) :arrow: :? :?: :!:

Предыдущая запись
«
Следующая запись
»