DataParkSearch: разделяй и властвуй

Категория: DataParkSearch Комментариев: 0

Сейчас мы поговорим о разделении страниц на секции и организации механизма разрешения/запрета индексирования страниц на основе содержания этих секций.
Разделение страницы на секции является очень полезной функцией. С помощью нее можно задавать вес найденного текста при выводе результатов поиска, или-же запретить индексацию определенных секций (например футеров страниц).

Секции документов описываются в файле sections.conf. Объявление новой секции выглядит следующим образом:
Section <string> <number> <maxlen>
Здесь string — это название новой секции, number — идентификатор секции (число между 0 и 255). Чем меньше это число, тем ниже вес текста этой секции в поисковой выдаче (0 — не индексировать секцию вообще). Аргумент maxlen указывает максимальную длину секции.
Вот пример двух стандартных HTML-секций body и title:
Section body 1 256
Section title 2 128

Большинство используемых секций документов уже описаны в файлеsections.conf, вам остается только раскомментировать соответствующие строки.

Разбиение документов на секции также дает возможность воспользоваться механизмом запрещения индексации страниц, содержащих определенный текст в той или иной секции. Для описания правил запрещения индексации использется комманда NoIndexIf. Ее синтаксис выглядит так:
NoIndexIf [Match|NoMatch] [NoCase|Case] [String|Regex] <section> <arg> [<arg> ... ]
Эта комманда служит для запрета индексации страниц в случае нахождения заданного шаблона в секции section
Аргументы [Match|NoMatch], [NoCase|Case], [String|Regex] аналогичны одноименным аргументам коммады Allow из предыдущей статьи об индексации, поэтому не будем на них останавливаться.
Параметр section указывает название секции, которую следует проверять на предмет совпаредия с шаблоном. Параметр arg — собственно шаблон.

Оформление шаблонов такое-же как и у директивы Allow.
Напоследок приеду пару примеров:
NoIndexIf meta.keywords *xxx* Запретит индексировать страницы, в мета-теге keyords которых встретится слово «xxx»
NoIndexIf NoMatch title *поиковая система*Запретит индексировать страницы, в заголовках которых нет словосочетания «поисковая система».

Автор: Кто-то   @   17 января 2009 Комментариев: 0
Метки : ,

Поблагодарить автора

Webmoney Z163628999150, R61715184597

Комментариев: 0


Leave a reply

;) :| :x :twisted: :) 8O :( :roll: :P :oops: :o :mrgreen: :lol: :idea: :D :evil: :cry: 8) :arrow: :? :?: :!:

Предыдущая запись
«
Следующая запись
»