
Возможностей внутреннего языка описания шаблона файла search.htm поисковой системы DataParkSearch Engine, увы, недостаточо для организации многих вещей. Именно поэтому может возникнуть необходимость добавления в него результатов выполнения какого-то PHP-скрипта.
Руководство по установке DataParkSearch Engine на Windows Server в вопросах и ответах.
Какие должны быть минимальные параметры хостинга для использования на нем DataParkSearch Engine?
Как сделать так, чтобы indexer DataParkSearch Engine индексировал только главные страницы сайтов, а не сайты полностью? Легко!
Парсеры — это программы, конвертирующие какой-либо опрделенный тип файла (mime type) в text/plain или text/html.
Внешние парсеры позволяют поисковому движку DataParkSearch Engine индексировать не только html-страницы, но и множество других форрматов файлов, например документы Mirosoft Office, PDF-документы, и даже Flash.
Клоны с точки зрения DataParkSerach Engine — это документы, имеющие одинаковые значения Hash32, вычисленной по всем секциям документа.
Сейчас мы поговорим о разделении страниц на секции и организации механизма разрешения/запрета индексирования страниц на основе содержания этих секций.
Как и обещал, выкладываю скрипт веб-интерфейса добавления/удаления индексируемых сайтов
Сегодня речь пойдет о том, как научить DataParkSearch Engine индексировать только определенные типы файлов. Это может оказаться полезным, если Вы хотите создать поисковую систему, например, для поиска только по текстовым документам (txt), или только по статичным страницам (htm), или даже (это каким извращенцем надо быть) для поиска только по файлам ...
Продолжаем осваивать движок поисковой системы DataParkSearch Engine. На этот раз займемся его базовой настройкой.