Настройка области индексирования Вы можете настроить модуль на индексацию исключительно контента (без навигации и пр.). Для этого необходимо проставить комментарий в макете дизайна: content --> в конце “Header”, и: content --> в начале “Footer”. В этом случае модуль будет индексировать контент только в пределах данных комментариев. Если данные тэги не присутствуют в коде страниц, модуль поиска проиндексирует только заголовки страниц.
Алгоритмы работы В качестве алгоритма поиска используется полнотекстовый поиск в MySQL (функция Match() и Against()). Корректировку запроса к БД можно производить в Системных настройках шаблона «Поиск по сайту». Там же приведено 3 варианта алгоритма поиска, 2 из которых по умолчанию закомментированы. Более подробно об алгоритме и его возможностях можно прочесть в документации по MySQL (http://dev.mysql.com/doc/refman/4.0/ru/fulltext-search.html). Если сайт проиндексирован, но поиск не выдает никаких результатов, можно изменить алгоритм поиска.
Полнотекстовый поиск с использованием релевантности отбрасывает все нерелевантные запросы.
Полнотекстовый поиск без использования релевантности не учитывает эту характеристику, поэтому выводятся все страницы, где найдена введенная фраза. Начиная с версии MySQL 4.0.1 возможен полнотекстовый поиск также и в логическом режиме с использованием модификатора IN BOOLEAN MODE. В этом случае релевантность не учитывается.
Поиск точного наличия искомой фразы в тексте покажет абсолютно все страницы, где присутсвует указанная фраза.
Индексация Индексация может производиться как вручную (кнопка «Индексировать» на странице управления модуля), так и автоматически по расписанию (функционал «Управление задачами» или файл crontab.php) – например, один раз в сутки. Учтите, что запуск индексации через страницу управления модулем ограничивается во времени сервером, поэтому не забывайте корректировать параметр PAGES_COUNT, если индексация преждевременно завершается сервером. Этот параметр указывает, сколько странице отработать за одну тразакцию, прежде чем перегрузить скрипт. Запуск через функционал «Управление задачами» - то же самое, что и ручной запуск через страницу управления модулем, только запуск происходит автоматически. Для его работы необходимо по FTP отредактировать файл cron.php, в самом начале файла удалить строку с «exit;», после чего чуть ниже в строке «$check="test";» вместо test задать ключевое слово, лучше латинскими буквами. Слово нужно для предотвращения несанкционированного доступа к скрипту. Далее в разделе «Управление задачами» системы администрирования отредактируйте ссылку «/netcat/modules/search/cron.php?param=test», указав вместо слова test выбранное вами ранее ключевое слово. Условия с параметром PAGES_COUNT те же. Третий, самый надежный вариант – размещение файла crontab.php в cron вашего сервера. Данный вариант ориентирован на специалистов и сайты большого объема. Для запуска необходимо произвести настройки файла. В самом начале файла в строке с «$_SERVER['HTTP_HOST']="example.net"; # Домен» нужно заменить значение переменной example.net на актульное название вашего домена. Описание настройки функционала «Управление задачами» находится в одноименном разделе данной документации.
Неработающие ссылки Модуль позволяет отслеживать «мертвые» ссылки – это ссылки, которые вернули при индексации ошибку 404, либо по каким-то другим причинам не смогли быть обработаны. Ссылки выводятся ко всем сайтам сразу. Сортировка происходит по адресу, поэтому домены будут сгруппированы вместе.
Параметры модуля Ниже приведены константы, используемые для настройки модуля.
Название констант
| Описание
| Допустимые значения
|
INDEX_TABLE
| Номер шаблона данных «Поиск по сайту: документы». Устанавливается автоматически при установке модуля.
| Число
|
PAGES_COUNT
| Кол-во индексируемых за одну транзакцию страниц. При обширном сайте с большим кол-вом ссылок на страницах число лучше устанавливать меньше.
| Число
|
ALLOWED_URLS
| Список допустимых префиксов ссылок для индексации (документ не индексируется, если его ссылка не начинается с указанного префикса). Префиксы указываются через запятую, без “http://”. Рекомендуется указывать домен без www.
| Ссылки, пример:
demo.example.net, example.net
|
DISALLOWED_URLS
| Список недопустимых префиксов ссылок для индексации (документ не индексируется, если его ссылка начинается с указанного префикса). Префиксы указываются через запятую, без “http://”.
| Ссылки, пример:
example.net/about/
|
START_URL
| Стартовая ссылка для индексации. Рекомендуется устанавливать на страницу с наибольшим количеством ссылок, к примеру, карта сайта или титульная страница.
| Ссылка, пример:
example.net/map/
|
Примечание: константу, символ пробела и параметры стоит писать без пробелов.
|