Поиск
в Интернет. Поисковые машины.
Обзор
и сравнение англоязычных, русскоязычных и международных поисковых систем.
Запрос
в поисковых системах. Оптимизация
Поисковая система — вебсайт, предоставляющий возможность поиска
информации в Интернете. Большинство поисковых систем ищут информацию на сайтах
Всемирной паутины, но существуют также системы, способные искать файлы на
ftp-серверах, товары в интернет-магазинах, а также информацию в группах
новостей Usenet. В последнее время появился новый тип поисковых движков,
основанных на технологии RSS.
Следует отметить, что
при выполнении запроса поисковая система не ищет документ непосредственно в
Интернете. Она обращается к своей базе данных. Существует два способа
пополнения информации в базы данных поисковых машин:
ü Разработчик Web-страницы
самостоятельно добавляет ссылку на неё в поисковую систему.
ü Специальная программа, называемая роботом, находит
ссылку на новую страницу во Всемирной паутине.
1993г - первой поисковой системой для Всемирной паутины был «Wandex», который создавал «World Wide Web Wanderer» —
бот, разработанный Мэтью Грэйем (англ. Matthew Gray)
из Массачусетского технологического института.
1993 г - появилась поисковая система «Aliweb».
1994 г - первая полнотекстовая (т. н.
«crawler-based» —
то есть индексирующая ресурсы при помощи робота) поисковая система «WebCrawler».
В 1994 был запущен «Lycos»,
разработанный в университете Карнеги Мелона.
Вскоре появилось множество других
конкурирующих поисковых машин, таких как «Excite»,
«Infoseek»,
«Inktomi»,
«Northern Light» и
«AltaVista».
В некотором смысле они конкурировали с популярными интернет-каталогами, такими,
как «Yahoo!».
Позже каталоги соединились или добавили к себе поисковые машины, чтобы
увеличить функциональность.
В 1996 году русскоязычным пользователям
интернета стало доступно морфологическое расширение к поисковой машине Altavista и
оригинальные российские поисковые машины Rambler и Aport.
23 сентября 1997 года была открыта
поисковая машина Яндекс.
Помимо поисковых машин для Всемирной
паутины существовали и поисковики для других протоколов, такие как Archie
для поиска по анонимным FTP-серверам и «Veronica»
для поиска в Gopher.
o
Лидер поисковых машин интернета, Google
занимает более 70 % мирового рынка.
o
Может находить информацию на 101 языке.
o
Google на
конец августа 2004 года состояла из 132
тыс. машин, расположенных в разных точках планеты (источник информации —
бывший высокопоставленный сотрудник компании).
o
Интерфейс Google содержит довольно сложный
язык запросов, позволяющий ограничить область поиска отдельными доменами,
языками, типами файлов и т. д.
Здесь можно найти необходимую вам
информацию без использования запросов, а просто переходя по ссылкам разделов
встроенного.Yahoo
является самой популярной системой в США, так как не требует специальной
подготовки для поиска информации.
Большинство «русскоязычных» поисковых
систем индексируют и ищут тексты на многих языках — украинском, белорусском,
английском и др. В основном индексируют ресурсы, расположенные в доменных
зонах, где доминирует русский язык.
Российская
система поиска в Сети и интернет-портал. С начала 2006 года поиск «Яндекса»
установлен на портале Mail.ru.
HTML, PDF,
RTF, DOC, XLS, PPT , SWF, RSS.
Возможность
точной настройки поискового запроса. Это
реализовано за счёт гибкого языка запросов.
По
умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в
настройках результатов поиска [1] можно
увеличить размер страницы до 20, 30 или 50 найденных документов.
Время от
времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит
к изменениям в результатах поисковых запросов. В частности, эти изменения
направлены против поискового спама.
В апреле 1997 был запущен Ask Jeeves
как поисковик, позволяющий формулировать запросы на естественном языке. Ask Jeeves
использовал людей в качестве редакторов.
Поисковый запрос
может состоять из одного или нескольких слов, в нем могут присутствовать знаки
препинания
Поисковая оптимизация (англ. search engine optimization, SEO) —
оптимизация HTML-кода,
текста, структуры и внешних факторов сайта с целью поднятия его в выдаче
поисковой системы.
«Белая» оптимизация – это оптимизаторская
работа над ресурсом без применения официально запрещённых поисковиками методов
раскрутки ресурса.
«Чёрная» оптимизация обычно представляется как
использование дорвеев — страниц и ресурсов, созданных (зачастую автоматически)
специально для роботов поисковых систем.