как определить какой вид поиска лучше использовать
Компьютерное обучение для новичков
Какой поисковик самый лучший
Существует огромное разнообразие поисковых систем, и каждая из них стремится завоевать любовь и доверие у пользователей. Давайте рассмотрим какие виды поисковых систем бывают, и разберемся чем лучше пользоваться.
Виды поисковых систем
Не все пользователи интернета знают, что существуют специальные узконаправленные поисковые системы. Это такие поисковики, которые предназначены для поиска определенной информации. Вот краткий список подобных поисковых систем:
Tagoo – данная поисковая система ориентирована на поиск музыки, видео и программ.
FileSearch – файловая поисковая система, ищет файлы на ftp серверах.
Astronet – производит поиск по астрономическим сайтам.
Tineye – ищет похожие изображения.
FindSounds – специализируется на поиске звуковых файлов.
Wolfram Alpha – это не поисковая система, а сервис который отвечает на ваши вопросы (русский язык не понимает).
Agakids – специализированный детский поисковик.
Существуют и другие узкоспециализированные поисковики, от более или менее популярных, до совсем экзотических.
Гугл или Яндекс
Если говорить о “обычных” поисковиках, то тут все довольно ясно, Google – вот мировой лидер! В рунете ему составляют конкуренцию несколько поисковых систем:
Rambler, Mail, Nigma, Aport и др. Но главным конкурентом конечно же является Yandex.
Кто же лучше Google или Yandex? Однозначно лучшим является Google. Аргументов можно привести довольно много, приведу парочку наиболее значимых:
Google стабильнее. У Яндекса иногда бывают различные проблемы и сбои. Вспомните к примеру “падение” Яндекса 19.08.2011, в этот день Яндекс, ровно как и все его сервисы были недоступны почти пять часов. В 17.00 Яндекс «упал», в 20.00 работа сервиса была частично возобновлена, в 22.00 проблемы были решены полностью. Согласитесь довольно неприятный факт.
Информация в Google актуальнее. Дело в том, что обновление поисковой выдачи у Google происходит гораздо чаще. К тому же Google индексирует сайты гораздо быстрее Яндекса. Следовательно новая и актуальная информация в Google появляется гораздо быстрее.
Тем не менее Yandex пока является главной поисковой системой в рунете, но поклонников Google с каждым годом становится все больше.
Голосуем! В комментариях напишите какой поисковой системой вы пользуетесь чаще всего.
Лично Я чаще всего пользуюсь Яндексом 🙂 Но если нужной мне информации я не нахожу на первой странице, я не перехожу на вторую, а щелкою по ссылке “Поискать в Google”.
Понравилась статья? Поделитесь с друзьями!
Поиск информации в сети Интернет
Что такое поисковые системы, и для чего они нужны
В глобальной сети Интернет можно найти информацию по любой интересующей теме. Но самое трудное в работе с сетью Интернет — найти нужную информацию. Т. к. Интернет не имеет четкой централизованной структуры, развивается хаотично, и в мире появляются все новые и новые серверы, вопросы поиска информации становятся очень актуальными.
Каждая из поисковых систем имеет какие-то свои достоинства и недостатки, которые определяются принципом работы поисковой машины, удобством использования, ее оформлением, сложностью языка запросов, наличием различных расширенных функций (управление форматом и ранжированием выводимой информации, исправление орфографических ошибок и ошибочной раскладки клавиатуры при вводе ключевых слов, перевод страницы на др. языки т. д.), скоростью работы, и др. параметрами. Выбор поисковой системы для конкретного применения определяется целью поиска, характером искомой информации, желаемым форматом выводимых данных и шириной охвата отслеживаемых адресов серверов в мире Интернет.
Наиболее популярные поисковые системы
За пределами России рейтинг поисковых систем также возглавляет Google, далее следуют bing и Yahoo!.
Поиск по ключевым словам. Язык запросов поисковой системы
Поисковая система обычно имеет поле для ввода ключевых слов, по которым она находит документы, содержащие эти ключевые слова. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов, и больше из них документов, соответствующих тому, что Вам требуется. Если запрос очень простой или составлен неграмотно, то поисковая машина может Вам выдать несколько миллионов документов, которые Вам не просмотреть за всю жизнь.
Используя язык запроса, содержащий логические операции (логические операторы AND, OR, NOT, скобки и др.), префиксы обязательности присутствия ключевых слов в документе «+» и «-» (при поиске по узкоспециализированным терминам — предпочтительней использовать), расположения ключевых слов в документе рядом или на определенном расстоянии и т. д.) и др. элементы, и большее количество связанных ими ключевых слов, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Следует учитывать, что разные поисковые системы могут иметь как различающиеся языки запросов, так и очень похожие.
На сайтах поисковых систем обычно есть ссылки на справочную информацию по использованию поисковых сервисов, языков запросов, рекомендации по поиску и т. д.
Некоторые поисковые системы дополнительно имеют функцию расширенного поиска, позволяющую пользователю более точно описать то, что ему конкретно нужно и без знания языка запроса. Функцию расширенного поиска имеют, например, поисковые системы Яндекс и Google.
Типы поисковых систем. Какой поисковой системой воспользоваться
Существует 2 основных типа поисковых систем Интернет: индексные и классификационные (каталоговые). Индексные поисковые системы (например, Яндекс, Google, Rambler и др.), работая в автоматическом режиме обновления своей информации, просматривают в Интернет содержимое серверов, индексируя информацию, содержащуюся в них и внося информацию о расположении слов на страницах сайтов в свои базы данных. Каталоговые системы поиска (например, Rambler, Yahoo! и др.) содержат тематически структурированный каталог серверов, и чаще всего пополняются вручную. Обычно на WWW-странице классификационной поисковой системы содержится и поле для ввода ключевых слов для поиска в собственной базе данных. В каталоговой системе поиска можно, начав с более крупной тематической рубрики, и постепенно спускаясь дальше по рубрикам, прийти к ссылке на нужный Вам сайт. В одних случаях бывает удобней воспользоваться первым типом поисковых систем, в других — вторым. Есть поисковые системы, сочетающие в себе оба принципа работы. В частности, большинство индексных поисковых систем имеют и каталоговую систему поиска. Также поисковые машины могут использовать и какие-то другие принципы методы поиска.
Многие поисковые системы преобразовались в Интернет-порталы, объединяющие в себе большое количество ресурсов и сервисов. На страницах таких порталов можно прочитать новости, ознакомиться с программой телепередач, узнать о погоде, курсах валют, воспользоваться картографическим сервисом и мн. др.
Для поиска по российским ресурсам Интернет рекомендуется пользоваться российскими поисковыми системами (например, Яндекс), ввиду наличия русскоязычного интерфейса, возможности поиска по русским словам, учета особенностей русского языка, близости расположения сервера и т. д. Для поиска по зарубежным ресурсам можно воспользоваться многоязычными поисковыми машинами, имеющими в т. ч. и русскоязычный пользовательский интерфейс, а также возможность перевода найденных страниц на русский язык (например, Google).
Для поиска одновременно в нескольких поисковых системах можно воспользоваться так называемыми поисковыми метамашинами, обращающимися сразу к нескольким поисковым средствам, например, MetaCrawler.
Как известно, поисковых систем в Интернете много и найти нужную информацию крайне непросто. Отсутствие единого стандарта на спецификацию задачи поиска в Сети приводит к тому, что на каждом узле предлагается собственный способ решения поставленной задачи. В результате пользователь, не искушенный в премудростях синтаксических конструкций запросов к поисковой системе, либо не полностью использует возможности поисковика, либо, изучив функции конкретной системы, постоянно обращается лишь к одной.
Мета-поисковая система имеет единый язык запросов, иногда даже возможность перевода ключевых слов на др. языки. Такие поисковые системы, получая результаты запросов от др. поисковых систем, фильтруют полученные материалы, убирая дублирующиеся ссылки, и сортируют их по релевантности (степени нужности). Для поиска зарубежных ресурсов можно пользоваться российскими поисковыми метамашинами, обращающимися к другим поисковым средствам (в том числе зарубежным). Это удобно, ввиду наличия русскоязычного интерфейса, возможности поиска по русским словам, учета особенностей русского языка, близости расположения сервера, имеющего в большинстве случаев доступ к скоростному каналу за рубеж и т. д. Для этого и существуют поисковые метамашины. Но в последнее время качество поиска наиболее популярных поисковиков Яндекс и Google существенно улучшилось, и надобность в метапоисковых машинах отпадает, и они проигрывают в конкуренции с популярными поисковиками, вследствие чего почти все метапоисковики прекратили свое существование.
Существуют также поисковые системы, специализирующиеся по поиску по одной какой-либо теме (например, по информационным технологиям, по музыке, по ресурсам, посвященные природе и т. д.)
В некоторых случаях можно обойтись и без применения поисковых систем. Так, например, большинство крупных зарубежных фирм имеют адреса типа http://www.название_фирмы.com (например, официальный сайт Microsoft Corporation — http://www.microsoft.com), а большинство крупных российских фирм — http://www.название_фирмы.ru, (например, сайт компании «Лукоил» — http://www.lukoil.ru).
Можно также найти нужный Вам WWW-сервер в так называемых «Желтых страницах Интернет» (Yellow pages), выпускаемых в печатном виде или размещаемых в сети Интернет (Yellowpages.com, Желтые страницы интернет и мн. др.) В «Желтых страницах» ссылки на WWW-сервера располагаются по рубрикам. Каждому серверу дается краткое описание и иногда небольшой снимок первой страницы.
Также, собираясь посетить какой-то зарубежный сервер (например, официальный WWW-сервер какой-либо зарубежной фирмы), можно учитывать и такие возможные варианты, как наличие зеркальных серверов на территории России (копии зарубежного сайта) или наличие официального российского сайта зарубежной компании (на русском языке), наряду со своим главным официальным сайтом (например, официальный российский сайт компании Intel Corporation — http://www.intel.ru). Конечно же, лучше воспользоваться именно этими вариантами.
Как заявить о своем WWW-сайте (WWW-странице) в Интернет
Если у Вас есть своя страничка в Интернет, и Вы хотите показать ее всему миру, можно добавить свой URL к списку обслуживаемых страниц в выбранных Вами поисковых системах и каталогах, нажимая на соответствующие ссылки на страницах поисковых серверов и заполняя соответствующие формы. Можно также воспользоваться сервисом, позволяющим добавить Ваш адрес сразу в несколько поисковых систем и каталогов. Среди них можно назвать, например, Студия Артемия Лебедева: Система TAU (регистрация в 12-х зарубежных и 8-и российских поисковых системах), Регистратура РУ (регистрация в 13-и российских и 15-и зарубежных поисковых машинах и в 13-и российских каталогах линков, а также регистрация 5-и счетчиков), NET-ADS Submission Station (регистрация в 24-х зарубежных поисковых системах) и др.
Для просмотра параметров своей страницы в наиболее известных поисковых системах и каталогах можно обратиться к сайту Инструмент оптимизатора.
Какую поисковую систему использовать лучше?
Все чаще пользователи задаются вопросом, а почему я никак не могу найти необходимую для себя информацию? Может я просто использую не ту поисковую систему?
Однако поисковая система Яндекс не менее популярна, чем Google и рассчитана в основном на поиск по российским сайтам. Но это не означает, что в такой машине нет сайтов на другом языке. Просто она рассчитана именно на русского человека. Даже некоторые фразеологизмы написаны так, как может сказать только «русский человек».
Мы решили провести опрос среди программистов, какой поисковой системой они чаще всего пользуются, и выяснилось, что это именно Google! Но почему? Все очень просто. Google действительно самая простая поисковая машина. И именно за простоту люди полюбили её. А вот Яндекс устроен немного сложнее. Но он внедрен практически во все программы, и неопытный пользователь ПК автоматически перестраивает свою поисковую машину на Яндекс и, затем, открывает её по-умолчанию.
Благодаря такой техники Яндекс стал самой известной поисковой системой и сейчас лидирует практически наравне с Google.
А теперь давайте вернем к нашему первоначальному вопросу: какая из этих поисковых систем всё-таки лучше?
Однозначно ответить на этот вопрос просто невозможно. Ведь каждый пользователь уже привык к своей поисковой системе и уже видит массу плюсов, почему не стоит отказываться от неё. Поэтому мы решили, что не стоит ограничиваться лишь одной поисковой системой. Попробуйте поискать одно и то же на разных системах и Вы увидите, что если нет определенной информации на одной системе, то на другой она обязательно есть (если очень хорошо поискать).
Однако, поисковых систем в мире очень и очень много! Почему же мы выделили именно эти две поисковые системы?
Давайте посмотрим на статистику посещений с поисковых систем на наш сайт «Немного о компьютере».
Как видим, наибольшее количество посещений происходит именно с поисковой системы Google и Яндекс. Значит они, на сегодняшний момент, и являются самыми популярными и самыми часто используемыми системами. Если люди ими пользуются, значит их что-то привлекает. Возможно, это простота поиска, удобные инструменты работы, удобная почта и т.д.
Остается только решить Вам, какая из этих поисковых систем Вам больше всего нравится? Ответ обязательно напишите в комментариях!
Эффективный поиск в Интернете
Тот факт, что сегодня все больше работодателей обращают внимание на навыки сотрудников по поиску информации в Интернете и даже прибегают к услугам коммерческих служб поиска информации, говорит о том, что для эффективного поиска нужны определенные навыки и опыт. Конечно, опыт со временем приходит, однако наши рекомендации помогут вам овладеть искусством поиска быстрее и эффективнее. В данной статье мы дадим наиболее полезные советы по оптимизации поиска в Сети.
Где искать, чтобы доверять
дним из важных навыков поиска информации в Интернете является умение анализировать степень достоверности найденных документов. После того как Интернет стал рекламной площадкой, сотни тысяч людей думают над тем, как привлечь ваше внимание к тому или иному товару. Увы, часто для этого используются недобросовестные приемы. Возможность высказать свое мнение и опубликовать в Сети свою статью имеет как положительный аспект (демократичность представления информации), так и отрицательный, связанный с появлением материалов, не прошедших редактирования. Поэтому даже если в найденном документе есть ключевые слова, по которым вы вели поиск, то ценность его может оказаться сомнительной. Ряд формальных правил помогут сэкономить время и избежать ошибок при отборе документов в Интернете.
Прежде всего следует выяснить, на каких условиях работает ресурс. Если информация находится на корпоративном сайте и представляет собой данные о продуктах компании, то очевидно, что фирма распространяет эти сведения потому, что ей выгодно информировать клиентов о своем товаре. Именно поэтому информация бесплатна. На таком сайте будет приведена наиболее актуальная информация о продуктах данной фирмы. Однако если на том же сайте продукты фирмы сравниваются с товарами конкурентов, то, скорее всего, будут указаны лишь те данные, которые позволяют представить продукты фирмы в благоприятном свете.
Сайт аналитического агентства обычно содержит более объективные данные о сравнении товаров, однако чаще всего такая информация платная. Если на подобном сайте информация выложена бесплатно, то, скорее всего, приведены не все данные. А для получения полной картины информацию придется докупать. Аналогично поступают создатели сайтов по продаже книг. Они выкладывают в Интернете отрывки, обрывающиеся на самом интересном месте, а для получения полного текста нужно купить книгу. Примерно так же выглядят сайты учебных курсов приводится часть лекции, а для того чтобы получить ее целиком, надо записаться на курсы. При этом очень часто похожую лекцию можно найти бесплатно на сайте, который размещает информацию для привлечения посетителей и окупается за счет рекламы.
Если документ размещен на сайте научного издания или университета, то, скорее всего, он прошел научное редактирование. К сожалению, оперативность обновления информации на институтских и университетских сайтах обычно невелика.
Поэтому не следует недооценивать самопубликации, дающие возможность оперативно представить новости, высказать нерецензируемую точку зрения не только на государственную, но и на корпоративную политику, на качество сервисов, на ту же «рекламность» тех или иных публикаций. Вполне возможно, что информация в частном журнале или на домашней страничке малоизвестного автора куда более актуальна, чем на сайте университета. Однако, если это частный сайт, важно установить авторство документа, полезно поискать источники, откуда была взята информация.
Как искать, чтобы экономить время
ипичной проблемой при поиске является отвлечение на интересные, но не относящиеся к делу материалы. Сеть велика, и процесс серфинга может быть бесконечным. Важно сфокусироваться на поиске и, насколько это возможно, разделять во времени поиск и чтение.
Переход по страницам в одном окне браузера может быть неэффективным. Для того чтобы вернуться к ранее просмотренной информации, приходится листать страницы, на что уходит лишнее время. Не бойтесь открывать сразу несколько окон браузера. Вместо того чтобы щелкать по ссылкам на полученных страницах, щелкните на ссылке правой клавишей мыши и выберите пункт меню Open in New Window (Открыть в новом окне) или перенесите ссылки мышью во второе окно браузера.
Если вы не можете самостоятельно найти интересующую информацию или у вас не хватает времени на поиски, можно прибегнуть к услугам специальных сервисов один из них находится по адресу: http://www.Bestinform.com.
Где искать, чтобы быстрее находить
Интернете было бы очень трудно находить информацию, если бы не были созданы мощные поисковые инструменты: поисковые машины, каталоги, метапоисковые системы, онлайновые энциклопедии, справочники и другие поисковые сервисы. Как показывает практика, для поиска разного рода информации наиболее эффективными оказываются различные инструменты.
Прежде всего следует сказать, что Web это не единственное пространство, в котором можно искать документы. Можно искать файлы на FTP-серверах, можно оставлять запросы в группах новостей и т.д. Однако самым массовым источником информации стал Web, и большинство пользователей начинают поиск именно во Всемирной паутине, поэтому в дальнейшем мы рассмотрим именно этот вид поиска.
Отметим, что и в Web-пространстве информацию можно искать в разных источниках и в различном виде это может быть конкретный документ, тематический ресурс, где могут находиться документы искомого типа, электронная библиотека, энциклопедия, коллекция ссылок, форум и т.д.
Документы можно искать в разных форматах, при этом формат документа имеет определенную связь с его содержанием. Например, если вы хотите найти материал, в котором тезисно изложена суть вопроса, то полезно поискать презентацию (то есть документы в формате *.ppt), если вам нужна техническая статья, то помимо HTML-документов логично поискать файлы с расширением *.pdf или *.doc (в этих материалах будет меньше рекламного и больше технического содержания).
Для каждого типа информации следует выбирать свой инструмент поиска. Если вам нужно ознакомиться с той или иной темой и понять структуру вопроса, то логично начать поиск в каталоге. Если вам требуется конкретный документ, следует обратиться к поисковой машине. Если вы знаете название фирмы или проекта и предполагаете наличие у фирмы (проекта) сайта, то стоит попытаться подобрать его имя. Рассмотрим специфику вышеперечисленных средств поиска.
Индексированные каталоги
Каталоги представляют собой данные, структурированные по темам в виде иерархических структур. Разделы первого уровня определяют наиболее популярные, максимально широкие темы, такие как «спорт», «отдых», «наука», «магазины» и т.д. В каждом таком разделе есть подразделы. Таким образом, пользователь может уточнять интересующую его область, путешествуя по дереву каталога и постепенно сужая область поиска. Например, при поиске информации о ноутбуках цепочка поиска может выглядеть следующим образом: Информационные технологии ® Компьютеры ® Ноутбуки.
Дойдя до нужного подкаталога, пользователь находит в нем набор ссылок.
Существует огромное количество каталогов, и один из наиболее популярных в Рунете находится по адресу: http://list.mail.ru/. Помимо каталогов общего профиля в Сети много специализированных каталогов. Например, по адресу www.kinder.ru можно найти хороший каталог, посвященный детским ресурсам. Если внутри отдельной темы каталога находится большое количество ресурсов, возникает проблема сортировки. Например, в каталоге Яндекса сортировка идет по индексу цитирования числу ссылок на сайт с других сайтов. Очевидно, что если необходимо найти конкретный документ, то каталог окажется малоэффективным поисковым средством.
Подбор доменного имени
Для того чтобы попасть на сервер компании Microsoft или IBM, вряд ли имеет смысл обращаться к каталогу. Угадать название соответствующего сайта нетрудно: www.microsoft.com и www.ibm.com или www. microsoft.ru и www.ibm.ru сайты российских представительств этих компаний.
Аналогично если пользователю необходим сайт, посвященный погоде в мире, то логично искать его на сервере www.weather.com. В большинстве случаев поиск сайта с ключевым словом в названии эффективнее, чем поиск документа, в тексте которого это слово используется. Если западная коммерческая компания (или проект) с односложным названием имеет в Сети свой сервер, то ее имя с большой вероятностью укладывается в формат www.name.com, а для Рунета (российской части Сети) www.name.ru, где name имя компании или проекта. Подбор адреса можно успешно использовать наряду с другими приемами поиска, поскольку при подобной системе поиска можно установить соединение с сервером, который не зарегистрирован ни в одной поисковой системе.
Поисковые машины
Поисковая машина состоит из двух частей: так называемого робота (или паука), который обходит серверы Сети и формирует базу данных поискового механизма, и программы, определяющей рейтинг найденных ссылок. База робота в основном формируется им самим (робот сам находит ссылки на новые ресурсы) и в гораздо меньшей степени владельцами ресурсов, которые регистрируют свои сайты в поисковой машине.
Принцип работы поисковой машины сводится к тому, что она опрашивает свой внутренний каталог (базу данных) по ключевым словам, которые пользователь указывает в поле запроса, и выдает список ссылок, ранжированный по релевантности.
Очевидно, что от умения пользователя правильно задавать запросы зависит успешность поиска.
Общие рекомендации по работе с поисковой машиной
Число документов, полученных в результате поиска, может быть огромно. Поэтому решающее значение для оптимального поиска информации имеет правильный набор ключевых слов.
При планировании поиска полезно вначале выбрать основные понятия, описывающие предмет поиска, затем ключевые слова и подобрать к ним синонимы. Ввод нескольких ключевых слов точнее определяет предмет поиска. Если в результате поиска не было найдено ни одного документа, возможно, вы допустили орфографическую ошибку в написании слова запроса. Проверьте орфографию и повторите поиск. Не пишите большими буквами. Начиная слово с большой буквы, в ряде поисковых систем вы не найдете слов, написанных с маленькой буквы, которые не являются первыми в предложении. Заглавные буквы в запросе рекомендуется использовать только в именах собственных. Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку «Найти похожие документы» (подобный сервис есть в большинстве поисковых машин).
При поиске имени собственного применяйте режим поиска «Точно по фразе» и кавычки. Ищите не только документы, но и ресурсы.
Большинство поисковых машин позволяют отыскивать картинки по названию файла или подписи. Поиск по картинкам может быть полезен не только при поиске собственно картинок. Иногда поиск документа по картинке позволяет ускорить процесс принятия решения о полезности ссылки, поскольку не нужно читать текст и открывать ссылку достаточно окинуть взглядом поле выданных по запросу картинок и быстро перейти на нужную ссылку.
Если поисковая машина выдает ссылку на интересующий документ, но документ с указанным вами адресом на сервере отсутствует, это еще не значит, что этот документ нельзя восстановить. Часто поисковая машина хранит копии индексированных страниц в кэше, поэтому, если найденная вами оригинальная страница уже не существует, вы, тем не менее, можете посмотреть, как выглядела страница на момент ее регистрации. Иногда в ситуации, когда по найденному адресу нужный документ отсутствует, удается найти нужную страницу на искомом сервере путем задания части URL-адреса. Это может помочь в случае переименования документов или вложенных папок на сервере.
Для более точного поиска полезно использовать расширенный поиск и язык запросов. Поскольку разные машины несколько отличаются в плане языка запросов, то этот вопрос мы рассмотрим позже, применительно к конкретным поисковикам. В мире существуют сотни поисковых машин, и для эффективного поиска логично пользоваться самой лучшей.
Какая из поисковых машин лучше?
Чтобы ответить на этот вопрос, обратимся к исследованию компании Nielsen NetRatings (http://www.netratings.com/), согласно которому популярность поисковиков в мире в конце 2005 года распределилась следующим образом: в 47,7% случаев пользователи обращались к Google, в 21,8% к Yahoo! и в 11,3% к MSN. Однако их лидерство условно аналитики свидетельствуют, что даже постоянные пользователи Google не всегда удовлетворены результатами поиска, 58% из них регулярно прибегают к помощи Yahoo Search и MSN Search, а 71% тех, кто ищет при помощи Yahoo!, посещают Google или MSN Search. Аналогично 70% пользователей, предпочитающих MSN, пользуются дополнительно одной-двумя другими поисковыми системами.
Активная борьба между основными поисковыми службами Google, Yahoo! и MSN заставляет генерировать все новые сервисы. Большее количество поисковиков, ранжируя их по популярности, приводит аналитическая служба SearchEngine.com (рис. 1).
Рис. 1. Популярность поисковых систем (доля каждой системы в общем поисковом трафике) (источник: SearchEngine.com, 2005 год)
Впрочем, в России ситуация несколько иная: поиск русскоязычных документов дело специфическое и отечественные поисковые машины, видимо, справляются с ним лучше. По крайней мере, об этом свидетельствует статистика.
Для оценки популярности отечественных поисковых систем можно обратиться к исследованию специалистов агентства «Артон Консалтинг», проведенному в 2005 году. Анализ популярности поисковых систем осуществлялся на базе 110 тыс. обращений на исследуемые сайты риелторских агентств и автосалонов. На рис. 2 показаны результаты исследования, согласно которым первые два места в списке популярных поисковых систем занимают Яндекс и Рамблер, причем перевес в пользу Яндекса составляет 3:1. MSN опережает Aport, а Google занимает третье место. Таким образом, интернациональные поисковики составляют конкуренцию российским поисковикам только второго эшелона.
Рис. 2. Популярность поисковых систем (доля каждой системы в общем поисковом трафике) (источник «Артон Консалтинг»)
Аналитиками оценивался не только вид поисковой системы, но и такой параметр, как качество аудитории. Под качественной аудиторией понимались пользователи, просмотревшие как минимум три разные (уникальные) страницы на сайте. Как отмечают авторы исследования, по показателю «глубина просмотра» наиболее качественной аудиторией являются пользователи Рамблера. Наименее качественной пользователи Google (рис. 3).
Рис. 3. Качество аудитории поисковых систем (источник «Артон Консалтинг»)
Исследования «Артон Консалтинг» показывают, что пользователи Рунета не активно применяют дополнительные возможности, предоставляемые поисковыми системами. Так, из рассмотренной аудитории всего 1,3% пользователей прибегали хотя бы к одному из дополнительных поисковых инструментов (расширенный язык запросов, поиск по региону, поиск в рамках одного сайта, поиск похожих документов, поиск через форму расширенного поиска).
Учитывая, что Google является наиболее популярной международной поисковой системой, а Яндекс предпочитает большинство пользователей Рунета, остановимся на сервисах этих ресурсов несколько более подробно.
Google и его поисковые сервисы
Поисковая система Google декларирует самый большой объем базы данных более 8 млрд. документов. Google первой из поисковых машин начала индексацию документов в форматах PDF, PS, DOC, XLS, PPT, RTF и WP5. В последнее время Google расширила число не-HTML-файлов до 12 форматов, включив основные форматы Microsoft Office. Сейчас Google обеспечивает интерфейс на многих языках мира (более 100 языков), в том числе и на русском.
Фирменная кнопка Google «I’m Feeling Lucky», или, в русской версии, «Мне повезет», (рис. 4) отправляет пользователя на единственную страничку, которую Google выбрала на ваш запрос. Однако в этом случае других результатов поиска он не увидит. Кнопка «Мне повезет» помогает сэкономить время и действительно полезна, если вы уверены в том, что система легко может дать однозначный прогнозируемый вариант.
Рис. 4. Интерфейс Google на русском языке
Google позволяет осуществлять поиск в различных источниках информации: во Всемирной паутине, в каталоге, в дискуссионных группах, а также искать картинки.
Возможен также расширенный поиск, который позволяет разыскивать документ на разных языках и в различных форматах (PDF, DOC, XLS и т.д.), показывать страницы, измененные в течение определенного времени, и учитывать ряд других параметров (рис. 5).
Рис. 5. Расширенный поиск в Google на русском языке
Работая с Google, полезно знать несколько операторов, которые упрощают поиск. Например, для того чтобы получить толкование слова или сочетания слов, достаточно перед незнакомым термином (через пробел) напечатать «define».
Так, задав запрос «define Интернет», вы получите специальную ссылку, предоставляющую всевозможные толкования термина в Сети (рис. 6).
Слово «site», сопровождаемое двоеточием, позволяет ограничить поиск конкретным сайтом. Например, запрос «сеть site:www. hownetworks.boom.ru» позволяет найти документ со словом «сеть» на конкретном сайте.
Рис. 6. Пример работы оператора define
По запросу типа link:siteURL вы получите страницы, которые ссылаются на данный URL.
Например, запрос «link:www.compress.ru» выдаст список ссылок страниц, которые ссылаются на сайт www.compress.ru, а запрос «link:www.google.com» даст список страниц, которые ссылаются на стартовую страничку Google.
Если вы включите оператор «intitle:» в ваш запрос, то Google ограничит результаты документами, содержащими данные слова в заголовке. Например, «intitle:google search» вернет документы, которые имеют слово «google» в заголовках, и слово «search» в любом месте документа.
Если вы начнете запрос с оператора «allinurl:», Google ограничит результаты ссылками, которые будут содержать слова запроса в url. Например, «allinurl: google search» выдаст только те документы, которые имеют слова «google» и «search» в url.
Пока поиск в блогах доступен в Google только на английском языке, сервис находится по адресу: www.google.com/blogsearch. Сервис имеет режим «Advanced Search», позволяющий указать язык, на котором будет произведен поиск, время, когда написан документ, и ряд других параметров (рис. 7).
Рис. 7. Расширенный поиск Google в блогах
Яндекс и его поисковые сервисы
Помимо Web-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), RTF (Rich Text Format), DOC (Microsoft Word), XLS (Microsoft Excel), PPT (Microsoft Power Point), SWF (Macromedia Flash), а также многие блоги и форумы.
Яндекс позволяет задать запрос по любому из источников информации («Каталог», «Новости», «Товары», «Адреса», «Словари», «Картинки» (рис. 8).
Рис. 8. Интерфейс панели ввода поисковых запросов в поисковой машине Яндекс
Для каждого документа выдается ссылка на ресурс и ссылка [Показать найденные слова] переход на подсвеченный документ, где контекст запроса выделен стрелочками, которые обеспечивают переход по выделенным словам (рис. 9).
Рис. 9. Подсветка искомых слов и стрелочки навигации по искомым словам
Также возможны поиск похожего документа и, если найденный сайт описан в каталоге, переход в рубрику каталога. В конце списка ссылок выдается «Колдунщик запросов», в котором даются советы и предложения по уточнению запроса пользователя. Например, при поиске с ключевым словом «Интернет» данный раздел может выглядеть так, как показано на рис. 10. Данный раздел позволяет сузить поиск по рубрике каталога или по региону, а также дает возможность поискать в других русскоязычных поисковых машинах и блогах.
Рис. 10. «Колдунщик запросов»
При точном соответствии запросу система выводит результат поиска в новостных лентах информационных агентств, результат поиска в энциклопедических статьях или в базе товарных предложений магазинов.
Очень удобно реализована служба изображений. «Яндекс.Картинки», которая автоматически собирает картинки в стандартных графических форматах (JPEG, GIF и PNG). Материалом для текстового поиска служат:
При поиске существует возможность задать желательный размер картинки.
Картинки группируются по площади:
Из базы «Яндекс.Картинки» исключаются баннеры и одинаковые изображения. В результатах поиска выдается не более одной картинки от одного сайта, остальные доступны по ссылке «Еще с сайта».
Как и в Google, в Яндексе есть служба расширенного поиска (рис. 11). Она позволяет задать словарный фильтр, то есть указать, какие слова обязательно должны встретиться в документе, каких быть не должно, а какие желательны. Поле «Все формы» или «Точная форма» указывает Яндексу, надо ли учитывать при запросе все словоформы. «Точная форма» обычно требуется только для поиска цитат. Зоной поиска слова может быть как текст документа (слова находятся в одном предложении или во всем документе), так и его заголовок, аннотация, ссылка (подпись URL) или адрес (сам URL). Вариант «Во фразе» означает необходимость искать слова в том порядке, в котором они введены. Вы можете задать несколько слов через запятую. Здесь же можно обозначить ограничение выдачи документов по дате, задать запрос только по страницам указанного сайта или поддиректории, найти ресурсы, которые ссылаются на некоторый Web-сайт, найти документы, содержащие картинку с определенным названием или подписью.
Рис. 11. Расширенный поиск в Google на русском языке
Несмотря на то что расширенный поиск предлагает массу возможностей, более точный запрос можно сделать с помощью языка запросов. Синтаксис языка запросов Яндекса рассматривается в табл. 1 и 2.
Таблица 1. Синтаксис языка запросов
Таблица 2. Синтаксис языка запросов Яндекса для поиска в элементах
Метапоисковые системы
Количество документов увеличивается быстрее, чем поисковые системы успевают их проиндексировать. Велика вероятность того, что нужный пользователю документ не попал в один поисковик, но проиндексирован другой поисковой системой. Поэтому существуют приложения, позволяющие передавать запрос пользователя сразу в несколько поисковых систем, так называемые метапоисковые системы. Метапоисковые системы являются разновидностью поисковых инструментов, не имеющих собственных поисковых роботов и индексных файлов и основанных на рассылке и обработке запросов сразу в несколько поисковых систем и на суммировании результатов.
Метапоисковая система имеет те же преимущества перед поисковой системой, что и поиск в нескольких справочниках перед поиском в одном. Однако это не означает, что метапоиском следует пользоваться во всех случаях. Если документов по теме много, то метапоиск не нужен и, возможно, даже вреден, поскольку смешивает разные логики ранжирования. Часто метапоисковые средства не в состоянии корректно обработать запрос для различных поисковых систем и правильно совместить результаты, полученные разными системами. Но если документов по теме мало, то метапоиск может быть полезен именно благодаря тому, что объединяет большое число поисковиков.
Следует отметить, что существуют онлайновые сервисы метапоиска по отдельным товарам. Например, на сайте www.booksearch.ru можно осуществить метапоиск по 12 наиболее популярным книжным Интернет-магазинам. Это позволяет найти редкие книги, которые есть не во всех магазинах.
Метапоисковая система может быть выполнена не только как онлайновый сервис, но и как отдельная программа. В качестве примера метапоисковой системы можно привести программу «ДИСКо Искатель» (разработка фирмы «ДИСКо» (www.disco.ru). Главной ее особенностью является возможность запоминать как параметры поиска, так и его результаты и впоследствии использовать их.
Онлайновые энциклопедии и справочники
Начать поиск толкования термина, конечно, можно и со страниц поисковой машины. Выше мы описали функцию поиска толкований на Google, а крупный энциклопедический ресурс «Яндекс. Энциклопедии» находится по адресу http://encycl.yandex.ru (14 энциклопедий, в том числе статьи из «Большой советской энциклопедии» и «Энциклопедии Брокгауза и Ефрона»). Однако полезно знать и некоторые другие ресурсы. В первую очередь следует обратить внимание на сетевую энциклопедию Wikipedia (www.wikipedia.com), которую может редактировать любой желающий. «Википедия» свободно распространяемая энциклопедия на всех языках. Она отличается не только большим объемом и быстротой пополнения, но и составом авторов это неоплачиваемые добровольцы, редактирующие «Википедию» посредством Интернета. Проект Wikipedia предлагает каждому пользователю написать для огромного справочника ту статью, в которой он считает себя специалистом. Казалось бы, неорганизованная в единый коллектив масса пользователей не может создать сложную упорядоченную структуру, однако рост объема и популярности Wikipedia говорит об обратном. В энциклопедии более 500 тыс. статей только на английском языке и сотни тысяч на других языках. Сервис разрешает свободное распространение материалов «Википедии», в том числе использование их на других Web-сайтах, при условии, что создатель сайта не имеет права ставить на взятые из «Википедии» материалы свой копирайт, и ссылается на статью-источник в «Википедии». Существует «Википедия» и на русском языке (рис. 12) она расположена по адресу: http://ru.wikipedia.org.
Рис. 12. Страница «Википедии» на русском языке
После большого успеха «Википедии» началась разработка сайтов, работающих на тех же принципах, но дополняющих «Википедию» другого рода справочными и учебными сведениями. Это следующие ресурсы:
• «Викиучебник» для написания учебников и руководств;
• «Викицитатник» сборник цитат и пословиц;
• «Викисловарь» все виды словарей на всех языках;
• «Викисклад» для всех видов иллюстраций для других Вики-сайтов;
• «Викиновости» открытое новостное издание и др.
Особенно актуальным является поиск толкований терминов по информационным технологиям, которые развиваются так быстро, что уследить за появлением новых терминов очень сложно. Увы, большинство словарей из данной категории англоязычные. Наиболее популярным и самым объемным из них является англоязычный FOLDOC (Free On-line Dictionary Of Computing http://wombat.doc.ic.ac.uk/foldoc/index.html), содержащий более 13 тыс. терминов. Следует рекомендовать еще как минимум два онлайновых словаря Webopedia и WhatIs.com.
Ресурс Webopedia (www.pcwebopaedia.com) содержит не только словарь, но и ряд специализированных сервисов например «Кто есть кто в компьютерных технологиях», «Сравнительная таблица микропроцессоров», «История развития компьютерных технологий» и др.
WhatIs.com (http://whatis.com/index.htm) толковый энциклопедический словарь по информационным технологиям, в первую очередь по терминам, связанным с ПК и Интернетом. Все статьи в нем взаимосвязаны и содержат около 12 тыс. гипертекстовых ссылок.
Часто бывает необходимо получить толкование аббревиатур их появилось так много, что порой найти толкование удается только при использовании специализированного сервиса (рис. 13). Для поиска значений аббревиатур полезно обратиться на сервер аббревиатур http://www.ucc.ie/cgi-bin/uncgi/acronym.
Рис. 13. Acronym Server позволяет найти толкование аббревиатур
Обычно на одну и ту же аббревиатуру система выдает пять, а то и десять толкований, так что выбирать нужное приходится по смыслу.
Вместо заключения дадим основные рекомендации по поиску в Интернете: