• Narrow screen resolution
  • Wide screen resolution
  • Auto width resolution
  • Increase font size
  • Decrease font size
  • Default font size
  • default color
  • red color
  • green color

Официальный сайт Дяди Зорыча

Friday
Nov 22nd
Главная arrow ПО/Комп/Интернет arrow Поисковые системы специального назначения
Поисковые системы специального назначения Версия для печати
Написал Максим ИВАНОВ   
18.04.2010

Поисковые системы, появившись практически сразу после рождения Интернета, в настоящее время являются самыми востребованными ресурсами. Согласно данным различных статистических исследований, поисковые системы Google и Yahoo совместно с сайтом корпорации Microsoft регулярно занимают первые три места в рейтинге самых посещаемых сайтов мира. Поисковые модули встраивают в браузеры, внедряются в различные сайты. >>>

Первой поисковой системой стал «Wandex» — бот, разработанный Мэтью Грэем из Массачусетского технологического института в 1993 году. Первой полнотекстовой системой, индексирующей ресурсы с помощью робота, стала «WebCrawler», запущенная в следующем году. В ней были заложены основы поисковых систем: пользователь мог вести поиск по любым ключевым словам на любой веб-странице. В международном сегменте поисковиков пальма первенства принадлежит системе Google, в российском сегменте жесткую конкуренцию ему составляет продукт компании Яндекс.
Изначально поисковые машины умели искать только текст. Но их мощь и функциональность росла с каждым годом: возможности многократно увеличились. К примеру, известные в Рунете поисковые системы Google, Яндекс и Рамблер умеют искать текст в веб-документах (кроме того, поиск ведется во вложенных текстовых файлах), изображения, видеофрагменты, картографическую информацию и информацию в новостях. Для более точного поиска вы можете воспользоваться расширенными возможностями поисковиков. В последнее время появилось множество самых разнообразных специализированных поисковых систем. Их преимущество в том, что поиск дает более релевантные результаты. Есть сервисы, заточенные под поиск изображений, музыки, клипов, видео, книг, научной информации и т.п. Мы рассмотрим несколько специализированных поисковых сервисов. Заодно посмотрим, так ли они хороши, как заявляют их создатели.

TinEye (http://tineye.com/)
Эта поисковая система умеет искать изображения по представленному образцу. Вы можете загрузить картинку (upload), либо ввести ссылку на изображение, размещенное в сети. Уже через несколько секунд получите вы результат, если система найдет похожее изображение. TineEye, как и большинство специальных поисковых систем, находится в стадии бета-тестирования. В базе более 1,2 млрд. изображений. Попытка найти копии авторских фотографий потерпели неудачу, несмотря на то, что они залиты на несколько других ресурсов. Впрочем, известно, что с помощью TineEye была установлена личность неизвестного солдата по фотографии, сделанной в Нормандии: на одном из американских сайтов удалось найти файл с полным списком изображенных на фотографии людей. Сервис может помочь найти изображение более высокого качества, чем вы имеете, либо узнать, как часто ли данная картинка используется на других сайтах, воруют ли ваши фотографии.

Picsearch (http://www.picsearch.ru/)
Как заявляют разработчики, этот сервис предоставляет инновационный поиск картинок. При помощи введенных ключевых слов пользователь может находить соответствующие изображения. Есть поиск по анимациям или определенным размерам изображений, используя функции расширенного поиска. Кроме всего прочего, из результатов будут исключены ссылки на порнографический или иной оскорбительный материал. Считается, что Picsearch осуществляет более точный поиск, чем обычные поисковики. Что ж, проверим. На запрос “Иванов Максим Евгеньевич” сервис выдал “Коршиков Георгий Георгиевич – заведующий лабораторией НИЛ МИНА”. И на запрос “вестибулярный аппарат” поиск картинок от Google выдал более правильные результаты. Так что, инновации-инновациями, а поиск изображений лучше доверить проверенным ресурсам.

Религиозные поисковые системы
Оказывается, последователи различных религий предпочитают искать информацию в специализированных поисковиках.
ImHalal (http://www.imhalal.com/) — первый исламский поисковик, который отсеивает информацию, запрещенную для мусульман (харамный контент) и выдает только разрешенную (халяльный контент). Сервис работает на основе трехбальной системы, оценивающий сайт на предмет “харамности”. Заявляется, что при поиске материалов порнографического характера, система выдаст сообщение: “Oops! Your search inquiry has a Haram level of 3 out of 3! I would like to advise you to change your search terms and try again”. Действительно, так и есть. Либо поиск не даст результатов. Впрочем, “харамный” контент найти все же можно. По-крайней мере, мне удалось это сделать при выборе русского языка для интерфейса. ImHalal уже одобрена для использования в Духовном управлении мусульман Республики Татарстан.
Иудеи предпочитают пользоваться “кошерным” сайтом Koogle (www.koogle.co.il). Он создан для того, чтобы удовлетворить жесткие религиозные требования раввинов по доступу к информации.
Некоторые российские христиане пользуются сайтом www.wwjd.ru. Это “стартовая страница Христианского интернета, включающая в себя поиск по христианским сайтам, новости всех конфессий, электронную почту, календарь христианских праздников и многое другое”.

Tagoo (http://tagoo.ru/)
Популярный сервис по поиску аудио-, видеофайлов и программ (в базе более 20 млн. единиц медиа-контента). Tagoo регулярно индексирует сайты, которые дают возможность скачать видео, музыку и программы бесплатно. Для поиска музыки достаточно ввести имя артиста, песни или альбома. Результат будет выдан через пару секунд. Причем вы не только сможете перейти по найденным ссылкам, но и сразу же проиграть композиции (требуется регистрация на сервисе). Для удобства пользователей имеется система быстрой регистрации (не требуется ждать на своем электронном ящике подтверждения). Кроме того, на сайте реализованы некоторые функции социальных сетей.

“КиноПоиск.ру” (http://kinopoisk.ru/)
Русскоязычный интернет-проект о кинематографе, содержащий самую разнообразную информацию о кинофильмах, телесериалах, актерах, режиссерах, продюссерах, сценаристах и т.д.; размещаются постеры, обложки, трейлеры, фотографии звезды, саундтреки, обои для рабочего стола. Присутствуют возможности социальной сети. Входит в число самых популярных сайтов Рунета.

Quintura (www.search.quintura.ru)
Quintura выводит результаты поиска сразу в двух формах. В виде обычного списка ссылок с кратким описанием. И параллельно строит облако тэгов (карту терминов, которые наиболее часто встречаются в результатах поиска). После первоначального запроса вы можете удалить из карты ненужные слова либо выбрать схожие по смыслу. Оба этих действия улучшать результаты поиска. Поисковую карту можно отправить по электронной почте, сохранить на жестком диске, а также встроить в собственный сайт. Действительно, удобная функция, правда сходу освоить схему управления картой терминов мне не удалось.

Yauba (http://ru.yauba.com/)
Известно, что большинство поисковых систем в той или иной степени собирают информацию о своих пользователях. Эти данные потом используются поисковыми компаниями в своих целях. И не всегда на благо потребителей. Поэтому несколько индийских программистов создали данный поисковик, обеспечивающий полную конфиденциальность пользователей. Yauba не ведет учет поисковых запросов, не сохраняет личную информацию. У них самая короткая политика конфиденциальности, заключающаяся всего в восьми словах: не храним никакую личную идентификационную информацию. Точка.” Однако нужно учесть, что работа через анонимное соединение будет несколько медленнее.

Генон (http://www.genon.ru/)
Еще одна беда поисковиков: порой трудно найти нужную информацию. Робот выдаст вам кучу ссылок, но толкового ответа на вопрос вы можете так и не получить. Система подвержена этому недостатку в меньше степени за счет того, что поиск осуществляется по внутренней базе. Для сбора и проверки информации привлекаются посетители и осуществляется сотрудничество с другими сайтами. В “Геноне” используется модель по накоплению и хранению проверенной информации вместе с вопросами, на которые эта информация отвечает. Причем, как и в “Википедии”, каждый пользователь может добавлять свои знания систему. Ответы и вопросы к ним создаются “авторами”, проверку осуществляют “редакторы”. За счет этого из системы удаляется не только информационный мусор, но и прямая реклама.

Lexxe (http://www.lexxe.com/)
Разработчики поисковой системы Lexxe пытаются решить одну из важных задач. Их система умеет обрабатывать вопросы на естественном языке, в дополнение к стандартному поиску по ключевым словам и фразам. Сервис пока тестируется (работает альфа-версия). Русский язык ограниченно поддерживается. Так, система не смогла ответить на вопрос “Как стать президентом?” и на простой, казалось бы вопрос: “Сколько будет дважды два” выдала четыре невразумительных ответа. Быть может, количество ответов и есть ответ на вопрос?

(Опубликовано в газете "Мой друг компьютер", № 6, март 2010 года. Здесь дана авторская редакция.)



33348 просмотров

  Ваш комментарий будет первым

Добавить комментарий
  • Пожалуйста оставляйте комментарии только по теме.
Имя:
E-mail
Домашняя страница
Тема:
BBCode:СсылкаEmailЖирный текстКурсивПодчёркнутый текстКавычкиCodeСписокПункт спискаЗакрыть список
Коментарий:



Код:* Code

 
< Пред.   След. >

///2011///
12 декабря. Новый рекорд: 812 посетителей (по данным счетчика "liveinternet.ru").
Апрель. Еженедельные горячие десятки анекдотов теперь не выкладываются на главной странице.
///2010///
27 января. Новый рекорд: 560 посетителей (по данным счетчика "mail.ru").
25 января. Перешел на более мощный тарифный план. Теперь сайт работает в 1,5-2 раза быстрее.
///2009///
19 ноября. Новый рекорд: 312 посетителя (по данным счетчика "mail.ru").
15 апреля. Закрылась почтовая рассылка "Лучшая десятка анекдотов от Дяди Зорыча". Сам раздел продолжит существование.
///2008///
21 октября. Новый рекорд: 102 посетителя (по данным счетчика "mail.ru").
26 июня. Сайт переехал на собственное доменное имя www.zorych.ru (спасибо Алексею Радченко).
01 июня.
День рождения сайта. В этот день начал заливать информацию на локальный сайт.