Реферат: Поисковики для школьника

Интернет предоставил нам лёгкий и быстрый доступ к большому количеству информационных материалов, возможность как читать, сохранять, распечатывать эти материалы, так и самим размещать полезную, а может и бесполезную информацию в сети.

Современный Интернет – это огромнейшее количество архивов разнообразнейшей тематики - от коллекций рефератов до кухонных рецептов, от небольших музыкальных файлов до полнометражных фильмов, но, к сожалению, эти архивы не взаимосвязаны, зачастую информация не структурирована и, чтобы найти интересующий нас материал приходится перерыть не один десяток страниц, потратить не один час на поиски. И тогда к нам на помощь приходят специально разработанные сайты - Поисковые системы. Существует два типа поисковых систем: каталоги и "сайты-пауки"

С каталогами всё предельно понятно - здесь информация как в библиотеке разложена по тематическим полочкам и имеет подробное описание. У каталогов есть один существенный минус- информация в каталоги вносится в ручную и далеко не все сайты там описаны.

А вот «сайты-пауки» давайте рассмотрим поподробней, они представляют для нас больший интерес. У каждого «сайта-паука» есть свой робот-паук, который ползает по всемирной паутине, просматривает практически все доступные страницы и вносит информацию о них в специальную базу данных, которая расположена на сайте паука и в последствии рядовые пользователи Интернета ищут необходимую им информацию уже по этим базам данных.

Наиболее известные и популярные сайты-пауки - это русскоязычные Яндекс, Рамблер, Google (рус) в меньшей степень Апорт и англоязычные Google и Alta Vista.

Возможно вы искали - Реферат: Borland Delphi 7: миграция в сторону .Net

Вроде бы сайты-пауки это совершенство поиска в Интернете: просто, удобно, быстро, практически вся информация сети собрана здесь, но здесь присутствуют свой недостаток: поисковик- это машина и не очень то интеллектуальная при запросе в базу он выдаёт вам вместе с искомой информацией ещё тонну всякого хлама, содержащего ваш запрос но, к сожалению, не в тему (к примеру, вы ищете « скачать программу Winamp» а он вам выдаст страницу в которой слово winamp находится в одной части страницы слово программу в совершенно другой а слово скачать относится к другой программе).

Не спорю, сейчас поисковики поумнели и на запросы выдают более осмысленную информацию, существует ранжирование информации либо либо по дате либо по релевантности (то есть насколько запрос заданный вами отвечает тому, что он нашёл, например, вы искали « скачать программу Winamp»- при выдаче результатов поисковик вначале вам выдаст те страницы 1)где эти слова встречаются вместе 2) где эти слова встречаются на одной странице, но в разных местах, 3)встречаются на одной странице, но в других формах « скачаю программу Winamp» или «скачивание программы Winamp» 4) где встречается два или одно слово из запроса), хотя всё равно они очень далеки до совершенства и поиск в них порой занимает много времени и зачастую не удаётся найти то, что ищешь.

К сожалению, мы не можем влиять на поисковик напрямую - это дело программистов и лингвистов, но мы можем задавать поисковику такие запросы, на которые он нам выдаст максимально приближенную к искомой информацию.

Правильный запрос в поисковую систему-это очень сложное дело, которому надо учиться и учиться и тогда на любой наш вопрос поисковик будет выдавать нам то, что мы искали.

Давайте поучимся создавать грамотные поисковые запросы на конкретном примере. Но в начале определимся, в каком поисковике будем искать. Я отдаю предпочтение Яндексу вот по каким причинам: во-первых, база относительно свежая (время переиндексации страниц у яндекса составляет 1 -30 дней), более менее нормально индексирует динамические адреса (это такие адреса которые могут меняться в процессе существования сайта, напримерhttp://www.predkov.net/index.php?showtopic=4342 все, что после знака «?» это динамическая часть адреса), возможность передать ваш поисковый запрос в другие поисковые системы всего нажатием одной клавиши мыши (внизу у яндекса есть такая строка: «в других поисковых системах: AltaVista · Google · MSN · Yahoo! · Rambler · Апорт!») Но это лишь сугубо моё мнение и вы можете начинать искать, например с Рамблера или Google (рус). Теперь перейдём непосредственно к поиску. Недавно меня попросили найти реферат или доклад по литературе на тему "Время гуманнистов". Я человек, далёкий от литературы и истории, я даже не знал, что искать из какой это темы и какой поисковый запрос задавать.

Похожий материал - Реферат: Приемы безопасного программирования веб-приложений на PHP

первый мой запрос естественно был «Время гуманнистов» на что я получил:

«опечатка? возможно, имелось в виду: «Время гуманистов» отсюда

совет №1 Всегда проверяйте ваш запрос на грамматические ошибки и очепятки

меняем запрос на правильный «Время гуманистов». Теперь нам яндекс выдаёт следующий результат:

Очень интересно - Реферат: Разработка DLL в Borland Delphi

Здесь нас интересуют только пункты 1 и 3 они наиболее полно отвечают нашим требованиям. Теперь загрузим найденные странички и посмотрим, что же нам интересного нашёл поисковик. Загружаем эти две странички и видим что здесь текста на минут 20-30 чтения и поиск среди всего этого нашего «Время гуманистов» займёт много времени, и тогда нам на помощь опять же приходят поисковые системы.

Давайте внимательнее взглянем на результат поиска, а точнее то, что написано под описанием ссылки - видите вот такую строчку «Найденные слова · Похожие документы · Еще с сайта (2)» Нас интересует « найденные слова» Нажав на эту ссылку, мы получим ту же страницу, но слова из нашего запроса будут выделены жёлтым цветом и будет очень трудно их не заметить.

Кстати, забыл сказать, что если вдруг страница не доступна или не найдена, хотя в поиске она была найдена - не отчаивайтесь - вы всегда сможете просмотреть её сохранённую копию на сайте паука (На яндексе это Найденные слова - сохранённая копия)

Просматриваем страницу и приходим к выводу что « Время гуманистов» - это период Возрождения, время Ренессанса и, скорее всего раннего Ренессанса. Также встречается имя Данте, а значит, мы уже можем составить 4-5 более менее осмысленных и правильных поисковых запросов.

Замечание: Пункта 3 (подбор нужных запросов) можно избежать, если хорошо известно, что ищется и с чем это связано, т.к. тогда легче подобрать синонимичные запросы, которые наиболее полно отражают тему поиска. Поэтому

Вам будет интересно - Курсовая работа: Delphi. Немного относительно методов упаковки данных

Совет №2 Постарайтесь, как можно больше узнать о том, что вам нужно найти и активней используйте наш могучий русский язык, подбирайте грамотно синонимы.

Теперь нам уже значительно легче, мы знаем практически всё о том, что мы ищем, мы знаем даже одного гуманиста из времени гуманистов - Данте, а это можно сказать три четверти всей работы. А вот сейчас мы можем пойти уже двумя путями: либо пройти на сайт с коллекциями рефератов и подобрать рефераты по тем ключевым словам, которые мы нашли, и скомпоновать один реферат, отобрав нужную нам информацию либо продолжить поиск и попытаться найти готовую работу. Так как тема этой статьи Поисковые системы, то мы естественно пойдём вторым путём, но перед этим скажу пару слов о сайтах с рефератами: большинство таких коллекций обладает поиском иногда даже очень умным, поэтому не теряйте своего драгоценного времени и активней используйте эту возможность. Также при скачивании рефератов постарайтесь найти ещё несколько работ на эту или схожую тему и скачайте все их - потом если вдруг что-то не подойдет, не придётся повторно искать. Из всех коллекций рефератов я отдаю предпочтение «Банку рефератов» наверно из-за их поисковой системы - очень удобная, с большим набором функций и интуитивно понятная . Но это сугубо моё мнение и вполне может, существует что-то лучше.

Наш следующий запрос в поисковую систему будет « Данте время гуманистов» Результаты уже процентов на 70-80 отвечают нашей теме, выкинуто много мусора и здесь мы начинаем уже более тщательно просматривать полученные результаты не только на первой, но и на второй, третьей странице.

Замечание: При нашем поиске мы использовали сортировку по релевантности (что это такое см. выше) и поэтому чем глубже мы продвигаемся, тем менее ответ поисковой машины соответствует нашему запросу, поэтому обычно дальше 3-4 страницы я не просматриваю то, что нашёл поисковик.

Наиболее интересным нам представляется результат:

Похожий материал - Реферат: Семь чудес и два фокуса на Дельфи

Это ссылка на pdf документ (т. е это, скорее всего отсканенные страницы, какой то книги), открываем и видим, что это почти то, что мы искали, остаётся только выбросить ненужное и подобрать ещё несколько материалов в тему и реферат готов. Кстати это большой плюс поисковиков, то, что они умеют хоть как то индексировать pdf документы. Чтобы конвертировать текст из pdf в txt достаточно воспользоваться специальной программой - грабером.

Последующие поисковые запросы мы можем уже составлять из того материала, который нам известен, например:

Великие гуманисты Данте