8(8412)74-58-38
(с 10-00 до 20-00 МСК)
Зачётик.Ру - помогаем студентам в учёбе

У нас можно недорого заказать курсовую, контрольную, реферат или диплом

Главная / готовые работы / Рефераты / Компьютерные сети

Поиск информации в Интернет. Web-индексы. Web-каталоги. - Реферат

Содержание

Введение 3

1 Теория поиска информации 4

2 Обзор возможностей поисковых систем и каталогов 7

2.1 YAHOO 8

2.2 GOOGLE 9

2.3 ALTAVISTA 9

2.4 LYCOS 10

2.5 YANDEX RU 10

2.6 RAMBLER RU 11

2.7 APORT RU 11

3 Реконструкция документов и перевод на иностранный язык 13

Заключение 15

Библиографический список 16

Введение (выдержка)

Рано или поздно, каждый пользователь Всемирной паутины сталкивается с проблемой поиска информации. Будь то реферат, курсовая работа либо документация к новой стиральной машине, поиск этой информации может занять у вас от пяти минут до нескольких часов – все зависит от умения искать и находить нужные данные в Интернете. В этом случае нам на помощь приходят всевозможные поисковые машины, каталоги и базы знаний. Рассмотрим их по отдельности.

Интернет – абсолютно децентрализованная система. И если сначала анархия и свобода казались замечательным достижением, то сейчас хаотичность расположения информации зачастую порождает значительные трудности. Тут-то на помощь и приходят поисковые машины.

Справедливости ради надо заметить, что поиск во Всемирной сети был возможен и до появления на свет сегодняшних гигантов вроде ALTAVISTA или YAHOO!. Даже в те далекие годы, когда не существовало самой WWW, одним из основных сервисов Интернет был Gopher. Эта система кажется сейчас чрезвычайно неудобной с практической точки зрения (впрочем, на наш взгляд, ни одна из первых Интернет-служб не могла похвастаться ни простотой принципа работы, ни хотя бы интерфейсом).

Основная часть (выдержка)

1 Теория поиска информации

Большинство современных молодых людей имеют мобильные телефоны, подавляющее большинство из них не знает, как работает сеть мобильной связи.

Поисковыми системами можно пользоваться так же, как мобильными телефонами – освоив нехитрые элементы управления ими, научившись нажимать нужные кнопочки. Для того чтобы уметь пользоваться поисковой машиной (или поисковой системой), не обязательно понимать, как она работает, и тем более знать ее внутреннее устройство.

Однако ситуация здесь примерно такая же, как с автомобилем: на нем можно ездить, умея лишь заправлять его, управлять им и зная правила дорожного движения. Но тот, кто хочет чувствовать себя за рулем уверенно и при необходимости самостоятельно устранять мелкие неисправности, должен знать устройство автомобиля, названия и принципы функционирования хотя бы важнейших узлов. Поэтому далее мы будем говорить об устройстве поисковых машин и основных терминах, которые приступающий к поиску информации в интернет пользователь должен знать так же хорошо, как автомобилист термины «карбюратор» и «зажигание».

Как работают поисковые машины Поисковая машина (для краткости ее часто называют просто поисковик) представляет собой комплект программ, в основе которого лежат следующие пять:

1 Spider («паук») – программа, которая загружает в поисковую машину Web-страницы. Работает аналогично браузеру, установленному на компьютере пользователя, но ничего не отображает ни на каком экране. Если вы хотите иметь представление о том, что именно загружает в поисковую систему «паук», откройте какую-нибудь Web-страницу и выберите в меню Вид браузера пункт Просмотр HTML (или «исходного») кода.

2 Crawler («червяк», или «путешествующий паук») – программа, способная найти на Web-странице все ссылки на другие страницы. Ее задача определить, куда дальше должен ползти «паук», руководствуясь ссылками или заранее заданным списком адресов.

3 Indexer (индексатор) – программа, которая «разбирает» страницу на составные части и анализирует их. Вычленяются и анализируютсязаголовки Web-страниц, заголовки документов, ссылки, текст документов, отдельно – текст, выделенный полужирным шрифтом, курсивом и т. д.

4 Database (база данных) – хранилище всех данных, которые поисковая система загружает и анализирует. Требует огромных ресурсов как для хранения, так и для последующей обработки.

5 Search Engine Results Engine (система выдачи результатов поиска) решает, какие страницы удовлетворяют запросу пользователя и в какой степени. Именно с этой частью поисковой системы «общается» пользователь.

Первые две программы, работающие «в связке», часто называют поисковый робот (а иногда – НТТР-робот).

Как видите, поисковая машина, получив запрос на поиск, не отправляется в длительное путешествие по «Всемирной паутине, как полагают некоторые пользователи, а анализирует лишь ту информацию, которую собрала ранее. С одной стороны, это позволяет резко повысить скорость обработки запроса на поиск. С другой, ограничивает область поиска внутренними ресурсами поисковой системы, которые, во-первых, ограниченны (ни одна поисковая машина не в состоянии загрузить в свою базу данных информацию со всех узлов Сети), во-вторых, уже в какой-то степени устарели. Ситуация в интернет изменяется очень быстро. Если «паук» с целью обновления информации об уже проиндексированных однажды Web-страницах «заползает» на них раз в два месяца, пользователь рискует получить в результатах запроса ссылку на уже несуществующую Web-страницу.

Процесс загрузки из Сети информации и предварительного анализа ее поисковой машиной называется индексация, а сама база данных поисковой машины, в которой хранится собранная информация, – индекс.

Глубина индексации может быть разной. Полные тексты документов, размещенных на странице, в базу данных копируют не все поисковые роботы – некоторые ограничиваются лишь заголовками. Когда пользователь формирует запрос на поиск, поисковая машина просматривает свою базу данных и выдает перечень Web-страниц, содержащих слова, введенные пользователем в поле ввода (их часто называют ключевые слова). Таких страниц может быть очень много. Задача поисковой машины – отобрать те из них, которые в наибольшей степени отвечают запросу пользователя (т.е. релевантны ему) и указать ссылки на них в числе первых.

Заключение (выдержка)

По моему мнению, проблема поиска информации стоит достаточно остро, несмотря на множество поисковых машин и каталогов наводнивших Интернет. Именно поиск информации является основной задачей сервиса.

Если заглянуть в будущее российских поисковых систем, становится очевидно, что новичкам выйти на этот рынок будет довольно сложно, значительно сложнее, чем на рынок счетчиков. Иллюстрацией этому уже сейчас служат такие проекты, как Lupa.r* и Punto, которые, хотя и стартовали, со своими обязанностями справляются пока крайне слабо. Лидерство описанных в статье поисковых машин определяется сложными технологиями, полнотой базы, большим парком компьютеров и сформировавшимися привычками пользователей. В то же время они страдают одним большим недостатком – «замусоренностью» своих баз данных, и для решения этой проблемы, возможно, в один прекрасный день придется проиндексировать русскую часть Интернета практически заново.

Литература

1 Всемирная паутина Интернет.– h**t://sesia5.r*/blok/8/83_10.htm

2 Левчук Ю.П., Охинченко Е.П., Сотников А.Д., Фоменко Т.А. Информатика.– h**t://dvo.sut.r*/libr/ite/i280levc/index.htm

3 Поиск в Сети: обзор возможностей поисковых систем и каталогов.– h**t://w*w.geocities.com/patan4ik/comp_artical_5.htm

4 Поиск информации в Интернет.– h**t://dev.ingate.r*/develop-targets/information-popular/

5 Поиск информации в Интернет.– h**t://w*w.extranom.r*/

6 Поиск информации в Интернете.– h**t://mirsovetov.r*/a/hi-tech/network/search-information.html

7 Поиск информации в интернете.– h**t://w*w.homebusiness.r*/ideas/506.htm

Информация о работе

Тип: Реферат
Страниц: 16
Год: 2007
250 p.
Не подошла эта работа?
Узнайте стоимость написания
работы по Вашему заданию.

Закажите авторскую работу по Вашему заданию!
Контрольная работа
от 100 p.
cрок: от 1 дня
Реферат
от 600 p.
cрок: от 1 дня
Курсовая работа
от 1000 p.
cрок: от 3 дней
Дипломная работа
от 6000 p.
cрок: от 6 дней
Отчет по практике
от 1000 p.
cрок: от 3 дней
Решение задач
от 150 p.
cрок: от 1 дня
Лабораторная работа
от 200 p.
cрок: от 1 дня
Доклад
от 300 p.
cрок: от 2 дней
Заказать работу очень просто!
Вы оформляете заявку
Получаете доступ в лк
Вносите предоплату
Автор пишет работу
Получаете уведомление
о готовности
Вносите доплату
Скачиваете готовую
работу из лк
X
X