Осуществление поиска информации в тексте

Осуществление поиска информации в тексте

Осуществление поиска информации в тексте




Скачать файл - Осуществление поиска информации в тексте


























Говорят, что в Интернете есть все. На самом деле — это не так. Материалы для размещения в сети готовят живые люди, и потому там можно найти лишь то, что они сочли нужным опубликовать. Впрочем, река питается ручьями, и, благодаря их творчеству сегодня в Интернете уже образовалось около двух миллиардов Web-страниц. В результате каталогизация имеющихся в сети ресурсов стала серьезной проблемой. Несмотря на то, что проблемой занимаются тысячи организаций, она не только не приближается к разрешению, но и становится острее. Процент каталогизированных ресурсов неуклонно падает. В последние годы это падение стало катастрофическим. К сожалению, у нас нет оснований предполагать, что в ближайшее время что-нибудь может измениться к лучшему. В итоге поиск информации в Интернет можно считать одной из самых трудных задач. Это самый быстрый и надежный вид поиска. Для быстрого доступа к ресурсу достаточно запустить браузер и набрать адрес страницы в строке адреса. Адреса Web-страниц приводятся в специальных справочниках, печатных изданиях, звучат в эфире популярных радиостанций и с экранов телевизора. Если вы не знаете адреса, то для поиска информации в сети Интернет существуют поисковые системы, которые содержат информацию о ресурсах Интернета. Каждая поисковая система — это большая база ключевых слов, связанных с Web-страницами, на которых они встретились. Для поиска адреса сервера с интересующей вас информацией надо ввести в поле поисковой системы ключевое слово, несколько слов или фразу. Тем самым вы посылаете поисковой системе запрос. Результаты поиска выдаются в виде списка адресов Web-страниц, на которых встретились эти слова. Как правило, поисковые системы состоят из трех частей: Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы. Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время. Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей. В России наиболее распространенными поисковыми системами являются: За рубежом поисковых систем гораздо больше. Яндекс является пожалуй наилучшей поисковой системой в российском Интернете. Эта база данных содержит около серверов и до 30 миллионов документов, которые система просматривает в течение нескольких секунд. На примере этой системы покажем как осуществляется поиск информации. Результаты поиска появляются в течение нескольких секунд, причем ранжированные по значимости — наиболее важные документы размещаются в начале списка. При этом ранг найденного документа определяется тем, в каком месте документа находится ключевое слово в заглавии документа важнее, чем в любом другом месте и числом упоминаний ключевого слова чем больше упоминаний, тем ранг выше. Таким образом, сайты, расположенные на первых местах в списке, являются ведущими не с содержательной точки зрения, а практически, по отношению к частоте упоминания ключевого слова. В связи с этим, не следует ограничиваться просмотром первого десятка предложенных поисковой системой сайтов. Содержательную часть сайта можно косвенно оценить по краткому его описанию, размещаемому Поисковой системой под адресом Сайта. Некоторые недобросовестные авторы сайтов, для того, чтобы повысить вероятность появления своей Web-страницы на первых местах Поисковой системы, умышленно включают в документ бессмысленные повторы ключевого слова. Даже ранжированный список документов, предлагаемый поисковой системой в ответ на ключевую фразу или слово, может оказаться практически необозримым. В связи с этим в Яндекс как и других мощных Поисковых Машинах предоставлена возможность в рамках первого списка, выбрать документы, которые точнее отражают цель поиска, то есть уточнить или улучшить результаты поиска. Например, на ключевое слово список из 34 Веб-страниц. Ссылки организованы в виде тематического рубрикатора, npeдставляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию. Приведем в качестве примера структуру поискового интернет-каталога Яндекс. Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. В этом каталоге выделены следующие темы: Каждая тема включает множество подразделов , а они, в свою очередь, содержат рубрики и т. Поиск можно организовать следующим образом:. В конце вам предлагается всего несколько ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога:. Это один из самых распространенных видов поиска. Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо. Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме. Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет огромное количество страниц - огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым. Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области. Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать расширенный поиск. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами. Количество ссылок уменьшится более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров. Очевидно, что следует продолжить движение в направлении уточнения условий поиска. Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык. Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Для поиска устойчивого словосочетания следует заключить слова в кавычки. Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа. Вместо одного слова в запросе можно подставить целое выражение. Вернемся к примеру с аквариумными рыбками. Аквариум - сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений. На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу. Для поиска литературы или полнотекстовых документов возможен следующий запрос: После обработки запроса поисковой машиной результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам. Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях: Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу. Прочитать предлагаемые статьи и приступить к устройству аквариума. Поискать материалы о хомячках или волнистых попугайчиках. Какой вид поиска является самым быстрым и надежным? Где пользователь может найти адреса Web-страниц? Каково основное назначение поисковой системы? Из каких частей состоит поисковая система? Какие поисковые системы вы знаете? Какова технология поиска по рубрикатору поисковой системы? Какова технология поиска по ключевым словам? Какие критерии поиска в Яндексе заданы следующей фразой: Пользуясь каталогом поисковой системы, найдите следующую информацию по указанию учителя: Формирование запроса по точному названию или цитате. Сформулируйте запрос для поиска в Интернете полного текста документа. Результат поиска сохраните в своей папке. В любой поисковой системе составьте запрос для поиска информации о русской бане. Исключите предложения об услугах, рекламу банных принадлежностей и прочую рекламу. Сосредоточьте поиск на влиянии русской бани на организм. Составьте сложный запрос на поиск информации по уходу за домашними кошками. Исключите из поиска крупных кошек например, львов , а также предложения о покупке, продаже, фотографии для обоев и т. Текст запроса и результат поиска оформите в Word и представьте учителю. Всеми известными вам способами выполните поиск в Интернете информации по истории развития вычислительной техники. Поиск производите по различным направлениям: Результаты поиска оформите в виде презентации. Используйте в презентации многоступенчатой оглавление в виде гиперссылок. Робот Spider, Robot или Bot - это программа, которая посещает веб-страницы и считывает полностью или частично их содержимое. Индекс - это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц. Бизнес и экономика; Общество и политика; Наука и образование; Компьютеры и связь; Справочники и ссылки; Дом и семья; Развлечения и отдых; Культура и искусство. Поиск можно организовать следующим образом: Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Найти. Ключевые слова в запросе следует писать строчными маленькими буквами.

Статья 'Поисковые возможности системы ГАРАНТ'

Информационный поиск

Каталог барановичского постельного белья

Причиныдля проведения ревизии фхд организации

Поисковые системы.Осуществление поиска информации или информационного объекта в тексте, в файловых структурах, в базах данных, в сети Интернет.

Сеть Интернет растет очень быстрыми темпами, поэтому найти нужную информацию среди сотен миллиардов Web-страниц и сотен миллионов файлов становится все сложнее. Для поиска информации используются специальные поисковые системы, которые содержат постоянно обновляемую информацию о местонахождении Web-страниц и файлов на сотнях миллионов серверов Интернета. Поисковые системы содержат тематически сгруппированную информацию об информационных ресурсах Всемирной паутины в базах данных. Специальные программы-роботы периодически 'обходят' Web-серверы Интернета, читают все встречающиеся документы, выделяют в них ключевые слова и заносят в базу данных Интернет-адреса документов. Большинство поисковых систем разрешают автору Web-сайта самому внести информацию в базу данных, заполнив регистрационную анкету. В процессе заполнения анкеты разработчик сайта вносит адрес сайта, его название, краткое описание содержания сайта, а также ключевые слова, по которым легче всего будет найти сайт. Поиск по ключевым словам. Поиск документа в базе данных поисковой системы осуществляется с помощью введения запросов в поле поиска. Запрос должен содержать одно или несколько ключевых слов, которые являются главными для этого документа. Например, для поиска самих систем поиска в Интернете можно в поле поиска ввести ключевые слова 'российская система поиска информации Интернет' рис. Через некоторое время после отправки запроса поисковая система вернет список Интернет-адресов документов, в которых были найдены заданные ключевые слова. Для просмотра этого документа в браузере достаточно активизировать указывающую на него ссылку рис. Если ключевые слова были выбраны неудачно, то список адресов документов может быть слишком большим может содержать десятки и даже сотни тысяч ссылок. Для того чтобы уменьшить список, можно в поле поиска ввести дополнительные ключевые слова или воспользоваться каталогом поисковой системы. Одной из наиболее полных и мощных поисковых систем является Google www. В Рунете российской части Интернета обширные базы данных, содержащие по миллионов документов, имеют поисковые системы Яndех www. Поиск в иерархической системе каталогов. В базе данных поисковой системы Web-сайты группируются в иерархические тематические каталоги , которые являются аналогами тематического каталога в библиотеке. Тематические разделы верхнего уровня, например: Интернет, Компьютеры, Наука и образование и т. Например, каталог Интернет может содержать подкаталоги Поиск, Почта и др. Поиск информации в каталоге сводится к выбору определенного каталога, после чего пользователю будет представлен список ссылок на Интернет-адреса наиболее посещаемых и содержательных Web-сайтов. Каждая ссылка обычно аннотирована, т. Наиболее полный многоуровневый иерархический тематический каталог русскоязычных Интернет-ресурсов имеет поисковая система Апорт www. Каталог содержит подробную аннотацию содержания Web-сайтов и указание на их географическое положение. Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы, в том числе поисковая система FileSearch www. Для поиска файла необходимо ввести имя файла в поле поиска, и поисковая система выдаст Интернет-адреса серверов файловых архивов, на которых хранится файл с заданным именем. Поиск информации в русскоязычной части Интернета с помощью наиболее поисковых систем: Google, Rambler, Апорт, Япс1ех и файловой поисковой системы Research можно производить с использованием интегрированной поисковой системы Gogle. Для этого достаточно ввести ключевые слова в строку поиска, с помощью переключателей установить тип необходимой информации и щелкнуть по кнопке с названием поисковой системы Gogle. Для этого достаточно ввести ключевые слова в строку поиска, с помощью переключателей установить тип необходимой информации и щелкнуть по кнопке с названием поисковой системы. Интернет в целом и Всемирная паутина, в частности, предоставляют абоненту доступ к тысячам серверов и миллионам Web-страниц, на которых хранится невообразимый объем информации. Как не потеряться в этом 'информационном океане'? Для этого необходимо научиться искать и находить нужную информацию в сети. Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа. Это наименее удобный способ, так как с его помошыо можно искать документы, только близкие по смыслу текущему документу. Если текущий документ посвящен, например, музыке, то, используя гиперссылки этого документа, вряд ли можно будет попасть на сайт, посвященный спорту. Обращение к поисковому серверу поисковой системе. Использование поисковых серверов - наиболее удобный способ поиска информации. В настоящее время в русскоязычной части Интернета популярны следующие поисковые серверы: Существуют и другие поисковые системы. Например, эффективная система поиска реализована на сервере почтовой службы mail. Наиболее доступным и удобным способом поиска информации во Всемирной паутине является использование поисковых систем. При этом поиск информации можно осуществлять по каталогам, а также по набору ключевых слов, характеризующих отыскиваемый текстовый документ. Рассмотрим использование поисковых серверов более подробно. Поисковый сервер содержит большое количество ссылок на самые различные документы, и все эти ссылки систематизированы в тематические каталоги. Причем эти ссылки устанавливаются сервером самостоятельно, в автоматическом режиме путем регулярного просмотра всех появляющихся во Всемирной паутине Web-страниц. Кроме того, поисковые серверы предоставляют пользователю возможность поиска информации по ключевым словам. После ввода ключевых слов поисковый сервер начинает просматривать документы на других Web-серверах и выводить на экран ссылки на те документы, в которых встретились указанные слова. Обычно результаты поиска сортируются по убыванию специального рейтинга документов, который показывает, насколько полно заданный документ отвечает условиям поиска или насколько часто он запрашивается в сети. Группа ключевых слов, сформированная по определенным правилам - с помощью языка запросов, называется запросом к поисковому серверу. Языки запросов к разным поисковым серверам очень похожи. Подробнее об этом можно узнать, посетив раздел 'Помощь' нужного поискового сервера. Рассмотрим правила формирования запросов на примере поисковой системы Яndex. Лучше не вводить ключевые слова с прописной буквы, так как это может привести к тому, что не будут найдены те же слова, написанные со строчной буквы. Если в итоге поиска вы не получили никаких результатов, проверьте, нет ли в ключевых словах орфографических ошибок. Современные поисковые системы предоставляют возможность подключения к сформированному запросу семантического анализатора. С его помощью можно, введя какое-либо слово, выбрать документы, в которых встречаются производные от этого слова в различных падежах, временах и пр. Сравнить результаты поиска документов по ключевому слову с использованием различных поисковых систем воспользоваться интегрированной поисковой системой Gogle. Найти на серверах файловых архивов файл мультимедиа проигрывателя WinAmp. У Вас есть материал пишите нам.

Нормы гто 2017 таблица для детей

Как сделать дневник на русском

Осуществление поиска информации в тексте, файловых структурах, базах данных, сети Интернет

Сколько разв день надо кормить птенцов

Материнская плата asus p5kpl инструкция

Статья 'Поисковые возможности системы ГАРАНТ'

Бульдозер sd7 технические характеристики

Эхинацея композитум инструкция как часто применять

Report Page