5.6.Засоби пошуку інформації в Інтернеті

Пошукові служби
За роки існування Інтернету на серверах мережі накопичились і продовжують накопичуватися великі обсяги інформаційних ресурсів. Якщо користувачу потрібна деяка інформація, а він не знає адреси її розміщення в Інтернеті, то способи пошуку можуть бути різними. Можна шукати, подорожуючи гіперпосиланнями з однієї веб%сторінки на іншу, але це займе багато часу і не гарантує позитивного результату. Інша можливість – звернутися до послуг пошукових служб.
Пошукові служби надають засоби зручного пошуку веб-сторінок з потрібними даними. Звертаючись до цих служб, користувач формулює запит на пошук даних – пошуковий запит, який передається на сервер пошукової служби. На сервері запит опрацьовують спеціальні програми – інформаційно-пошукові системи. Їх задача – знайти у своїй базі даних записи, що відповідають запиту. У результаті користувач отримує перелік посилань на веб-сторінки, на яких можна знайти потрібні дані.
За принципом дії розрізняють кілька видів пошукових служб. Найбільш поширеними є веб-каталоги та пошукові системи.


Вебкаталоги
Вебкаталоги (інша назва тематичні каталоги) містять базу даних посилань на веб-сайти, які розподілені на окремі тематичні рубрики.
Наприклад, до однієї рубрики віднесені усі посилання, що стосуються подорожей, до іншої – комп’ютерів, до третьої – бізнесу тощо.
У свою чергу, кожна рубрика поділяється на підрубрики. Так, у рубриці Бізнес можна виділити підрубрики Промисловість, Будівництво, Транспорт тощо.

Веб-каталоги бувають:
універсальними, що містять посилання на веб-сайти з різних частин світу з різноманітною тематикою,
територіальними, що охоплюють веб-ресурси країни, області або міста;
спеціалізованими, що містять посилання на веб%сайти певної спрямованості – літературні, науково-технічні, комерційні, освітні тощо.
Окремі пошукові каталоги поруч із посиланнями на ресурс надають оцінку його популярності у користувачів. Такі каталоги називають рейтинговими системами.
Заповнюють базу даних каталогу, як правило, вручну працівники служби. Вони переглядають веб-сторінки, обирають ті, що на їх погляд можуть представляти інтерес для користувачів Інтернету, заносять URL-адреси таких веб-сторінок з коротким описом до відповідної рубрики бази даних.
Один і той самий сайт може бути віднесений до кількох рубрик. Число сайтів в Інтернеті величезне, тому при ручному опрацюванні веб-сторінок база даних інформаційно%пошукової системи веб-каталогів наповнюється й оновлюється досить повільно. Власники сайтів для популяризації своїх ресурсів можуть самостійно зареєструвати свій сайт у веб-каталогах.
Існує багато веб-каталогів, у тому числі українські Мета (http://meta.ua), UAport(http://uaport.net), Пошук (http://www.poshuk. com), Холмс(http://holms.ukrnet.net), UkraiNet (http://www.ukrainet.com.ua/ukr) та інші.

У різних каталогах рубрики можуть називатися по різному, бази даних можуть суттєво відрізняться за обсягом, працівниками пошукових служб можуть опрацьовуватися різні ресурси Всесвітньої павутини. Тому результати пошуку на різних веб-каталогах будуть відрізнятися один від одного. Якщо потрібна інформація не знайдена в одному тематичному каталозі, то можна спробувати її знайти в іншому.
Для пошуку інформації з використанням веб%каталогу користувачу потрібно виконати таку послідовність дій:
1. Визначити тему, за якою здійснюватиметься пошук.
2. Вибрати на сторінці тематичного каталогу рубрику, яка найбільше відповідає темі.
3. Прочитати описи посилань на сторінці, що відкрилася.
4. Якщо знайдено посилання, яке відповідає темі, то використати його для відкриття відповідної веб%сторінки, інакше уточнити тему і повторити пошук у цій або іншій пошуковій службі.
Розглянемо, наприклад, як здійснити пошук за темою Штучний інтелект, використовуючи тематичний каталог українського порталу Мета.
Це одна з найстаріших та найбільших в Україні пошукових служб, яка веде каталог веб-ресурсів з 1998 р.  На головній сторінці порталу Мета на вкладці Україна наведений перелік рубрик веб-каталогу. Ресурси, посилання на які включені до цих рубрик, переважно україномовні та російськомовні.
Для здійснення пошуку вибираємо послідовно назви рубрик, звужуючи область пошуку: Наука та Освіта, Наукові дисципліни, Точні науки.
Після вибору кожного посилання відкривається чергова сторінка з переліком підрубрик і посиланнями на веб-сайти. На останній сторінці наведені перші десять гіперпосилань на сайти з рубрики Точні науки. Два сайти стосуються теми Штучний інтелект: Розпізнавання образів та штучний інтелект (http://www.ocrai.narod.ru) і  Штучний інтелект (http://ai-blog.org). Серед інших посилань також можуть бути такі, що відповідають темі. Кожне гіперпосилання супроводжується коротким описом змісту сайта та його URL-адресою.

Пошукові системи
Інший вид пошукових служб – пошукові системи, які також називають індексними базами данихабо пошуковими покажчиками.
Бази даних пошукових систем містять значно більше посилань на веб-сторінки, ніж бази даних тематичних каталогів. Це досягається завдяки тому, що опрацювання веб-сторінок виконують не люди, а спеціальні програми, які називають пошуковими роботами. Ці програми переглядають вміст веб-сторінок, визначають слова, які найчастіше зустрічаються у тексті та зберігають результати опрацювання вмісту сторінок у базі даних пошукової системи.
Існує багато пошукових систем. За даними компанії Bigmir-Internet в українських користувачів найбільш популярними є пошукові системи Google (http://google.com.ua),  Яндекс (http://yandex.ru),  Рамблер (http://rambler.ru), I.UA (http://i.ua) тощо. Такі портали як Мета (http://meta.ua), Український портал (http://uaportal.com), Bigmir)net (http://www.bigmir.net) та інші надають послуги як тематичного каталогу, так і пошукової системи.
Запити до пошукових систем містять ключові слова та словосполучення, які добирають користувачі, щоб коротко й якомога точніше охарактеризувати тему, за якою здійснюється пошук. Для введення ключових слів і словосполучень на веб-сторінках пошукових систем користувачам надаються спеціальні поля


У відповідь на запит користувача пошукова система переглядає власну базу даних та виводить перелік посилань на веб-сторінки, у тексті яких зустрічаються слова з пошукового запиту і які відповідають іншим умовам пошуку.
У змаганні за популярність пошукові системи намагаються надати якомога більше послуг своїм користувачам. Серед них:

  • пошук ресурсів не лише за точним формулюванням пошукового запиту, а й з урахуванням різних форм слів, їх синонімів;
  • складний (розширений) пошук: за точною фразою, з обов’язковими чи забороненими словами, за датою публікації сторінок тощо;
  • пошук різних видів повідомлень та об’єктів – зображень, новин, блогів, мап, музики, відео тощо;
  • пошук сторінок за регіональними ознаками – певною мовою або зареєстрованих у визначених територіальних доменах;
  • створення власних сторінок користувачів і користувацької пошукової системи;
  • перевірка правопису та переклад веб-сторінок;
  • пошук означень в енциклопедіях;
  • пошук інших сторінок, які посилаються на задану сторінку та інші.

Для пошуку інформації з використанням пошукової системи користувачу потрібно виконати такий алгоритм:

1. Сформулювати ключові слова або словосполучення, за якими здійснюватиметься пошук.
2. Увести ключові слова або словосполучення в поле для введення пошукового запиту на сторінці пошукової системи.
3. Вибрати кнопку Пошук або натиснути клавішу Enter.
4. Переглянути описи посилань з отриманого списку.
5. Якщо знайдено посилання, що відповідає темі, то використати його для відкриття відповідної веб-сторінки, інакше уточнити ключові слова або словосполучення та повторити пошук у цій або іншій пошуковій системі.
Розглянемо, як здійснюється пошук інформації з теми Штучний інтелект у пошуковій системі Google (http://www.google.com.ua). Це одна з найбільших у світі пошукових систем, до того ж її послуги можуть надаватися українською мовою.
Як ключове словосполучення для пошуку можна вибрати штучний інтелект, якщо нас цікавить загальна інформація про цю наукову галузь.
У пошуковій системі Google результат не залежить від того, великими чи маленькими літерами введені ключові слова.

На головній сторінці веб-сайта в поле для введення пошукового запиту введемо ключове словосполучення та виберемо кнопку Пошук. Менш ніж за секунду в базі даних служби Google буде виконаний пошук і відкриється сторінка з результатами. На цій сторінці наводиться список гіперпосилань, кожне з яких супроводжується фрагментом вмісту веб-сторінки. У ньому виділені слова, що входять до пошукового запиту. Для кожного посилання вказана URL-адреса веб-сторінки. В окремому рядку відображається кількість знайдених посилань, що відповідають пошуковому запиту.
Результати пошуку виводяться групами по 10 посилань на сторінку. На початку списку розміщені посилання на ті веб-сторінки, у яких найчастіше зустрічаються слова з пошукового запиту або до яких найбільше зверталися користувачі. Таким чином, можна очікувати, що серед перших десяти посилань будуть такі, що найбільше відповідають побажанням користувача. Перед гіперпосиланням може бути вказаний тип документа: [PDF], [DOC], [RTF] тощо. При виборі такого посилання залежно від налаштувань браузера або відкривається вікно відповідної прикладної програми та в нього завантажується документ, або з’являється діалогове вікно Завантаження файлу з пропозицією відкрити або зберегти документ.

Кількість знайдених посилань може бути великою, але це не означає, що всі вони відповідають темі. Так, на окремих веб-сторінках, на які є посилання за пошуковим запитом штучний інтелект, зустрічаються обидва ключові слова, але не обов’язково, що у тексті вони стоять поруч. Можливо, на одній сторінці згадується не штучний інтелект, а штучний газон та інтелект нації тощо.  Для переходу на іншу сторінку з результатами пошуку слід вибрати її номер у списку номерів або посилання Уперед у нижній частині сторінки.

Якщо результати пошуку не містять потрібної інформації, то це означає, що користувач невдало сформулював пошуковий запит або в пошукової служби недостатня база даних.

Стратегії пошуку
Вибір засобів пошуку залежить від даних, які хоче отримати користувач. Якщо вас цікавлять загальні питання з деякої теми (наприклад, загальні уявлення про заходи для школярів, які проводяться в Україні), їх доцільніше шукати у тематичних каталогах. Спеціалізовані веб-каталоги використовують для пошуку відповіді на вузькоспеціалізовані питання (наприклад, принцип дії адронного коллайдера).
У випадку, коли питання більш конкретне (наприклад, умови проведення Інтернет%олімпіад для школярів з фізики), можна скористатися пошуковою системою. Кожна пошукова система пропонує власні засоби для того, щоб зробити пошук більш влучним, і містить сторінку з поясненням правил пошуку.
Кілька правил стосуються позначень у записі ключових слів і словосполучень. Якщо для пошукового запиту використати словосполучення, то до результату потраплять посилання на всі сторінки, в тексті яких зустрічається кожне з слів словосполучення. Змінити результат можна, якщо використати певні позначення. Деякі з них наведені в таблиці 5.6.

  • Інтернет– пошук серед сторінок в усій мережі;
  • сторінки українською мовою– пошук серед сторінок заданою мовою;
  • сторінки з України – пошук серед сторінок домену ua.

Після отримання великої кількості посилань за пошуковим запитом, можна доповнити запит уточнюючими словами та виконати пошук лише серед знайдених сторінок. Для цього потрібно:
1. Вибрати посилання Пошук серед знайденого в нижній частині сторінки.
2. Увести слова, які уточнюють запит, у поле введення пошукового запиту у вікні, що відкриється.
3. Вибрати кнопку Пошук серед знайденого.
Подальше уточнення приводить до зменшення числа посилань та отримання більш релевантного результату пошуку.
Конкретизувати запит можна ще більше, обравши посилання Складний пошук.
Наведемо приклад міркувань при виборі стратегії пошуку. Якщо нас цікавлять подробиці сонячного затемнення, яке бачили влітку 2008 р.
мешканці України та Росії, то для проведення пошуку та складання пошукового запиту можна міркувати так:

  • питання не надто загальне, але й не вузько спеціалізоване, тому для пошуку можна використовувати пошукову систему;
  • у питанні кілька складових, тому варто застосувати складний пошук;
  • слова сонячне затемнення є словосполученням, яке не можна роз’єднувати, тому їх варто використати як точну фразу;
  • затемнення спостерігали мешканці України і Росії, тому нам потрібне хоча б одне зі слів Україна або Росія;
  • у полі з усіма словами введемо слово спостерігали, оскільки нас цікавить подія, яка вже відбулася;
  • дата завантаження повинна охоплювати літо 2008 р.;
  • мова сторінок– українська.

Врахувавши ці міркування, заповнимо форму складного пошуку. У результаті проведеного пошуку всі 10 перших посилань зв’язані з веб-сторінками, які містять опис, фотографії та відео сонячного затемнення, що відбулося 1 серпня 2008 року. Як правило, це публікації в Інтернет-виданнях і на сторінках новин українських порталів.

Пошук зображень
Багато пошукових систем дають змогу здійснювати пошук даних певних видів: зображення, відео, новини, мапи, словники, записи у блогах тощо.
Розглянемо можливості пошуку зображень, які надає пошукова система Google. У верхній частині веб-сторінки міститься група посилань для вибору виду ресурсів.

Якщо вибрати вид ресурсу Зображення, ввести ключове слово або словосполучення та вибрати кнопку Пошук зображення, то буде здійснюватися пошук зображень, що містяться на веб-сторінках і в підписах до яких зустрічаються ключові слова. На сторінці з результатами відображаються ескізи малюнків.
Після вибору ескізу відкривається вікно пошукової системи (рис. 5.49), у верхній частині якого відтворено ескіз та наведені дані про нього:
URL-адреса файлу, розміри зображення та файлу, попередження про авторські права на зображення. У нижній частині вікна виводиться веб-сторінка, на якій міститься зображення.
Вибір гіперпосилання Зображення в повний розмір,що розміщено поруч з ескізом, приводить до виведення зображення реального розміру.
Саме в цьому вікні варто виконувати зберігання знайденого зображення.
Завдяки цьому буде забезпечена максимальна якість зображення.


Оцінювання веб-ресурсів
До даних, які ви отримали в результаті пошуку в Інтернеті, слід ставитися критично, не сприймати як абсолютну істину все, що написане та
зображене на веб-сторінках.
Розмістити статтю у Всесвітній павутині може будь-який користувач Інтернету. Ці дані ніким не контролюються та не перевіряються, а тому вони можуть бути недостовірними (містять хибні твердження) та суб’єктивними (особиста точка зору). Крім того, частина сайтів в Інтернеті були створені давно і з часом не оновлювалися. Деякі дані можуть виявитися неактуальними, застарілими. Варто пам’ятати і про те, що часто на веб-сторінках розміщують рекламні матеріали та й такі, що виражають упереджені інтереси окремих людей або соціальних груп. Почастішали випадки використання ресурсів Інтернету з метою шахрайства: отримання особистих даних (адреси, місця роботи батьків), паролів доступу до фінансових документів тощо.
Щоб впевнитися в тому, чи можна довіряти даним з веб-сайта, варто звертати увагу на таке:

  • Чи вказано, для кого призначений веб-сайт та яка мета його створення?
  • Чи наведені на веб-сторінці дані про автора та чи достатньо його кваліфікації для написання даного матеріалу?
  • Чи можна перевірити дані, що містяться на сторінці, даними з інших джерел? Чи є на них посилання в статті?
  • Чи містяться на веб-сторінці контактні дані, за якими автору сторінки можна поставити запитання?
  • Наскільки регулярно оновлюються дані на веб%сайті? Чи не застаріла дата розміщення статті?
  • Дані подаються з однієї точки зору чи наведено порівняння різних поглядів?
  • Чи узгоджуються отримані дані з тим, що ви вивчали у школі або про що дізналися з інших джерел?
  • Чи не вимагають розробники веб-сторінки введення ваших особистих даних?

Последнее изменение: Четверг, 25 Июль 2013, 10:14