Принципи роботи пошукових систем. Пошукові системи в інтернеті

8 0 Новини високих технологій

В інтернеті, на різних сайтах користувачеві пропонується великий обсяг різної інформації. Для отримання необхідних відомостей, пошуку відповідей на запитання створені пошукові системи. Почувши це словосполучення, багато думають про Google, «Яндекс». Однак пошукових систем в інтернеті набагато більше.

Що таке пошукова система

Пошуковою системою прийнято вважати програмне забезпечення, яке складається з бази даних документів. Користувачам надається спеціальний інтерфейс, який дозволяє вводити потрібні запити і отримувати посилання з відповідною інформацією. На перші позиції в результатах пошуку виходять завжди документи, які максимально відповідають тому, що шукає конкретна людина.


Пошукова видача, яка формується у відповідності з введеним запитом звичайно містить різні типи результатів. В ній можуть бути присутніми інтернет-сторінки, відео - і аудіофайли, картинки, pdf-файли, конкретні товари (якщо пошук здійснюється по інтернет-магазину).
Принципи роботи пошукових систем. Пошукові системи в інтернеті

Класифікація пошукових систем

Існуючі пошукові системи класифікуються на декілька видів. У першу чергу варто назвати традиційні пошукові системи. У таких пошукових систем принципи роботи орієнтовані на пошук інформації на величезному кількість існуючих сайтів. Пошукові системи ще бувають на окремих інтернет-ресурсах:
  • в інтернет-магазинах (для пошуку потрібних товарів);
  • на форумах і блогах (для пошуку повідомлень);
  • на інформаційних сайтах (для пошуку статей на потрібну тематику новин) і т. д.
  • Пошукові системи ще підрозділяють з урахуванням географічної ознаки. У такій класифікації є 3 групи пошукачів:


  • Глобальні. Пошук ведеться по всьому світу. Лідером у цій групі є пошуковик Google. Раніше існували такі пошукові системи, як Inktomi, AltaVista і інших
  • Регіональні. Пошук здійснюється по країні або групі країн, яких об'єднує одна мова. Регіональні пошукові системи широко поширені. Їх приклад в Росії – «Яндекс, Rambler.
  • Місцеві. Пошук ведеться в конкретному місті. Приклад такої пошукової системи – «Томськ.ру».
  • Складові елементи пошукачів

    В будь-якому пошуковику можна виділити 3 складових елемента, що визначають принципи роботи пошукової системи:
  • робота (індексатора, спайдера, краулера);
  • базу даних;
  • оброблювача запитів.
  • Робот – це спеціальна програма, призначення якої полягає в формуванні бази даних. У базі даних зберігається і сортується вся зібрана інформація. Обробник запитів, званий клієнтом, який працює з особливими запитами. Він має доступ до бази даних. Не завжди клієнт розташовують на одному комп'ютері. Обробник запитів буває рознесений по кільком фізично не пов'язаним електронно-обчислювальних машин.
    Принципи роботи пошукових систем. Пошукові системи в інтернеті

    Принципи роботи пошукових систем

    Всі існуючі системи працюють за єдиним принципом. Розглянемо, наприклад, функціонування традиційних пошукових систем, призначених для інтернету. Функціонування робота схоже з діями користувача. Ця програма періодично обходить всі сайти, додає нові сторінки і інтернет-ресурси в базу даних. Даний процес називається індексацією.
    Коли користувач в інтернеті в пошуковий рядок вводить певний запит, починає працювати клієнт. Програма звертається до існуючої бази даних і за ключовими словами формує видачу. Посилання пошукова система надає користувачеві у певній послідовності. Вони сортуються за мірою відповідності запиту, тобто враховується релевантність. У кожного пошукача свій спосіб визначення релевантності. Якщо користувач відправить конкретний запит в різні системи, то він отримає не зовсім однакові видачі. Алгоритм визначення релевантності зберігається в секреті.
    Принципи роботи пошукових систем. Пошукові системи в інтернеті

    Детальніше про релевантності

    Якщо говорити простими словами, то релевантністю називається відповідність введеного в пошук слова або сполучення слів конкретних посилань у видачі. На позиції документів у списку впливає кілька нюансів:
  • Наявність слів, введених в пошук, в документах. Цей нюанс очевидний. Якщо в документі є слова з введеного користувачем запиту, то це означає, що даний документ відповідає умовам пошуку.
  • Частота входження слів. Чим частіше вживаються ключові слова в документі, тим він буде вище в списку видачі. Однак не все так просто. Занадто часте вживання слів може бути ознакою неякісного контенту для пошукової машини.
  • Алгоритм визначення релевантності досить складний. Кілька років тому у видачу могли потрапляти посилання, що містять потрібні ключові слова, але при цьому не відповідні їм за змістом. В нині принципи роботи пошукових систем ускладнені. Тепер роботи можуть аналізувати повністю весь текст. В роботу пошуковців закладений облік величезної кількості різних факторів. Завдяки цьому видача формується з найбільш якісних, релевантних посилань.

    Як правильно формулювати запити

    Ще в школі нас вчили правильно задавати питання. Від цього залежить те, які відповіді ми будемо отримувати. Однак це правило не потрібно дотримуватися при використанні пошукових систем. Для сучасних пошукачів не грає ніякої ролі те, в якому числі або відмінку пише людина свій запит. У будь-якому випадку видача буде включати в себе однакові результати. Чітке формулювання питання пошуковим системам не потрібна. Користувачеві потрібно тільки правильно підбирати ключові слова. Розглянемо приклад. Нам потрібно знайти текст пісні «День без тебе», яку виконує відома жіноча поп-група «Віа-Гра». При зверненні в пошукову систему необов'язково називати групу, вказувати, що це пісня. Достатньо написати «день без тебе». Дотримуватися регістри, знаки пунктуації не потрібно. Ці нюанси не враховуються пошуковими системами.
    Принципи роботи пошукових систем. Пошукові системи в інтернеті

    Рейтинг пошукових систем у світі

    Провідною пошуковою системою в світі є Google. Вона була заснована в 1998 році. Система дуже популярна, що підтверджується аналітичними даними. Близько 70 % запитів, що надходять в інтернет, обробляє саме Google. База пошуковика величезна. Проіндексовано понад 60 трильйонів різних документів. Google приваблює користувачів простим інтерфейсом. На головній сторінці розміщені логотип і рядок пошуку. Ця особливість дозволяє назвати Google одним з найбільш мінімалістичних пошуковиків.

    На другому місці в рейтингу популярних пошукових систем знаходиться Bing. Вона з'явилася в тому ж році, що і Google. Творцем цього пошуковика є відома міжнародна корпорація Microsoft. Більш низькі позиції в рейтингу займають Baidu, Yahoo!, AOL, Excite, Ask.
    Принципи роботи пошукових систем. Пошукові системи в інтернеті

    Що популярно в Росії

    Серед пошукових систем в Росії найбільшою популярністю користується «Яндекс». Цей сервіс з'явився в 1997 році. Перший час їм займалася російська компанія CompTek International. Трохи пізніше з'явилася компанія «Яндекс», яка продовжила займатися пошуковою системою. Пошуковик за роки існування завоював величезну популярність. В ньому можливий пошук на декількох мовах – російською, білоруською, українською, татарською, казахському, англійською, німецькою, французькою, турецькою. Із статистичних даних відомо, що «Яндекс» цікавий понад 50% користувачів рунету. Більше 40 % людей вважають за краще Google. Приблизно 3% користувачів зупинили свій вибір на Mail.ru – російськомовному інтернет-порталі.
    Принципи роботи пошукових систем. Пошукові системи в інтернеті

    Захищені пошуковики

    Звичайні пошукові системи, які є звичними для нас, не зовсім підходять дітям. Юні користувачі інтернету можуть випадково знайти якісь матеріали для дорослих, інформацію, здатну зашкодити психіці. З цієї причини були створені спеціальні захищені пошукові системи. В їх базах зберігається тільки безпечний контент для дітей.
    Приклад одного такого пошукача – «Супутник.Діти». Цей сервіс є досить молодим. Його створила компанія «Ростелеком» в 2014 році. Головна сторінка пошуковика яскраво і цікаво оформлена. На ній представлено широкий перелік вітчизняних і зарубіжних мультфільмів для дітей різних віків. Додатково на головній сторінці розміщені пізнавальні посилання, що відносяться до декількох рубрик – «Спорт», «Хочу все знати», «Зроби сам», «Ігри», «Технології», «Шкільне», «Природа». Інший приклад захищеної дитячої пошукової системи – Agakids.ru. Це абсолютно безпечний ресурс. Як працює пошукова система? Робот налаштований таким чином, що він обходить тільки ті сайти, які відносяться до дитячої тематики або є корисними для батьків. В базу пошукової машини потрапляють ресурси з мультфільмами, книгами, навчальною літературою, іграми, розмальовками. Батьки, використовуючи Agakids.ru, можуть для себе знаходити сайти по вихованню, здоров'ю дітей.
    Принципи роботи пошукових систем. Пошукові системи в інтернеті
    На закінчення варто відзначити, що пошукові системи – це складні системи. Перед ними стоїть безліч проблем – проблеми спаму, визначення релевантності документів, відсіювання неякісного контенту, аналізу документів, що не містять текстової інформації. З цієї причини в роботу пошукових систем інтернету розробники впроваджують нові підходи, алгоритми, що є комерційною таємницею.