Ким було запропоновано всесвітнє павутиння. Всесвітнє павутиння (www). Адреси та протоколи
Все більшого місця в нашому житті займає Інтернет. Ще жодна технологія, створена людиною, не набула такої широкої популярності. Інтернет - Всесвітнє павутиння, яке охоплює всю земну кулю, огортаючи її мережею з телевеж. Свою популярність він почав набувати ще відносно далеких 1990-х років. У статті ми й обговоримо, звідки він узявся і чому став такий популярний.
Інтернет як Всесвітнє павутиння
Друга назва такого плану припала неспроста. Справа в тому, що Інтернет поєднує безліч користувачів по всьому світу. Подібно до мережі павука, він огортає всю земну кулю своїми нитками. І це не проста метафора, так і є насправді. Інтернет являє собою дроти та бездротові мережі, другі з яких нам не видно.
Але це ліричний відступ, насправді Інтернет пов'язаний із Всесвітнім павутинням (www, або Word Wide Web). Вона охоплює всі комп'ютери, підключені до Мережі. На віддалених серверах користувачі зберігають потрібну інформацію і можуть спілкуватися в Мережі. Нерідко під цією назвою розуміють Всесвітню чи Глобальну мережі.
Вона базується на кількох особливо важливих протоколах, типу TCP/IP. Завдяки Інтернету Всесвітня павутина, або інакше Word Wide Web (WWW) здійснює свою діяльність, тобто передає та отримує дані.
Кількість користувачів
Наприкінці 2015 року було проведено дослідження, на підставі якого отримано такі дані. Кількість користувачів Інтернету в усьому світі становить 3,3 мільярда людей. А це майже 50% від усього населення нашої планети.
Таких високих показників було досягнуто завдяки поширенню стільникових мереж 3G і високошвидкісної 4G. Важливу роль відіграли провайдери завдяки масовості впровадження інтернет-технологій, зменшилися витрати на утримання серверів та виготовлення оптоволоконних кабелів. У більшості країн Європи швидкість інтернету вища, ніж у країнах Африки. Це пояснює технічним відставанням останньої та неширокої затребуваністю послуги.
Чому Інтернет називають Всесвітнім павутинням?
Як це не парадоксально, але багато користувачів впевнені, що вказаний вище термін і Інтернет - це одне і теж. Ця глибока помилка, що витає в головах багатьох користувачів, викликана схожістю понять. Зараз ми розберемося, що до чого.
Всесвітня павутина найчастіше плутається зі схожим словосполученням "Всесвітня мережа". Вона є певним інформаційним обсягом, що базується на основі технології інтернету.
Історія World Wide Web
До кінця 90-х у світі остаточно затверджується домінація NSFNet над технологією ARPANET. Як не дивно, але їхньою розробкою займався один науковий центр. На замовлення військового міністерства США було розроблено ARPNET. Так, першими, хто скористався Інтернетом, були військові. А технологія NSFNet розроблялася незалежно від державних служб практично на чистому ентузіазмі.
Саме конкуренція між двома розробками стала ґрунтом для їх подальшого розвитку та масового впровадження у світ. Всесвітня мережа Інтернет стала доступна широким масам в 1991 році. Вона мала якось працювати, і розробкою системи для Інтернету зайнявся Бернерс Лі. За два роки успішної роботи він створив гіпертекст, або HTTP, знамениту електронну мову HTML та URL. Нам не треба вдаватися до подробиць, адже зараз ми їх бачимо як звичайні посилання для адрес сайтів.
Інформаційний простір
Насамперед це інформаційний простір, доступ до якого здійснюється за рахунок Інтернету. Вона дозволяє користувачеві мати доступ до даних на серверах. Якщо використовувати наочно-подібний спосіб, то Інтернет – це об'ємний циліндр, а Всесвітнє павутиння – це те, що його заповнює.
За допомогою програми, званої "браузер", користувач отримує доступ до Інтернету для серфа за Павутиною. Вона складається з безлічі сайтів, які базуються на серверах. Вони підключені до комп'ютерів та відповідають за збереження, завантаження, перегляд даних.
Павукові мережі та сучасна людина
В даний час Homo sapiens у розвинених країнах практично повністю інтегрувалися зі Світовою мережею. Не йдеться про наших дідусів з бабусями чи про віддалені села, де й знати не знають про якийсь Інтернет.
Раніше людина у пошуках інформації вирушала прямісінько до бібліотеки. І часто траплялося, що потрібної книжки не було, тоді доводилося їхати до інших закладів з архівами. Зараз потреба в подібних маніпуляціях відпала.
У біології всі назви видів складаються з трьох слів, наприклад наша повна назва Homo sapiens neanderthalensis. Зараз можна сміливо додати четверте слово internetiys.
Інтернет захоплює уми людства
Погодьтеся, ми черпаємо практично всю інформацію з Інтернету. У наших руках перебувають тонни інформації. Розкажи про таке нашому предку, він би жадібно уткнувся в екран монітора і просидів би там увесь свій вільний час у пошуках інформації.
Саме Інтернет вивів людство на принципово новий рівень, він сприяє створенню нової культури – змішаної чи мульти. Представники різних народів мімікрірують і пристосовуються, наче зливаючи свої звичаї в один казан. Звідки потім виходить підсумковий продукт.
Особливо він корисний для науковців, більше немає потреби збиратися на консиліумах у країні, яка знаходиться за 1000 км від вашої. Ви можете обмінятися досвідом без особистої зустрічі, наприклад, через месенджери або соціальні мережі. А якщо важливе питання треба обговорити, можна зробити це через Skype.
Висновок
Всесвітнє павутиння – це складова Інтернету. Її робота забезпечена завдяки серверам-сховищам, які надають інформацію користувачеві на його запит. Сама Мережа була розроблена завдяки вченим із США та їхньому ентузіазму.
Всесвітнє павутиння Роботу виконав: Джамбулатов Альберт 11»А» Вчитель: Чернова Анна Петрівна
Всесвітнє павутиння (англ. World Wide Web) - розподілена система, що надає доступ до пов'язаних між собою документів, розташованих на різних комп'ютерах, підключених до Інтернету. Для позначення Всесвітньої павутини також використовують слово веб (англ. web "павутина") та абревіатуру WWW.
Всесвітнє павутиння утворюють сотні мільйонів веб-серверів. Більшість ресурсів Всесвітньої павутини ґрунтуються на технології гіпертексту. Гіпертекстові документи, що розміщуються у Всесвітньому павутинні, називаються веб-сторінками. Декілька веб-сторінок, об'єднаних спільною темою, дизайном, а також пов'язаних між собою посиланнями і зазвичай знаходяться на тому самому веб-сервері, називаються веб-сайтом. Для завантаження та перегляду веб-сторінок використовуються спеціальні програми – браузери (англ. browser).
Всесвітня павутина викликала справжню революцію в інформаційних технологіях та вибух у розвитку Інтернету. У повсякденному мовленні, говорячи про Інтернет, часто мають на увазі саме Всесвітню павутину. Однак важливо розуміти, що це не одне й те саме.
Історія: Винахідниками всесвітньої павутини вважаються Тім Бернерс-Лі і, меншою мірою, Роберт Кайо. Тім Бернерс-Лі є автором технологій HTTP, URI/URL та HTML. У 1980 році він працював у Європейській раді з ядерних досліджень (фр. conseil européen pour la recherche nucléaire, CERN) консультантом із програмного забезпечення. Саме там, у Женеві (Швейцарія), він для власних потреб написав програму «Енквайр» (англ. Enquire, можна вільно перекласти як «Дозвідник»), яка використовувала випадкові асоціації для зберігання даних і заклала концептуальну основу для Всесвітньої павутини.
У 1989 році, працюючи в CERN над внутрішньою мережею організації, Тім Бернерс-Лі запропонував глобальний гіпертекстовий проект, тепер відомий як Всесвітня павутина. Проект мав на увазі публікацію гіпертекстових документів, пов'язаних між собою гіперпосиланнями, що полегшило б пошук та консолідацію інформації для вчених CERN. Для реалізації проекту Тімом Бернерсом-Лі (разом з його помічниками) були винайдені ідентифікатори URI, протокол HTTP та мова HTML. Це технології, без яких не можна собі уявити сучасний Інтернет. У період з 1991 по 1993 рік Бернерс-Лі удосконалив технічні специфікації цих стандартів та опублікував їх. Але все ж таки, офіційно роком народження Всесвітньої павутини треба вважати 1989 рік.
З 1994 року основну роботу з розвитку Всесвітньої павутини взяв на себе консорціум Всесвітньої павутини (англ. world wide web consortium, три літери W і C, W3C), заснований і досі очолюваний Тімом Бернерсом-Лі. Даний консорціум - організація, яка розробляє та впроваджує технологічні стандарти для Інтернету та Всесвітньої павутини. Місія W3C: «Повністю розкрити потенціал Всесвітнього павутиння шляхом створення протоколів та принципів, які гарантують довгостроковий розвиток Мережі». Дві інші найважливіші завдання консорціуму – забезпечити повну «інтернаціоналізацію Мережі» та зробити Мережу доступною для людей з обмеженими можливостями. W3C розробляє для Інтернету єдині принципи та стандарти (звані «рекомендаціями», англ. W3C recommendations), які потім впроваджуються виробниками програм та обладнання. Таким чином досягається сумісність між програмними продуктами та апаратурою різних компаній, що робить Всесвітню мережу більш досконалою, універсальною та зручною. Усі рекомендації консорціуму Всесвітньої павутини відкриті, тобто не захищені патентами і можуть впроваджуватись будь-якою людиною без жодних фінансових відрахувань консорціуму.
Безпека:Для кіберзлочинців Всесвітня павутина стала ключовим способом поширення шкідливого програмного забезпечення. Крім того, під поняття мережевої злочинності підпадають крадіжка особистих даних, шахрайство, шпигунство та незаконний збір відомостей про ті чи інші суб'єкти або об'єкти. Веб- вразливості, за деякими даними, нині перевершують за кількістю будь-які традиційні прояви проблем комп'ютерної безпеки; За оцінками Google, приблизно одна з десяти сторінок у Всесвітньому павутинні може містити шкідливий код. За даними компанії Sophos, британського виробника антивірусних рішень, більшість кібератак у веб-просторі відбувається з боку легітимних ресурсів, розміщених переважно в США, Китаї та Росії. Найбільш поширеним видом подібних нападів, за відомостями від тієї ж компанії, є SQL-ін'єкція - зловмисне введення прямих запитів до бази даних у текстові поля на сторінках ресурсу, що при недостатньому рівні захищеності може призвести до розкриття вмісту БД. Іншою поширеною загрозою, що використовує можливості HTML і унікальних ідентифікаторів ресурсів, для сайтів Всесвітньої павутини є міжсайтове виконання сценаріїв (XSS), яке стало можливим із введенням технології JavaScript і набрало обертів у зв'язку з розвитком Web 2.0 і Ajax - нові стандарти веб-дизайну. інтерактивних сценаріїв. За оцінками 2008 року, до 70% всіх веб-сайтів у світі були вразливі для XSS-атак проти їхніх користувачів.
Поширення: У період з 2005 по 2010 рік кількість веб-користувачів подвоїлася і досягла позначки двох мільярдів. Згідно з ранніми дослідженнями 1998 і 1999 років, більшість існуючих веб-сайтів не індексувалися коректно пошуковими системами, а сама веб-мережа виявилася більшою, ніж очікувалося. За даними на 2001 рік було створено вже понад 550 мільйонів веб-документів, більшість з яких, однак, знаходилися в межах невидимої мережі. За даними на 2002 рік було створено понад 2 мільярди веб-сторінок, 56,4% всього інтернет-вмісту було англійською мовою, після нього йшла німецька (7.7%), французька (5.6%) та японська (4.9%). Згідно з дослідженнями, що проводилися наприкінці січня 2005 року 75 різними мовами було визначено понад 11,5 мільярдів веб-сторінок, які були індексовані у відкритій мережі. За даними на березень 2009 року, кількість сторінок збільшилася до 25.21 мільярдів . 25 липня 2008 року інженери програмного забезпечення Google Джессе Альперт і Ніссан Хайай оголосили, що пошуковик Google засік понад мільярд унікальних URL-посилань.
Структура та принципи Всесвітнього павутиння
Всесвітнє павутиння навколо Вікіпедії
Всесвітнє павутиння утворюють мільйони веб-серверів мережі Інтернет, розташованих по всьому світу. Веб-сервер є програмою , яка запускається на підключеному до мережі комп'ютері та використовує протокол HTTP для передачі даних. У найпростішому вигляді така програма отримує по мережі HTTP-запит на певний ресурс, знаходить відповідний файл на локальному жорсткому диску і відправляє його по мережі комп'ютеру. Більш складні веб-сервери здатні динамічно розподіляти ресурси у відповідь HTTP-запит. Для ідентифікації ресурсів (найчастіше файлів або їх частин) у Всесвітньому павутинні використовуються однакові ідентифікатори ресурсів URI (англ. Uniform Resource Identifier). Для визначення місцезнаходження ресурсів у мережі використовують одноманітні локатори ресурсів URL (англ. Uniform Resource Locator). Такі URL-локатори поєднують у собі технологію ідентифікації URI та систему доменних імен DNS (англ. Domain Name System) - доменне ім'я (або безпосередньо -адреса в числовому записі) входить до складу URL для позначення комп'ютера (точніше - одного з його мережевих інтерфейсів), який виконує код потрібного веб-сервера.
Для огляду інформації, отриманої від веб-сервера, на клієнтському комп'ютері використовується спеціальна програма - веб-браузер. Основна функція веб-браузера – відображення гіпертексту. Всесвітня павутина нерозривно пов'язана з поняттями гіпертексту та гіперпосилання. Більшість інформації в Інтернеті є саме гіпертекст. Для полегшення створення, зберігання та відображення гіпертексту у Всесвітньому павутинні традиційно використовується мова HTML (англ. HyperText Markup Language), мова розмітки гіпертексту. Робота з розмітки гіпертексту називається версткою, майстра з розмітки називають веб-майстром або веб-майстром (без дефісу). Після HTML-розмітки гіпертекст, що вийшов, поміщається у файл, такий HTML-файл є основним ресурсом Всесвітньої павутини. Після того, як HTML-файл стає доступним веб-серверу, його починають називати веб-сторінкою. Набір веб-сторінок створює веб-сайт . До гіпертексту веб-сторінок додаються гіперпосилання. Гіперпосилання допомагають користувачам Всесвітньої павутини легко переміщатися між ресурсами (файлами) незалежно від того, є ресурси на локальному комп'ютері або на віддаленому сервері. Гіперпосилання веб-сервера засновані на технології URL.
Технології Всесвітнього павутиння
Для покращення візуального сприйняття Інтернету стала широко застосовуватися технологія CSS, яка дозволяє задавати єдині стилі оформлення для багатьох веб-сторінок. Ще одне нововведення, яке варто звернути увагу, - система позначення ресурсів URN (англ. Uniform Resource Name).
Популярна концепція розвитку Всесвітнього павутиння - створення семантичного павутиння. Семантична павутина - це надбудова над існуючим Всесвітнім павутинням, яка покликана зробити розміщену в мережі інформацію більш зрозумілою для комп'ютерів. Семантична павутина - це концепція мережі, в якій кожен ресурс людською мовою був би забезпечений описом, зрозумілим комп'ютеру. Семантична павутина відкриває доступ до чітко структурованої інформації для будь-яких програм, незалежно від платформи та незалежно від мов програмування. Програми зможуть самі знаходити потрібні ресурси, обробляти інформацію, класифікувати дані, виявляти логічні зв'язки, робити висновки та навіть приймати рішення на основі цих висновків. При широкому поширенні та грамотному впровадженні семантична павутина може спричинити революцію в Інтернеті. Для створення зрозумілого комп'ютера опису ресурсу в семантичній павутині використовується формат RDF (англ. Resource Description Framework ), який заснований на синтаксисі XML та використовує ідентифікатори URI для позначення ресурсів. Новинки у цій галузі - це RDFS (англ.)російська. (англ. RDF Schema) та SPARQL (англ. Protocol And RDF Query Language ) (вимовляється як «спаркл»), нова мова запитів для швидкого доступу до даних RDF.
Історія Всесвітнього павутиння
Винахідниками всесвітньої павутини вважаються Тім Бернерс-Лі і меншою мірою Роберт Кайо. Тім Бернерс-Лі є автором технологій HTTP, URI/URL та HTML. У 1980 році він працював у Європейській раді з ядерних досліджень (фр. Conseil Européen pour la Recherche Nucléaire, CERN ) консультантом із програмного забезпечення. Саме там, у Женеві (Швейцарія), він для потреб написав програму «Енквайр» (англ. Enquire, можна вільно перекласти як «Дозвідник»), яка використовувала випадкові асоціації для зберігання даних і заклала концептуальну основу для Всесвітньої павутини.
Перший у світі веб-сайт був розміщений Бернерсом-Лі 6 серпня 1991 на першому веб-сервері доступному за адресою http://info.cern.ch/, (). Ресурс визначав поняття Всесвітньої павутини, містив інструкції щодо встановлення веб-сервера, використання браузера тощо. Цей сайт також був першим у світі інтернет-каталогом, тому що пізніше Тім Бернерс-Лі розмістив та підтримував там список посилань на інші сайти.
На першій фотографії у Всесвітньому павутинні була зображена пародійна філк-група Les Horribles Cernettes. Тім Бернес Лі попросив їх відскановані знімки у лідера групи після CERN Hardronic Festival.
І все-таки теоретичні основи Інтернету були закладені набагато раніше Бернерса-Лі. Ще 1945 року Ваннавер Буш розробив концепцію Memex (англ.)російська. - Допоміжних механічних засобів «розширення людської пам'яті». Memex - це пристрій, в якому людина зберігає всі свої книги та записи (а в ідеалі - і всі свої знання, що піддаються формальному опису) і який видає необхідну інформацію з достатньою швидкістю та гнучкістю. Воно є розширенням та доповненням пам'яті людини. Бушем було також передбачено всеосяжне індексування текстів та мультимедійних ресурсів із можливістю швидкого пошуку необхідної інформації. Наступним значним кроком на шляху до Всесвітнього павутиння було створення гіпертексту (термін запроваджено Тедом Нельсоном у 1965 році).
- Семантична павутина передбачає поліпшення зв'язності та релевантності інформації у Всесвітньому павутинні через введення нових форматів метаданих.
- Соціальне павутиння покладається на роботу з упорядкування наявної в павутинні інформації, що виконується самими користувачами павутини. В рамках другого напряму напрацювання, що є частиною семантичної павутини, активно використовуються як інструменти (RSS та інші формати веб-каналів, OPML, мікроформати XHTML). Частково семантизовані ділянки Дерева категорій «Вікіпедії» допомагають користувачам усвідомлено переміщатися в інформаційному просторі, проте дуже м'які вимоги до підкатегорій не дають підстав сподіватися на розширення таких ділянок. У зв'язку з цим інтерес можуть становити спроби складання атласів Знання.
Існує також популярне поняття Web 2.0, що узагальнює відразу кілька напрямків розвитку Всесвітньої павутини.
Способи активного відображення інформації у Всесвітньому павутинні
Інформація в Інтернеті може відображатися як пасивно (тобто користувач може лише зчитувати її), так і активно – тоді користувач може додавати інформацію та редагувати її. До способів активного відображення інформації у Всесвітньому павутинні відносяться:
Слід зазначити, що цей поділ дуже умовний. Так, скажімо, блог або гостьову книгу можна розглядати як окремий випадок форуму, який, у свою чергу, є окремим випадком системи управління контентом. Зазвичай різниця проявляється у призначенні, підході та позиціонуванні того чи іншого продукту.
Частково інформація з сайтів може бути доступна через мовлення. В Індії вже почалося тестування системи, що робить текстовий вміст сторінок доступним навіть для людей, які не вміють читати та писати.
World Wide Web іноді іронічно називають Wild Wild Web (дикий, дикий Web) – за аналогією з назвою однойменного фільму Wild Wild West (Дикий, дикий Захід).
Див. також
Примітки
Література
- Філдінг, Р.; Геттіс, Дж.; Могул, Дж.; Фрістік, Р.; Мазінтер, Л.; Ліч, П.; Бернерс-Лі, Т. (Червень 1999). "Hypertext Transfer Protocol - http://1.1" (Information Sciences Institute).
- Бернерс-Лі, Тім; Брей, Тім; Коннолі, Ден; Коттон, Підлога; Філдінг, Рой; Джекл, Маріо; Ліллі, Кріс; Мендельсон, Ной; Оркард, Девід; Уолш, Норман; Вілліамс, Стюарт (Грудень 15, 2004). «Architecture of the World Wide Web, Volume One» (W3C).
- Поло, Лучано World Wide Web Technology Architecture: Conceptual Analysis . New Devices(2003). Архівовано з першоджерела 24 серпня 2011 року. Перевірено Липень 31 2005 року.
Посилання
Захист конфіденційних даних та анонімність в інтернетіу Вікіпідручнику |
- Офіційний сайт Консорціуму Всесвітньої павутини (World Wide Web Consortium (W3C)) (англ.)
- Tim Berners-Lee, Mark Fischetti.Плетя павутину: витоки і майбутнє Всесвітньої павутини = Weaving the Web: Original Design and Ultimate Destiny of the World Wide Web. - New York: HarperCollins Publishers (англ.)російська. . - 256 p. - ISBN 0-06-251587-X, ISBN 978-0-06-251587-2(англ.)
Вебта веб-сайти | |
---|---|
Глобально | |
Локально | |
Види сайтів та сервісів |
|
Створення та обслуговування |
|
Типи макетів, сторінок, сайтів |
|
Технічне | |
Маркетинг | |
Соціум та культура |
Семантична павутина | |
---|---|
Основи | Всесвітня павутина · Інтернет · Гіпертекст · Бази даних · Семантичні мережі · Онтології · Дескрипційна логіка |
Підрозділи | Linked Data · Data Web · Hyperdata · Dereferenceable URIs · Rule bases · Data Spaces |
Програми | Семантична вікі · Semantic publishing · Semantic search · Semantic computing · Semantic advertising · Semantic reasoner · Semantic matching · Semantic mapper · Semantic broker · Semantic analytics · Semantic service oriented architecture |
Пов'язані теми | Фолксономія · Бібліотека 2.0 · Веб 2.0 Посилання · Інформаційна архітектура · Управління знаннями · Колективний інтелект · Тематичні карти · Mindmapping · Метадані · Geotagging · Web science |
Стандарти |
Синтаксис: RDF (RDF/XML · Нотація 3 · Turtle · N-Triples) · SPARQL · URI · HTTP · XML Схеми, онтології: RDFS · OWL · Rule Interchange Format · Semantic Web Rule Language · Common Logic · |
Всесвітнє павутиння (скорочено World Wide Webабо WWW) - це єдність інформаційних ресурсів, які пов'язані між собою засобами телекомунікацій та засновані на гіпертекстовому поданні даних, розкиданих по всьому світу.
Роком народження Всесвітньої павутини вважається 1989 рік. Саме цього року Тім Бернерс-Лі запропонував спільний гіпертекстовий проект, який згодом отримав назву Всесвітнього павутиння.
Творець «павутини» Тім Бернес-Лі, працюючи в лабораторії фізики елементарних частинок європейського центру ядерних досліджень «CERN» У Женеві (Швейцарія), спільно з партнером Робертом Кайо займалися проблемами застосування ідей гіпертексту для побудови інформаційного середовища, яке б спростило обмін інформацією між фізиками .
Підсумком цієї роботи став документ, у якому розглядалися поняття, мають принципове значення для «павутини» у її сучасному вигляді, і було запропоновано ідентифікатори URI, протокол HTTR і мову HTML. Без даних технологій не можна уявити сучасний Інтернет.
Бернерс-Лі створив перший у світі веб-сервер та перший у світі гіпертекстовий веб-браузер. На першому у світі веб-сайті він описав, що таке Всесвітня павутина та як встановити веб-сервер, як використовувати браузер тощо. Цей сайт був першим у світі Інтернет-каталогом.
Починаючи з 1994 року найголовніші завдання розвитку Всесвітньої павутини взяв на себе Консорціум Всесвітньої павутини ( World Wide Web Consortium, WЗС), який організував і досі очолює Кім Бернес-Лі. Консорціум розробляє та впроваджує технологічні стандарти для Інтернету та Всесвітньої павутини. Місія WЗС: «Повністю розкрити потенціал Всесвітньої павутини шляхом створення протоколів і принципів, що гарантують довгостроковий розвиток Мережі» . WЗС розробляє «Рекомендації», щоб досягти сумісності між програмними продуктами та апаратурою різних компаній, що робить Всесвітню мережу більш досконалою, універсальною та зручною.
Пошукові системи: склад, функції, принципи роботи.
Пошукова система - це програмно-апаратний комплекс, призначений для пошуку в мережі Інтернет і реагує на запит користувача, що задається у вигляді текстової фрази (пошукового запиту), видачею списку посилань на джерела інформації, в порядку релевантності (відповідно до запиту). Найбільші міжнародні пошукові системи: "Google", «Yahoo», "MSN". У російському Інтернеті це – "Яндекс", «Рамблер», «Апорт».
Опишемо основні характеристики пошукових систем :
Повнота
Повнота - одна з основних характеристик пошукової системи, що є відношенням кількості знайдених за запитом документів до загальної кількості документів у мережі Інтернет, що задовольняють даному запиту. Наприклад, якщо в Інтернеті є 100 сторінок, що містять словосполучення "як вибрати автомобіль", а за відповідним запитом було знайдено всього 60 з них, то повнота пошуку буде 0,6. Очевидно, що чим повніше пошук, тим менша ймовірність того, що користувач не знайде потрібний документ, за умови, що він взагалі існує в Інтернеті.
Точність
Точність - ще одна основна характеристика пошукової машини, яка визначається мірою відповідності знайдених документів запиту користувача. Наприклад, якщо за запитом «як вибрати автомобіль» знаходиться 100 документів, у 50 з них міститься словосполучення «як вибрати автомобіль», а в інших просто ці слова («як правильно вибрати магнітолу і встановити в автомобіль»), то точність пошуку вважається рівною 50/100 (=0,5). Чим точніше пошук, тим швидше користувач знайде потрібні йому документи, тим менше «сміття» серед них буде зустрічатися, тим рідше знайдені документи не відповідатимуть запиту.
Актуальність
Актуальність - не менш важлива складова пошуку, що характеризується часом, що проходить з моменту публікації документів у мережі Інтернет, до занесення їх до індексної бази пошукової системи. Наприклад, наступного дня після появи цікавої новини велика кількість користувачів звернулася до пошукових систем з відповідними запитами. Об'єктивно з моменту публікації новинної інформації на цю тему пройшло менше доби, проте основні документи вже були проіндексовані та доступні для пошуку завдяки існуванню у великих пошукових систем так званої «швидкої бази», яка оновлюється кілька разів на день.
Швидкість пошуку
Швидкість пошуку тісно пов'язана з його стійкістю до навантажень. Наприклад, за даними ТОВ «Рамблер Інтернет Холдинг», на сьогоднішній день у робочі години до пошукової машини Рамблер надходить близько 60 запитів на секунду. Така завантаженість потребує скорочення часу обробки окремого запиту. Тут інтереси користувача та пошукової системи збігаються: відвідувач бажає отримати результати якнайшвидше, а пошукова машина повинна відпрацьовувати запит максимально оперативно, щоб не гальмувати обчислення наступних запитів.
Наочність
Наочність уявлення результатів є важливим компонентом зручного пошуку. За більшістю запитів пошукова машина знаходить сотні, а то й тисячі документів. Внаслідок нечіткості складання запитів або неточності пошуку навіть перші сторінки видачі не завжди містять тільки потрібну інформацію. Це означає, що користувачеві часто доводиться проводити свій власний пошук усередині знайденого списку. Різні елементи сторінки видачі пошукової системи допомагають орієнтуватися в результатах пошуку. http://help.yandex.ru/search/?id=481937.
Коротка історія розвитку пошукових систем
У початковий період розвитку Інтернет, кількість його користувачів була невелика, а обсяг доступної інформації порівняно невеликий. Здебільшого доступ до мережі Інтернет мали лише співробітники науково-дослідної сфери. У цей час завдання пошуку інформації в Інтернеті не було таким актуальним, як нині.
Одним із перших способів організації доступу до інформаційних ресурсів мережі стало створення відкритих каталогів сайтів, посилання на ресурси у яких групувалися згідно з тематикою. Першим таким проектом став сайт Yahoo.com, що відкрився навесні 1994 року. Після того, як кількість сайтів у каталозі Yahoo значно збільшилася, було додано можливість пошуку потрібної інформації з каталогу. У повному розумінні це ще не було пошуковою системою, тому що пошукова область була обмежена лише ресурсами, які є в каталозі, а не всіма Інтернет ресурсами.
Каталоги посилань широко використовувалися раніше, проте практично втратили свою популярність нині. Так як навіть сучасні, величезні за своїм обсягом каталоги, містять інформацію лише про мізерну частину мережі Інтернет. Найбільший каталог мережі DMOZ (його ще називають Open Directory Project) містить інформацію про 5 мільйонів ресурсів, тоді як база пошукової системи Google складається з понад 8 мільярдів документів.
Першою повноцінною пошуковою системою став проект WebCrawler, що вийшов друком у 1994 році.
У 1995 році з'явилися пошукові системи Lycos та AltaVista. Остання довгі роки була лідером у сфері пошуку інформації в мережі Інтернет.
У 1997 році Сергій Брін та Ларрі Пейдж створили пошукову машину Google у рамках дослідницького проекту у Стендфордському університеті. Зараз Google – найпопулярніша пошукова система у світі!
У вересні 1997 року було офіційно анонсовано пошукову систему Yandex, що є найпопулярнішою в російськомовному Інтернеті.
В даний час існують три основні міжнародні пошукові системи - Google, Yahoo і MSN, які мають власні бази та алгоритми пошуку. Більшість інших пошукових систем (яких налічується велика кількість) використовує у тому чи іншому вигляді результати трьох перелічених. Наприклад, пошук AOL (search.aol.com) використовує базу Google, а AltaVista, Lycos та AllTheWeb – базу Yahoo.
Склад та принципи роботи пошукової системи
У Росії основною пошуковою системою є «Яндекс», далі – Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причому зараз Mail.ru використовує механізм і базу пошуку «Яндекса».
Практично всі великі пошукові системи мають власну структуру, відмінну від інших. Однак, можна виділити загальні для всіх пошукових машин основні компоненти. Відмінності у структурі може лише у вигляді реалізації механізмів взаємодії цих компонентів.
Модуль індексування
Модуль індексування складається з трьох допоміжних програм (роботів):
Spider (павук) – програма, призначена для завантаження веб-сторінок. "Павук" забезпечує скачування сторінки та витягує всі внутрішні посилання з цієї сторінки. Завантажується HTML-код кожної сторінки. Для завантаження сторінок роботи використовують протоколи HTTP. Працює «павук» в такий спосіб. Робот на сервер передає запит "get/path/document" та деякі інші команди HTTP-запиту. У відповідь робот отримує текстовий потік, що містить службову інформацію і сам документ.
URL сторінки
дата, коли сторінку завантажили
http-заголовок відповіді сервера
тіло сторінки (html-код)
Crawler («мандрівний» павук) – програма, яка автоматично проходить за всіма посиланнями, знайденими на сторінці. Виділяє всі посилання на сторінці. Його завдання - визначити, куди далі має йти павук, спираючись на посилання або виходячи із заздалегідь заданого списку адрес. Crawler, слідуючи за знайденими посиланнями, здійснює пошук нових документів, ще невідомих пошуковій системі.
Indexer (робот-індексатор) - програма, яка аналізує веб-сторінки, завантажені павуками. Індексатор розбирає сторінку на складові та аналізує їх, застосовуючи власні лексичні та морфологічні алгоритми. Аналізують різні елементи сторінки, такі як текст, заголовки, посилання структурні та стильові особливості, спеціальні службові html-теги і т.д.
Таким чином, модуль індексування дозволяє обходити за посиланнями задану безліч ресурсів, завантажувати сторінки, що зустрічаються, витягувати посилання на нові сторінки з одержуваних документів і проводити повний аналіз цих документів.
База даних
База даних, або індекс пошукової системи - це система зберігання даних, інформаційний масив, в якому зберігаються спеціальним чином перетворені параметри всіх завантажених та оброблених модулем індексування документів.
Пошуковий сервер
Пошуковий сервер є найважливішим елементом усієї системи, оскільки від алгоритмів, які лежать в основі її функціонування, безпосередньо залежить якість та швидкість пошуку.
Пошуковий сервер працює наступним чином:
Отриманий від користувача запит піддається морфологічному аналізу. Генерується інформаційне оточення кожного документа, що міститься в базі (яке і буде згодом відображено у вигляді сніпету, тобто відповідного запиту текстової інформації на сторінці видачі результатів пошуку).
Отримані дані передаються як вхідні параметри спеціальному модулю ранжування. Відбувається обробка даних за всіма документами, внаслідок чого для кожного документа розраховується власний рейтинг, що характеризує релевантність запиту, введеного користувачем, та різних складових цього документа, що зберігаються в індексі пошукової системи.
Залежно від вибору користувача, цей рейтинг може бути скоригований додатковими умовами (наприклад, так званий «розширений пошук»).
Далі генерується сніппет, тобто для кожного знайденого документа з таблиці документів вилучаються заголовок, коротка анотація, найбільш відповідна запиту і посилання на сам документ, причому знайдені слова підсвічуються.
Отримані результати пошуку передаються користувачеві як SERP (Search Engine Result Page) – сторінки видачі пошукових результатів.
Як видно, всі ці компоненти тісно пов'язані один з одним і працюють у взаємодії, утворюючи чіткий досить складний механізм роботи пошукової системи, що вимагає величезних витрат ресурсів.
Жодна пошукова система не охоплює всі ресурси Інтернету.
Кожна пошукова система збирає відомості про ресурси Інтернет, застосовуючи свої унікальні методи, і формує власну базу даних, що періодично оновлюється. Доступ до цієї бази надається користувачеві.
Пошукові системи реалізують два способи пошуку ресурсу:
Пошук за тематичним каталогам - інформаціяпредставляється як ієрархічної структури. На верхньому рівні - загальні категорії ("Інтернет", "Бізнес", "Мистецтво", "Освіта" і т.д.), на наступному рівні категорії поділяються на розділи і т.д. Найнижчий рівень – посилання на конкретні веб-сторінки чи інші інформаційні ресурси.
Пошук за ключовими словами (індексний пошук або детальний) - користувач надсилає пошуковій системі запит, Що складається з ключових слів. Система повертаєкористувачеві перелік знайдених на запит ресурсів.
Більшість пошукових систем поєднують обидва способи пошуку.
Пошукові системи можуть бути локальними, глобальними, регіональними та спеціалізованими.
У російській частині Інтернет (Рунет) найбільш популярні зараз пошукові системи загального призначення Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Google (www.google.ru).
Більшість пошукових системреалізовано у вигляді порталів.
Портал (від англ.portal- головний вхід, ворота) це веб-сайт, який інтегрує різні сервіси Інтернет: засоби пошуку, пошту, новини, словники і т.д.
Портали можуть бути спеціалізованими (як,www. museum. ru) та загальними (наприклад,www. km. ru).
Пошук за ключовими словами
Набір ключових слів, за якими ведеться пошук, також називають критерієм пошуку або темою пошуку.
Запит може складатися як із одного слова, і з поєднання слів, об'єднаних операторами - символами, якими система визначає, яку дію їй необхідно произвести. Наприклад: запит Москва Пітер містить оператор І (так сприймається пробіл), який вказує, що треба шукати документи, в яких є обидва слова - і Москва, і Пітер.
Для того, щоб пошук був релевантним (від англ. relevant - доречний, що стосується справи), слід враховувати кілька загальних правил:
Незалежно від того, в якій формі вжито слово у запиті, пошук враховує всі його словоформи за правилами російської. Наприклад, за запитом "квиток" будуть знайдені і слова "квитком", "квитку" і т.д.
Великі літери слід використовувати лише в власних іменах, щоб не переглядати зайві посилання. На запит "ковалів", наприклад, будуть знайдені документи, де йдеться і про ковалів, і про Кузнєцових.
Бажано звужувати коло пошуку, використовуючи кілька ключових слів.
Якщо потрібної адреси немає серед першої двадцятки знайдених адрес, слід змінити запит.
Кожна пошукова система використовує свою мову запитів. Для знайомства з ним користуйтеся вбудованою довідкою пошукової системи
Великі сайти можуть мати вбудовані системи пошуку інформації в межах веб-сторінок.
Запити в подібних системах пошуку, як правило, будуються за тими самими правилами, що й у глобальних пошукових системах, проте знайомство з довідкою тут не буде зайвим.
Розширений пошук
Пошукові системи можуть надавати механізм користувача, що дозволяє формувати складний запит. Перехід за посиланням Розширений пошукдає можливість редагувати параметри пошуку, вказувати додаткові параметри та вибирати найбільш зручну форму показу результатів пошуку. Нижче описано параметри, які можуть бути задані при розширеному пошуку в системах Япс1ех та Rambler.
Опис параметра |
Назва в Яндекс |
Назва вRambler |
Де шукати ключові слова (заголовок документа, основний текст тощо) |
Словниковий фільтр |
Пошук за текстом... |
Які слова повинні або не повинні бути присутніми в документі і наскільки точним має бути збіг |
Словниковий фільтр |
Шукати слова запиту... Виключити документи, які містять наступні слова... |
На якій відстані один від одного повинні розташовуватися ключові слова |
Словниковий фільтр |
Відстань між словами запиту... |
Обмеження на дату документа |
Дата документу... |
|
Обмеження пошуку межами одного або кількох сайтів |
Сайт/Вершина |
Шукати документи лише на наступних сайтах... |
Обмеження пошуку з мови документа |
Мова документа... |
|
Пошук документів, що містять картинку з певним ім'ям або підписом |
Зображення | |
Пошук сторінок, що містять об'єкти |
Спеціальні об'єкти | |
Форма представлення результатів пошуку |
Формат видачі |
Виведення результатів пошуку |
Деякі пошукові системи (наприклад, Яндекс) дозволяють вводити запити природною мовою. Ви пишіть, що потрібно знайти (наприклад: замовлення квитків на поїзд з Москви до Пітера). Система аналізує запит та видає результат. Якщо вона Вас не влаштовує, переходьте на мову запитів.
ВСЕСВІТНЯ ПАВУТИНА[англ. World Wide Web, скор. - WWW або Web (веб)] – розподілена неодноріднакомп'ютерна система колективного користуваннягіпермедійними документами, що діє на базі мережіІнтернет . Пов'язані гіперпосиланнями документи цієї системи, що утворюють складну розгалужену структуру, названо образно «павутиною» (web). Один із найбільш популярних інтернет-сервісів (поряд зелектронною поштою , пошуковими системамита ін.).
Веб-сторінки та веб-сайти
Гіпермедійні документи Інтернету, які називаються веб-сторінками, є розвитком гіпертекстових (див. Гіпертекст ). Вони можуть містити текст, зображення, аудіо, відео та ін. Кожна веб-сторінка має унікальну адресу – URL (скор. Universal Resource Locator – уніфікований покажчик ресурсу), за якою її можна знайти. Напр., www.webopedia.com – URL головної веб-сторінки електронного словника. Будь-яка сукупність суміжних символів веб-сторінки може бути гіперпосиланням на іншу веб-сторінку або ін. інформаційний ресурсІнтернет. Гіперпосилання можуть вказувати не тільки на документи Інтернету, але й на інші інформаційні ресурси, що надаються інтернет-сервісами. Сукупність пов'язаних гіперпосиланнями веб-сторінок, які мають загальну частину URL (і, як правило, об'єднані тематично), називають веб-сайтом. Напр., сайт електронного комп'ютерного словника Webopedia має адресу www.webopedia.com, а веб-сторінка статті з визначенням терміна Web - http://www.webopedia.com/TERM/W/World_Wide_Web.html. Загальною частиною всіх сторінок сайту є адреса сайту.
Веб-сервери та браузери
Веб-сайти зберігаються на веб-серверах (комп'ютерах зі спец. програмним забезпеченням). Веб-серверами можуть бути комп'ютери разл. архітектури, що відповідають вимогам надійності та продуктивності. Вони можуть працювати під управлінням різних операційних системі використовувати різноманітні серверні програми. Тому Інтернет є неоднорідною комп'ютерною системою. Глобальна розподіленість Інтернету полягає в тому, що веб-сервери можуть знаходитися в будь-якій точці світу, де є можливість підключення до Інтернету.
Для отримання веб-сторінок користувач застосовує веб-браузер (програму веб-клієнт). За допомогою браузера він формує і відправляє запити на отримання інформаційних ресурсів, що його цікавлять. Браузер інтерпретує отримані від веб-серверів повідомлення у відповідь і відображає результати інтерпретації на пристрої у складі комп'ютера або комп'ютерного пристрою користувача (дисплеї комп'ютера, смартфона або ін.). Зі зростанням кількості різних веб-додатків (веб-пошти, пошуку, різних фото-, графічних та текстових веб-редакторів, а також ін прикладних програм) браузери стали використовувати як платформи для веб-додатків. Для роботи з будь-яким із веб-додатків користувачеві достатньо мати відповідний браузер, знати адресу програми та мати право доступу. Зі зростанням кількості веб-застосунків браузери беруть на себе зростаючу частку завдань операційної системи (напр., Google Chrome OS заснована на браузері Google Chrome).
Інтерпретацію повідомлень від браузерів виконують серверні програми, встановлені на веб-серверах. Обмін повідомленнями між цими програмами здійснюється за правилами (протоколами), що відповідають архітектурі клієнт-сервер (див. Комп'ютерна мережа). У Інтернеті діє протокол передачі гіпертексту – HTTP (Hypertext transfer protocol).
Винахід Інтернет та реалізація проекту
У березні 1989 британський фізик Т. Бернерс-Лі (Tim Berners-Lee) запропонував проект, згодом названий проектом Інтернету [на той час винахідник Інтернету був співробітником Європейської організації ядерних досліджень CERN (European Organization for Nuclear Researchnbsp)]. При реалізації проекту Інтернету його першим помічником був системний інженер Robert Cailliau. У наст. Час винахідник Інтернету є директором міжнародного консорціуму World Wide Web Consortium (W3C). Мета W3C – збільшення потенціалу Інтернету (шляхом розробки більш досконалих протоколів і технологій) та забезпечення його безперервного сталого зростання.
З кін. 1993 (після створення першого браузера Mosaic з графічним інтерфейсом) почалося швидке зростання популярності Інтернету.
На поч. 21 ст. Веб став найпопулярнішим сервісом Інтернету, що найбільш динамічно розвивається. Простота взаємодії з Інтернетом і тематич. різноманітність веб-ресурсів визначили масштаб його застосування у різних галузях людської діяльності (дистанційне навчання, електронна торгівля, соціальні мережі, електронні видання та ін.).