¿Quién propuso la World Wide Web? Web mundial (www). Direcciones y protocolos
Internet está ocupando un lugar cada vez más importante en nuestras vidas. Ninguna otra tecnología creada por el hombre ha ganado tanta popularidad. Internet: la World Wide Web, que cubre todo el mundo y lo envuelve en una red de torres de televisión. Comenzó a ganar popularidad en la década de 1990, relativamente lejana. En el artículo discutiremos de dónde viene y por qué se hizo tan popular.
Internet como la World Wide Web
El segundo nombre de tal plan no carecía de razón. El hecho es que Internet une a muchos usuarios de todo el mundo. Como una telaraña, envuelve todo el globo con sus hilos. Y ésta no es una metáfora cualquiera, realmente lo es. Internet se compone de cables y redes inalámbricas, estas últimas invisibles para nosotros.
Pero esto es una digresión lírica; de hecho, Internet está conectado a la World Wide Web (www o Word Wide Web). Cubre todas las computadoras conectadas a Internet. En servidores remotos, los usuarios almacenan la información necesaria y también pueden comunicarse a través de Internet. Este nombre a menudo se entiende como World Wide Web o Red Global.
Se basa en varios protocolos particularmente importantes, como TCP/IP. Gracias a Internet, la World Wide Web, o lo que es lo mismo la Word Wide Web (WWW), realiza sus actividades, es decir, transmite y recibe datos.
Número de usuarios
A finales de 2015 se realizó un estudio, a partir del cual se obtuvieron los siguientes datos. Hay 3.300 millones de usuarios de Internet en todo el mundo. Y esto es casi el 50% de toda la población de nuestro planeta.
Cifras tan elevadas se lograron gracias a la difusión de las redes móviles 3G y 4G de alta velocidad. Los proveedores jugaron un papel importante, gracias a la introducción masiva de tecnologías de Internet, los costos de mantenimiento de servidores y fabricación de cables de fibra óptica disminuyeron. En la mayoría de los países europeos, las velocidades de Internet son más rápidas que en los países africanos. Esto se explica por el rezago técnico de estos últimos y la baja demanda del servicio.
¿Por qué Internet se llama World Wide Web?
Por paradójico que parezca, muchos usuarios están seguros de que el término anterior e Internet son lo mismo. Este profundo error que ronda por la mente de muchos usuarios se debe a la similitud de conceptos. Ahora descubriremos qué es qué.
La World Wide Web a menudo se confunde con la frase similar "World Wide Web". Representa un cierto volumen de información basada en la tecnología de Internet.
Historia de la World Wide Web
A finales de los años 90, finalmente se estableció en el mundo el dominio de NSFNet sobre la tecnología ARPANET. Curiosamente, su desarrollo estuvo a cargo de un centro científico. ARPNET fue desarrollado por orden del Departamento de Guerra de Estados Unidos. Sí, sí, los primeros en utilizar Internet fueron los militares. Y la tecnología NSFNet se desarrolló independientemente de las agencias gubernamentales, casi por puro entusiasmo.
Fue la competencia entre los dos desarrollos la que se convirtió en la base para su mayor desarrollo y su introducción masiva en el mundo. La World Wide Web estuvo disponible para el público en general en 1991. Tenía que funcionar de alguna manera, y Berners Lee se puso a desarrollar un sistema para Internet. Después de dos años de trabajo exitoso, creó el hipertexto, o HTTP, el famoso lenguaje electrónico de HTML y URL. No necesitamos entrar en detalles, porque ahora los vemos como enlaces habituales a direcciones de sitios web.
Espacio de información
En primer lugar, se trata de un espacio de información cuyo acceso se realiza a través de Internet. Permite al usuario tener acceso a los datos que se encuentran en los servidores. Si utilizamos un método visual-figurativo, entonces Internet es un cilindro volumétrico y la World Wide Web es lo que lo llena.
A través de un programa llamado "navegador", el usuario obtiene acceso a Internet para navegar por la Web. Consta de una innumerable cantidad de sitios que se basan en servidores. Están conectados a computadoras y son responsables de almacenar, cargar y visualizar datos.
Las telas de araña y el hombre moderno
Actualmente, el Homo sapiens en los países desarrollados se ha integrado casi por completo a la World Wide Web. No hablamos de nuestros abuelos ni de pueblos remotos donde ni siquiera conocen algún tipo de Internet.
Anteriormente, una persona en busca de información iba directamente a la biblioteca. Y a menudo sucedía que no encontraba el libro que necesitaba, entonces tenía que acudir a otras instituciones que tuvieran archivos. Ahora no hay necesidad de tales manipulaciones.
En biología, todos los nombres de especies constan de tres palabras, como nuestro nombre completo Homo sapiens neanderthalensis. Ahora podemos agregar con seguridad la cuarta palabra internetiys.
Internet está capturando las mentes de la humanidad.
De acuerdo, obtenemos casi toda nuestra información de Internet. Tenemos toneladas de información a nuestro alcance. Cuéntele esto a nuestro antepasado, él miraba ansiosamente la pantalla del monitor y se sentaba allí todo su tiempo libre en busca de información.
Fue Internet la que llevó a la humanidad a un nivel fundamentalmente nuevo; contribuye a la creación de una nueva cultura, mixta o multiforme. Los representantes de diferentes naciones imitan y se adaptan, como si fusionaran sus costumbres en un solo caldero. ¿De dónde viene entonces el producto final?
Esto es especialmente útil para los científicos, ya no es necesario reunirse para consultas en un país que se encuentra a 1000 km del suyo. Puedes intercambiar experiencias sin conocerte en persona, por ejemplo, a través de mensajería instantánea o redes sociales. Y si es necesario discutir un tema importante, puede hacerlo a través de Skype.
Conclusión
La World Wide Web es un componente de Internet. Su funcionamiento está asegurado gracias a servidores de almacenamiento, que proporcionan información al usuario cuando la solicita. La propia Red se desarrolló gracias a los científicos de EE.UU. y su entusiasmo.
World Wide Web Trabajo realizado por: Dzhambulatov Albert 11 "A" Profesora: Chernova Anna Petrovna
La World Wide Web es un sistema distribuido que proporciona acceso a documentos interconectados ubicados en diferentes computadoras conectadas a Internet. La palabra web (web en inglés “web”) y la abreviatura WWW también se utilizan para referirse a la World Wide Web.
La World Wide Web está formada por cientos de millones de servidores web. La mayoría de los recursos de la World Wide Web se basan en tecnología de hipertexto. Los documentos de hipertexto publicados en la World Wide Web se denominan páginas web. Varias páginas web que comparten un tema, diseño y enlaces comunes y que generalmente están ubicadas en el mismo servidor web se denominan sitio web. Para descargar y ver páginas web, se utilizan programas especiales: navegadores.
La World Wide Web ha provocado una auténtica revolución en las tecnologías de la información y una explosión en el desarrollo de Internet. En el habla cotidiana, cuando se habla de Internet, a menudo se refiere a la World Wide Web. Sin embargo, es importante entender que no son lo mismo.
Historia: Tim Berners-Lee y, en menor medida, Robert Cayo son considerados los inventores de la World Wide Web. Tim Berners-Lee es el creador de las tecnologías HTTP, URI/URL y HTML. En 1980, trabajó para el Consejo Europeo de Investigación Nuclear (conseil européen pour la recherche nucléaire, CERN) como consultor de software. Fue allí, en Ginebra (Suiza), donde, para sus propias necesidades, escribió el programa Inquire, que utilizaba asociaciones aleatorias para almacenar datos y sentó las bases conceptuales de la World Wide Web.
En 1989, mientras trabajaba en el CERN en la intranet de la organización, Tim Berners-Lee propuso el proyecto global de hipertexto ahora conocido como World Wide Web. El proyecto implicó la publicación de documentos de hipertexto enlazados mediante hipervínculos, que facilitarían la búsqueda y consolidación de información a los científicos del CERN. Para implementar el proyecto, Tim Berners-Lee (junto con sus asistentes) inventaron los URI, el protocolo HTTP y el lenguaje HTML. Se trata de tecnologías sin las cuales ya no es posible imaginar la Internet moderna. Entre 1991 y 1993, Berners-Lee perfeccionó las especificaciones técnicas de estas normas y las publicó. Pero, sin embargo, el año oficial de nacimiento de la World Wide Web debería considerarse 1989.
Desde 1994, el trabajo principal sobre el desarrollo de la World Wide Web ha sido asumido por el World Wide Web Consortium (consorcio de la World Wide Web en inglés, tres letras “W” y “C”, W3C), fundado y aún dirigido por Tim. Berners-Lee. Este consorcio es una organización que desarrolla e implementa estándares tecnológicos para Internet y la World Wide Web. Misión del W3C: "Liberar todo el potencial de la World Wide Web mediante el establecimiento de protocolos y principios para garantizar el desarrollo a largo plazo de la Web". Otros dos objetivos principales del consorcio son garantizar la plena “internacionalización de la Red” y hacer que la Red sea accesible para personas con discapacidad. El W3C desarrolla principios y estándares uniformes para Internet (llamados “recomendaciones”, recomendaciones del W3C en inglés), que luego son implementados por los fabricantes de software y hardware. De esta forma se logra la compatibilidad entre productos de software y equipos de diferentes empresas, lo que hace que la World Wide Web sea más avanzada, universal y conveniente. Todas las recomendaciones del consorcio World Wide Web son abiertas, es decir, no están protegidas por patentes y pueden ser implementadas por cualquier persona sin ninguna contribución financiera al consorcio.
Seguridad: Para los ciberdelincuentes, la World Wide Web se ha convertido en un método clave para distribuir malware. Además, el concepto de delito en línea incluye el robo de identidad, el fraude, el espionaje y la recopilación ilegal de información sobre determinados sujetos u objetos. Las vulnerabilidades web, según algunos datos, actualmente superan en número a cualquier manifestación tradicional de problemas de seguridad informática; Google estima que aproximadamente una de cada diez páginas de la World Wide Web puede contener código malicioso. Según Sophos, un fabricante británico de soluciones antivirus, la mayoría de los ciberataques en la web son llevados a cabo por recursos legítimos ubicados principalmente en Estados Unidos, China y Rusia. El tipo más común de este tipo de ataques, según información de la misma empresa, es la inyección SQL: introducir maliciosamente consultas directas a la base de datos en campos de texto de páginas de recursos que, si el nivel de seguridad es insuficiente, puede dar lugar a la divulgación del contenidos de la base de datos. Otra amenaza común que explota el poder del HTML y los identificadores de recursos únicos para los sitios World Wide Web es el cross-site scripting (XSS), que fue posible con la introducción de la tecnología JavaScript y cobró impulso con el desarrollo de la Web 2.0 y Ajax - nueva web. Los estándares de diseño fomentaron el uso de escenarios interactivos. En 2008, se estimó que hasta el 70% de todos los sitios web del mundo eran vulnerables a ataques XSS contra sus usuarios.
Distribución: Entre 2005 y 2010, el número de usuarios de la web se duplicó hasta alcanzar los dos mil millones. Según los primeros estudios de 1998 y 1999, la mayoría de los sitios web existentes no estaban indexados correctamente por los motores de búsqueda y la web en sí era más grande de lo esperado. En 2001 ya se habían creado más de 550 millones de documentos web, aunque la mayoría de ellos se encontraban dentro de la red invisible. En 2002, se habían creado más de 2.000 millones de páginas web, el 56,4% de todo el contenido de Internet estaba en inglés, seguido del alemán (7,7%), el francés (5,6%) y el japonés (4,9%). Según una investigación realizada a finales de enero de 2005, se identificaron más de 11,5 mil millones de páginas web en 75 idiomas diferentes y se indexaron en la web abierta. Y según datos de marzo de 2009, el número de páginas aumentó a 25,21 mil millones. El 25 de julio de 2008, los ingenieros de software de Google, Jesse Alpert y Nissan Hiai, anunciaron que el motor de búsqueda de Google había detectado más de mil millones de URL únicas.
Estructura y principios de la World Wide Web.
World Wide Web alrededor de Wikipedia
La World Wide Web está formada por millones de servidores web de Internet ubicados en todo el mundo. Un servidor web es un programa que se ejecuta en una computadora conectada a una red y utiliza el protocolo HTTP para transferir datos. En su forma más simple, dicho programa recibe una solicitud HTTP para un recurso específico a través de la red, encuentra el archivo correspondiente en el disco duro local y lo envía a través de la red a la computadora solicitante. Los servidores web más complejos son capaces de asignar recursos dinámicamente en respuesta a una solicitud HTTP. Para identificar recursos (a menudo archivos o partes de ellos) en la World Wide Web, se utilizan identificadores uniformes de recursos (URI). Identificador uniforme de recursos). Los localizadores uniformes de recursos URL se utilizan para localizar recursos en la web. Localizador Uniforme de Recursos). Estos localizadores de URL combinan la tecnología de identificación URI y el sistema de nombres de dominio DNS. sistema de nombres de dominio) - un nombre de dominio (o directamente una dirección en notación numérica) es parte de la URL para designar una computadora (más precisamente, una de sus interfaces de red) que ejecuta el código del servidor web deseado.
Para ver la información recibida del servidor web, se utiliza un programa especial en la computadora cliente: un navegador web. La función principal de un navegador web es mostrar hipertexto. La World Wide Web está indisolublemente ligada a los conceptos de hipertexto e hipervínculos. La mayor parte de la información en Internet es hipertexto. Para facilitar la creación, almacenamiento y visualización de hipertexto en la World Wide Web, tradicionalmente se utiliza HTML. Lenguaje de marcado de hipertexto), Lenguaje de marcado de hipertexto. El trabajo de marcar hipertexto se llama diseño; el maestro de marcado se llama webmaster o webmaster (sin guión). Después del marcado HTML, el hipertexto resultante se coloca en un archivo; dicho archivo HTML es el recurso principal de la World Wide Web. Una vez que un archivo HTML está disponible para un servidor web, se denomina "página web". Una colección de páginas web constituye un sitio web. Los hipervínculos se añaden al hipertexto de las páginas web. Los hipervínculos ayudan a los usuarios de la World Wide Web a navegar fácilmente entre recursos (archivos), independientemente de si los recursos están ubicados en la computadora local o en un servidor remoto. Los hipervínculos web se basan en tecnología URL.
Tecnologías de la World Wide Web
Para mejorar la percepción visual de la web, se ha utilizado ampliamente la tecnología CSS, que permite establecer estilos de diseño uniformes para muchas páginas web. Otra innovación a la que vale la pena prestar atención es el sistema de designación de recursos URN. Nombre de recurso uniforme).
Un concepto popular para el desarrollo de la World Wide Web es la creación de la Web Semántica. La Web Semántica es un complemento de la World Wide Web existente, que está diseñada para hacer que la información publicada en la red sea más comprensible para las computadoras. La Web Semántica es un concepto de red en el que cada recurso en lenguaje humano recibiría una descripción que una computadora puede entender. La Web Semántica abre el acceso a información claramente estructurada para cualquier aplicación, independientemente de la plataforma y del lenguaje de programación. Los programas podrán encontrar por sí mismos los recursos necesarios, procesar información, clasificar datos, identificar conexiones lógicas, sacar conclusiones e incluso tomar decisiones basadas en estas conclusiones. Si se adopta ampliamente y se implementa sabiamente, la Web Semántica tiene el potencial de provocar una revolución en Internet. Para crear una descripción de un recurso legible por computadora, la Web Semántica utiliza el formato RDF (inglés). Marco de descripción de recursos ), que se basa en la sintaxis XML y utiliza URI para identificar recursos. Lo nuevo en esta área es RDFS (Inglés) ruso (Inglés) Esquema RDF) y SPARQL (ing. Protocolo y lenguaje de consulta RDF ) (pronunciado "sparkle"), un nuevo lenguaje de consulta para un acceso rápido a datos RDF.
Historia de la World Wide Web
Tim Berners-Lee y, en menor medida, Robert Cayo son considerados los inventores de la World Wide Web. Tim Berners-Lee es el creador de las tecnologías HTTP, URI/URL y HTML. En 1980 trabajó en el Consejo Europeo de Investigación Nuclear (francés). Consejo Europeo para la Investigación Nuclear, CERN ) consultor de software. Fue allí, en Ginebra (Suiza), donde escribió el programa Inquire para sus propias necesidades. Preguntar, puede traducirse libremente como "Interrogador"), que utilizaba asociaciones aleatorias para almacenar datos y sentó las bases conceptuales de la World Wide Web.
El primer sitio web del mundo fue alojado por Berners-Lee el 6 de agosto de 1991 en el primer servidor web disponible en http://info.cern.ch/, (). El recurso definió el concepto. World Wide Web, contenía instrucciones para configurar un servidor web, usar un navegador, etc. Este sitio también fue el primer directorio de Internet del mundo porque Tim Berners-Lee posteriormente publicó y mantuvo allí una lista de enlaces a otros sitios.
La primera fotografía que apareció en la World Wide Web fue de la banda de cine parodia Les Horribles Cernettes. Tim Bernes-Lee pidió escaneos de ellos al líder del grupo después del CERN Hardronic Festival.
Y, sin embargo, las bases teóricas de la red se sentaron mucho antes que Berners-Lee. En 1945, Vannaver Bush desarrolló el concepto de Memex. (Inglés) ruso - medios mecánicos auxiliares para “expandir la memoria humana”. Memex es un dispositivo en el que una persona almacena todos sus libros y registros (e, idealmente, todos sus conocimientos que puedan describirse formalmente) y que proporciona la información necesaria con suficiente rapidez y flexibilidad. Es una extensión y adición a la memoria humana. Bush también predijo una indexación integral de recursos textuales y multimedia con la capacidad de encontrar rápidamente la información necesaria. El siguiente paso significativo hacia la World Wide Web fue la creación del hipertexto (término acuñado por Ted Nelson en 1965).
- La Web Semántica implica mejorar la coherencia y relevancia de la información en la World Wide Web mediante la introducción de nuevos formatos de metadatos.
- La Web Social se basa en el trabajo de organización de la información disponible en la Web, realizado por los propios usuarios de la Web. En la segunda dirección, se utilizan activamente como herramientas los desarrollos que forman parte de la web semántica (RSS y otros formatos de canales web, OPML, microformatos XHTML). Las secciones parcialmente semantizadas del árbol de categorías de Wikipedia ayudan a los usuarios a navegar conscientemente por el espacio de información; sin embargo, los requisitos muy suaves para las subcategorías no dan motivos para esperar una expansión de dichas secciones. En este sentido, pueden resultar interesantes los intentos de compilar atlas de conocimientos.
También existe el concepto popular Web 2.0, que resume varias direcciones de desarrollo de la World Wide Web.
Métodos para mostrar información activamente en la World Wide Web
La información en la web se puede mostrar de forma pasiva (es decir, el usuario sólo puede leerla) o de forma activa, luego el usuario puede agregar información y editarla. Los métodos para mostrar información activamente en la World Wide Web incluyen:
Cabe señalar que esta división es muy arbitraria. Así, digamos, un blog o un libro de visitas puede considerarse un caso especial de foro, que, a su vez, es un caso especial de un sistema de gestión de contenidos. Por lo general, la diferencia se manifiesta en el propósito, enfoque y posicionamiento de un producto en particular.
También se puede acceder a cierta información de los sitios web a través del habla. India ya ha comenzado a probar un sistema que hace que el contenido de texto de las páginas sea accesible incluso para personas que no saben leer ni escribir.
La World Wide Web a veces se llama irónicamente Wild Wild Web, en referencia al título de la película Wild Wild West.
ver también
Notas
Literatura
- Campo, R.; Gettys, J.; Mogul, J.; Fristik, G.; Mazinter, L.; Lixiviación, P.; Berners-Lee, T. (junio de 1999). “Protocolo de Transferencia de Hipertexto - http://1.1” (Instituto de Ciencias de la Información).
- Berners-Lee, Tim; Bray, Tim; Connolly, Dan; Algodón, Paul; Campo, Roy; Jeckle, Mario; Lilly, Chris; Mendelsohn, Noé; Orcard, David; Walsh, normando; Williams, Stuart (15 de diciembre de 2004). "Arquitectura de la World Wide Web, Volumen Uno" (W3C).
- Polo, Luciano Arquitectura tecnológica de la World Wide Web: un análisis conceptual. Nuevos dispositivos(2003). Archivado desde el original el 24 de agosto de 2011. Consultado el 31 de julio de 2005.
Enlaces
Protección de datos confidenciales y anonimato en Internet en Wikilibros |
- Sitio web oficial del World Wide Web Consortium (W3C) (inglés)
- Tim Berners-Lee, Mark Fischetti. Tejiendo la Web: Los orígenes y el futuro de la World Wide Web = Tejiendo la Web: El diseño original y el destino final de la World Wide Web. - Nueva York: HarperCollins Publishers (Inglés) ruso . - 256 p. - ISBN 0-06-251587-X, ISBN 978-0-06-251587-2(Inglés)
Web y sitios web | |
---|---|
Globalmente | |
En la zona | |
tipos de sitios y servicios |
|
Creación y servicio |
|
Tipos de diseños, páginas, sitios |
|
Técnico | |
Marketing | |
sociedad y Cultura |
Web semántica | |
---|---|
Lo esencial | La World Wide Web · Internet · Hipertexto · Base de datos · Redes semánticas · Ontologías · Lógica de descripción |
Subsecciones | Datos vinculados · Red de datos · Hiperdatos · URI desreferenciables · Bases de reglas · Espacios de datos |
Aplicaciones | Wiki semántica · Publicación semántica · búsqueda semántica · Computación semántica · Publicidad semántica · razonador semántico · Coincidencia semántica · mapeador semántico · corredor semántico · Análisis semántico · Arquitectura semántica orientada a servicios. |
Temas relacionados | folksonomía · Biblioteca 2.0 · Enlaces Web 2.0 · Arquitectura informacional · Conocimiento administrativo · Inteligencia colectiva · Mapas temáticos · Mapas mentales · Metadatos · Geoetiquetado · ciencia web |
Estándares |
Sintaxis: RDF (RDF/XML · Notación 3 · Tortuga · N-Triples) · SPARQL · URI · HTTP · XML Esquemas, ontologías:RDFS · BÚHO · Formato de intercambio de reglas · Lenguaje de reglas de la web semántica · Lógica común · |
World Wide Web (abreviado World Wide Web o WWW) es una unidad de recursos de información que están interconectados mediante telecomunicaciones y se basan en una representación hipertextual de datos dispersos por todo el mundo.
Se considera que el año de nacimiento de la World Wide Web es 1989. Fue este año cuando Tim Berners-Lee propuso un proyecto de hipertexto común, que más tarde se conoció como la World Wide Web.
El creador de la "web" Tim Bernes-Lee, trabajando en el laboratorio de física de partículas elementales del Centro Europeo de Investigación Nuclear "CERN" en Ginebra (Suiza), junto con su socio Robert Caillot, trabajaron en los problemas de la aplicación de ideas de hipertexto. construir un entorno de información que simplifique el intercambio de información entre físicos.
El resultado de este trabajo fue un documento que examinó conceptos que son fundamentales para la "web" en su forma moderna y propuso URI, el protocolo HTTP y el lenguaje HTML. Sin estas tecnologías ya no es posible imaginar la Internet moderna.
Berners-Lee creó el primer servidor web del mundo y el primer navegador web de hipertexto del mundo. En el primer sitio web del mundo, describió qué era la World Wide Web y cómo configurar un servidor web, cómo utilizar un navegador, etc. Este sitio fue también el primer catálogo de Internet del mundo.
Desde 1994, las tareas más importantes para el desarrollo de la World Wide Web han sido asumidas por el Consorcio World Wide Web ( Consorcio World Wide Web, WZS), que fue organizado y todavía dirigido por Kim Bernes-Lee. El consorcio desarrolla e implementa estándares tecnológicos para Internet y la World Wide Web. Misión de WZS: “Liberar todo el potencial de la World Wide Web mediante la creación de protocolos y principios que garanticen el desarrollo a largo plazo de la Red”. WZS está desarrollando "Recomendaciones" para lograr la compatibilidad entre productos de software y equipos de varias empresas, lo que hace que la World Wide Web sea más avanzada, universal y conveniente.
Motores de búsqueda: composición, funciones, principios de funcionamiento.
Sistema de búsqueda es un complejo de software y hardware diseñado para buscar en Internet y responder a una solicitud de usuario, especificada en forma de frase de texto (consulta de búsqueda), generando una lista de enlaces a fuentes de información, en orden de relevancia (de acuerdo con la solicitud). Los mayores motores de búsqueda internacionales: "Google", "Yahoo", "MSN". En la Internet rusa es: "yandex", "Excursionista", "Aporto".
describamos principales características de los motores de búsqueda :
Lo completo
La integridad es una de las principales características de un sistema de búsqueda, que es la relación entre el número de documentos encontrados mediante solicitud y el número total de documentos en Internet que satisfacen la solicitud determinada. Por ejemplo, si hay 100 páginas en Internet que contienen la frase "cómo elegir un automóvil" y solo se encontraron 60 de ellas para la consulta correspondiente, entonces la integridad de la búsqueda será 0,6. Evidentemente, cuanto más completa sea la búsqueda, menos probable será que el usuario no encuentre el documento que necesita, siempre que exista en Internet.
Exactitud
La precisión es otra característica principal de un motor de búsqueda, que está determinada por el grado en que los documentos encontrados coinciden con la consulta del usuario. Por ejemplo, si la consulta "cómo elegir un automóvil" contiene 100 documentos, 50 de ellos contienen la frase "cómo elegir un automóvil" y el resto simplemente contiene estas palabras ("cómo elegir la radio adecuada e instalarla en un coche”), entonces la precisión de la búsqueda se considera igual a 50/100 (=0,5). Cuanto más precisa sea la búsqueda, más rápido el usuario encontrará los documentos que necesita, menos "basura" se encontrará entre ellos y menos a menudo los documentos encontrados no corresponderán a la solicitud.
Relevancia
La relevancia es un componente igualmente importante de la búsqueda, que se caracteriza por el tiempo que transcurre desde el momento en que los documentos se publican en Internet hasta que se ingresan en la base de datos del índice del motor de búsqueda. Por ejemplo, al día siguiente de que aparecieran noticias interesantes, una gran cantidad de usuarios recurrieron a los motores de búsqueda con consultas relevantes. Objetivamente, ha pasado menos de un día desde la publicación de noticias sobre este tema, pero los principales documentos ya están indexados y disponibles para su búsqueda, gracias a la existencia de la llamada “base de datos rápida” de los grandes buscadores, que se actualiza varias veces al día.
Velocidad de búsqueda
La velocidad de búsqueda está estrechamente relacionada con su resistencia a la carga. Por ejemplo, según Rambler Internet Holding LLC, hoy, durante el horario comercial, el motor de búsqueda Rambler recibe alrededor de 60 solicitudes por segundo. Esta carga de trabajo requiere reducir el tiempo de procesamiento de una solicitud individual. Aquí coinciden los intereses del usuario y del motor de búsqueda: el visitante quiere obtener resultados lo más rápido posible, y el motor de búsqueda debe procesar la solicitud lo más rápido posible, para no ralentizar el cálculo de consultas posteriores.
Visibilidad
La presentación visual de los resultados es un componente importante de una búsqueda cómoda. Para la mayoría de las consultas, el motor de búsqueda encuentra cientos o incluso miles de documentos. Debido a consultas poco claras o búsquedas inexactas, ni siquiera las primeras páginas de resultados de búsqueda contienen siempre sólo la información necesaria. Esto significa que el usuario a menudo tiene que realizar su propia búsqueda dentro de la lista encontrada. Varios elementos de la página de resultados del motor de búsqueda le ayudan a navegar por los resultados de la búsqueda. Puede encontrar explicaciones detalladas de la página de resultados de la búsqueda, por ejemplo para Yandex, en el enlace http://help.yandex.ru/search/?id=481937.
Una breve historia del desarrollo de los motores de búsqueda
En el período inicial de desarrollo de Internet, el número de usuarios era pequeño y la cantidad de información disponible era relativamente pequeña. En su mayor parte, sólo el personal de investigación tenía acceso a Internet. En ese momento, la tarea de buscar información en Internet no era tan urgente como lo es ahora.
Una de las primeras formas de organizar el acceso a los recursos de información de la red fue la creación de directorios abiertos de sitios, cuyos enlaces a recursos se agrupaban según el tema. El primer proyecto de este tipo fue el sitio web Yahoo.com, que se inauguró en la primavera de 1994. Después de que la cantidad de sitios en el directorio de Yahoo aumentó significativamente, se agregó la capacidad de buscar la información necesaria en el directorio. En sentido pleno, todavía no era un motor de búsqueda, ya que el área de búsqueda se limitaba únicamente a los recursos presentes en el catálogo y no a todos los recursos de Internet.
Los directorios de enlaces se utilizaban mucho en el pasado, pero en la actualidad han perdido casi por completo su popularidad. Dado que incluso los catálogos modernos, de gran volumen, contienen información sólo sobre una parte insignificante de Internet. El directorio más grande de la red DMOZ (también llamado Open Directory Project) contiene información sobre 5 millones de recursos, mientras que la base de datos del motor de búsqueda Google consta de más de 8 mil millones de documentos.
El primer motor de búsqueda completo fue el proyecto WebCrawler, publicado en 1994.
En 1995 aparecieron los motores de búsqueda Lycos y AltaVista. Este último es líder en el campo de la búsqueda de información en Internet desde hace muchos años.
En 1997, Sergey Brin y Larry Page crearon el motor de búsqueda Google como parte de un proyecto de investigación en la Universidad de Stanford. ¡Google es actualmente el motor de búsqueda más popular del mundo!
En septiembre de 1997, se anunció oficialmente el motor de búsqueda Yandex, que es el más popular en Internet en idioma ruso.
Actualmente, existen tres principales motores de búsqueda internacionales: Google, Yahoo y MSN, que tienen sus propias bases de datos y algoritmos de búsqueda. La mayoría de los demás motores de búsqueda (de los cuales hay un gran número) utilizan de una forma u otra los resultados de los tres enumerados. Por ejemplo, la búsqueda de AOL (search.aol.com) utiliza la base de datos de Google, mientras que AltaVista, Lycos y AllTheWeb utilizan la base de datos de Yahoo.
Composición y principios de funcionamiento del sistema de búsqueda.
En Rusia, el principal motor de búsqueda es Yandex, seguido de Rambler.ru, Google.ru, Aport.ru, Mail.ru. Además, actualmente Mail.ru utiliza el motor de búsqueda y la base de datos Yandex.
Casi todos los principales motores de búsqueda tienen su propia estructura, diferente de los demás. Sin embargo, es posible identificar los principales componentes comunes a todos los motores de búsqueda. Las diferencias en la estructura sólo pueden estar en la forma de implementación de los mecanismos de interacción de estos componentes.
Módulo de indexación
El módulo de indexación consta de tres programas auxiliares (robots):
Araña – un programa diseñado para descargar páginas web. La araña descarga la página y recupera todos los enlaces internos de esa página. Se descarga el código html de cada página. Los robots utilizan protocolos HTTP para descargar páginas. La araña funciona de la siguiente manera. El robot envía la solicitud "obtener/ruta/documento" y algunos otros comandos de solicitud HTTP al servidor. En respuesta, el robot recibe un flujo de texto que contiene información del servicio y el propio documento.
URL de la página
fecha en que se descargó la página
Encabezado http de respuesta del servidor
cuerpo de la página (código html)
Reptador (araña “viajera”) – un programa que sigue automáticamente todos los enlaces que se encuentran en la página. Selecciona todos los enlaces presentes en la página. Su trabajo es determinar dónde debe ir la araña a continuación, basándose en enlaces o una lista predeterminada de direcciones. El rastreador, siguiendo los enlaces encontrados, busca nuevos documentos que aún son desconocidos para el motor de búsqueda.
Indexador (robot indexador) - un programa que analiza las páginas web descargadas por las arañas. El indexador analiza la página en sus componentes y los analiza utilizando sus propios algoritmos léxicos y morfológicos. Se analizan varios elementos de la página, como texto, encabezados, enlaces, características estructurales y de estilo, etiquetas HTML de servicios especiales, etc.
Por lo tanto, el módulo de indexación le permite rastrear un conjunto determinado de recursos utilizando enlaces, descargar páginas encontradas, extraer enlaces a páginas nuevas de los documentos recibidos y realizar un análisis completo de estos documentos.
Base de datos
Una base de datos, o índice de motor de búsqueda, es un sistema de almacenamiento de datos, una matriz de información en la que se almacenan parámetros especialmente convertidos de todos los documentos descargados y procesados por el módulo de indexación.
Servidor de búsqueda
El servidor de búsqueda es el elemento más importante de todo el sistema, ya que la calidad y velocidad de la búsqueda dependen directamente de los algoritmos que subyacen a su funcionamiento.
El servidor de búsqueda funciona de la siguiente manera:
La solicitud recibida del usuario es sometida a análisis morfológico. Se genera el entorno de información de cada documento contenido en la base de datos (que posteriormente se mostrará en forma de snippet, es decir, información de texto correspondiente a la solicitud en la página de resultados de la búsqueda).
Los datos recibidos se pasan como parámetros de entrada a un módulo de clasificación especial. Los datos se procesan para todos los documentos, como resultado de lo cual cada documento tiene su propia calificación que caracteriza la relevancia de la consulta ingresada por el usuario y los distintos componentes de este documento almacenados en el índice del motor de búsqueda.
Dependiendo de la elección del usuario, esta calificación se puede ajustar mediante condiciones adicionales (por ejemplo, la llamada “búsqueda avanzada”).
A continuación, se genera un fragmento, es decir, para cada documento encontrado, se extraen de la tabla de documentos el título, un breve resumen que mejor se adapta a la consulta y un enlace al documento en sí, y se resaltan las palabras encontradas.
Los resultados de búsqueda resultantes se transmiten al usuario en forma de SERP (página de resultados del motor de búsqueda), una página de resultados de búsqueda.
Como puede ver, todos estos componentes están estrechamente relacionados entre sí y trabajan en interacción, formando un mecanismo claro y bastante complejo para el funcionamiento del sistema de búsqueda, que requiere enormes cantidades de recursos.
Ningún motor de búsqueda cubre todos los recursos de Internet.
Cada motor de búsqueda recopila información sobre los recursos de Internet utilizando sus propios métodos únicos y forma su propia base de datos actualizada periódicamente. El acceso a esta base de datos se concede al usuario.
Los motores de búsqueda implementan dos formas de buscar un recurso:
Buscar por tema catálogos - información se presenta en forma de estructura jerárquica. En el nivel superior hay categorías generales (“Internet”, “Negocios”, “Arte”, “Educación”, etc.), en el siguiente nivel las categorías se dividen en secciones, etc. El nivel más bajo son los enlaces a páginas web específicas u otros recursos de información.
Búsqueda de palabras clave (búsqueda de índice o búsqueda detallada): el usuario envía al motor de búsqueda pedido, que consta de palabras clave. Sistema devoluciones al usuario una lista de recursos encontrados a pedido.
La mayoría de los motores de búsqueda combinan ambos métodos de búsqueda.
Los motores de búsqueda pueden ser locales, globales, regionales y especializados.
En la parte rusa de Internet (Runet), los motores de búsqueda de uso general más populares son Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www. google.ru).
La mayoría de los motores de búsquedaimplementado en forma de portales.
Portal (del inglés.portal- entrada principal, portón) es un sitio web que integra diversos servicios de Internet: herramientas de búsqueda, correo, noticias, diccionarios, etc.
Los portales pueden ser especializados (como,www. museo. ru) y general (por ejemplo,www. kilómetros. ru).
Buscar por palabras clave
El conjunto de palabras clave utilizadas para la búsqueda también se denomina criterio de búsqueda o tema de búsqueda.
Una solicitud puede consistir en una palabra o una combinación de palabras combinadas por operadores: símbolos mediante los cuales el sistema determina qué acción debe realizar. Por ejemplo: la solicitud "Moscú San Petersburgo" contiene el operador AND (así se percibe un espacio), lo que indica que se deben buscar documentos que contengan ambas palabras: Moscú y San Petersburgo.
Para que la búsqueda sea relevante (del inglés relevante - relevante, relevante), se deben tener en cuenta varias reglas generales:
Independientemente de la forma en que se utilice la palabra en la consulta, la búsqueda tiene en cuenta todas las formas de las palabras de acuerdo con las reglas del idioma ruso. Por ejemplo, la consulta “ticket” también encontrará las palabras “ticket”, “ticket”, etc.
Las letras mayúsculas sólo deben usarse en nombres propios para evitar ver referencias innecesarias. A petición de los "herreros", por ejemplo, se encontrarán documentos que hablan tanto de los herreros como de los Kuznetsov.
Es recomendable limitar la búsqueda utilizando algunas palabras clave.
Si la dirección requerida no se encuentra entre las primeras veinte direcciones encontradas, deberá cambiar la solicitud.
Cada motor de búsqueda utiliza su propio lenguaje de consulta. Para familiarizarse con él, utilice la ayuda integrada del motor de búsqueda.
Los sitios grandes pueden tener sistemas de recuperación de información integrados en sus páginas web.
Las consultas en dichos sistemas de búsqueda, por regla general, se crean de acuerdo con las mismas reglas que en los motores de búsqueda globales; sin embargo, estar familiarizado con la ayuda aquí no será superfluo.
Búsqueda Avanzada
Los motores de búsqueda pueden proporcionar un mecanismo para que el usuario cree una consulta compleja. Siguiendo un enlace Búsqueda Avanzada permite editar los parámetros de búsqueda, especificar parámetros adicionales y seleccionar la forma más conveniente para mostrar los resultados de la búsqueda. A continuación se describen los parámetros que se pueden configurar durante una búsqueda avanzada en los sistemas Yanex y Rambler.
Descripción de parámetros |
Nombre en Yandex |
Nombre enExcursionista |
Dónde buscar palabras clave (título del documento, cuerpo del texto, etc.) |
Filtro de diccionario |
Buscar por texto... |
Qué palabras deberían o no estar presentes en el documento y qué tan precisa debe ser la coincidencia |
Filtro de diccionario |
Buscar palabras de consulta... Excluir documentos que contengan las siguientes palabras... |
¿A qué distancia deben ubicarse las palabras clave? |
Filtro de diccionario |
Distancia entre palabras de consulta... |
Restricción en la fecha del documento. |
Fecha del documento... |
|
Limite su búsqueda a uno o más sitios |
Sitio/Arriba |
Busque documentos sólo en los siguientes sitios... |
Limitar la búsqueda por idioma del documento |
Idioma del documento... |
|
Busque documentos que contengan una imagen con un nombre o firma específicos |
Imagen | |
Encontrar páginas que contengan objetos |
Objetos especiales | |
Formulario de presentación de resultados de búsqueda |
Formato de emisión |
Mostrar resultados de búsqueda |
Algunos motores de búsqueda (por ejemplo, Yandex) le permiten ingresar consultas en lenguaje natural. Escribe lo que necesita encontrar (por ejemplo: pedir billetes de tren de Moscú a San Petersburgo). El sistema analiza la solicitud y produce el resultado. Si no está satisfecho con él, cambie al idioma de consulta.
LA RED MUNDIAL[Inglés] World Wide Web, abreviado. – WWW o Web (web)] – distribuido heterogéneo computadora sistema de uso compartido hipermedia documentos, operando en red Internet . Los documentos de este sistema unidos mediante hipervínculos, formando una estructura ramificada compleja, se denominan en sentido figurado "web". Uno de los servicios de Internet más populares (junto conPor correo electrónico , los motores de búsqueda y etc.).
Paginas web y sitios web
Los documentos hipermedia de la Web, llamados páginas web, son un desarrollo del hipertexto (ver hipertexto). Pueden contener texto, imágenes, audio, vídeo y otros componentes. Cada página web tiene una dirección única: URL (abreviada: Universal Resource Locator - localizador unificado de recursos) donde se puede encontrar. Por ejemplo, www.webopedia.com es la URL de la página web principal del diccionario electrónico informático. Cualquier conjunto de caracteres contiguos en una página web puede ser un hipervínculo a otra página web u otra. recurso de información Internet. Los hipervínculos pueden apuntar no sólo a documentos web, sino también a otros recursos de información proporcionados por los servicios de Internet. Una colección de páginas web con hipervínculos que comparten una URL común (y generalmente están vinculadas temáticamente) se denomina sitio web. Por ejemplo, el sitio del diccionario electrónico informático Webopedia tiene la dirección www.webopedia.com y la página web del artículo con la definición del término Web es http://www.webopedia.com/TERM/W/World_Wide_Web. .html. La parte común de la dirección de todas las páginas del sitio es la dirección del sitio.
Servidores web y navegadores.
Los sitios web se almacenan en servidores web (computadoras con software especial). Los servidores web pueden ser diferentes computadoras. arquitecturas que cumplan con los requisitos de confiabilidad y rendimiento. Pueden trabajar bajo diferentes sistemas operativos y utilizar una variedad de programas de servidor. Por tanto, la Web es un sistema informático heterogéneo. La distribución global de Internet significa que los servidores web pueden ubicarse en cualquier parte del mundo donde haya una conexión a Internet.
Para recibir páginas web, el usuario utiliza un navegador (programa cliente web). Utilizando un navegador, genera y envía solicitudes para obtener recursos de información de su interés. El navegador interpreta los mensajes de respuesta recibidos de los servidores web y muestra los resultados de la interpretación en un dispositivo como parte de la computadora o dispositivo informático del usuario (pantalla de computadora, teléfono inteligente, etc.). Con el crecimiento en el número de aplicaciones web diferentes (correo web, búsqueda, diversos editores web de fotografías, gráficos y texto, así como otros programas de aplicación), los navegadores comenzaron a utilizarse como plataformas para aplicaciones web. Para trabajar con cualquiera de las aplicaciones web, el usuario sólo necesita disponer de un navegador adecuado, conocer la dirección de la aplicación y tener derechos de acceso. A medida que crece el número de aplicaciones web, los navegadores asumen una parte cada vez mayor de las tareas del sistema operativo (por ejemplo, Google Chrome OS se basa en el navegador Google Chrome).
La interpretación de los mensajes provenientes de los navegadores se realiza mediante programas de servidor instalados en servidores web. Los mensajes se intercambian entre estos programas de acuerdo con reglas (protocolos) correspondientes a la arquitectura cliente-servidor (ver. Red de computadoras). Internet utiliza el Protocolo de transferencia de hipertexto (HTTP).
Invención de la Web e implementación del proyecto.
En marzo de 1989, el físico británico T. Berners-Lee propuso un proyecto que más tarde se denominó proyecto Web [en aquel momento el inventor de la Web era un empleado de la Organización Europea para la Investigación Nuclear (CERN)]. Durante la implementación del proyecto web, su primer asistente fue el ingeniero de sistemas Robert Cailliau. Actualmente En aquel momento, el inventor de la Web es el director del consorcio internacional World Wide Web Consortium (W3C). El objetivo del W3C es aumentar el potencial de la Web (mediante el desarrollo de mejores protocolos y tecnologías) y garantizar su crecimiento sostenible continuo.
Desde el final En 1993 (después de la creación del primer navegador Mosaic con interfaz gráfica), la popularidad de Internet comenzó a crecer rápidamente.
Al Principio Siglo 21 La Web se ha convertido en el servicio de Internet más popular y de mayor desarrollo dinámico. Facilidad de interacción con la Web y temáticas. la variedad de recursos web ha determinado la escala de su aplicación en diversas áreas de la actividad humana (educación a distancia, comercio electrónico, redes sociales, publicaciones electrónicas, etc.).