¿Qué es la Deep de la web? - El Megacurioso

Lo más reciente

Home Top Ad

Post Top Ad

sábado, 7 de noviembre de 2015

¿Qué es la Deep de la web?


Se conoce informalmente como internet profunda o internet invisible; abreviada en ingles como DW. Es una porción presumiblemente muy grande de la internet que es difícil de rastrear o ha sido hecha casi imposible de rastrear.

Teniendo en cuenta esto, tienes que saber que en la DW no se “navega” por así decirlo; se bucea. Si creias que Google es la web estas muy equivocado“la web son todas las máquinas y dispositivos interconectados entre sí que pueden ser accesibles desde otros dispositivos similares.”


La DW es el mismo internet que conocemos pero lleno de más sitios que no pueden ser indexados de ninguna manera por los buscadores convencionales, ya sea porque son páginas tan arcaicas que los buscadores ya ignoran, ya sea porque poseen contenido no indexable (páginas totalmente hechas en flash tendían a caer casi de inmediato a la DW por no poseer html indexable) o también porque los programadores de la página en cuestión han hecho su código intencionalmente para ser ignorado por los buscadores y… hasta hay páginas privadas y encriptadas.

Se conoce así a todo el contenido de internet que no forma parte de la internet superficial, es decir, de las páginas indexadas por las redes de los motores de búsqueda de la red. Esto se debe a las limitaciones que tienen las redes para acceder a todos los sitios web por distintos motivos. La mayor parte de la información encontrada en la internet profunda está enterrada en sitios generados dinámicamente y para los motores de búsqueda tradicionales es difícil hallarla. Fiscales y agencias gubernamentales han calificado a la internet profunda como un refugio para la delincuencia debido al contenido ilícito que se encuentra en ella.


Origen

La principal causa de la existencia de la internet profunda es la imposibilidad de los motores de búsqueda (Google, Yahoo, Bing, etc.) de encontrar o indexar gran parte de la información existente en internet. Si los buscadores tuvieran la capacidad para acceder a toda la información entonces la magnitud de la «internet profunda» se reduciría casi en su totalidad. No obstante, aunque los motores de búsqueda pudieran indexar la información de la internet profunda esto no significaría que esta dejará de existir, ya que siempre existirán las páginas privadas. Los motores de búsqueda no pueden acceder a la información de estas páginas y solo determinados usuarios, aquellos con contraseña o códigos especiales, pueden hacerlo.

Los siguientes son algunos de los motivos por los que los buscadores son incapaces de indexar la internet profunda:



Páginas y sitios web protegidos con contraseñas o códigos establecidos.
  • Páginas que el buscador decidió no indexar: esto se da generalmente porque la demanda para el archivo que se decidió no indexar es poca en comparación con los archivos de texto HTML; estos archivos generalmente también son más «difíciles» de indexar y requieren más recursos.3
  • Sitios que, dentro de su código, tienen archivos que le impiden al buscador indexarlo.
  • Documentos en formatos no indexables.
  • Según la tecnología usada por el sitio: por ejemplo los sitios que usan bases de datos. Para estos casos los buscadores pueden llegar a la interfaz creada para acceder a dichas bases de datos, como por ejemplo, catálogos de librerías o agencias de gobierno.3
  • Enciclopedias, diccionarios, revistas en las que para acceder a la información hay que interrogar a la base de datos, como por ejemplo la base de datos de la RAE.4
  • Sitios que tienen una mezcla de medios o archivos que no son fáciles de clasificar como visible o invisible (Web opaca).
  • La información es efímera o no suficientemente valiosa para indexar. Es posible indexar está información pero como cambia con mucha frecuencia y su valor es de tiempo limitado no hay motivo para indexarla.3
  • Páginas que contienen mayormente imágenes, audio o video con poco o nada de texto.
  • Los archivos en formatos PostScript, Flash, Shockwave, ejecutables (.exe), archivos comprimidos (.zip,.rar, etc).
  • Información creada en páginas dinámicas después de llenar un formulario, la información detrás de los formularios es invisible.
  • Documentos dinámicos, son creados por un script que selecciona datos de diversas opciones para generar una página personalizada. Este tipo de documentos, aunque sí se pueden indexar, no están en los motores de búsqueda porque en ocasiones puede haber varias páginas iguales, pero con pequeños cambios, y las arañas web quedan atrapadas en ellos.3
  • Es un sitio aislado, es decir, no hay ligas que lo vinculen con otros sitios y viceversa.5
  • Son subdirectorios o bases de datos restringidas.





Imagenes:nacion

No hay comentarios.:

Publicar un comentario

Post Bottom Ad

Responsive Ads Here

Pages