CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation

 
SEGUIR LEYENDO
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
CURSO 2019-2020
BÚSQUEDA DE INFORMACIÓN EN INTERNET
David Herrera Sánchez
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
INTRODUCCIÓN

Según Bill Gates “Internet facilita la
información adecuada, en el momento                Directorios de recursos de
adecuado, para el propósito adecuado”. Con
esta premisa y partiendo de un axioma que                 información
se empieza a consolidar, en el sentido de
que “si no está en Internet, no existe”, la idea
del presente tutorial, reside en ofrecer un          Listas de distribución
producto sumamente extractado, para que el
usuario final, no divague entre conceptos
etéreos o le aburra el contenido propuesto.            Metabuscadores
Sería necesario, profundizar en cada uno de
los temas tratados, para un mayor
conocimiento, pero éste no es el objetivo que             Buscadores
se persigue, más bien es el de dotar de unos
elementos que conduzcan a mejorar nuestra
actividad profesional o académica, cuando          Google: funcionalidades,
nos enfrentamos ante la problemática de
buscar información en internet. (Enlace a
                                                    búsqueda avanzada
vídeo)

                                                   Operadores de búsqueda
Hoy en día Internet se ha convertido en una
herramienta esencial en nuestra vida. Para
la búsqueda de información en la web,                    Fuentes RSS
habremos de tener en cuenta algunos
conceptos: (Enlace a vídeo “10 datos reales
sobre Internet que te van a volver loco”)               Redes sociales

                                                           Deep web

                                                           Tesauros
                                                                                1
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
DIRECTORIOS DE RECURSOS DE INFORMACIÓN

Son listados de recursos de información con enlaces a diversas fuentes de información,
categorizados por temas. Constituyen la primera forma de organización de información que
hubo en Internet, y suelen presentar un índice temático, similar al de las bibliotecas. Con el
auge de los buscadores, decayeron en importancia hasta prácticamente desaparecer.

    El más conocido eraYahoo, aunque existen otros, como los que se relacionan a
       continuación (Primera página de Yahoo).
      Buscopio(desaparecido)
      DMOZ(versión actual) (versión en español)
      VLIB – Biblioteca Virtual WWW
      Bibliotecas de España y de todo el mundo(poco actualizada)
      Ezilon (www.ezilon.com) ,
      EINET (http://www.einet.net/) ,
      DOAJ, directorio de revistas de acceso libre (http://www.doaj.org) ,
      Base de datos de la UNESCO (http://databases.unesco.org/dare/form.shtml),
      Directorio de expertos en el tratamiento de la información,
      Directorio de motores de búsqueda por países,
      Directorio de Google,
      ipl2 Florida StateUniversity,
      Directorio de colecciones digitales,
      Worldcriminologicaldirectory

Había una gran cantidad de ellos. Por ejemplo, en el siguiente enlace, lista algunos más
"directorios similares a bubl.ac.uk". Sin embargo, han ido desapareciendo con el cambio de
hábitos de los usuarios y la aparición de otras tecnologías.
                                                                                           2
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
GRUPOS DE TRABAJO, DISCUSIÓN Y LISTAS DE DISTRIBUCIÓN

Constituyen redes de usuarios que comparten información. Se organizan en torno a
distintas temáticas y suele necesitarse autorización para recibir información.

      http://www.rediris.es/list/
      http://www.elistas.net/
      http://www.lsoft.com/lists/listref.html
      https://groups.google.com/forum/?fromgroups&hl=es#!browse
      http://www.iaca.net/resources.asp?Cat=Email%20List
      http://forensicsncrime.proboards.com/index.cgi
      http://www.esc-eurocrim.org/workgroups.shtml
      http://es.groups.yahoo.com/

                                                                                   3
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
METABUSCADORES

Puede decirse que eran superbuscadores, dado que permitían la búsqueda simultánea en
varios buscadores.

Podían utilizarse vía web o previa instalación del software de un fabricante.

Citamos algunos de los más conocidos:

    Metacrawler (http://www.metacrawler.com/)
    Webcrawler (http://www.webcrawler.com/)
    Searchcaddy, utilizado con navegador Internet Explorer
     (http://www.searchcaddy.com/)
    Dogpile (http://www.dogpile.com/)
    Monstercrawler (http://monstercrawler.com/)
    Bestsearch (http://www.bestsearch.com/beta/)
    Ixquick (https://classic.startpage.com/)
    Copernic (http://find.copernic.com/)
    Gigablast (http://www.gigablast.com/)
    Infocom (http://www.info.com/)
    Zuula (www.zuula.com)
    Unabot (http://www.unabot.com/)
    Zapmeta (http://www.zapmeta.com/)
    Katapulco (http://www.katapulco.com)
    Twingine (http://www.twingine.com/)
    Webferret (programa gratuito)
    Quickweb (programa gratuito)
    Firststopwebsearch (programa gratuito)
    etc.                                                                         4
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
BUSCADORES

Como la propia palabra indica sirve para realizar BÚSQUEDA DE INFORMACIÓN EN
INTERNET.

                                                 Existen distintos tipos de buscadores.

                                                 Empezaremos por hacer referencia a los
                                                 relacionados con la asignatura, dejando el
                                                 buscador por antonomasia, Google, para
                                                 un tratamiento posterior y más extenso.

En primer lugar podemos citar los que se ubican dentro de páginas web como

    la base de datos de Tesis Doctorales TESEO
     (https://www.educacion.gob.es/teseo/irGestionarConsulta.do)
    la Biblioteca Virtual Cervantes (http://www.cervantesvirtual.com/),
    ScienceDirect (http://www.sciencedirect.com/) ,
    dialnet (http://dialnet.unirioja.es/),
    Etc.

Hay una serie de buscadores específicos, según temática que se quiera consultar. Son
bastante útiles para estudiantes.

      Buscador de charlas (http://talkminer.com/)
      información científica (http://www.sciencedirect.com/)
      buscador de libros (http://www.bookfinder.com/)
      enciclopedia (http://www.encyclopedia.com/ )
      buscador de vídeos Blinkx (http://www.blinkx.com/)
                                                                                          5
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
 buscador de noticias (http://news.google.es/), ahora https://news.google.com/?hl=es-
     419&gl=US&ceid=US%3Aes-419
    buscador de imágenes (http://www.gettyimages.es/)
    Buscador de ebooks y documentos digitales (http://search.boocu.com/)
    Buscador de pdf (http://pdf-ebook.net/)
    Indeed (http://www.indeed.es/)
    Buscador de datos estadísticos Zanran (http://www.zanran.com/q/)
    Buscador de páginas web similares (http://www.similarsites.com/)

A la hora de establecer, cual es el mejor buscador, hay que tener en cuenta muchos
factores, pues pueden variar según permitan ciertas opciones en la búsqueda, tales como
la búsqueda avanzada, operadores booleanos, privacidad, etc.

En septiembre de 2013, la cuota de mercado de los mismos, era el siguiente:

Fuente: http://marketshare.hitslink.com/

En enero de 2015 la situación ha cambiado ofreciendo el siguiente panorama:
                                                                                      6
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
En enero de 2018, la situación es la que sigue:

Y en lo que respecta a dispositivos móviles:

Y esta es la situación en noviembre de 2018

Y en móviles
                                                  7
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
Pero……, existe vida más allá de Google y de los otros grandes buscadores descritos en la
diapositiva anterior. Existen buscadores bastante interesantes:

      Quintura (http://quintura.com/)
      Wolframalpha motor de conocimiento computacional (http://www.wolframalpha.com/)
      Exalead (http://www.exalead.com/search/)
      Kartoo (http://www.kartoo.com/)
      Hotbot (http://www.hotbot.com/)
      Duckduckgo (http://duckduckgo.com/)
      Yippy (http://www.yippy.com/)
      Archive (http://www.archive.org/)
      Yandex (http://www.yandex.com/)
      Oamos (http://www.oamos.com/)
      Spezify (http://www.spezify.com/)
      Sensebot (http://www.sensebot.net/sense6.aspx)
      Facbites, búsquedas en inglés (http://www.factbites.com/)
      Cluuz (http://www.cluuz.com/)
      Blekko, puedes utilizar etiquetas de búsqueda (http://blekko.com/ )
      Clusty (http://clusty.com/)
      Gotapi para programadores informáticos (http://www.gotapi.com/html)
      Volunia(http://www.volunia.com/)
      Programa Yacy, software libre (con licencia GPL) y de código abierto, realiza
       búsquedas descentralizadas (http://yacy.net/es/)
                                                                                     8
CURSO 2019-2020 BÚSQUEDA DE INFORMACIÓN EN INTERNET - ModNation
REDES SOCIALES

Los buscadores de información en redes sociales adolecen de “refinamiento en la
búsqueda” y de que suelen estar enfocados a la búsqueda de términos en inglés.

Existen diversos buscadores de información en redes sociales, citamos:

    Omgili (www.omgili.com), buscador mixto de información general y en redes
     sociales,
    Entireweb (http://www.entireweb.com/),
    Convoflow (http://www.convoflow.com/),
    Social Mention (http://socialmention.com/),
    WhosTalking (http://www.whostalkin.com/)
    48ers (http://www.48ers.com/),
    Open Status Search (http://openstatussearch.com/) ,
    Tinker (http://www.tinker.com/),
    Tweetreach (http://tweetreach.com/),
    Topsy (http://topsy.com/),
    Kurrently (http://www.kurrently.com/)
    Trendsmap (http://trendsmap.com/),
    WinkPeopleSearch buscador de personas en redes sociales (http://wink.com/ y
     http://snitch.name/ ) ,
    Tweepz (http://tweepz.com/)
    Programa gratuito AlertThingy 3.03

                                                                                   9
GOOGLE

Es el buscador número uno de internet. Creado en 1997 por dos doctorandos de la
Universidad de Stanford (Larry Page y Sergey Brin), no existe nadie en el mundo que utilice
internet hoy en día y no conozca esta poderosa herramienta. Pero Google, es algo más que
un buscador. Permite la búsqueda de imágenes, videos, noticias, etc.

En versiones anteriores del buscador, se ofrecía un menú que nos permitía navegar por
distintas opciones. Hoy en día se ofrece un menú de iconos.

Las antiguas funcionalidades, hoy se organizan en aplicaciones:

https://www.google.es/intl/es/about/products/
                                                                                        10
Podemos destacar el apartado de alertas que se ofrece con el icono:

Si deseamos recibir alertas en nuestro correo electrónico (que no tiene por qué ser una
cuenta de Google), no tenemos más que pulsar este icono e introducir nuestra cuenta de
correo y el término conceptual en cuestión.

La pantalla para la creación de alertas es la siguiente:

La forma de realizar la búsqueda en Google es sencilla. No obstante, es conveniente utilizar
todas las potencialidades que este buscador nos ofrece.

Para alcanzar a comprender el alcance de las búsquedas, conviene ver el siguiente video
tutorial (control + click sobre la imagen, abrirá el vídeo en el navegador)
                                                                                        11
Existen unas pantallas de búsqueda avanzada, que antes se ofrecían en los menús del
buscador. Actualmente es algo más complicado encontrarlas. Se ofrecen a continuación los
enlaces:

   -   Búsqueda avanzada: https://www.google.es/advanced_search
   -   Búsqueda avanzada de imágenes: https://www.google.es/advanced_image_search

Hay que hacer referencia a una funcionalidad de Google que no está disponible para
España por problemas tributarios, Google News. No obstante, podemos utilizar la versión
de Estados Unidos en habla hispana, aunque es algo complicado dar con ella desde IP’s
situadas en España. El enlace correspondiente es el siguiente:

https://news.google.com/?hl=es-419&gl=US&ceid=US%3Aes-419

                                                                                      12
OPERADORES DE BÚSQUEDA

Operadores Booleanos

AND: indica que se recuperarán los documentos que contengan todas las palabras
indicadas en la solicitud de búsqueda

OR: ordena a la base de datos que devuelva todos los documentos que contengan, al
menos, una de las palabras clave solicitadas.

NOT o AND NOT: se utiliza entre 2 términos claves y se traduce por "no".

XOR: Pide a la base de datos que devuelva todos los documentos que contengan una de
las 2 palabras clave, pero excluye aquellos que contengan las 2 a la vez.

Operadores relacionales

Los operadores relacionales (, =, , =) permiten buscar expresiones numéricas.
Utilizar los operadores relacionales encerrando un campo entre llaves {}, y tecleando un
operador relacional y un número.

mayor que

= igual a

diferente de

= mayor que o igual a

Operadores de proximidad

NEAR: En español significa "cerca" y solicita los documentos que contengan ambas
palabras clave, pero que no estén separadas por más de 10 palabras o 100 caracteres.

ADJ: Este operador significa “junto” y se utiliza para recuperar conjuntos de búsqueda
adyacentes.
                                                                                         13

FAR: palabras clave de búsqueda indicadas aparezcan con 25 palabras o más de distancia
FOLLOWED BY: En español significa "seguido de". Sus resultados son muy parecidos a
los que produce Near, pero marca claramente cuál ha de ser el orden de las palabras clave.

Operadores de campo

TITLE: Se indica que se debe buscar sólo por el campo de título; ejemplo
title:"Organización Panamericana de la Salud", nótese que no se deben dejar espacios
entre los dos puntos (:) y el título a buscar.

DOMAIN: Se restringe la búsqueda en determinados dominios de países o tipo de
instituciones (educativas, militares, comerciales, etc), ejemplo, domain:es and "educación
universitaria" (buscará el término "educación universitaria" solo en aquéllas páginas cuyo
dominio sea .es)

URL: Se limitan los resultados a páginas web donde las palabras clave se encuentre en el
URL, ejemplo url:autonoma

LINK: Se utiliza para conocer las páginas que ofrecen enlaces a un sitio en particular,
ejemplo link:www.uam.es

HOST: Para buscar dentro de un sitio en particular, ejemplo host:www.uam.es

Operadores de truncado
Son operadores cuya presencia puede sustituir un carácter o un conjunto de caracteres,
situados a la derecha de un término. Los más comunes son:

OPERADOR $: Permite el truncamiento de un número múltiple de caracteres en medio o al
final de un término de búsqueda.

OPERADOR ?: Permite sustituir un carácter en medio o al final de un término de búsqueda.
No se puede utilizar al inicio de una palabra.

EL SÍMBOLO *: Se usa únicamente como carácter de truncamiento a la derecha para
encontrar todas las formas de una palabra.
                                                                                          14
FUENTES RSS

RSS son las siglas de Really Simple Syndication, un formato XML para sindicar o compartir
contenido de una web con los demás.

Se utiliza para difundir información actualizada frecuentemente a usuarios que se han
suscrito a la fuente de contenidosRSS. Este formato XML se ha desarrollado
específicamente para todo tipo de sitios que se actualicen con frecuencia y por medio del
cual se puede compartir la información y usarla en otros sitios web o programas. A esto se
le conoce como redifusión web o sindicación web (una traducción incorrecta, pero de uso
muy común).

Normalmente aparecen con el icono de la izquierda pero también puede que tengan los que
se insertan en la derecha.

A continuación se insertan
enlaces a tres videos tutoriales
de cómo agregar una fuente
RSS. (Requiere Internet y
pulsar sobre el enlace)

    Agregar RSS al
     navegador
    Agregar RSS al correo
     electrónico Outlook
    Suscribirse a una
     fuente RSS desde
     Facebook o Twitter
                                                                                        15
DEEP WEB

Hay vida más allá de la red visible, no sólo la
que se oculta por motivos empresariales
(intranets corporativas, subredes de pago, etc),
sino también otra parte que trata de ocultarse
de miradas indiscretas, con todo tipo de
propósitos lícitos o ilícitos. Se trata de la
denominada red profunda o deep web y se
estima que constituye un porcentaje muy
elevado de la red total.

En la deep web, los usuarios intentan mantener
su anonimato mediante el uso de proxies anonimizadores (ocultan la dirección IP real del equipo del
usuario, pasando por distintas máquinas con el objeto de hacer muy difícil su rastreo).

La más conocida de estas redes es la red TOR. A continuación se citan algunos buscadores en esta
red (nótese que las URLs facilitadas terminan con la palabra .onion).

   NotEvilSearch: Uno de los más importantes, no filtra contenidos delicados.

       http://hss3uro2hsxfogfq.onion/

   Candle: Más versátil, pero menos páginas indexadas que el anterior

       http://gjobqjj7wyczbqie.onion/

   Grams: Mercados negros

       http://grams7enufi7jmdl.onion/

   Torch: Similar al primero, pero tiene caché (permite ver páginas desaparecidas)

       http://xmh57jrzrnw6insl.onion/

   Ahmia: Más discreto que los anteriores, filtra contenidos delicados

       https://ahmia.fi/

   Darknet links: Directorio y buscador

       http://aaalinktbyhxngho.onion/

A la hora de navegar por la Deep Web, hay que tener cuidado con lo que se hace, porque puede
que nos topemos con contenidos muy delicados, e incluso actividades poco éticas o incluso
ilegales.
                                                                                               16
TESAUROS
Un tesauro es una lista de palabras con significados similares o sinónimos, habitualmente
acompañada por otra lista de antónimos. Suelen recoger los términos usados en un campo
especializado. Su finalidad es contribuir a la normalización de los términos; de este modo se facilita
la comprensión y la comunicación.

Un ejemplo de este concepto puede apreciarse en el Tesauro de la UNESCO. En él se incluyen los
términos que deben emplearse para buscar publicaciones y documentos y para realizar análisis de
tipo temático. Dicho tesauro contiene miles de términos en diferentes idiomas, entre ellos el
castellano.

       Tesauro de la UNESCO, en inglés
       Tesauro de la UNESCO, en español

                                                                                                   17
BIBLIOGRAFÍA
   “La información especializada en Internet”. Autor: CSIC
   Serrano Cinca C. (2003): "Encontrar información en el World Wide Web“
   “The invisible Web: uncovering information sources search engines can't see”.
   Escrito por Chris Sherman y Gary Price
   “Servicios Bibliotecarios”. Escrito por Figueroa Alcántara, Hugo Alberto, Ramírez
   Velázquez, Cesar Augusto
   Buscadores de internet:
   http://www.buscadoresdeinternet.net/search/label/Buscadores%20de%20internet
   The Top 100 Alternative Search Engines:
   http://www.readwriteweb.com/archives/top_100_alternative_search_engines.php
   100+ Alternative Search Engines You Should Know: http://www.hongkiat.com/blog/100-
   alternative-search-engines-you-should-know/
   10 Offbeat & Alternative Search Engines You Might Not Have Heard Of:
   http://www.makeuseof.com/tag/10-offbeat-alternative-search-engines-heard/
   Top 7 Best Alternative Search Engines:http://www.top10tag.com/top-7-best-alternative-
   search-engines/
   10 Herramientas para buscar personas en redes
   sociales:http://manuelgross.bligoo.com/content/view/743239/10-Herramientas-para-
   buscar-personas-en-redes-sociales.html
   Lista de los mejores buscadores de Redes Sociales: http://soxialmedia.com/lista-mejores-
   buscadores-redes-sociales/
   Buscador en redes sociales y en tiempo real:
   http://www.kabytes.com/buscadores/buscador-en-redes-sociales-y-en-tiempo-real/
   70 Herramientas para monitorizar información en las Redes Sociales:
   http://www.socialblabla.com/70-herramientas-para-monitorizar-informacion-en-las-
   redes-sociales.html
   Search Through All The Data On Gmail, Google Apps & Twitter With CloudMagic:
   http://www.makeuseof.com/tag/search-tons-data-gmail-google-apps-twitter-
   cloudmagic/
   Sincronizar Twitter y Facebook: http://www.kabytes.com/aplicaciones-online/sincronizar-
   twitter-y-facebook/
   El objetivo de Google consiste en organizar la información del mundo y hacerla accesible y
   útil de manera universal: http://www.google.com/intl/es/about/
   El uso de los buscadores en Internet:
   http://www.bvs.sld.cu/revistas/aci/vol11_3_03/aci04303.htm
   Operadores: http://dosei.who.int/iBistro_helps/Spanish/tip7102.html
   Truncamiento y máscaras o caracteres comodín:
   http://www2.uah.es/bibliotecaformacion/BECO/BUSQUEDADEINFORMACION/trunc
   amiento_y_mscaras_o_caracteres_comodn.html
   Agregar una fuente RSS: http://office.microsoft.com/es-hn/outlook-help/agregar-una-
   fuente-rss-HA010159539.aspx
   Las listas de distribución como herramienta profesional:
   http://exlibris.usal.es/merlo/escritos/pdf/mei.pdf
   4 Multi-Search Engines to Consider for Your Home Page:
   http://www.makeuseof.com/tag/4-multi-search-engines-you-should-consider-for-your-
   home-page/
   Los 5 mejores buscadores de la Deep Web
   http://elblogdeladeepweb.blogspot.com.es/2016/01/los-5-mejores-buscadores-de-la-
   deep-web_16.html
   Definiciones de tesauro:
       o Wikipedia: https://es.wikipedia.org/wiki/Tesauro
                                                                                           18
Definición.de: https://definicion.de/tesauro/

                                                19
También puede leer