Encontrar en internet

Buscar en internet podría parecer una tarea simple, casi automática. Pero como cualquier tarea intelectual no es así. Para empezar hay que imaginar cómo estará escrito lo que nosotros buscamos. Si quiero encontrar textos que desarrollen temas sobre diseño gráfico no basta con poner esas palabras ya que me devolverá resultados con cursos o con ofrecimiento de servicios. Normalmente no hacemos búsquedas tan genéricas y probablente podamos utilizar terminología propia. Por ejemplo, para buscar en Google notas sobre el uso del serif en la web escribimos web serif | serifs -software. Con el ‘|‘, shorcut para el operador OR, me aseguro de buscar un término, sus sinónimos o, como en este caso, el plural y -software me permite descartar los artículos sobre software ( es el shorcut de NOT).

Los programadores han tomado decisiones en cuanto a cómo se busca y si no las conocemos nuestras búsquedas pueden darnos resultados inesperadamente pobres o absurdos.
Muchas búsquedas pueden hacerse utilizando la búsqueda avanzada, pero también en esa página hay características que yo desconocía.

Algo que no sabía y que me enteré en esta página de medicina (?), es que google.com toma en cuenta acentos, eñes y demás signos diacríticos, pero las versiones locales no. Ej: al buscar caña google.com devolvió resultados sólo con esa palabra y google.com.ar me trajo respuestas con caña y cana. También me entero que el signo más (+) no es sólo el shorcut para AND sino que se utiliza para incluir palabras que normalmente se descartan por ser muy comunes como de o el. (La nota toca muchos temas relacionados con internet y podemos encontrar la explicación sobre Google bajo el título Cuadro 2: operadores lógicos que utiliza Google).

Cuando busquemos imágenes debemos saber que usando la página de Google En la web no obtendremos resultados de archivos de este tipo (.gif, .jpg, .jpeg, .png) (tampoco con el operador filetype:). En esta búsqueda Google lee DENTRO del archivo o sea que solo sirve para los archivos que indexa (los que escanea leyendo su contenido). Además de los estándares de web .htm y .html encontraremos:

  • Adobe Portable Document Format (pdf)
  • Adobe PostScript (ps)
  • Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • Lotus WordPro (lwp)
  • MacWrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (wks, wps, wdb)
  • Microsoft Write (wri)
  • Rich Text Format (rtf)
  • Shockwave Flash (swf)
  • Text (ans, txt)

El operador filetype: es útil también para eliminar de nuestra búsqueda los tipos de archivo que no nos interesan. Ej: para eliminar los .ppt debemos escribir -filetype:ppt.
Para encontrar imágenes es la opción imágenes que también tiene una versión avanzada.

Hay muchos operadores más. En elhacker.net están detallados: Link, Allinurl, Allintitle, Allintext, Allinanchor, Site, Info, Inurl, Intitle, Cache, Related (que parece no sirve de mucho), Stocks, Filetype, Define.

Link es útil cuando tenemos un sitio y queremos saber qué sitios lo linkean. Ej: para ver los sitios que linkean a este weblog escribo link:http://www.irenefernandez.com.ar/badd/.

También se pueden usar comodines. Escribiendo «* balcones y * flor» encuentra el poema de Baldomero Fernández Moreno, porque toma cada asterisco como indicación de una palabra faltante. Una suerte para quienes no recordamos cuántos balcones eran :P.

El rango temporal no tiene un método simple de ser usado. En el sitio metodosdebusca.com me entero que utiliza el día juliano, usado normalmente en cálculos astronómicos.

A mi resulta más cómodo utilizar los operadores que la búsqueda avanzada, además que me permite corregir la búsqueda según la devolución obtenida. Además hay búsquedas complejas que no pueden hacerse con ese panel.

Curiosidades:

Etiquetas:

2 comentarios