robots.txt

julio 18, 2007

Son conocidos como Spiders (arañas) a los bots de búsqueda que van revisando la WWW.
Los robots realizan sus tareas de formas automáticas y pueden generar conflictos al servidor, con por ejemplo, exceso de utilización de ancho de banda o accediendo a contenido que no debería tener acceso.

Para suplir este problema surgió el archivo robots.txt, este le informa a los bots a que archivos web tiene acceso y cuales no según el webmaster.

Se utiliza el paramento User-agent: para especificar sobre un bot en particular y Disallow: para especificar cuales son los directorios a “no revisar” (según el bot se pueden utilizar comodines).

Mas información en el estándar de exclusión de robots y en la ayuda de google (googlebot es el bot encargado de indexear las páginas para este buscador).

Anuncios

Otras formas de acceso a la enciclopedia libre

julio 12, 2007

Hay varias formas de acceder al contenido de Wikipedia, para que se pueda encontrar la información buscada de diferentes formas, ademas de navegando por los links o utilizando el buscador.

Omnipelagos: mediante dos palabras muestra las diferentes relaciones entre dos definiciones.

WikiMindMap: navegación entre los conceptos de wikipedia.

En la página de descarga de wikimedia se puede descargar una copia de los wikis en formato XML o en páginas HTML estáticos.

Exportando una entrada a formato XML.


Hotlinking: Qué es y cómo evitarlo

julio 4, 2007

El hotlinking, en la WWW, es la utilización del ancho de banda de otro sitio; mediante enlaces directos a los archivos (normalmente imagenes) y no a la página web de este otro sitio que enlaza a estos archivos.

Esta practica es considerada por algunos webmasters como “robo de ancho de banda y de visitas” dado que estos archivos no fueron descargados desde el sitio que se creo, sino desde uno externo.

Para evitar esto, por parte del que mantenga un sitio web, se pueden agregar marcas de agua a las imágenes (no evita el hotlinkig pero se da a conocer de donde se saco la imagen) y/o utilizar la directiva “RewriteCond” junto con el http_referer del archivo .htaccess (para servidores HTTP Apache) para evitar o redirigir el acceso a la imagen.

Si uno desea utilizar una imagen de otro sitio (teniendo en cuenta la licencia del contenido del sitio), pero sin realizar hotlinkig, puede descargar la imagen y subirla al propio servidor (o a otro que permita hotlinkig), utilizar la opción url de servidores gratuitos de imágenes como imageshack, o utilizar servicios como ImgRed, entre otras opciones.


Peligros del Peligro Abstracto

julio 1, 2007

Un peligro abstracto se puede entender como la acción cuya finalidad o efecto puede producir un daño a bienes comunes. Está posibilidad se suele ver desde un punto de vista subjetivo, dejando de lado el peligro concreto y acercándose mas a la generalización de “los peligros”.

Ejemplo de Peligro Abstracto

En esta tira cómica (dibujada por Perillo, vista en meneame) se ve como la posesión de un objeto, en un video juego, es considerada como “un peligro” por parte de la ESRB (entidad que clasifica los video juegos por edades). Sin tenerse en cuenta los fines por los que este objeto aparece en la escena. Un peligro sin un daño existente.


Ajedrez minimalista en JavaScript

julio 1, 2007

Menos de 5kb es lo que ocupa este ajedrez programado en JavaScript por Douglas Bagnall.
El código está un poco confuso; variables y nombre de funciones de pocos caracteres.

Ajedrez rey dama

Otro ajedrez programado en JavaScript con gráficos más bonitos y un código más extenso (menos de 12 kb) es el programado por Neil pearce.