Gracias a Slashdot me entero que entrevistan a Tim Berners-Lee en BBC NEWS.
La entrevista, se centra en aspectos como la veracidad de la información, y las consecuencias negativas que tiene internet, asuntos que preocupan a la «sociedad». Pero también muestra los aspectos positivos, como un medio de comunicación global (que debería de llegar a todos los paises y todas las personas) y participativo (blogs y wikis), algo que tenía en mente Tim desde los inicios en la gestación de World Wide Web.
Por cierto, la entrevista, la podeís encontrar en Berners-Lee on the read/write web. Y me gustaría destacar (citar) tan sólo una frase:
My goal for the web in 30 years is to be the platform which has led to the building of something very new and special, which we can’t imagine now.
.
Cambiando te tema, pero siguiendo hablando de Tim, yo personalmente os recomiendo leer el libro Tejiendo la red, que cuenta la historia de la creación de la Web, escrito por el propio Tim Berners-Lee. Yo lo he leído dos veces ya (prestado de una biblioteca), y lo leeré unas cuantas veces más. Es muy recomendable.
A ver si aprovecho la próxima lectura para hacer una reseña sobre el libro…
Categoría: Web Semántica
Web semántica.
Buscando un poco en technorati, la etiqueta semantic web, me encuentro con una página, que aunque no hace referencia a una noticia de última hora, sí que me ha llamado la atención. El artículo (en inglés), se llama Human Markup Language (Human ML).
En una parte de este post, nos encontramos con:
Some of the questions that the use of HumanML could hopefully address are: Is the retrieved document informational in nature? Is it intended as policy, as advertisement, propaganda or some other purpose? At the point in history of document creation, what was the unstated motivation to create and publish it? What was the author’s attitude toward the subject? When extracting or quoting short sections for citation or comment, how can this context be carried forward without the need to include long background passages? How to avoid accidental release of protected information by ignoring or forgetting to include external markings? How to avoid distortion of original meaning or intent whether intentional or not? How to understand cross-culturally and interpret specialized lingo such as «governmentese» in current layman’s terms and in the current context?
.
Aunque no tiene demasiado que ver, sí que guarda cierta relación con el artículo de Emmanuelle publicado en Web Semántica Hoy, titulado Comer, amar, vivir… Las etiquetas de la gente. El concepto es algo que ya exponía en Añadiendo información semántica sencilla para los robots de búsqueda, y que ya había comentado también por este blog: podríamos resumir el horizonte de la web semántica en un camino con dos direcciones:
- Una, en la que tenemos que facilitar el trabajo para los buscadores hablando su idioma.
- Otra, en la que los buscadores tienen que comprender el lenguaje natural de los humanos, para organizar e indexar la información, y también para comprender sus criteros de búsqueda.
Todavía no he podido mirar en profundidad ese asunto, pero creo que merece la pena tenerlo en cuenta.
Si alguien tiene más interés en conocer un poquito más, puede leer el artículo HumanML: The Vision.
Explicar cómo obtener información geográfica precisa para ser usada en metadatos útiles dentro de ficheros HTML, XHTML y RDF, es el objetivo de dos artículos publicados en Web Semántica Hoy.
El primero de ellos, Metadatos geográficos (1): Obteniendo información geográfica para la web semántica, explica como obtener metadatos geográficos gracias a la aplicación Google Earth, que es capaz de mostrarnos las coordenadas GPS de cualquier lugar geográfico de la Tierra, y a una aplicación web que nos permite generar metadatos geográficos mediante un formulario: Geo Tag Generator.
En el segundo artículo, Metadatos geográficos (2): Empleándolos en ficheros HTML, XHTML y RDF, explico como usar los metadatos geográficos generados por la aplicación anterior, en ficheros HTML, XHTML y RDF.
Vinculando estos artículos con otros similares, recomendaría la lectura de HOW TO GPS Tag Photos: Flickr, Mappr, Google Earth…., que encontré gracias al blog de labra, en su post GeoTag.
Hablando ahora de aspectos personales en la elaboración de estos artículos, aparte de mencionar que en principio iba a escribir uno, y he acabado escribiendo tres, lamento no haberlos publicado antes, ya que llevan escritos prácticamente un mes, y entre vacaciones y asuntos personales no lo he hecho antes. Espero que merezca la pena, je je.
Por cierto, espero vuestros comentarios, queda muy triste ver un par de trackback del autor del mismo, je je.
Acabo de publicar mi primer post en Web Semántica Hoy, una bitácora que cuenta entre sus autores a Vincent Tabard, Charles McCathieNevile, Emmanuelle Gutiérrez y Restrepo y Leandro Mariano López (Inkel).
Hace algunos meses ya, me invitó Emmanuelle a escribir algún post, pero no conseguí escribir nada que me pareciese lo suficientemente bueno como para aparecer allí. Al final, gracias a una fructífera investigación sobre los metadatos geográficos en la web semántica, consiguió que por fin me lanzase a escribir un post, que en mi opinión era bastante interesante.
El problema, es que no tengo el don de la brevedad, y lo que en principio iba a ser un post, se ha convertido en tres, uno de ellos publicado ahora mismo, y otros dos que espero hacerlo en próximas fechas.
Como comentario personal… hay una ilustración de un robot de búsqueda, llamado Ruperto Lee. Un nombre curioso, que tiene una pequeña historia. Este robot se llama Ruperto, como mi abuelo, que en la dura época de la postguerra en España, ejerció una abnegada labor de profesor a los niños y niñas de su pueblo (Sotillo de la Adrada). Y estas clases las daba por la noche, cuando acababa una dura jornada de labrador. Era una de las múltiples facetas que demostraba que era una buena persona, para mí el valor fundamental de lo seres humanos.
Esta labor docente, la realizada además de manera altruista, sin cobrar nada a nadie. Cualquier homenaje que se haga a personas de este tipo, siempre se quedará pequeño.
Y el apellido de Lee, en inglés… otro homenaje al reconocido autor de la Web: Tim Berners-Lee. Tiene la doble lectura de la acción de leer (una de las tareas de los buscadores web), y el apellido de esta ilustre persona.
Poco más que añadir. Bueno, sí, un vínculo, je je: Añadiendo información semántica sencilla para los robots de búsqueda.
Actualización:
Con las prisas, se me olvidó incluir una imagen del robot en cuestión.

En un proyecto en el que estoy trabajando actualmente me he encontrado con un interesante reto, desde el punto de vista de la web semántica. ¿Cómo añadir información precisa de la situación geográfica de un recurso? Cuando hablo de recurso, me refiero a un comercio, colegio, monumento, museo,…
De momento no contemplo la posibilidad de dar de alta la web en un directorio web, porque todavía no está la web en su lugar definitivo.
Un buen punto de partida, era usar metadatos de dublincore, y el más indicado era coverage, que podíamos traducir como "covertura". Esta etiqueta sirve para añadir información temporal (por ejemplo, un intervalo de fechas), ó información geográfica. En este caso, el recurso estaba localizado en Madrid. La idea inicial, para incluir en un documento XHTML, era la siguiente:
<head>
[...]
<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />
<meta name="DC.coverage" content="Madrid" />
[...]
</head>
En la primera línea, indicamos el esquema que utilizamos (schema.DC), y le decimos la ruta donde está definido el perfil http://purl.org/dc/elements/1.1/.
Pero tenemos un problema: ¿Qué es Madrid? Dublincore indica covertura geográfica y temporal. Evidentemente no parece ser una fecha o intervalo de tiempo (cualquier buscador lo sabría). Por tanto se trata de un lugar. Pero, ¿donde está ese lugar?
Si buscamos en internet, sabríamos que Madrid es una ciudad de España, concretamente su capital. Pero también es una Provincia. Y una Comunidad Autónoma (o región).
Pero no es el único Madrid que hay en el mundo. De hecho, en el continente Americano, hay alrededor de seis localidades que tienen el mismo nombre.
El objetivo que buscábamos, definir univocamente la situación geográfica de un recurso, no se soluciona usando únicamente este metadato.
Tras solicitar consejo en la lista de correo de web semántica, surgen algunas buenas ideas:
- Utilizar coordenadas geográficas. Aunque no sabría como conseguirlas, y eso es un problema bastante grande.
- Utilizar información del aeropuerto más cercano, usado, por ejemplo en el proyecto FOAF (que traducido al castellano, sería Amigo de un Amigo). También es buena idea, pero lo más que puedo acercarme, es al Aeropuerto de Barajas. Y eso no sirve de mucho (pero ayuda).
Afortunadamente, aparecieron dos buenas noticias:
- En Dirson, me entero de que Google lanza la aplicación Google Earth. Que entre otras maravillosas utilidades, permite conocer las coordenadas geográficas de un lugar.
- Encuentro un estupendo generador de metadatos geográficos.
Gracias a estas aplicaciones, consigo afinar más la información geográfica del recurso en cuestión.
- Mediante Google Earth, puedo conocer las coordenadas geográficas.
- En Geo Tag Generator, puedo introducir esas coordenadas y me genera un metadato que define de forma unitaria un recurso (latitud y longitud). Además, en otra sección, puedo elegir un país (Country Code), y una región ó Comunidad Autónoma (Region Code) del país seleccionado. También la aplicación genera un metadato con esa información.
El resultado, cumple ampliamente mis espectativas. Todo el mundo con acceso a internet, y que pueda conseguir el programa Google Earth (disponible de forma gratuita, y de forma ilimitada), puede generar de forma sencilla información semántica precisa de cualquier lugar. Puede que lo único que falte, es que los buscadores sepan interpretar correctamente la información, je je.