La información medioambiental en España: recursos y acceso a la información pública: análisis webmétrico (2ª parte)
DOI:
https://doi.org/10.17533/udea.rib.18335Palabras clave:
Webmetría, Mbot, webcrawler, medio ambiente, administración pública, información del sector público, acceso a la información, topografía web, información medioambiental, España, MéxicoResumen
La meta de la investigación es el análisis webmétrico de los principales sitios de la administración central española especializada en medio ambiente, con el objetivo de estudiar la topografía, estructura, interrelación y metadescripciones de los contenidos, pudiendo posteriormente realizar su comparación con la web mexicana de la misma área de conocimiento. Para lograrlo, se ha utilizado la herramienta webcrawler Mbot, que analiza la extensión y dimensiones de la web, los rankings de sitios web con más páginas, el ratio de meta-descriptores por página, el análisis de frecuencia de los términos empleados en las descripciones y una serie de tablas estadísticas que permiten valorar la muestra. A raíz de los resultados obtenidos, se han elaborado varias recomendaciones dirigidas a mejorar la capacidad de indexación de los motores de búsqueda y suprimir malas prácticas que debilitan la capacidad de recuperación y acceso a la información pública. Entre las conclusiones, destaca la importante interrelación entre la Web española de medio ambiente y su homóloga europea, descubriendo fuentes de información poco conocidas, la recopilación de canales de sindicación que permita el seguimiento de la información pública en medio ambiente y el descubrimiento del rango ideal de frecuencias de aparición de los términos usados en las metadescripciones.
Descargas
Citas
BERGMARK, D.; LAGOZE, C.; SBITYAKOV, A. (2002). Focused crawls, tunneling, and digital libraries. En: Proceedings of the Sixth European Conference on Digital Libraries, (Rome, September 16–18), 91–106. Disponible en: http://link.springer.com/content/pdf/10.1007%2F3-540-45747-X.pdf [Consulta: 21 de octubre de 2013].
BERNERS-LEE, T. (1995). Hypertext Markup Language - 2.0, RFC 1866, Network Working Group. Disponible en: http://tools.ietf.org/html/rfc1866 [Consulta: 21 de octubre de 2013].
BLÁZQUEZ OCHANDO, M.; SERRANO MASCARAQUE, E. (2011). Análisis de la web y usabilidad: prueba de funcionamiento de Mbot webcrawler. En: X Congreso del Capítulo español de ISKO (La Coruña, 30 junio – 1 julio). Disponible en: http://eprints.rclis.org/19104/ [Consulta: 21 de octubre de 2013].
BLÁZQUEZ OCHANDO, M. (2013a). “Desarrollo tecnológico y documental del webcrawler Mbot: prueba de análisis web de la universidad española”. En: XIII Jornadas Españolas de Documentación, Fesabid, (Toledo, 21-24 mayo).
BLÁZQUEZ OCHANDO, M. (2013b). Mbot – Webcrawler multipropósito. Disponible en: http://mblazquez.es/mbot/ [Consulta: 21 de octubre de 2013].
CHAKRABARTI, S.; JOSHI, M.M.; PUNEA, K.; PENNOCK, D.M. (2002). The structure of broad topics on the Web. En: Proceedings of the 11th World Wide Web Conference, (Honolulu, Hawaii, May 7–11). 508-516. Disponible en: http://www.cse.iitb.ac.in/soumen/doc/www2002t/p338-chakrabarti.pdf [Consulta: 21 de octubre de 2013].
COTHEY, V. (2004). Web-crawling reliability. Journal of the American Society for Information Science and Technology. 55(14), 1228–1238. Disponible en: http://onlinelibrary.wiley.com/doi/10.1002/asi.20078/pdf [doi:10.1002/asi.20078] [Consulta: 21 de octubre de 2013].
DCMI. (2012). DCMI Metadata Terms. Disponible en: http://dublincore.org/documents/dcmi-terms/ [Consulta: 21 de octubre de 2013].
GANSNER, E.R. (2012). Drawing graphs with Graphviz. Disponible en: http://www.graphviz.org/doc/oldlibguide.pdf [Consulta: 21 de octubre de 2013].
GIL LEIVA, I. (2008). Manual de Indización: teoría y práctica. Gijón: Trea. 67-69.
GRAELLS, E.; BAEZA YATES, R. (2007). Características de la Web Chilena.
HENZINGER, M.R. (2003). Algorithmic challenges in Web search engines. Internet Mathematics, 1(1), 115–126. Disponible en: http://www.internetmathematics.org/volumes/1/1/pp115_123.pdf [Consulta: 21 de octubre de 2013].
LUHN, H. P. (1958). The Automatic Creation of Literature Abstracts. IBM Journal of Research Development, 2(2), 159-165.
THELWALL, M. (2001). A web crawler design for data mining. Journal of Information Science, 27(5), 319-325. Disponible en: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.90.830&rep=rep1&type=pdf [doi: 10.1177/016555150102700503] [Consulta: 21 de octubre de 2013].
W3C. (1999). HTML 4.01 Specification: The global structure of an HTML document. Meta data. Disponible en: http://www.w3.org/TR/REC-html40/struct/global.html#h-7.4.4 [Consulta: 21 de octubre de 2013].