La extracción de datos o "scraping" –hacer que una computadora capture información de fuentes en internet– es una de las técnicas más poderosas que los periodistas pueden usar para llegar de primeros a la noticia, o para descubrir informacion exclusiva que nadie mas posee.
Más rápido que una solicitud información y más potente que las técnicas de búsqueda avanzada, el scraping permite conseguir los datos estructurados de formas que facilitan su analisis, y a veces puede servir incluso para conseguir informacion que algunas organizaciones preferirian no compartir
*Extracción de datos para periodistas* contiene una amplia gama de técnicas de scraping, desde algunas no más complicadas que una fórmula en una hojas de cálculo, hasta desafíos complejos, como trabajar con bases de datos o extraer informacion de cientos de documentos.
El libro esta diseñado para que se aprecien los resultados de lo aprendido a cada paso, avanzando hacia la construcción de herramientas más ambiciosas y poderosas.
En apenas cinco minutos aprendera a escribir su primer extractor al inicio del libro, pero mas importante aun es que estará aprendiendo principios y técnicas clave para resolver problemas de extracción de datos.
A diferencia de textos generales de programación, todo el contenido de este libro tiene aplicación directa en periodismo y cada principio de programación aparece conectado a su uso en la produccion de noticias. En lugar de ocuparse de herramientas o tecnicas particulares, como hacen algunas guías y blogs, este texto tiene por objeto desarrollar habilidades que pueda aplicar en nuevas situaciones y con nuevas herramientas.