Archivo

Posts Tagged ‘analisis de datos. Data science’

Big Data. Pero ¿Qué es?

noviembre 9, 2017 4 comentarios

data scienceAhora está muy de moda hablar de “Big Data”, pero pocos saben a qué se refiere esta expresión. Se habla de las tres famosas “V” de variedad, volumen y velocidad de los datos, pero esto no aclara mucho. Para mí, después de trabajar el asunto bastante, he llegado a la conclusión que con la expresión “Big Data” se denominan a todas las técnicas de almacenamiento, acceso y análisis de datos, que no se pueden realizar con los procedimientos de análisis de datos que tradicionalmente se han utilizado.

Vamos, que no sirve el Excel para analizarlos, pues cuando tienes varios millones de filas y un centenar de columnas, el Excel se te colapsa y no lo puedes ni abrir. Pero no solo es por el volumen de datos por lo que se caracteriza el big data. Por ejemplo si yo quiero analizar qué se ha dicho de mí en Twitter o en Facebook en una semana específica, acceder a esos datos es muy complejo, aunque una vez accedido, estos datos constituyan una base de datos muy pequeña, pues realmente se habla poco de mí en las redes. Sin embargo, esos datos se podría decir que se trata de big data, por lo complejo que es acceder a ello, y por la gran variedad de los textos, comentarios, fotos, etc. que pueden aparecer. Es decir que no se trata de una tabla de filas y columnas con números.

Si en vez de buscar lo que se dice de Miguel Angel Ariño, se busca lo que se dice de tal noticia en boga o de tal presidente de gobierno o de comunidad autónoma que esté de moda, el número de datos es ya muy grande, y está en forma de textos, noticias, videos, comentarios, fotos, pies de fotos, y cada minuto e van generando más. Analizar esto puede llegar a ser muy complejo. Pues bien hay una serie de tecnologías que ahora nos permiten analizar todo este tipo de información.

Seguiré hablando de este tema en algunos mensajes más porque hay mucho que decir al respecto. Hasta el jueves que viene.

A %d blogueros les gusta esto: