Big Data 2Podemos denominar el Big Data como el crecimiento exponencial y disponibilidad de los datos al que tenemos acceso a día de hoy, tanto de manera estructurada como desestructurada. La definición encierra también la gestión y análisis de enormes volúmenes de estos datos que no pueden ser tratados de manera convencional, ya que superan los límites y capacidades de las herramientas de software habitualmente utilizadas para la captura, gestión y procesamiento de datos.

 

El objetivo del Big Data no es otro que convertir esa enorme cantidad de datos en  Información útil para el usuario. La conversión de estos datos en información útil puede ser tan importante para el mundo de los negocios y la Sociedad como Internet. Cuanto mayor sea la cantidad de datos que procesemos, mayor y más precisa será la información que podamos analizar.

 

A  la hora de caracterizar al Big data tenemos que hacer referencia a la definición que formuló el analista industrial Doug Laney, en la que estableció las 3 Vs del Big data: Volumen, Variedad y Velocidad.

 

En cuanto al volumen, en la nueva era los volúmenes están superando las capacidades del software habituales en cuanto a su manejo y gestión. En el pasado el excesivo volumen de datos suponía un problema de almacenamiento, pero hoy  en día  el costo de almacenamiento de los datos ha disminuido hasta tal punto que ya no supone un problema a considerar. Ahora el punto de mira se centra en cómo determinar la relevancia de la información contenida en los enormes volúmenes (hablamos de Terabytes o Petabytes) de datos que se reciben y como realizar análisis  que faciliten  la extracción de información.

 

En lo referente a la Variedad, no podemos obviar la aparición de multitud de plataformas en los últimos tiempos que se diferencian de las que se utilizaban de forma tradicional. Particularmente la información obtenida en las Redes Sociales, así como el cada vez más amplio grupo de dispositivos que se encuentran conectados a Internet, la contenida en emails, videos, audios o transacciones financieras. Cuando hablamos de Big Data nos referimos a información que puede estar semiestructurada o no tener ninguna estructuración. Para la gestión de esta información desestructurada precisa de una tecnología diferente y permite tomar decisiones basadas en información que tiene importantes grados de inexactitud.

El tercer punto al que hacía referencia Laney era la velocidad, ciertamente en la actualidad los datos están siendo compartidos a una velocidad sin precedentes. Los censores o las etiquetas RFID están obligando a la mayoría de organizaciones que trabajan en la red a buscar formas de reaccionar rápidamente a los enormes flujos de datos que  arriban constantemente, ya que la mayoría de los sistemas tradicionales les es imposible analizar de forma inmediata los grandes volúmenes de datos que les llegan, sin embargo, incorporar el concepto de tiempo real es imprescindible para sistemas de detección del fraude o la realización de oferta personalizadas a los clientes.

 

Si bien es cierto que estas 3 Vs que definen el Big Data promulgadas por Laney son aceptadas por la mayoría de los autores y la comunidad cibernética, hay otros términos que han sido destacados por importantes investigadores y organizaciones con peso en Internet.

 

La variabilidad como atributo que caracteriza la época del Big Data se refiere a la inconsistencia con que los flujos de datos son recibidos. Se alcanzan picos de información con determinados eventos y precisamente determinar si algo en la red será tendencia debe ser una de los retos para las organizaciones que se dediquen al análisis de esos datos.

 

Otros autores han destacado la veracidad como punto a tener muy en cuenta. La  confianza en los datos recibidos eliminando aquellos que no puedan aportarnos ninguna información de valor, posibilitando así extraer datos de calidad que nos lleven a  tomar las decisiones correctas.

 

Gracias al Big Data las empresas pueden desarrollar modelos y usarlos para conocer cuales sería los comportamientos de los consumidores. Por ejemplo, puede crearse un modelo estadístico que asocie comportamientos de compra con perfiles de consumidores y a partir de esa información dirigirse al consumidor que tiene el perfil adecuado.

 

Igualmente el Big Data puede usarse para objetivos tan dispares como detectar y prevenir el fraude financiero, calcular el riesgo de una acción que la empresa vaya a  realizar y su previsible comportamiento en el mercado o realizar campañas de  marketing mucho más precisas.