Aplicaciones de Biga Data en PyMES y Startups pero primero debemos saber que es Big Data. La opción para definir Big Data sería en relación al volumen de datos a procesar; pero esta medida es relativa pues el volumen de datos que puede ser considerado como Big Data dependerá del negocio que se esté considerando. En realidad Big Data no es realmente una tecnología. Sino más bien una combinación de nuevas tecnologías; junto a tecnologías ya consolidadas que posibilitan el análisis de grandes cantidades de datos a una velocidad suficiente; para poder interactuar con los datos en tiempo real.
Podríamos definir el Big Data como: “grandes volúmenes de datos” o “datos masivos” ; y todas las cosas que se pueden hacer con estos datos pero a gran escala.
Contenido
Las Cinco V (Características fundamentales del Big Data)
La última característica en añadirse, pero no menos importante es el valor de los datos. Consideramos importante profundizar dentro de estas cinco dimensiones del Big Data para comprender mejor el concepto y después aprender sobre las aplicaciones del Big Data:
Volumen
Se define por dos variables, el número de ocurrencias de la observación; que vendría a ser el número de filas en una base de datos tradicional. Y la cantidad de información de cada ocurrencia, que equivale al número de campos o columnas de una base de datos. Debido a las limitaciones para obtener datos y procesarlos, se ha trabajado con muestras de datos para poder hacer análisis predictivos.
Variedad
Actualmente los datos no vienen únicamente de bases de datos estructuradas donde se han recolectado datos de transacciones de negocio, encuestas a muestras de población. En la actualidad muchos de los datos provienen de fuentes mucho más diversas y no estructuradas; informaciones como datos de usuarios de redes sociales como Facebook, Twitter o LinkedIn, correos electrónicos, datos de sensores, de geolocalización, logs de servidores web, etc.
Velocidad
Al hablar de este término en relación con Big Data nos referimos: por una parte a la velocidad con la que se crean datos actualmente y por otro la velocidad de procesamiento y análisis de estos. Con el “internet de las cosas” se puede extraer más información del usuario, ya que éste da información. Por ejemplo, acerca de sus gustos cinematográficos y televisivos si hablamos de un televisor con internet; o un “Smartwatch” sabrá todo sobre nuestras rutinas, datos personales, etc
Actualmente la agilidad en la toma de decisiones empresariales es una necesidad y el flujo de datos es constante. Lo que crea la necesidad de recoger estos datos y procesarlos a tiempo casi real; para acelerar la toma de decisiones, pero basándose en el conocimiento extraído de los datos.
Veracidad
se refiere a la yerra o integridad de los datos. Hay estructuras en Big Data, en los que no es posible controlar con exactitud y fiabilidad los datos. Por ejemplo, los tweets con “hashtags”, las abreviaturas, errores tipográficos o el habla coloquial. En la actualidad gracias a la tecnología, aunque no parezca posible, podemos realizar análisis con este tipo de datos, aunque sea complejo.
Valor
Este componente es quizás el más importante. Resulta complicado que las empresas se informaticen al nivel que se necesita el Big Data, y a su vez la rentabilidad de esa inversión deberá ser alta. El valor que se extraiga de los datos depende de la cantidad almacenada de los mismos y su tratamiento, y viceversa. Si conseguimos muchos datos, pero no extraemos valor de ellos no tendremos nada.
La norma habitual en la industria es que de las primeras 3 uves, un sistema debe contemplar al menos dos de ellas para ser calificado como procesos Big Data.
PyMES acercándose a la Big Data
Aplicaciones del Big Data. Big Data nace de la exigencia de dar respuesta a toda una serie de necesidades del mercado actual, requerimientos que los avances han impulsado y a los que sólo se puede dar satisfacción por medios tecnológicos. Hoy en día los clientes quieren ser tratados de forma totalmente personalizada. Es por esto que, ser capaces de detectar sus gustos, se ha convertido en una necesidad de primer nivel para poder aumentar el volumen de ventas, dirigiéndolas de forma mucho más directa para lograr el éxito esperado.
Además, hay que tener en cuenta que cada individuo se relaciona con otras personas, cuyo análisis permite tanto conocer más a fondo al propio cliente, como aumentar el número de clientes potenciales. Estos datos se transforman en un conocimiento de valor incalculable para el negocio.
La mejor solución para un acercamiento a la analítica de datos para las pymes son los servicios en la nube pues son servicios que no precisan de grandes inversiones, la mayoría de ellos ningún desembolso inicial, y unas tarifas que no suponen un gran gasto para la empresa.
Cuando el objetivo es la implementación de Big Data en la organización, lo primero que se debe hacer es conocer y cuantificar cuánto valor puede ofrecer al negocio. Es necesario llevar a cabo una autoevaluación que permita conocer cuáles son los límites que impiden avanzar, o acelerar el progreso, qué expectativas se tienen a medio y largo plazo o qué restricciones afectan a la recogida, procesamiento y análisis de la información. Una vez respondidas todas estas cuestiones, se está en posición de decidir cuál es el proyecto de Big Data más adecuado para la empresa.
Conceptos tecnológicos relacionados
Para entender el funcionamiento y potencial del big data es fundamental hacer referencia a otros conceptos tecnológicos que están estrechamente ligados al mismo.
Data Warehouse
Es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. La creación de un data warehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence.
Data Mining
Es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Básicamente, el Data Mining surge para intentar ayudar a comprender el contenido de un repositorio de datos.
Cloud Computing
Es el conjunto de programas y servicios alojados en un servidor conectado a la Red, accesible desde cualquier ordenador (sea cual sea el sistema operativo que éste ejecute) con conexión a Internet sin necesidad de instalar aplicaciones ejecutables en su disco duro y donde también se almacena la información generada por estas mismas aplicaciones o servicios.
Business Intelligence
Es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. Desde un punto de vista más pragmático, y asociándolo directamente con las tecnologías de la información, se puede definir Business Intelligence como el conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa o para su análisis y conversión en conocimiento, dando así soporte a la toma de decisiones sobre el negocio.
Tecnologías Big Data
Otro punto clave que se debe tener en cuenta son las diferentes herramientas tecnológicas que se utilizan para la explotación de los datos. Sin entrar en profundidad en ellas para explorar el Big Data existen determinadas herramientas del desarrollador de software libre y código abierto, Apache Software Foundation.
Hadoop: es un sistema de código abierto que se usa para almacenar, procesar y analizar grandes volúmenes de datos y que almacena todo tipo de datos, tanto estructurados como no estructurados y prácticamente cualquier archivo o formato.
HDFS: es el sistema de archivos en el que se basa Hadoop
YARN – MapReduce: se ocupa de distribuir el trabajo encontrando los datos que ha de procesar y gestiona la ejecución de los programas
Hbase: es el sistema de base de datos que usa Hadoop y se basa en BigTable de Google.
Hive: es un sistema de almacén de datos para Hadoop, que permite realizar resúmenes de datos, consultas y análisis de datos mediante HiveQL (un lenguaje de consultas similar a SQL).
Spark: es de IBM y sirve para gestionar las aplicaciones de análisis de datos.
Storm: es un sistema de cálculo de código abierto, distribuido y con tolerancia a errores que permite procesar datos en tiempo real con Hadoop
Negocios innovadores: Big Data y sus Grandes oportunidades
Big Data puede, y de hecho está siendo la precursora de gran cantidad de startups que se dedican a explotar los datos de forma innovadora o combinando datos de forma que la información resultante sea un producto innovador. Con la perspectiva adecuada los datos pueden dar origen a nuevos negocios, y es que el valor de los datos no radica tanto en los datos en si como en los usos que les podamos dar, en cualquier caso, poseer los datos necesarios puede ayudar a formular nuevas aplicaciones o análisis que quizás serían más difíciles de obtener si no se poseen los datos necesarios.
Un producto innovador fruto del Big Data y que recientemente ha patentado Amazon es el concepto de la compra anticipada basado en llevar las recomendaciones y las predicciones quizás demasiado lejos para los tiempos que corren, la idea de Amazon es usar los datos que recoge de los clientes referentes a compras, recomendaciones, productos deseados… para predecir lo que quieren los clientes y enviar los productos automáticamente, el concepto rompedor es que Amazon anticiparía los envíos ¡sin que los clientes hayan hecho la compra todavía!.
Estado actual de adopción del Big Data en las empresas
Big Data todavía está en un estado inicial de adopción, las grandes empresas y las empresas de tipo tecnológico llevan el liderazgo en la adopción del Big Data, pero aún queda mucho recorrido para consolidar Big Data y las aplicaciones del Big Data en las empresas.
A día de hoy hay bastantes áreas relacionadas con el Big Data en un estado exploratorio, por lo que aún podemos esperar nuevas innovaciones tanto en el almacenamiento como en tratamiento y explotación de los datos, de la misma manera que un iceberg, del Big Data solo estamos viendo la pequeña parte que sobresale por encima del agua, la gran mayoría de datos que se poseen todavía están sin explotar, a estos se les añadirán la geolocalización, los sensores integrados, el internet de las cosas, la posibilidad de integrar una SIM en todos los dispositivos, los wearables, las ciudades inteligentes… todos estos elementos pueden marcar los nuevos pasos para el Big Data.
Big Data para el mañana
Hasta ahora la mayoría de grandes empresas disponen de toda la cadena de explotación de datos, desde los data warehouse, las aplicaciones de data mining, las herramientas business intelligence, reporting y cuadros de mandos, en los mejores casos estas infraestructuras habían y están ayudado a entender las compras de sus clientes, los patrones de comportamiento de estos en los diferentes canales, la optimización del packaging y de los precios de venta, la mejora de la imagen de marca, en el peor de los casos las empresas habían invertido excesivamente como para poder recuperar las inversiones en almacenamiento, analítica y visualización.
Muchas de estas empresas después de haber hecho importantes inversiones en sus data warehouse y en toda la cadena de explotación de datos no quieren invertir en remplazar tecnologías que funcionan bien, para solucionar las dependencias y costumbres interiorizadas. Por lo que normalmente se intenta optar por una arquitectura híbrida que convine lo mejor de las tradicionales cadenas de explotación de datos con las nuevas tecnologías de los datos masivos.
Algunas Aplicaciones del Big Data
Public data: Es una aplicación de Google que muestra con gráficos datos referentes a diversos datos a nivel mundial, europeo o por países (Cabello, 2015). Algunos de los datos que se pueden consultar que pueden interesar a un empresario son el impuesto a las ventas, el PIB, salario mínimo, gasto del consumidor, precio de los productos básicos, la tasa de crecimiento demográfico, entre otros.
Consume Barometrer Es una herramienta para la investigación de mercados en E-commerce que nos proporciona datos sobre el comportamiento de los consumidores en internet, tales como lo que buscan y lo que compran y cómo interactúan con internet para informar de las decisiones de compra.
Google Analytics: Esta herramienta permite hacer un seguimiento de sitios web, blogs y redes sociales. Trabaja sobre elementos tan variados e importantes como el número de visitas, la duración de estas, las fuentes de tráfico, las páginas visitadas, las secciones preferidas por tus usuarios, palabras clave utilizadas o detalles técnicos de los dispositivos de los visitantes y en base a los datos obtenidos realiza informes predeterminados y personalizables
IBM Watson Analytics: Es una plataforma tecnológica en la nube que nos ayuda a la exploración y el análisis de datos, mediante un sistema avanzado de visualización y predicción analítica.
Tranzlogic: Es un servicio trabaja con comerciantes y sistemas de pago para extraer y analizar los datos de compras realizadas con tarjeta de crédito.
InsightSquared: Esta herramienta conecta con soluciones como CRM, QuickBooks, Google Analytics, Zendesk, a recopilar datos y extraer información que se procesa automáticamente.
Qualtrics: Es una solución online que permite a las pymes realizar encuestas o estudios para obtener información de calidad. Se enfoca sobre todo en obtener información del comportamiento del mercado, de los clientes y también de los empleados de una compañía.
Otro tipo de Aplicaciones del Big Data
- Determinar las causas de los fracasos, los problemas y defectos en tiempo casi-real.
- Optimizar las rutas de muchos miles de vehículos de entrega de paquetes mientras están en la carretera.
- Genera cupones de compras en el punto de venta en base a compras anteriores y actuales de los clientes.
- Enviar las recomendaciones a la medida para dispositivos móviles, mientras que los clientes están en el área de derecho de aprovechar las ofertas.
- Recalcular carteras de riesgo en cuestión de minutos.
- Identificar rápidamente los clientes que más importan.
- Utilice el análisis de clics y la minería de datos para detectar comportamientos fraudulentos.
- Consulta y generación de informes.
- Extracción de datos.
- Visualización de datos.
- Analítica geoespacial, de Streming, de video, de voz, texto de lenguaje natural.
Algunas experiencias en el uso de Big Data
Atención al cliente
Unilever (Reino Unido): utiliza el big data para conocer si las conversaciones de los potenciales consumidores en medios sociales difieren mucho de su comportamiento real de compra, y también analiza el comportamiento de los usuarios en las búsquedas que éstos realizan en internet.
Investigación
CERN (Suiza): el laboratorio suizo de física nuclear hace big data desde hace más de 20 años. Cada año produce 30 petabytes de nueva información; acumulando ya unos 250 Pb de datos en sus centros de datos, sobre los que se realizan unos dos millones de tareas cada día.
Universidad de Maryland (EE.UU.): colabora en la iniciativa académica de cómputo en la nube de IBM/Google. Sus investigaciones incluyen proyectos en la lingüística computacional, modelado del lenguaje, bioinformática, análisis de correo electrónico y procesamiento de imágenes.
Sector retail
Nike (EE.UU.): gracias a la creación de wearables -dispositivo que permite aplicar inteligencia artificial a objetos como relojes o pulsómetros- la compañía está localizando nuevos nichos de mercado.
Target (EE.UU.): esta cadena de distribución fue capaz de predecir cuándo sus clientes esperaban un bebé, asignando un número de identificación único a cada cliente, asociado a su tarjeta de crédito para analizar el historial de compra y después generar cupones de descuento.
Amazon (EE.UU.): para conocer los gustos de los lectores, la compañía se basa, no sólo en los datos del usuario, sino también en las tendencias que es capaz de generar a partir de los amplios catálogos de datos que recopila. Una de las estrategias para conseguirlo es a través de las recomendaciones que ofrece con cada producto, basadas en las pautas de comportamiento de otros compradores similares al propio usuario.
Telecomunicaciones
Netflix (EE.UU.): la reina de las plataformas de series y películas online supo utilizar el big data para conocer los gustos de sus usuarios. Su éxito se debe a las recomendaciones que hace a sus consumidores en base a los patrones de consumo de contenido.
Conclusión
Big Data y sus aplicaciones. Es una fuente importante de valor para las empresas, aun siendo una tendencia que empiezan a adoptar las empresas. Numerosos casos reales avalan la idea de que Big Data es un percusor de nuevas innovaciones y por tanto de ventajas competitivas. Que no solo transforman las empresas y sus productos, sino que son capaces de crear y transformar mercados. Los empresarios deben perder el miedo al cambio que produce la gestión de esta cantidad masiva de datos. Debido a que las predicciones calculadas serán más aproximadas a la realidad, los beneficios obtenidos gracias a ellas serán mayores.
A pesar de que hoy en día se diga que estamos en “La era de la Información”; en la que se generan enormes cantidades de datos, lo que actualmente parecen enormes cantidades pronto se convertirían poco importante. Por ello las aplicaciones del Big Data y la tecnología Big Data debe y puede seguir evolucionando. Y de este modo aprovechar la gran avalancha de datos, sin olvidar por otro lado que no todos ellos son útiles, que existe mucho ruido entre ellos. Destacando la importancia de captar únicamente aquellos que puedan ser posteriormente transformados en información y conocimiento.
Es por eso que los invitamos a nuestro foro. Estén al pendiente de los cursos que lanzamos para personas no técnicas, disponible para que los empresarios y emprendedores aprendan a trabajar con este tipo de tecnología y puedan integrar a su equipo de trabajo personas especialistas. Y así poder aplicar la información que aquí aprendiste sobre las aplicaciones del Big Data.