Las 5 preguntas que puedes responder con Data Science
¿Y cómo encuentra estas respuestas?
El Data Scientist utiliza por un lado datos y por otro, algoritmos. Si tuviéramos que explicarle a un profano en la materia en qué consiste el trabajo de un Data Scientist , podríamos decir consiste en buscar respuestas a las siguientes preguntas:
1. ¿Esto es A o B?
2. ¿Es esto normal o aquí pasa algo raro?
3. ¿Cuánto o cuántos …?
4. ¿Cómo está organizado esto?
5. ¿Y ahora, qué conviene hacer?
Para ello utiliza un “libro de cocina” con distintas recetas. Los ingredientes, son los datos. Y las recetas, que nos dicen cómo preparar y combinar esos datos, serían los algoritmos.
1. ¿Esto es A o B?
Para responder a esta pregunta, el Data Scientist utiliza Algoritmos de clasificación. Pueden ser de clase 2, si sólo hay dos respuestas posibles (¿A o B?), o multiclase, en el caso de que haya más de dos respuestas posibles.

Sirve para responder preguntas como éstas:
• ¿Fallará esta pieza de maquinaria en los próximos días?
• ¿Qué atrae más clientes, un cupón regalo o un % de descuento?
• ¿Éste tweet es positivo?
• ¿Qué servicio elegirá este cliente A, B o C?
Por tanto, permite identificar a qué categoría pertenece nueva información. Un ejemplo de estos algoritmos son los árboles de decisión.

2. ¿Es esto normal o aquí pasa algo raro?

Sirven para responder preguntas de este tipo:
• ¿Es normal este cargo de una tarjeta de crédito? (prevención de fraude)
• ¿Es normal este mensaje de correo? (prevención de spam)
• ¿Es normal esta medición registrada? (prevención de averías)
Estos algoritmos generan alertas sobre posibles eventos o comportamientos futuros que nos dan pistas muy útiles para evitar problemas. Por ejemplo, si una entidad financiera detecta un cargo por un volumen muy alto en una tarjeta donde no es habitual que haya este tipo de operaciones, se emite una alerta de posible fraude y se toman acciones para verificar la legitimidad de la operación. También se puede crear una alerta si la operación bancaria se realiza desde una ubicación que no coincide con la del móvil del cliente. Es decir, si el banco detecta que se va a realizar un cargo en Londres y tiene contratado un servicio como Smart Digits de LUCA, que detecta que el móvil del usuario está en Madrid, se genera una alerta para comprobar si se trata de un fraude o no.

3. ¿Cuánto o cuántos …?
Puede responder a preguntas como éstas:
• ¿Cuál será el volumen de ventas de este trimestre?
• ¿Qué temperatura hará mañana?
• ¿Cuál será el consumo eléctrico previsto a la hora del partido?
En la siguiente figura, podemos ver un ejemplo de cómo una empresa de coches de alquiler aplicaría un algoritmo de regresión para estimar la demanda sus servicios.

4. ¿Cómo está organizado esto?

• ¿Qué modelos de impresora tienen la misma avería?
• ¿Qué libros debemos recomendar a este cliente?
• ¿Qué oferta personalizada debemos hacer a este cliente?
Si comprendemos cómo se estructuran los datos, podremos comprender y predecir comportamientos y eventos futuros.
5. ¿Y ahora, qué conviene hacer?

Estos algoritmos nos dan respuesta a preguntas que “se puede plantear” un robot o una máquina ,como :
• Soy un coche sin conductor y esto es un semáforo en amarillo: ¿acelero o me paro?
• Soy un robot aspirador, y me queda un 30% de batería, ¿sigo aspirando o voy a la estación a recargar?