Javier Carro Calabor

Javier Carro Calabor

Telecommunication Engineer at UVA, and certified in PMP and Scrum Master. In #BD4SG we look for the benefits of technology to cover every angle.
AI & Data
VI Edición del encuentro Big Data Castilla y León
Escrito por Pedro A. Alonso Baigorri , Dr. Richard Benjamins y Javier Carro Calabor , de LUCA. El pasado lunes 26 se celebró, por sexto año consecutivo, BigData CyL que organiza Telefónica I+D en su sede del Parque Tecnológico de Boecillo. Se consolida así un evento que congrega a profesionales de muy diferentes sectores industriales cuyo elemento común es el análisis de datos como activo de gran valor en el desarrollo de su actividad. Carlos Moro, presidente del grupo Matarromera, fue el encargado de dar la bienvenida con una charla inaugural en la que destacó la importancia de las infraestructuras de comunicaciones como primer paso para la transformación digital de las actividades industriales. También hizo énfasis en la importancia de disponer de datos y capacidad de analizarlos para ayudar a focalizar y sacar el mayor partido a la actividad y el mercado de industrias como la del vino y la biotecnología. Elena Martín, COO de Sociograph, nos llevó de viaje por el cerebro para introducirnos en el mundo del Marketing Science, una disciplina que persigue captar la atención de los consumidores impactando en sus emociones para optimizar el éxito del marketing. Técnicas como la resonancia magnética funcional, EECG, eye-tracking, diademas de sensor seco, etc. ayudan a interpretar las emociones ante estímulos publicitarios. Esto, realizado a gran escala, permite que se puedan diseñar espacios de establecimientos, escaparates, anuncios, series de televisión, etc. Figura 1: Elena Martín José Carlos Baquero, Division Director Artificial Intelligence & BigData GMV, nos habló de los riesgos que tiene la Inteligencia Artificial cuando se utiliza para tomar decisiones, especialmente cuando afectan directamente a las personas de forma significativa. De hecho, la reciente regulación europea de protección de datos (GDPR), que entró en vigor en mayo de este año, exige que las personas tengan derecho a explicación o a ser excluidas de procesos de decisión totalmente automáticos. Obviamente es un tema importante ya que incluye desde decisiones sobre concesión de créditos hasta citas online. José Carlos nos explicó una estrategia de minimización de este tipo de riesgos basada en el uso de p%-rules y redes neuronales GAN. Figura 2: José Carlos Baquero Iván Matzkin, H ead of Data Analytics and Business Intelligence de ProFuturo, junto con Carmen Rodríguez y Jesús Ángel Andrés, nos explicaron cómo gestionan y utilizan los datos que generan. ProFuturo persigue transformar la educación digital de niños en entornos vulnerables, y lo hacen llevando a escuelas de todo el mundo no sólo equipación que incluye servidores con contenidos educativos y tablets, sino también la capacitación y seguimiento adecuado a los docentes involucrados. Actualmente llegan a casi 8 millones de niños de 25 países de Latinoamérica, África, Europa y Sudeste Asiático. Los datos de uso que se generan se utilizan tanto para optimizar la operación de cada una de las casi 60.000 escuelas, como para fines más avanzados, como el diseño de un asistente que ayude al profesor a diseñar rutas de aprendizaje más apropiadas para sus alumnos. Figura 3: Iván, Carmen y Jesús Ángel. Roberto Vidal, CEO de Xeridia y Presidente de Smarkia, nos explicó varios casos de éxito de estas empresas en proyectos que involucran Big Data y análisis avanzados. Por ejemplo, un producto de gestión de facturas que originalmente conseguía automatizar gran parte de los procesos utilizando Big Data pero que, aplicando además técnicas de Inteligencia Artificial, han conseguido automatizar todavía más tareas. De forma similar hacen gestión de fraude en trading financiero, redes de energía, consumo, etc. Figura 5: Roberto Vidal. Tras la pausa para el café, Félix Velasco, CSO y cofundador de Wembley Studios, nos contó su experiencia trabajando en la gestión del acceso multicanal a los servicios digitales del Real Madrid. Nos explicó detalles de cómo el análisis de datos de uso de estos canales por parte de los fans permite tomar decisiones tanto sobre el diseño funcional y la UX de las aplicaciones web y de móvil, como sobre la personalización de los mismos para hacer los servicios más atractivos y prácticos. Figura 6: Félix Velasco A continuación, Rodrigo Méndez, CEO de Tecnoempleo, presentó este portal, que permite que empresas que buscan profesionales tecnológicos, y profesionales que buscan empleo, optimicen sus respectivas búsquedas. Destacó la importancia de que ambas partes cuenten con la mejor información para ahorrar tiempo y esfuerzo, de que las empresas puedan ofrecer las ventajas más apropiadas a los trabajadores (flexibilidad, conciliación, etc.), y precisamente Tecnoempleo facilita de forma oportuna los datos necesarios para que tanto empresa como profesional consigan sus mejores opciones. Figura 7: Rodrigo Méndez Delia Majarín , de Global People Transformation en RRHH Global de Telefónica contó la experiencia de su área en el diseño e implantación de un sistema de HR Analytics que permite automatizar la ingesta y explotación de todas las fuentes de datos sobre empleados, que estaban distribuidas en múltiples sistemas, y que gracias al nuevo sistema de BigData han centralizado permitiendo la implantación de nuevos casos de uso de manera global. El Dr. Pablo Chamoso, del departamento BISITE de la Universidad de Salamanca, nos contó un interesante proyecto que realizan en colaboración con la Interpol para luchar contra la propaganda de contenidos multimedia de carácter terrorista. El proyecto consiste en un sistema que mediante técnicas de Inteligencia Artificial es capaz de rastrear el origen de determinados contenidos de video que pretenden hacer propaganda en los medios digitales sobre el terrorismo, de forma que se puedan tomar acciones para eliminarlos y detectar sus autores. Para ello, el sistema recolecta contenidos de forma sistemática y una vez aplicado una serie de conversiones sobre las imágenes, busca de forma inteligente dicho contenido en las bases de datos existentes. De esta manera se puede indentificar el origen de un contenido aún habiendo sido modificado posteriormente a su creación. Finalmente, como colofón a la jornada, el Dr. Richard Benjamins, Data&AI Ambassador de Telefónica, explicó que el problema de la posible discriminación injusta de los algoritmos se puede tratar con metodologías para el “uso responsable de la IA por diseño”, en analogía con la “privacidad por diseño”, empezando por la definición de unos Principios de Inteligencia Artificial. Pero existen otros retos de la aplicación masiva de la Inteligencia Artificial. Muchos de estos retos requieren una respuesta, más allá de empresas concretas, de los gobiernos e instituciones internacionales. Los temas a resolver incluyen: el futuro del trabajo (por la automatización de tareas “inteligentes”), la responsabilidad (“liability”) de sistemas inteligentes y autónomos (quién es responsable en caso de errores con daños?), la relación entre las personas y los robots (¿puede ser un robot nuestro jefe?), los monopolios de los gigantes tecnológicos (GAFAM, BAT), los usos mal intencionados de la IA, y el uso de esta tecnología en armas autónomas (“killer robots). No te pierdas ninguno de nuestros post. Suscríbete a LUCA Data Speaks.
13 de diciembre de 2018
AI & Data
Usando datos para gestionar situaciones de emergencia
Escrito por Carmen Rodríguez, becaria en LUCA, y Javier Carro, Data Scientist en LUCA. Área Big Data for Social Good. ¿Qué pensarías si te dijese que los datos pueden ayudar a salvar vidas? ¿Y si pudiésemos ayudar a minimizar las consecuencias de un desastre natural? En el área Big Data for Social Good de LUCA tenemos una línea de investigación centrada en el análisis de datos de desastres naturales (terremotos, movimientos de tierra, inundaciones, etc.) con el objetivo de optimizar su gestión. Puedes ver un ejemplo en este post sobre nuestra colaboración con UNICEF. La repercusión de este tipo de eventos se ve reflejada en nuestro comportamiento en las comunicaciones. Llamamos para pedir ayuda, a nuestros familiares y amigos, para comprobar que están a salvo, o para avisar de que estamos bien. Esas reacciones humanas se reflejan en los datos de las redes de telefonía móvil y, convenientemente anonimizados y agregados, pueden ser utilizados para ayudar en la gestión de estos eventos. En esta ocasión hemos hecho un estudio de impacto del temporal que tuvo lugar en la zona del Golfo de San Jorge de Argentina entre los días 29 de marzo y 7 de abril de 2017 y del que se hicieron eco varias noticias a lo largo de varios días. Comodoro Rivadavia y Rada Tilly son dos municipios argentinos situados entre las cuencas de varios arroyos y cuencas de drenaje. El temporal de lluvias dejó unos valores de 232 mm el día 29, cuando la media de precipitaciones del mes de marzo en Comodoro Rivadavia se sitúa en 20,7 mm. [caption id="attachment_37449" align="aligncenter" ] Figura 2: condiciones meteorológicas en Comodoro Rivadavia en torno a las fechas del temporal estudiado.[/caption] Estas intensas lluvias, junto con el desbordamiento de los ríos que desembocan en el océano Atlántico, provocan grandes inundaciones en la ciudad, que dejan anegadas las calles y provocan la evacuación de miles de personas. ¿Qué nos dicen los datos de llamadas? Para llevar a cabo este análisis hemos utilizado los registros de llamadas realizadas por hora en diferentes municipios. En función de la variación de llamadas causada por el desastre los hemos catalogado en tres zonas: afectación alta (Comodoro Rivadavia y Rada Tilly) en color rojo, afectación media (Caleta Olivia) en amarillo y afectación baja (Camarones, Sarmiento, Las Heras y Pico truncado) en azul. En la siguiente figura hemos representado el número de llamadas por hora para cada una de las localidades. Podemos apreciar a simple vista que para las líneas rojas, que representan la "zona cero" de la catástrofe, hay un pico de llamadas el día 29 de marzo a las 18:00. [caption id="attachment_37452" align="aligncenter" ] Figura 3: llamadas cursadas por hora en cada localidad en torno a las fechas del temporal estudiado. Las escalas son diferentes para cada localidad para que se puedan observar mejor los patrones horarios.[/caption] Vemos también un aumento de llamadas en las localidades de Sarmiento y Pico Truncado, que nos indica que la repercusión del evento llega también a zonas más alejadas geográficamente. Para profundizar un poco más, calculamos la desviación de las llamadas respecto de su patrón habitual por hora y día de la semana. Normalizamos esta diferencia y representamos el siguiente gráfico en el que los picos nos indican una desviación muy grande respecto de lo que se esperaría a esa hora ese día. En este caso sí podemos ver, en la Figura 4, un pico el día 29 en todas las localidades, en mayor o menor medida. Figura 4: desviaciones de las llamadas realizadas respecto a los patrones horarios habituales para cada localidad. La desviación está expresada en número de desviaciones estándar respecto de la media. De nuevo ténganse en cuenta los cambios de escala, que se han hecho para poder observar mejor cómo destacan los diferentes picos, pero muestran que los niveles de impacto son diferentes. En este tipo de catástrofes, un desbordamiento debido a las grandes lluvias o un terremoto, la reacción es bastante inmediata. El día 28 los valores de llamadas se ajustan a las medias habituales, pero el 29 se produce una desviación brusca a una hora concreta, un gran pico de llamadas en el momento del desastre. Los días posteriores, la situación va normalizándose hasta alcanzar de nuevo valores normales de llamadas. En el siguiente mapa podemos ver esta evolución temporal. Los colores representan el grado de desviación del patrón de llamadas, que van desde el verde claro para las menores desviaciones hasta el rojo para las más grandes, pasando por amarillo y naranja. Apreciamos el cambio brusco el día 29 de marzo y como la situación se estabiliza a lo largo de los días. Figura 5: evolución temporal de las desviaciones en cada localidad. Los colores verdes representan las menores desviaciones respecto al patrón habitual y, los rojos, las más grandes. Podemos profundizar aún más a nivel geográfico, analizando el comportamiento en cada antena y pudiendo discriminar así la afectación por zonas dentro del mismo municipio. En la Figura 6 representamos los valores de llamadas para una muestra de antenas de distintas localidades, en las que vemos cómo unas antenas registran un pico mayor que otras o cómo algunas dejan de prestar servicio, probablemente debido a problemas técnicos en la red derivados precisamente de las condiciones meteorológicas. Figura 6: patrones de llamadas horarios para las antenas de cada municipio. Como podemos ver en la figura 7, si analizamos los datos de llamadas (línea verde) respecto a su patrón habitual (línea rosa) podemos comprobar las diferencias entre las desviaciones de antenas del mismo municipio, . Además, vemos la diferencia entre la repercusión en las distintas zonas de afectación. Las gráficas de la izquierda corresponden a antenas de Comodoro, que presentan un pico de llamadas el día 29 alrededor de las 6 de la tarde. Sin embargo, para las gráficas de la derecha, que son de antenas situadas en el municipio de Las Heras, la influencia del desastre se ve reflejada en las llamadas de los días posteriores. Figura 7: comparativa entre los valores reales de llamadas por hora y los patrones habituales para dos de los municipios del estudio. Izquierda: Comodoro Rivadavia, perteneciente a la zona de afectación alta. Derecha: Las Heras, de afectación baja. Movilidad Gracias a nuestra red de telefonía, no sólo podemos observar el comportamiento en cuanto a tráfico de llamadas, sino también el comportamiento anonimizado y agregado en cuanto a movilidad. Así, al igual que en este post o en este otro, podemos estudiar la movilidad en estos casos de desastres naturales. Hemos creado una matriz origen-destino con todas las provincias de Argentina y especialmente con las localidades que hemos visto hasta ahora. También hemos seguido el mismo método para el cálculo de desviaciones. A continuación aplicamos un filtro que deje visibles sólo las localidades y provincias del país que tienen mayor desviación en movilidad en las fechas en torno al desastre. El resultado se muestra en Figura 8, donde vemos los perfiles de movilidad entre las diferentes combinaciones origen-destino más afectadas según se van seleccionando localidades o provincias en los mapas. Observamos un claro pico negativo de desviación en la movilidad el día 29 de marzo entre las localidades afectadas y su entorno. Las personas se mueven menos, están aisladas en la zona del desastre o no viajan desde allí o hacia allí debido a las condiciones meteorológicas o los efectos del temporal. Figura 8: desviaciones de movilidad para diferentes combinaciones origen-destino filtrando localidades con mayor impacto en las fechas de interés. Observamos también con claridad un segundo pico de descenso de movilidad en todas las combinaciones origen-destino, y es que el día 7 de abril se produjeron de nuevo grandes tormentas y precipitaciones en las mismas zonas de Argentina, tal y como comentamos arriba al referirnos al histórico meteorológico. Conclusiones En definitiva, los desastres naturales afectan a nuestro comportamiento y dejamos un rastro de datos que, convenientemente anonimizados y agregados, podemos utilizar para reaccionar ante estos eventos. La creación de alertas para los servicios de emergencia es un posible caso de uso implementable a partir de estos datos, de manera que se puedan dirigir los esfuerzos y recursos a las zonas más afectadas, o quizá anticiparse a la llegada de los efectos del temporal. Otra posibilidad es desarrollar una aplicación de avisos para los propios usuarios de la red de telefonía móvil, que alertase de un peligro inminente en la zona en la que se encuentran y aconsejase medidas de precaución. Obviamente, es importante discernir si los eventos que registramos de esta forma corresponden a un desastre natural o están motivados por otros tipos de actos multitudinario como conciertos o unas olimpiadas, por ejemplo. Otras fuentes y formas de análisis, como la propia información de estado y rendimiento de los elementos de red, Twitter con procesamiento de lenguaje o análisis de sentimiento, otros estudios meteorológicos, topográficos y geomorfológicos, etc. pueden completar este tipo de estudios. Aún así, con este análisis seguimos comprobando el gran potencial que estos datos tienen en este tipo de servicios dedicados al bien social. Datos que nos ayuden a mejorar, a ayudar y a prevenir en la medida de lo posible los efectos de estas catástrofes.
11 de abril de 2018
AI & Data
Solidaridad con afectados por el cáncer: marchas y videojuegos
El pasado 29 de octubre se celebró en Valladolid una de las varias marchas contra el cáncer que la AECC organiza en España. En este post, por un lado queremos compartiros esta iniciativa que combina videojuegos y lucha contra el cáncer , ya que se alinea con el espíritu que Movistar promueve desde Movistar Riders y con nuestra colaboración con el club . Y, por otro lado, a continuación vamos a hacer un pequeño análisis de cómo se acercó a la marcha de Valladolid la gente que acudió. En los mapas que vamos a ver a continuación, la aproximación al color rojo representa mayor concentración de gente desplazándose por la ciudad. Estamos entonces representando el movimiento en transporte privado o público, pero en esta ocasión no estamos representando el movimiento de la gente durante el recorrido de la marcha. En la parte izquierda de la Figura 1 vemos cómo estaba Valladolid y localidades cercanas a las 9 de la mañana. Todavía es la situación de cualquier sábado normal. En la parte derecha de la Figura 1 vemos la situación a las 10:00 de la mañana. Comprobar que ése no es el patrón habitual de Valladolid un sábado a las 10:00 nos confirma que algo extraño ha ocurrido. Efectivamente la marcha comenzaba a las 10:30 y ya se empiezan a apreciar los caminos por los que la gente se aproxima a la zona centro de la ciudad, donde tendrá lugar la marcha. Figura 1: Intensidad de movimiento en transporte público o privado en Valladolid el 29/10/2017. Izqda: 9:00-10:00. Dcha: 10:00-11:00. Nos acercamos ahora a la zona en la que se va a desarrollar la marcha. La ruta concreta de la marcha está delimitada por el polígono de borde negro que se ve en todas las figuras. En concreto, en la Figura 2 se ve cómo cambian las vías por las que la gente se aproxima a esa zona. Entre las 10 y las 11 (Figura 2, arriba) la gente ha ido llegando (para aparcar o en bus) sobre todo a la zona de la salida de la marcha (zona más roja en la Figura 2), hasta donde llegan varias líneas de autobús, y donde suele haber sitio libre para aparcar y también varios aparcamientos de pago. Figura 2: Intensidad de movimiento en transporte público o privado en Valladolid el 29/10/2017. Arriba: 10:00-11:00. Abajo: 11:00-12:00. Si ahora nos fijamos en la parte de abajo de la Figura 2, vemos un efecto curioso que sucede en la segunda hora de la marcha: se concentra movimiento en la zona superior izquierda, justo en el extremo de una parte del camino de la marcha. La explicación que encontramos es que en esa zona hay un aparcamiento grande, que ese día es gratuito y que, aunque no es muy céntrico, está próximo a la ruta de la marcha cuando la marcha ya ha alcanzado ese punto. En definitiva, la gente llega, aparca, y se une a la ruta de la marcha en ese punto. Parece una estrategia inteligente por parte de los que decidieron no madrugar mucho. En la Figura 3 se ve cómo y por dónde la gente va abandonando la zona de la marcha y el centro de la ciudad en las siguientes dos horas. Figura 3: Intensidad de movimiento en transporte público o privado en Valladolid el 29/10/2017. Arriba: 12:00-13:00. Abajo: 13:00-14:00. Así hemos intentado acompañar a quienes apoyaron la lucha contra el cáncer ese día. No te pierdas ninguno de nuestros post. Suscríbete a LUCA Data Speaks.
23 de diciembre de 2017
AI & Data
Profuturo: mejora de la enseñanza con la analítica de datos
Escrito por Manuel Ruiz (Fundación Profuturo) y Javier Carro (LUCA). El pasado día 12 de diciembre ofrecimos un nuevo webinar de nuestra serie de LUCA Talks. En esta ocasión presentamos una colaboración muy interesante y muy bonita entre LUCA, la Fundación Profuturo de Telefónica y la Universidad Pontificia de Salamanca (UPSA). Desde el área de Big Data for Social Good de LUCA se coordina esta colaboración en la que todas las partes contribuyen a que Profuturo, la iniciativa de Telefónica que lleva educación digital a lugares vulnerables de todo el mundo, dé lo mejor de sí mismo. En esta colaboración por parte de LUCA participa la propia área de Big Data for Social Good, y también ha contribuido Synergic Partners, el área consultora y analítica de LUCA, con el estudio de casos de uso. Por parte de la UPSA se está teniendo una experiencia muy positiva, ya que se ha implicado un grupo de estudiantes que han encontrado en este proyecto, junto con la tutela y coordinación ofrecida desde la Facultad de Informática, un ejemplo práctico y motivador de análisis de datos reales. Manuel Ruiz, gerente de tecnología de Fundación Profuturo, contó el interesante origen de esta iniciativa, pero sobre todo apuntó lo ambicioso de sus objetivos, ya que se han propuesto llegar a 10 millones de niños en 2020. A pesar de la sorprendente magnitud de la cifra, se considera una iniciativa viable, ya que actualmente se ha llegado ya a 5.6 millones. Esto sitúa a Profuturo como la segunda entidad en el ámbito de la educación a nivel mundial después de UNICEF. Respecto a la solución de Profuturo, Manuel destacó varias características: Es una solución funcional tanto online como offline: hay casos, como el de África, en el que el 60% de los niños y niñas entre 15 y 24 años no puede conectarse a la red, por lo que el hecho de que se pueda utilizar el sistema sin conexión a Internet es fundamental para poder llegar a cualquier lugar. Es una solución modular en cuanto a HW y SW, con lo cual se puede adaptar a las diferentes circunstancias de los países donde se despliega, tamaños de escuelas, etc. Es integral: los contenidos son innovadores y se imparte formación tanto general como específica a los docentes que utilizarán la plataforma, ya que ellos son actores fundamentales para lograr el éxito del proyecto. Es medible, debido a que la solución es digital desde su nacimiento. Y en este sentido, LUCA y la UPSA están trabajando para sacar lo mejor de Profuturo. Adaptable: porque los contenidos se organizan de forma que se adapten, complementen e impulsen las mallas curriculares de los países, contando además con las autoridades educativas locales. Se ofrece soporte continuo a los profesores y coordinadores que trabajan directamente en las escuelas. Los datos con los que se está trabajando proceden de la propia plataforma de e-learning (la base son tecnologías LMS que contienen información sobre las escuelas, clases, actividades, etc.), de Salesforce (que aporta información de contexto social y económico, gestión de incidencias, etc.), y GlobalSAP (que aporta información sobre las preguntas con impacto económico directo que hay que abordar). También se utilizan Datos Abiertos como los del Banco Mundial o datos generados por otras ONGs. Figura 2 : Aula Profuturo en Perú. Por su parte, Carmen Rodríguez, que proviene de la UPSA y actualmente disfruta una beca en el área Big Data for Social Good de LUCA, nos explicó el trabajo de regularización, homogeneización y visualización de datos necesarios para lograr generar una herramienta fiable. Esta herramienta está ya ayudando a Profuturo a tener el control de los aspectos del proyecto relativos al producto en sí, al equipo de soporte de la plataforma, y aporta la información necesaria para poder reportar convenientemente a los interesados (el propio Patronato de la Fundación Profuturo, ONGs y entidades colaboradoras, escuelas y autoridades educativas de los países). Este trabajo ha permitido que, prácticamente desde el inicio, se puedan extraer conclusiones sobre la calidad de los datos y también insights como los que nos explica Carmen al final del vídeo relativos, por ejemplo, a la importancia de la formación presencial de los docentes o al éxito no esperado del área de matemáticas en alguno de los países donde está Profuturo. Si quieres conocer más detalles, puedes ver el vídeo íntegro del webinar a continuación. Te esperamos en el siguiente LUCA Talk, ¡gracias! No te pierdas ninguno de nuestros post. Suscríbete a LUCA Data Speaks.
15 de diciembre de 2017
AI & Data
V Encuentro de Big Data en Castilla y León
Escrito por el equipo de CDO de Boecillo (Valladolid). La V Edición del Big Data CyL ha vuelto a reunir en la sede de Telefónica I+D de Boecillo a diferentes profesionales relevantes del sector público y privado del mundo Big Data de Castilla y León. Figura 1 : Big Data CyL. El 22 de noviembre tuvo lugar la V edición del Big Data CyL, y volvió a reunir, como de costumbre, a profesionales de diferentes sectores y AAPP, todos ellos con el denominador común de basar su trabajo en las tecnologías más avanzadas del mundo del Big Data. En este post hacemos un resumen de la jornada, y además también podéis consultar el impacto del evento recogido por la prensa regional. Arturo Canales, experto BigData de Telefónica I+D, introdujo el evento presentando a los ponentes y dio paso a Modesto Mezquita, Coordinador de la Agencia de Innovación y Desarrollo Económico del Ayuntamiento de Valladolid. Modesto describió una serie de proyectos, entre otros, Remourban, que ponen de manifiesto el interés decidido que la ciudad tiene por progresar en el ámbito de las Smart Cities y los Datos Abiertos con la colaboración de numerosos socios. Figura 2 : Arturo Canales presentando el evento. Figura 3 : Modesto Mezquita durante su intervención. A continuación, desde LUCA, unidad Big Data de Telefónica para servicios a empresas, su CEO, Elena Gil, abordó los retos a los que se enfrentan las organizaciones a la hora de tomar decisiones basadas en datos: minimizar barreras culturales para que la estrategia de datos sea transversal, la dificultad de encontrar perfiles mixtos que sean expertos en negocio y en datos y, por supuesto, el reto de la adaptación a la regulación de privacidad que se avecina con la nueva GDPR. El mensaje final que nos dejó Elena se resume en que tomar decisiones basadas en datos es “una realidad y una necesidad para todas las empresas, y hacerlo es ya inexcusable”. Figura 4 : Elena Gil, CEO de LUCA. Por parte de Luce Innovative Technologies, contamos con la presencia de Javier Durán de Jesús, Director General en esta empresa. Javier nos explicó cómo en Luce han construido un producto que, analizando la navegación en Internet de los usuarios mediante redes neuronales, consigue anticipar con gran precisión si la satisfacción de la necesidad del cliente va a ser exitosa. Figura 5 : Javier Durán, Director General de Luce Innovative Technologies. El Dr. Pedro de Alarcón, Head del área Big Data for Social Good & Sports Science, presentó su área de trabajo en la que trabajan para que Telefónica pueda generar un impacto social positivo en la sociedad, demostrando que los datos que las empresas utilizan para desarrollar y optimizar sus negocios, también se pueden utilizar para devolver valor a la sociedad. Pedro explicó varios proyectos en esta línea, desde la colaboración con UNICEF en gestión de desastres naturales y situaciones de vulnerabilidad, hasta la colaboración con el equipo de eSports de Movistar, pasando por investigaciones en calidad del aire con datos de movilidad propios de Telefónica. Figura 6 : Pedro de Alarcón durante su intervención sobre Big Data for Social Good. Desde Minsait by Indra nos acompañaron Noelia González, Manager Data Science, y Santiago Moreno, Especialista Senior. Además de presentarnos Minsait, la unidad en la que desarrollan su trabajo de forma transversal dentro de Indra, explicaron su experiencia trabajando con datos de imágenes de satélite en las que detectan la presencia de agua. Nos enseñaron también un ejemplo de su plataforma Sofia2 que les permite, entre otras cosas, utilizar diferentes tecnologías (Spark, HiveSQL, etc…) dentro de un mismo notebook. Figura 7 : Noelia González y Santiago Moreno, de Minsait by Indra. Después de una pequeña pausa para el café, Javier Prieto, Profesor del Máster en Big Data Science de la Universidad de Valladolid, abordó el mundo de las Ciudades Inteligentes. Con la tecnología de Spark de fondo, nos condujo por los caminos que deben llevar a construir la plataforma ideal de las Smart Cities. Figura 8 : Javier Prieto durante su intervención. Paco González, Moneyball, aportó otra de las visiones disruptivas de la jornada, ya que su trabajo se mueve en el mundo de los datos deportivos. Desde su experiencia con el Sevilla F.C., otros clubes, y también en la organización del Curso de Experto en Análisis Deportivo de datos y Big Data, mostró cómo se puede ayudar con eficacia al ahorro de tiempo en procesos dentro de un club de fútbol, y al rendimiento deportivo. Figura 9 : Paco González durante su intervención. Desde Renault, empresa histórica y clave en el desarrollo de Valladolid, Marta Alonso, Data Analyst, primero nos presentó el contexto en el que una empresa de fabricación de coches necesita manejar datos para su actividad de manufactura, y acto seguido nos explicó cómo el análisis de esos datos les está ayudando a predecir y evitar defectos en los procesos, la fabricación y en el propio mantenimiento de los diferentes robots con los que fabrican. Figura 10 : Marta Alonso, desde Renault, nos explica su experiencia en el uso de datos para el mantenimiento predictivo en la fabricación de coches. El Dr. Qiyang Duan, Big Data Product Manager de Huawei, abordó la complejidad de llevar el Data Science y los Modelos Analíticos al mundo PaaS (Platform as a Service), de forma que se puedan implantar casos de uso que trasladen los modelos analíticos a sistemas de Producción. Para ello nos acompañó en un viaje explicativo de los diferentes retos que Huawei resuelve con su marco de despliegue de modelos en cuanto a lenguajes de programación, APIs, etc. Figura 11 : Qiyang Duan, durante su intervención. En la anterior edición del Big Data CyL nos despedimos esperando contar este año con nuevas experiencias de profesionales que nos trajeran nuevos retos superados y nos enseñaran nuevos caminos a explorar. El objetivo está más que superado, y estamos seguros de que el próximo año volveremos a tener una nueva selección de ejemplos a seguir. No te pierdas ninguno de nuestros post. Suscríbete a LUCA Data Speaks.
30 de noviembre de 2017
AI & Data
Profuturo, UPSA y LUCA por la educación digital en lugares vulnerables
El pasado jueves día 22 se celebró en la Universidad Pontificia de Salamanca un encuentro donde nos reunimos representantes del área Big Data for Social Good de LUCA, Fundación Profuturo y la Facultad de Informática como colofón de la colaboración en la que hemos estado trabajando durante este curso. Se trata de una colaboración planteada a largo plazo con un acuerdo que permite a los estudiantes tener un primer contacto con casos de uso y datos reales. En el encuentro se hizo el planteamiento de la colaboración para los próximos cursos. Figura 1: Algunos momentos de la jornada que reunió a estudiantes de la UPSA y representantes de Fundación Profuturo, Universidad Pontificia de Salamanca y LUCA El objetivo de Fundación Profuturo es reducir la brecha educativa proporcionando una educación digital a niños y niñas de entornos vulnerables. Para ello, en colaboración con ONGs e instituciones locales, proveen a escuelas de equipamiento tecnológico (ordenador portátil conectado por wifi a las tablets que usan los estudiantes), contenidos formativos multimedia, y la formación y acompañamiento necesarios para que los docentes puedan sacar el mayor provecho de la plataforma. En el encuentro participaron también el equipo de estudiantes que han estado trabajando con los datos de la Fundación Profuturo durante este curso. Su colaboración ya ha dado los primeros frutos, que han demostrado ser muy útiles para la optimización del funcionamiento de la plataforma. Los comentarios de los estudiantes acerca de esta experiencia ponían de manifiesto no sólo la utilidad de esta iniciativa para su aprendizaje en tecnologías Big Data, sino también la ilusión y motivación que les aporta el hecho de que se trate de una iniciativa de esta índole. Pudimos contar con la presencia del Decano de la Facultad de Informática de la Universidad Pontificia de Salamanca, el Dr. Alfonso José López Rivero, que confirmó el compromiso de la Facultad con esta iniciativa y animó a los estudiantes a seguir con su contribución y aprendizaje. Figura 2: Javier Carro, Data Scientist en LUCA, Manuel Martín-Merino, Catedrático de IA en la UPSA, Javier M. Elicegui, Senior Data Scientist colaborador de la UPSA, y Manuel Ruiz, Gerente de Tecnología en Fundación Profuturo, junto con algunos de los estudiantes que han colaborado en esta iniciativa. En las actividades realizadas a lo largo de este curso hemos podido contar también con la colaboración de Synergic Partners, que también seguirá aportando su conocimiento y experiencia para asegurar el éxito de esta iniciativa. ¡Nos vemos en el próximo curso!
26 de junio de 2017
AI & Data
3,2,1... Comienza el reto HackForGood!
Hace unos días anunciábamos la presencia de LUCA en la 5ª edición del HackForGood donde hemos hecho nuestras propuestas de reto y premios. Desde LUCA queremos por un lado, devolver a la sociedad el valor de sus propios datos y, por otro, fomentar un ecosistema de innovación cerca de Telefónica. Por eso estamos participando en este HackForGood. En el siguiente vídeo te explicamos nuestra propuesta y los datos que se podrán utilizar. Pero no seas perezoso y lee el post completo para no perderte nada. Los datos Los datos que proporciona Telefónica en este caso son de tráfico de antenas, movilidad y estancias de móviles para varios meses de 2015 en Colombia. Están anonimizados, sampleados y agregados por municipio. Para acceder a ellos, además del registro en HackForGood deberás aceptar una serie de condiciones de confidencialidad sobre los datos en un formulario online en el que te pediremos tus datos básicos y un correo electrónico verificable, ya que el uso de estos datos debe ser exclusivo para este evento y finalidad. Las condiciones que aceptas en el formulario de descarga son estrictas con esto por temas legales, pero es fácil si sigues la máxima "lo que pasa en HackForGood se queda en HackForGood" ;-) Te enviaremos un enlace personalizado a tu correo electrónico para la descarga de los datos. Los datos que descargarás llevan una marca de agua personalizada. Esto es, de nuevo, sólo para evitar que se usen los datos fuera del ámbito de este evento. Ya puedes descargar los datos aquí. Los datasets tienen la siguiente información: El dataset que podrás utilizar para mapear los códigos de municipio y de departamento con sus nombres y también con sus geometrías (por si por ejemplo los quieres pintar en mapas) es éste. Tienes versión geojson y versión shapefile. Estancias: Fecha (día, mes y año) en la que tuvieron lugar las estancias. Código de departamento de Colombia (similar a Comunidad Autónoma en España). Código de municipio de Colombia (similar a municipio en España). Número de estancias detectadas (se considera estancia a una permanencia en un lugar aproximadamente a partir de 2h). Número de móviles distintos para los que se detectaron las estancias. Desplazamientos: Fecha (día, mes y año) en la que tuvieron lugar los desplazamientos de ese registro. Código de municipio de Colombia (similar a municipio en España) desde el que se iniciaron los desplazamientos contabilizados en ese registro (hay un registro por cada combinación fecha-origen-destino). Código de municipio de Colombia (similar a municipio en España) en el que finalizaron los desplazamientos contabilizados en ese registro (hay un registro por cada combinación fecha-origen-destino). Número de desplazamientos detectados entre sendos municipios origen y destino. Número de móviles distintos para las que se detectaron esos desplazamientos. Tráfico de antenas por municipio: Fecha (día, mes y año) de observación del tráfico de antenas en el municipio. Código de departamento de Colombia (similar a Comunidad Autónoma en España). Código de municipio de Colombia (similar a municipio en España). Datos 3G de descarga (MB). Datos 3G de subida (MB). Número de llamadas completadas vía red 3G. Número de llamadas no completadas vía red 3G. Datos 2G de descarga (MB). Datos 2G de subida (MB). Número de llamadas completadas vía red 2G. Número de llamadas no completadas vía red 2G. Además, por supuesto, podrás usar cualquier fuente Open Data que se te ocurra. Por ejemplo en DataRepública puedes encontrar datasets muy interesantes (censos, ocupación territorial, etc). También en los bancos de datos del Banco Mundial, WEF, UN, UNICEF, etc. Figura 1: Algunos de los participantes de HackForGood en la edición del 2015. Las ideas Tras leer lo anterior quizá ya se te ha ocurrido alguna idea interesante sobre cómo utilizar estos datos ¡adelante con ella!. Si necesitas más inspiración, echa un vistazo a los 17 " Sustainable Development Goals" de Naciones Unidas. Si quieres ir más a fondo con los SDGs, ten en cuenta que tienen 169 targets con 241 KPIs. Los KPIs están clasificados en 3 “tiers”. Tier I se refiere a KPIs que se sabe cómo medir y para los que hay datos disponibles así que, en principio, serían KPIs "resueltos". Tier II se refiere a KPIs que se sabe cómo medir pero no hay datos, con lo cual es un campo en el que se puede aportar valor. Y, por último, Tier III se refiere a KPIs que no se sabe cómo medir y para los que además tampoco hay datos, otro caso en el que aportar. Los retos tienen Tier II y III. Para que no te pierdas entre tanto KPI, nosotros hemos destacado estos: SDG 10.2.1: Proportion of people living below 50 per cent of median income, by age, sex and persons with disabilities (Tier III) SDG 9.1.1: Proportion of the rural population who live within 2 km of an all-season road (Tier II) SDG 11.2.1: Proportion of population that has convenient access to public transport, by sex, age and persons with disabilities (Tier II) SDG 11.3.1: Ratio of land consumption rate to population growth rate (Tier II). También puedes inspirarte en este ejemplo de colaboración de Telefónica con UNICEF. Pero insistimos: nuestras propuestas no deben limitar tu imaginación. Seguro que con todos estos ingredientes nos sorprenderás con ideas y trabajos muy interesantes. ¡Ánimo con el reto, “hackers for good”!
7 de marzo de 2017
AI & Data
Destacando el valor de los datos en Castilla y León
En la “Jornada sobre Proyectos Big Data” organizada por el Branch del PMI de Castilla y León se habló de los retos en la gestión de todo tipo de proyectos relacionados con los datos. El 14 de febrero tuvo lugar en el edificio CTTA de la Universidad de Valladolid la Jornada sobre Proyectos Big Data, que convocó a numerosos profesionales del mundo de la gestión y dirección de proyectos relacionados con Big Data de Castilla y León. Figura 1: Panorámica de ponentes y asistentes. Emilio del Prado fue el encargado de ofrecer una clara y didáctica ponencia inicial en la que propuso una metodología para afrontar el reto de conectar las innumerables fuentes de datos con los objetivos de negocio de las empresas. Como no podía ser de otra forma, el valor de los datos para el negocio fue un denominador común en muchas de las intervenciones que se dieron a lo largo de la jornada. Figura 2: Niveles para acercar los datos al negocio y viceversa según Emilio del Prado. Después de esta ponencia tuvimos una mesa redonda moderada por Jesús de Prado, Subdirector de Desarrollo de la Escuela de negocios CEU Castilla y León, quien comenzó animando a los ponentes participantes a explicar su experiencia con proyectos Big Data. Por ejemplo, Pablo Hermoso nos habló de la experiencia de NGOSS integrando gestión del conocimiento, aprendizaje informal y trabajo colaborativo en un entorno de datos enlazados. Así consiguen, por ejemplo, crear grafos de conocimiento interrogables para facilitar ahorro de tiempo y costes en el descubrimiento y la gestión del conocimiento, y también potenciar el desarrollo de nuevos negocios. El trabajo de NGOSS con el Museo del Prado ha sido reconocido recientemente en los premios Webby. Figura 3: Premio Webby para la colaboración entre NGOSS y el Museo del Prado. Antonio Ibáñez, Jefe de Servicio del SIAU y la Web Corporativa de la Junta de Castilla y León habló de los retos de la Administración Pública a la hora de ofrecer de forma abierta los datos de que dispone para su explotación por parte de ciudadanos y empresas. Figura 4: Ponentes de la mesa redonda: Emilio del Prado, Antonio Ibáñez, Pablo Hermoso. Algunos de los secretos del uso de datos en el ámbito del márketing nos fueron desvelados por Andrés David Virto. Desde su posición de Digital Marketing Manager en Madison Experience Marketing nos llevó al mundo de la captación de la atención publicitaria y el posicionamiento y construcción de marca, dándonos ejemplos de cómo el análisis de datos les hacen más eficientes y competitivos. El World Padel Tour que se celebra en Valladolid es uno de estos casos. Figura 5: Ponentes de la mesa redonda: José Manuel Cuena, Francisco Javier González, Andrés David Virto Francisco Javier González hizo una apasionada descripción del estado de la ciencia de los datos en el deporte. Comenzó diferenciando el Big Data “dentro y fuera del campo”, dos ámbitos que persiguen objetivos distintos. También nos dio ejemplos prácticos, como haber batido récords de ausencias de lesiones en jugadores de fútbol. Su batalla por la defensa y potenciación del talento local quedó patente con los datos que dio de las inscripciones al curso de Análisis deportivo de datos y Big Data promovido por él y la Universidad de Valladolid. Por parte de la Universidad de Valladolid, José Manuel Cuena, responsable del CPD del Parque Científico de la Universidad de Valladolid, nos describió los retos a los que se enfrenta este CPD para conseguir estar al día en oferta de computación y almacenamiento. Figura 6: Foto de familia de los ponentes de la mesa redonda. Esta jornada puso de manifiesto la relevancia del talento y la iniciativa de Castilla y León en la gestión y desarrollo de proyectos Big Data. Teniendo en cuenta siempre que, según el ponente Emilio del Prado, para no abusar del término Big Data, éste “ debe ir siempre acompañado y explicado por el valor de negocio que aporta”.
16 de febrero de 2017
AI & Data
¿Dónde van los madrileños en el puente de Diciembre?
Muchos aprovechamos el puente de diciembre para descansar, hacer turismo o visitar nuestros lugares de origen. En esta ocasión, a modo de entrega adicional a nuestros artículos anteriores sobre movilidad ( commuting y contaminación), os proponemos un breve estudio sobre nuestras costumbres en el puente de diciembre. Nos hemos centrado de nuevo en Madrid por ser una fuente de movilidad que afecta a toda España, por lo que muchos nos veremos representados. Pero esta vez también descubriremos aspectos interesantes sobre Toledo. Figura 1: "Los datos se van de puente. ¿Dónde van los madrileños en el puente de Diciembre?" ¿Dónde van los madrileños en el puente de Diciembre? Hemos vuelto a utilizar datos de SmartSteps centrándonos en el concepto dwell en vez de en los POIs (puntos de interés) home y work que os presentamos en los posts anteriores. Para entender este concepto recordamos que SmartSteps extrae la información a partir de dos tipos de datos que se generan en la red móvil: eventos activos (llamadas, SMSs, …) y eventos pasivos (los que realiza la propia red por su necesidad intrínseca de gestionar los móviles conectados a ella). Si te interesa conocer más sobre los datos que recoge SmartSteps te remitimos a este artículo que, sobre todo en su primera parte, lo explica de forma muy clara. A partir de estos dos tipos de eventos se pueden inferir lugares donde realmente hemos estado un tiempo significativo ( dwells) diferenciándolos de lugares por donde simplemente hemos pasado. Antes de continuar insistimos en los principios de agregación y anonimización que rigen siempre la actividad y el uso de los datos de SmartSteps. Es decir, observamos y analizamos datos de grupos homogéneos, nunca de personas de manera individual. Lo hemos explicado formalmente en los posts anteriores y ahora lo resumimos de forma sencilla: si al leer este artículo y ver sus gráficas te sientes aludido, no te alarmes, somos muchos los que hacemos algo similar y por eso aparecemos como significativos. Principales destinos de los madrileños en el puente de diciembre El primer paso es similar a los que hicimos en el post sobre commuting: un mapa de calor (Figura 2) que representa la distribución de los destinos elegidos por los que habitualmente viven en Madrid. Figura 2: Distribución de los destinos elegidos por los habitantes de Madrid en el puente de diciembre. El puente suele ser muy largo y muchos no lo pasamos entero en un único lugar, así que para obtener este gráfico hemos seleccionado como destinos los lugares en los que la gente ha pasado más horas dentro del puente (dwells más largos). Podemos fijarnos en varios tipos de destinos: Destinos muy destacados: Barcelona, Toledo. Destinos destacados: Valencia, Alicante, Sevilla, Málaga, Cádiz, Guadalajara. En el resto podemos destacar provincias alrededor de Madrid y unas cuantas provincias costeras alrededor de toda España. Este primer acercamiento, aparentemente sencillo, nos empieza a sugerir preguntas que nos gustaría responder profundizando más en los datos. Como no hay tiempo para todo nos quedamos con una de las que más nos ha llamado la atención: Toledo. Si vives en Madrid seguro que conoces a muchos con familia en Toledo, pero en el mapa destaca realmente mucho. A priori Guadalajara podría haber tenido un comportamiento similar, ya que tienen poblaciones casi idénticas que podrían “tirar” de los habitantes de Madrid. Realmente Madrid y Toledo están muy “unidas”. ¿Familia? ¿Turismo (El Greco, gastronomía…)? Toledo, ¿simple casualidad? Para continuar nos hemos planteado si este comportamiento fue puntual o es recurrente. Así que hemos agregado los datos de los que fueron a Toledo en el puente para ver sus destinos más habituales en otros 9 fines de semana del año. El resultado lo vemos reflejado en la Figura 3. Figura 3: Diagrama sunburst con los 100 grupos de provincias destino más elegidos por los “madrileños-toledanos” en los 9 fines de semana analizados. Para esta visualización hemos reutilizado uno de los ejemplos de uso de la librería D3.js y hemos representado los grupos de destinos elegidos por los “madrileños-toledanos”. Se trata de una librería JavaScript que es de gran ayuda para hacer representaciones gráficas de datos. Su potencial es muy grande ya que, además de poder usarla directamente para páginas web, puedes extenderla acorde a tus necesidades, y también se integra con la mayoría de herramientas de visualización de datos tanto propietarias como abiertas. Para esta Figura 3, como las combinaciones de lugares de destino en esos 9 fines de semana son muy numerosas, nos hemos quedado con las 100 combinaciones más frecuentes. Así, podemos ver, de aquellos que fueron a Toledo en el puente, los porcentajes de gente que suelen quedarse únicamente en Madrid, los que siempre se van a Toledo, los que reparten sus fines de semana entre Madrid y Toledo, Madrid-Toledo-Alicante, Madrid-Toledo-Alicante-Valencia, etc. Lo podríamos resumir en estos grupos: Toledanos: Aproximadamente 1 de cada 3 ha vuelto a Toledo todos los 9 fines de semana del estudio, así que podemos decir que esta parte de los viajeros tienen lazos permanentes con Toledo. Aproximadamente 1 de cada 5 unas veces se quedan en Madrid y otras van a Toledo. Diríamos que también tienen lazos permanentes con Toledo, pero no lo visitan con tanta frecuencia. Madrileños: Aproximadamente 1 de cada 5 se ha quedado en Madrid todos los 9 fines de semana del estudio, así que está claro que estos fueron a Toledo como escapada ocasional. Madrileños turistas y Toledanos turistas: hay un grupo que se quedan casi siempre en Madrid pero hace visitas sobre todo a la Comunidad Valenciana. Y otro grupo, más pequeño, que casi siempre van a Toledo pero también visitan la Comunidad Valenciana. Incluso para los que normalmente alternan entre Madrid y Toledo, su tercera opción para viajar vuelve a ser sobre todo la Comunidad Valenciana. Pero, si nos fijamos bien, vemos que en seguida empiezan a aparecer destinos de lo más diverso. Queda claro el éxito de la Comunidad Valenciana. De ella, Alicante es el destino más elegido. En el gráfico izquierdo de la Figura 4 podemos ver el porcentaje global (considerando todos los grupos de destinos y no sólo los 100 primeros) que se lleva cada grupo de destinos y que confirma, por ejemplo, el grupo de "toledanos" explicado más arriba. En el gráfico derecho de la Figura 4 vemos cuántos madrileños han visitado la Comunidad Valenciana alguno de los 9 fines de semana, lo cual confirma de nuevo el éxito de esta comunidad. Figura 4: Izquierda, porcentaje de madrileños por destino. Derecha, porcentaje de madrileños que también fueron a la Comunidad Valenciana. En definitiva, este análisis empieza a poner de manifiesto las costumbres viajeras de los españoles en cuanto a frecuencia con la que se hacen diferentes tipos de escapadas de fin de semana, número de destinos diferentes a para esas escapadas. Cuanto más profundizamos, más nos gustaría saber sobre diversos aspectos que van surgiendo, pero el tiempo es limitado y tendremos que dejarlo para otra ocasión. Esperamos que este nuevo viaje por España os haya resultado interesante, e incluso que os haya despertado más preguntas que respuestas. Ya sabéis que para cualquier sugerencia, duda o propuesta podéis contactarnos siempre aquí. Para mantenerte al día con LUCA visita nuestra
19 de diciembre de 2016
AI & Data
Los datos hablan en Castilla y León
El pasado 3 de noviembre tuvo lugar la IV edición del Big Data CyL, un evento que convoca a numerosos profesionales del mundo Big Data de Castilla y León para compartir experiencias sobre análisis de datos, visualización, tecnologías, gestión de datos y gestión de negocios en este ámbito. Figura 1: Big Data CyL tuvo lugar el 3 de Noviembre en Castilla y León Arturo Canales introdujo el evento aludiendo al cambio tecnológico que ha experimentado este campo en los últimos 10 años, llegando a la conclusión de que, tal y como se refleja en el discurso actual de Telefónica, Big Data no es una cuestión de tecnología, sino de negocio. Si tu iniciativa tecnológica sobre datos no aporta valor al negocio, fracasará. La encargada de la inauguración oficial fue Marta López de la Cuesta, Viceconsejera de Función Pública y Gobierno Abierto, que habló de la responsabilidad que tienen las AAPP de ofrecer datos de calidad y fiables a empresas, profesionales, etc., y también de ser ellas mismas usuarias de esos datos. Figura 2: Charla inaugural de Marta López La visión humanizada de las máquinas y de los algoritmos la aportó Salvador Pérez Crespo, Head of Technology Dissemination en Telefónica I+D. Ofreció varios ejemplos del creciente acercamiento de las máquinas a comportamientos humanos en cuanto a autonomía y creatividad, y propuso pensar en los diferentes debates éticos que surgen a medida que damos responsabilidades de decisión a las máquinas. Figura 3: Entidades no humanas toman vida "Jao", cofundador de BigML, llevó a la audiencia por una breve historia donde explicó el avance de la abstracción del acceso a los datos (bases de datos, redes, sistemas distribuidos, Machine Learning) para presentar una herramienta que pone complejos algoritmos de Machine Learning al alcance de un click. A continuación, Enrique de Miguel, de Telefónica España, sugirió que el liderazgo de cada sector de actividad lo tendrán las empresas con mayor Data Market Share. Lo cual no consiste en acumular datos sin más, sino en extraer valor para tomar decisiones en base al conocimiento. Estos datos son anonimizados, agregados y analizados para extraer conocimiento que resuelve casos de negocio para otras empresas y para Telefónica. Desde la Universidad de Valladolid, Aníbal Bregón Bregón, Profesor Auxiliar en esta Universidad, presentó la plataforma Big Data que han construido para analizar la eficiencia operacional de vuelos basada en el análisis del tráfico aéreo y también en datos climatológicos. Se trata de un proyecto liderado por Boeing Research & Technology Europe en el marco del proyecto CIEN del CDTI. Diego Merino habló de lo que hacen en Smart Rural S.L. en cuanto a transferencia, procesado y almacenamiento de datos que capturan con drones. Estos drones están equipados con diferentes sensores de forma que hacen vuelos multiespectrales, térmicos, RGB, climáticos, de suelo, de agua, etc, y la información que captan se procesa con el objetivo de optimizar y planificar la actividad agrícola (recomendaciones de sistemas de riego o de fertilización, gestión de bosques, enfermedades, etc.). Figura 4: CARTO en su nueva versión Builder Por parte de CARTO, Daniel Carrión presentó la plataforma de la que hemos hablado recientemente en este blog, y que tiene como objetivo poner las tecnologías GIS, hasta ahora reservadas a expertos, al alcance de cualquier negocio. En su nueva versión “Builder”, que precisamente este día tuvo su lanzamiento comercial, van un paso más allá ofreciendo herramientas sencillas de inteligencia de negocio y diferentes tipos de análisis geográfico y análisis predictivo . Desde Telefónica I+D, Álvaro Sánchez, Data Analyst and Visualization Engineer, presentó una herramienta de visualización desarrollada en Telefónica I+D que permite navegar fácilmente por el cada vez más profuso y complejo panorama del Big Data, y así hacer más comprensible y asequible la cantidad de herramientas, tecnologías y empresas que actúan en este sector. El encuentro lo concluyó Jose Palazón, CTO en Telefónica CDO, explicando el proyecto de la plataforma de Big Data de Telefónica. Precisó que no se trata de una plataforma colocada sin más sobre las otras tres (redes, IT y servicios) sino algo que las rodea, y que se integra e interactúa con ellas. Seguro que dentro de un año podremos escuchar nuevas experiencias de profesionales, empresas y AAPP de Castilla y León que habrán superado los que hoy se han identificado como los próximos retos que tenemos por delante.
7 de noviembre de 2016