En este segundo post, continuación de "Ciudades Inteligentes: Exprimiendo Open Data con Power BI" analizaremos el problema y conoceremos las medidas que tomaron los Bomberos de Londres a la vista de estos resultados, para intentar paliar la situación.
Hipótesis
Ha llegado el momento de plantearnos qué información queremos extraer de los datos, qué respuestas estamos buscando. Algunas preguntas pueden estar claras desde el principio del análisis. Otras, sin embargo, irán surgiendo según los datos nos vayan revelando información.
El problema: La señal de alarma que nos ha llevado a plantearnos el análisis es el incremento del número de intervenciones del cuerpo de bomberos para realizar estos servicios, y el coste asociado.
Figura 1: Imagen de la campaña lanzada en 2016.
Empezamos a plantear hipótesis que intentaremos contrastar con los datos. Con las conclusiones que obtengamos, buscaremos estrategias o definiremos iniciativas que nos permitan solucionar el problema o reducir/minimizar sus efectos.
-
Hipótesis 1: El número de servicios se va incrementando cada año. Si no se plantea ninguna medida correctiva el coste seguirá aumentando.
-
Hipótesis 2: El tipo de animal implicado en el incidente es fundamental a la hora de discriminar si realmente es necesaria la intervención del cuerpo de bomberos o no. La ubicación del incidente (rural o urbano) también puede estar relacionada con el tipo de animal
Lo primero que conviene hacer es echarle un vistazo a los datos. Cargarlos en forma de tabla, ver los nombres de los campos (algunos nos resultarán descriptivos, otros no), y probar algunos filtros. Esta breve exploración previa nos ayudará a elegir qué campos pueden aportar información más relevante para cada informe.
*En un análisis más complejo, estaríamos en la fase de seleccionar qué atributos nos proporcionan una mayor “ganancia de información” (information gain), permitiéndonos segmentar los datos de forma más eficaz. Por ejemplo, cuales son los atributos que nos permiten agrupar y predecir los valores del campo “IncidentNominalCost” (coste del servicio).
Para trabajar sobre la Hipótesis 1, elegimos la visualización
“Line Chart”. Seleccionamos el campo sumatorio CallYear y lo arrastramos bajo la etiqueta
“Axis” para que represente este valor en el eje vertical (ordenadas) y campo
PumpCount lo arrastramos bajo la etiqueta
“Values” para que aparezca en el eje horizontal (abscisas). Si seleccionamos directamente los campos en la lista los puede añadir en un orden que no es el que nos interesa por eso es mejor arrastrarlos directamente a su posición final.
Figura 2: El campo CalYear (año) debe aparecer bajo la etiqueta “Axis”, mientras que el campo “PumpCount” (número de casos) debe aparecer bajo la etiqueta “Values” leyenda.
Obtenemos así el primer panel del informe, en el que se aprecia la evolución del número de servicios de rescate por año.
Figura 3: Evolución del número de casos por año.
Para hacer un análisis más eficiente de esta gráfica conviene aplicar algunos filtros. Dado que del año 2017 sólo tenemos algunos datos del primer cuatrimestre, vamos a cortar por año completo. Aplicamos el filtro:
Figura 4: Ejemplo del filtro avanzado. Sólo muestra los años anteriores a 2016.
Aplicado el filtro, la nueva gráfica sería la siguiente:
Figura 5: Evolución del número de casos por año (filtrada).
Podemos probar con otra visualización de los datos,
“Funnel” donde es más fácil apreciar el valor total del número de servicios realizados por año. Cambiar de una a otra es tan fácil como seleccionar en el panel de visualización el nuevo formato con el que queremos que nos presente los datos. Power BI hará el resto del trabajo.
Figura 6: Ejemplo de visualización “Funnel”.
Se puede apreciar claramente un incremento de las actuaciones entre 2009 y 2011, cómo a partir de ese punto empieza a disminuir (ya veremos por qué), para volver a repuntar el 2016. La muestra no es muy grande, pero si se aprecia una tendencia al
incremento progresivo del número de casos.
La evolución del coste del servicio por año no es exactamente lineal ya que el coste del servicio viene determinado por el número de horas dedicadas y puede variar en cada caso. Claramente, en 2011 ha habido un cambio de tendencia en la evolución del coste, que se ha vuelto a revertir en 2015.
Figura 7: Evolución del coste de servicio por año.
Para trabajar sobre la Hipótesis 2, elegimos la visualización
“Pie Chart”. Seleccionamos el campo sumatorio
CallYear y lo arrastramos bajo la etiqueta “Axis” para que represente este valor en el eje vertical (ordenadas) y campo
PumpCount lo arrastramos bajo la etiqueta “Values” para que aparezca en el eje horizontal (abscisas).
Figura 8: Número de servicios por tipo de animal.
Claramente, la mayor parte de los incidentes tiene que ver con animales pequeños. Al pasar el puntero por cada sector del diagrama podemos ver el dato concreto y el porcentaje sobre el total (49,61% gatos, 17,91% pájaros, y 17,79% perros).
[video mp4="https://empresas.blogthinkbig.com/wp-content/uploads/2017/04/3_Visualizacion_Pie.mp4"][/video]
Si lo traducimos a costes, y volvemos a visualización
“Clustered Column Chart”, podemos ver el
gasto público dedicado a rescatar gatos en el periodo 2009-2016: ¡
866.834 GBP!, de ellos 115.404 GBP sólo en 2016.
Figura 9: Coste del servicio por tipo de animal en 2016.
En este mismo periodo 2009-2016 se han dedicado 307418 GBP a “rescatar” pájaros, 11084 GBP a rescatar ardillas. Tan sólo entre 2009-2010 el cuerpo de bomberos ha tenido 34 salidas para rescatar ejemplares de estos pequeños roedores en apuros.
El analizar la distribución de avisos según el parámetro “
Animal Group Parent” nos ha revelado información de gran interés. Vamos a finalizar este análisis completándolo con información sobre su distribución geográfica.
Para analizar la distribución geográfica, elegimos la visualización
“Map”. Seleccionamos el campo
Borough y lo arrastramos bajo la etiqueta
“Location”, el campo
AnimalGroupParent bajo la etiqueta
“Legend” y el campo
PumpCount lo arrastramos bajo la etiqueta “
Size”.
[video mp4="https://empresas.blogthinkbig.com/wp-content/uploads/2017/04/4_Visualizacion_mapa.mp4"][/video]
Mientras que la distribución de avisos relativos a gatos y perros es bastante homogénea en las zonas más urbanas:
Figura 10: Distribución geográfica de avisos referentes al rescate de gatos (en amarillo) y perros (en naranja).
La relativa a otro tipo de animales de mayor tamaño como vacas, toros, ciervos etc. resulta más dispersa y asociada a zonas rurales, como era de esperar. En estos casos, al tratarse de animales de gran tamaño, lo más probable es que sí que se haga imprescindible la participación de los bomberos para resolver la situación.
Figura 11: Distribución geográfica de avisos referentes al rescate de animales de gran tamaño como toros (en rojo), vacas (en gris) y ciervos (en azul).
Por ello, como hemos mencionado antes, el parámetro
“AnimalGroupParent” se perfila como uno de los parámetros que aporta mayor información a la hora de discriminar o al menos priorizar los servicios.
Si aparecen algunos puntos “fuera de campo” puede deberse a duplicidades o errores en los nombres de códigos postales o nombres de ciudades que coinciden a uno y otro lado del Atlántico. En esos casos, podemos hacer click directamente sobre esos puntos y excluirlos de la gráfica.
Figura 12: Ejemplo de datos claramente erróneos por duplicidades de nombres, códigos numéricos etc.
PowerBI también nos permite visualizar segmentaciones. Podemos segmentar los datos del informe por un valor concreto, por ejemplo, por año o por ubicación geográfica. Como ejemplo, vamos a segmentar el número de servicios realizados en 2016 relativos a animales “pequeños” (perros, gatos, pájaros, erizos, hamsters, ardillas, patos etc).
Para realizar esta segmentación, elegimos la visualización
“Slicer”. Seleccionamos el campo
Borough (Distrito) y, automáticamente, todos los demás paneles del lienzo ofrecen la información correspondiente a ese segmento concreto que, en este caso, corresponde a un distrito.
Figura 13: Aspecto del lienzo con dos visualizaciones diferentes (tabla y funnel) tras aplicar la segmentación
Borugh =“City of London”
Todavía podríamos profundizar más con PowerBI y realizar un análisis del texto incluido en el campo “
FinalDescription”. Por ejemplo, para agrupar y analizar con mayor detalle aquellos en los que se menciona la intervención previa de la RSPCA (“…ASSIST RSPCA…”), u ocurrencias como “Trapped” o “Stuck”. Este tipo de “Text Analytics” puede llevarse a cabo también con PowerBI gracias a su
integración nativa con R.
Conclusiones: Tomamos medidas
Todo el análisis anterior nos ha servido para confirmar la Hipótesis 1 que se podría reformular como:
“
Si no se toman medidas, el consumo inadecuado de recursos públicos en este tipo de servicios seguirá aumentando año a año”
Si a esto le sumamos los siguientes datos:
-
Los ciudadanos de Londres sienten un gran amor por los animales (puede parecer un tópico, pero los datos que hemos analizado lo corroboran)
-
El buen ciudadano que llama a los bomberos para socorrer a un animalito no paga de su bolsillo el coste del servicio…. ¿O si lo paga?
Parece evidente sacar la conclusión de que el ciudadano que da el aviso NO es consciente del coste incurrido en realizarlo. No se da cuenta del derroche en dinero público (y el mal uso de un recurso de emergencia) que supone llamar a los bomberos para que rescaten a un hámster, una paloma atrapada en un sedal o ayuden a un gato a bajar de un tejado.
Aquí se planteaba un problema al que había de que dar una solución que debía repercutir en un uso más eficiente de los recursos públicos y en dar mejor servicio a los ciudadanos. En este caso se planteó una campaña de concienciación ciudadana
2012: La Campaña
En Julio de 2012, el Cuerpo de Bomberos de Londres lanzó la campaña:
El objetivo de la campaña era educar a los ciudadano sobre cómo poder seguir siendo “buenos samaritanos” en caso de encontrar animales en situaciones delicadas sin por ello hacer un mal uso de recursos públicos.
La campaña tenía dos ejes:
- Por una lado, el de informar del coste que supone para la ciudadanía en general el dar este tipo de avisos directamente a los bomberos
- Y por otro, mostrar cuál sería la vía alternativa más adecuada a la que recurrir en este tipo de situaciones. En este caso, llamar a la RSPCA (Royal Society for the revention of Cruelty to Animals).
Esta campaña tuvo un inmediato efecto positivo sobre la población que se refleja en el descenso del número de avisos registrado a partir de 2012.
Figura 15: Noticia sobre el descenso de servicios de rescate animal.
Sin embargo, en 2015 se registró un nuevo cambio de tendencia con un rápido incremento del número de casos. Los bomberos usaron las redes sociales para difundir la campaña.
Figura 16: Campaña de los Bomberos de Londres 2012.
Figura 17: Campaña de la BBC.
Y, en Febrero de 2017, se publicó un mapa interactivo:
Figura 18: Mapa Interactivo
Se pone de manifiesto la necesidad de que este tipo de campañas se repitan periódicamente para no perder efectividad.
Conclusión final
La mayor
disponibilidad de datos en abierto sobre los servicios públicos, y de distintas herramientas que permiten combinarlos, analizar patrones y visualizar modelos se pueden traducir rápidamente en ahorros costes, y en ciudadanos satisfechos e involucrados con su entorno.
Este ha sido un ejemplo muy sencillo, pero con resultados palpables. Si en 2016 descontamos las salidas del Cuerpo de Bomberos relativas a percances de animales domésticos o de pequeño tamaño, las que consideramos “evitables”, el
ahorro hubiera sido de £215.160.
Si tenemos en cuenta el potencial que supone el poder aplicar Data Science a todo el arsenal de datos que hoy en día recogen y almacenan instituciones y empresas, nos damos cuenta de la gran oportunidad de mejorar nuestro entorno y nuestras vidas.
¡Aprovechémosla!
[video mp4="https://empresas.blogthinkbig.com/wp-content/uploads/2017/04/5_Conclusion.mp4"][/video]
Para mantenerte al día con LUCA visita nuestra .