Cloudera, MapR, Hortonworks...¿Qué distribución Hadoop necesitas? (IV y fin)
¿Por qué hay distintas distribuciones?
¿Y cuáles son estas distribuciones?.



¿Qué preguntas tenemos que hacernos a la hora de elegir?
-
¿Qué problema de negocio quieres resolver?.
-
¿Qué tipo de datos tienes que analizar?.
-
¿Componentes opensource o software propietario?.
-
La infraestructura Hadoop que estás considerando, es lo suficientemente flexible para tus distintos casos de uso?.
-
¿Qué herramientas ya existentes quieres integrar con Hadoop?.
-
¿Necesitan tus administradores herramientas de gestión? (la distribución core de Hadoop no las incluye).
-
¿Necesitas recursos de formación? ¿Cómo de compleja es la instalación?.
-
¿Necesitas soporte?.
-
¿Puedes tener problemas de vendor lock-in? (como código no transferible a otras distribuciones o formatos de datos propietarios).