RapidMiner
Esta fue la primera herramienta que utilizamos
para aprender sobre análisis de datos. Es una herramienta que permite hacer todos
los estudios o análisis de los datos de manera gráfica. Es muy intuitiva y fácil
de usar.
Esta herramienta esta basada en Java y requiere
que se instale el JVM. Tiene la capacidad de correr algún set de datos
utilizando diferentes algoritmos. Antes de los análisis de datos cuenta con
herramientas para limpieza y visualización de los datos para entenderlos mejor.
Otra de las ventajas es que cuenta con una
amplia documentación sobre todos los algoritmos, métodos de limpieza de datos y
herramientas con la que se cuenta para el trabajo.
Su instalación es muy simple y fácil. Sin embargo,
no es de uso gratuita, pero cuenta con un tiempo de prueba con lo que se puede
iniciar a ver si la herramienta es lo que necesitas para iniciar en el mundo
del análisis de datos.
Los trabajos realizados con esta herramienta fueron
muy rápidos de hacer ya que la herramienta es muy eficiente y permite trabajar
con proyectos distintos a la vez. Por ejemplo, cuando se quería hacer un análisis
de datos generalmente lo que yo hacia era crear un proyecto, luego lo duplicaba
para correr diferentes modelos sobre los mismos datos y poder comprar
resultados.
Cuanto con un set de estadísticas para poder comprender
cual es el modelo que se ajusta mejor a nuestro análisis.
Al no requerir conocimientos de programación y
ser todo grafico me atrevo a decir que cualquier persona podría hacer análisis de
datos. Claro después de estudiar un poco que son los modelos, como aplicarlos y
además estudiar un poco sobre la limpieza. Esto ya que rapidminer nos permite arrastrar
los componentes e iniciar a trabajar.
Adicional a todo lo mencionado antes, se pueden
usar diferentes fuentes de datos como archivos de Excel, documentos de texto, SQL,
etc. por lo que se puede crear set de datos complejos y con cualquier tipo de información.
Con los modelos listos también se pasó a crear predicciones
que fueron rápidas y no genero ningún problema.
Etiquetas: Data Analytics / Big Data