¿Es posible resolver problemas de administración de datos con machine learning?

Escrito por Equipe SYNNEX Westcon-Comstor | 28-jun-2018 10:00:00

Descubre si el aprendizaje de máquina puede facilitar el análisis y gestión de datos de tu empresa.

El aprendizaje de máquina y la Inteligencia Artificial, ya hace tiempo, dejaron de ser apenas tema de películas de ficción científica. Esas tecnologías ya están disponibles y muchas empresas ya aprovechan sus ventajas. Según proyecciones del IDC, hasta el 2020, el mercado para esas tecnologías alcanzará un valor de $46 billones de USD. Pero, ¿cómo es posible resolver problemas de gestión de datos con machine learning?

Ya hablamos algunas veces aquí en el Canal Comstor sobre, cómo el Big Data está creciendo a cada día que pasa y ya pasamos el nivel del zettabyte –1 billón de terabytes– en el 2016. Según estadísticas de Cisco, el tráfico global de Internet alcanzará 3.3 zettabytes para el 2021. Al mismo tiempo que eso revela una oportunidad gigantesca de negocios para empresas que trabajan con análisis de datos, también representa una serie de desafíos para las organizaciones en lo que se refiere a la administración de esos datos.

Algunos de los principales desafíos de la administración de datos son:
-Entendimiento de datos no identificados;
-Retención de datos;
-Integración de datos para mejores resultados de análisis;
-Acceso a los datos.

Es necesario analizar los problemas de administración de datos encontrados por los departamentos de TI. Para comenzar, las empresas están mal equipadas para lidiar con las grandes cantidades de datos no estructurados que llegan diariamente. Al final, estos simplemente almacenan los datos en algún lugar, lo que no sólo es imprudente, sino también antiético. Además de eso, los responsables por las decisiones de negocios prefieren no descartar los datos. La falta de atención en las políticas de retención de datos es otro aspecto problemático.

Toda organización quiere un rápido acceso a los datos, pero, considerando el costo del almacenamiento de alta velocidad en la Nube o en el local, las empresas optan por archivar una parte de sus datos, usando medios de almacenamiento más baratos y más lentos. Como resultado, cuando ocurren serios problemas, la empresa tiene que designar a miembros del equipo para lidiar con los proyectos, lo que perjudica las metas principales del negocio.

Machine learning e IA en la administración de datos.

Los datos no estructurados son la principal razón por la cual la administración de datos presenta tales dificultades para las empresas. Por ello, la inteligencia artificial, el análisis y aprendizaje de máquina, pueden ayudar a superar ese problema. Con el aprendizaje de máquina, la IA es aplicada para enseñar algoritmos de computadora y posibilitar que estas ingresen datos, realicen el análisis de éstos y los utilicen para aprender nuevos insight y soluciones que no fueron previamente enseñadas a ésta.

¿Y cómo funciona?

Existen algunos métodos de machine learning que pueden ser utilizados por las empresas y son subdivididos en categorías con base en el algoritmo:

1- Aprendizaje supervisado.
Representa más de la mitad de los algoritmos de aprendizaje de máquina. Aquí, el algoritmo necesita de insumos ya rotulados con respuestas previamente establecidas. Un ejemplo práctico es, de una IA que descubre enfermedades en pacientes en un hospital. Ésta necesita ser alimentada con varios casos de los síntomas en enfermedades, para hacer la correlación de los datos. Entonces, por medio del machine learning, la máquina lleva en consideración las características de cada paciente y descubre la enfermedad de éste.

2- Aprendizaje no supervisado.
En este caso, el aprendizaje no requiere de rótulos predefinidos. Es el algoritmo que busca descubrir lo que está siendo mostrado, explorando los datos. Ese tipo de algoritmo, por ejemplo, puede ser utilizado en actividades como segmentación de clientes para campañas de marketing.

3- Aprendizaje semi-supervisado.
Ese tipo de aprendizaje de máquina usa básicamente los mismos patrones del aprendizaje supervisado, pero con la posibilidad de utilizar tanto datos rotulados así como datos no definidos. Esta representa una buena alternativa para aumentar la capacidad de generalización de modelos de machine learning. Generalmente es usada en desafíos en los cuales las muestras rotuladas son difíciles de ser obtenidas.

4- Aprendizaje por refuerzo.
Aquí, el algoritmo consigue descubrir, por prueba y error, cuáles acciones generan mayores recompensas, alcanzando sus objetivos más rápidamente. Por lógica, una IA haciendo ese tipo de pruebas, realiza el trabajo en un periodo mucho menor, lo que crea insights de forma rápida, listos para ser utilizados de forma concreta en las decisiones de la empresa.

Las máquinas inteligentes ya están presentes en nuestra rutina de trabajo con la propuesta de facilitar cada vez más el almacenamiento y comprensión de datos. Frente a este nuevo escenario de análisis de datos y producción de insights, los números muestran la importancia de invertir en este mercado, que será esencial en el futuro para resolver desafíos en la era digital.

Ver post completo