Introducción al Machine Learning

En las últimas décadas han existido importantes avances en el almacenamiento de datos y en el procesamiento de los mismos por medio de computadores, esto ha permitido una gran evolución en el entorno tecnológico a través del Machine Learning. El autor Arthur Samuel expone que, el Machine Learning es el campo de estudio que da a los computadores la habilidad de aprender sin ser explícitamente programados, sobre su concepto, Andrew Ng aporta que es la ciencia de hacer que los computadores actúen sin estar explícitamente programados.

El Machine Learning es una disciplina enfocada en cómo construir sistemas que de manera automática mejoren de acuerdo a su experiencia sin ser programados para eso, que a su vez consisten en, entrenar un modelo matemático o estadístico usando información histórica, para inferir o predecir el valor de una variable, la cual puede ser continua o discreta, en orden para entender o explicar un fenómeno dado.

El Machine Learning utiliza algoritmos para que estos puedan dar información interesante con base a un conjunto de datos sin tener que escribir ningún código específico.

El Machine Learning puede ser clasificado en 3 tipos de aprendizajes:

  • Aprendizaje supervisado: En este modelo de aprendizaje, los datos están debidamente etiquetados, es decir, cada dato tiene su respectiva etiqueta asociada o clase, donde el algoritmo aprenderá la relación entre los datos y sus etiquetas para aplicar la relación aprendida hacia una clasificación de datos completamente nuevos que no haya visto en su proceso de entrenamiento. En este tipo de aprendizaje, son las personas quienes guían al algoritmo a la respuesta correcta.
  • Aprendizaje no supervisado: Este modelo de aprendizaje por lo general es muy usado para identificar o deducir estructuras comunes entre sí, que permitan crear agrupaciones ya que los datos no se encuentran categorizados o clasificados.
  • Aprendizaje por refuerzo: Este modelo de aprendizaje está inspirado en la psicología conductista, cuya ocupación es determinar qué acciones debe escoger un agente de software en un entorno dado, con el fin de maximizar alguna noción de “recompensa” o premio acumulado (tomado de Wikipedia).

El Machine Learning tiene un proceso de modelamiento el cual es iterativo y de constante mejoramiento para lograr encontrar un resultado que aplique a la solución de nuestro problema, este se realiza por medio de los siguientes pasos:

https://www.accenture.com/pl-en/insights/security/board-primer-artificial-intelligence

  1. Obtención de datos: Conseguir datos de diferentes fuentes como bases de datos, archivos, imágenes, redes sociales, etc.
  2. Limpieza, preparación y manipulación de los datos: En este paso lo que se realiza principalmente es validar los datos, eliminar/corregir los datos nulos, estandarizar los datos y conocer si algún dato no aplica para la solución que se quiere lograr.
  3. Entrenar modelo: Elegir uno o varios modelos, configurar los hiperparametros y realizar el entrenamiento del modelo con base a los datos que se tienen.
  4. Realizar pruebas: Realizar pruebas del modelo entrenado para validar su rendimiento.
  5. Mejorar: Con base a los resultados de las pruebas, se decide si toca volver a los pasos anteriores; ya sea para obtener más datos, preparar los datos de manera diferente, seleccionar otros algoritmos y/o configurar otros hiperparametros, o si el modelo tiene un buen rendimiento y puede ser usado/probado en el sistema de producción.

Actualmente, el Machine Learning está ayudando a mejorar la lealtad y la retención de los clientes. Además, mediante este proceso las empresas pueden analizar los comportamientos de los consumidores tales como: actividades de compra, prácticas en redes sociales y todo tipo de actividades medibles para identificar áreas de oportunidad, lo cual permite la optimización de estrategias y personalización de experiencia del usuario.

A continuación podemos observar un gráfico que muestra diferentes aplicaciones y algoritmos que se pueden implementar con Machine Learning con base al tipo de aprendizaje:

http://www.cognub.com/index.php/cognitive-platform/

Si tenemos en cuenta lo anterior, podemos identificar la importancia del Machine Learning, ya que se puede aplicar a muchos contextos, por ejemplo, estos algoritmos se encuentran en diferentes aplicaciones que consumimos diariamente como: Filtros de Spam en el correo electrónico, recomendaciones de Amazon, Netflix, Google Translator, Office/Gsuite, buscadores como Google, Bing, etc.

En GreenSQA reconocemos el Machine Learning como una realidad que se materializa cada día de nuestra vida cotidiana, por eso, en nuestro servicio de Automatización de Pruebas donde optimizamos y simplificamos las pruebas de rutina logrando una mayor cobertura con una menor inversión de esfuerzo, juegan un papel estas técnicas. Como compañía nos mueve el conocimiento, construir junto a nuestros clientes experiencias innovadoras que les genere valor y nos permita aportar a su negocio con compromiso y una mentalidad de crecimiento que nos lleve a lograr grandes objetivos antes no conseguidos, liderando nuevas acciones con grandes resultados para los proyectos de nuestros clientes y que nos impulsan a mantenernos en nuestra honorable posición en el mercado.

Autor: David Lopera Betancur