El machine learning y las tendencias de los negocios.

Las nuevas tendencias de la tecnología han jugado un papel fundamental en el camino hacia el cual se dirigen los negocios en el presente y futuro cercano, pero muchas personas no conocemos bien la manera en que esto se dará y la forma en que afectará nuestras vidas. Así hemos decidido escribir sobre esta clase de tecnologías para conocer más al respecto.

El tema que trataremos en este artículo es el machine learning (aprendizaje automático) y porque es importante saber algo acerca de esto.

Pero ¿qué es exactamente? Arthur Samuel, uno de los pioneros en el campo en 1959 lo definía como:

“el campo de estudio que le da a los computadores la capacidad de aprender sin ser explícitamente programados para hacerlo”

El machine learning puede entenderse como una serie de métodos computacionales que utilizan la experiencia con el objetivo de mejorar el desempeño o hacer predicciones de manera precisa, se entiende la idea de experiencia como la información obtenida en el pasado o datos que están disponibles para nosotros los cuales han sido identificados y categorizados. En un ejercicio de tipo computacional la precisión de las predicciones realizadas depende de la cantidad y calidad de los datos.

Al ver el machine learning de esta manera, se parece mucho al modelamiento estadístico. En este se recolecta datos, se verifican que están limpios (que se haya completado, corregido o eliminado datos irrelevantes, incorrectos e incompletos) y se usa esta base de datos limpia para probar hipótesis y hacer predicciones. La idea del modelamiento estadístico es intentar representar temas complejos en términos que permitan explicar la mayoría de los eventos estudiados.

Es así como se programa el algoritmo para ejecutar ciertas funciones basadas en los datos que se envían, es decir que el algoritmo es estático y por lo tanto necesita un programador que especifique lo que debe hacer y cuando se le alimenta con los datos.

En el caso del machine learning, los datos son los que determinan la técnica analítica que debe ser seleccionada para ejecutar mejor la tarea, así el computador utiliza los datos que debe seleccionar y entrena el algoritmo, por lo tanto, el algoritmo no es estático, analiza los datos a los cuales ha sido expuesto, determina el mejor camino de acción y actúa. Es así como aprende de los datos y en el proceso se extrae conocimiento a partir de estos.

Sobre la repetición es que se basa el método de aprendizaje. Un algoritmo es solo un conjunto de instrucciones que un computador utiliza para transformar una entrada en una salida particular. Así en el machine learning el aspecto de aprendizaje es solo un algoritmo que repite esta operación de ejecución una y otra vez y hace ajustes hasta que se satisfacen ciertas condiciones; la prueba de fuego de un algoritmo de aprendizaje es cuando es capaz de predecir cuando se le da nuevos datos que no hayan sido entrenados previamente.

Tipos de machine learning (aprendizaje automático)

Los datos determinan el tipo de método que se utiliza así la estructura de los datos determinará como ocurrirá el proceso de aprendizaje. Los tres niveles de machine learning son los siguientes:

Aprendizaje supervisado.

En este el computador es entrenado sobre datos que tienen la etiqueta o el resultado correctos. Es decir que si se le quiere enseñar a un computador a distinguir entre una foto de un bus y un automóvil entonces se debe poner a cada foto la etiqueta de bus o automóvil según el caso. Este proceso debe ser realizado por un programador. Una vez es realizado el algoritmo de machine learning puede ahora clasificar esta nueva información que le llega y determinar si la nueva imagen es la de un bus o un automóvil.

Así el aprendizaje supervisado puede usarse para operaciones más complejas, como leer alfabetos e ilustraciones. Un ejemplo de esto es la lectura de símbolos manuscritos porque la manera en que una persona escribe un número o una letra es diferente a como lo hace otra. Es así como al alimentar al computador con grandes cantidades de ejemplos de números o letras manuscritas se puede entrenar al algoritmo para ver varias versiones de estas. El computador aprende a reconocer estas variaciones y se vuelve mejor al entender estos patrones.


Letras manuscritas
Fuente: seewald.at

En este escenario se tiene que entre más grande sea la base de datos el algoritmo está mejor entrenado y una vez está entrenado al algoritmo se le dan nuevos datos y usa su experiencia con datos anteriores para predecir un resultado.

Aprendizaje no supervisado

En este el algoritmo es entrenado al usar un conjunto de datos que no tiene ninguna etiqueta y no se le dice a este lo que representan los datos. Aquí el proceso de aprendizaje consiste en la identificación de patrones que crean los datos de manera repetida.

En el aprendizaje no supervisado, los algoritmos deben usar métodos de estimación que se basan en la inferencia estadística para descubrir los patrones, relaciones, así como las correlaciones en los datos. Cuando los patrones son identificados, el algoritmo utiliza estadísticas para identificar fronteras entre los datos. Es decir que los datos con patrones similares se agrupan lo que genera un subconjunto de los datos. Al continuar con el proceso de clasificación el algoritmo empieza a entender a los datos que analiza lo que le permite en el futuro categorizar a los datos futuros.

Esto tiene como consecuencia la automatización de la toma de decisiones y permite fortalecer los conocimientos sobre el tema de interés que se trate en ese momento. Esto se usa mucho con los datos que vienen en forma de texto o las imágenes.

Aprendizaje por refuerzo

En este los datos de entrenamiento se encuentran también sin etiqueta. La diferencia es que cuando se hace una pregunta sobre los datos el resultado es calificado (que implica algo se supervisión). Al algoritmo se le presentan datos que no tienen etiquetas, pero si se le da un ejemplo con un resultado positivo o negativo. Este resultado retroalimenta al algoritmo y le permite determinar si la solución que provee a la resolución del problema es la correcta o la incorrecta. Este es la versión computarizada del aprendizaje por ensayo y error.

El aprendizaje por refuerzo es usado casi siempre para hacer estrategias, como las decisiones tienen consecuencias el resultado da una indicación y es el que se utiliza para enseñarle a los computadores a jugar juegos. Este fue el utilizado por Google para crear AlphaGo que venció al mejor jugador de Go del mundo que es uno de los juegos más complejos de todos por la cantidad de combinaciones posibles en este.


Desafío AlphaGo
Fuente: dailymail.co.uk

El aprendizaje automático ha despertado el interés de las empresas y es usado en un número diverso de áreas como el reconocimiento facial de las cámaras, en las finanzas donde ha tenido un énfasis grande y ha cambiado a este sector de manera sustancial, y es lo que está detrás de los intentos de automatización de varias tareas intelectuales que tendrá como consecuencias en muchos casos la eliminación de muchos puestos de trabajo pero la creación de trabajos más especializados que requieren mayor preparación.

Deja una respuesta

Cerrar menú