Por: Martín Rago
En esta 3ra. Revolución Industrial el cambio radical consiste en qué ahora, contamos con algoritmos capaces de aprender por si mismos.
Somos participes y estamos presenciando la 3er revolución industrial. En la 1ra se reemplazó la fuerza del hombre, sus capacidades manuales. Con la extracción de minerales fósiles se accedió de forma artificial al reemplazo de la fuerza humana. La 2da consistió en el desarrollo de las líneas de producción y hoy tenemos automóviles con 250 caballos de fuerza, bombas eléctricas que extraen agua en las granjas para dar riego a los cultivos.
En esta 3ra revolución industrial le estamos dando inteligencia a ese automóvil para que conduzca solo, a esa bomba de agua para extraiga la cantidad necesaria teniendo en cuenta las reservas, la meteorología, el momento del año y de la siembra.
Fue Arthur Samuel el creador del Aprendizaje Automático (Machine Learning), quien en 1956 quería que su computadora lo venciera en el juego de damas, y tras horas y horas de intentar enseñarle las mejores jugadas, decidió hacer jugar a la computadora contra si misma para que aprenda por si sola. En 1962 su computadora ganó el campeonato de Connecticut.
El inicio de la inteligencia artificial comenzó su andar con el conocimiento del experto, donde debemos indicarle a la computadora qué hacer con lujo de detalles. En esta 3ra revolución industrial, el cambio radical consiste en que ahora, contamos con algoritmos capaces de aprender por si mismos, ya sea con un set de datos de entrenamiento o bien en frío.
Los algoritmos que clasifican/predicen sin un conocimiento a prior se denominan “No Supervisados” y los que precisan de un entrenamiento se llaman “Supervisados”, donde los datos de entrenamiento consisten en pares de objetos (normalmente vectores): una componente del par son los datos de entrada y el otro, los resultados deseados. La salida de la función puede ser un valor numérico (como en los problemas de regresión) o una etiqueta de clase (fraude / transacción normal / transacción sospechosa).
Una característica importante a tener en cuenta de los algoritmos supervisados es el “overfitting” o “sobreajuste”. Sucede cuando el algoritmo queda entrenado por demás en el set de entrenamiento y pierde capacidad de generalizar, es decir, queda muy especializado en lo conocido en el set de entrenamiento y con una rendimiento muy malo para cualquier situación no prevista en el set de entrenamiento.
Si un modelo posee un sobreajuste tiene un bajo rendimiento predictivo, ya que reacciona exageradamente a pequeñas fluctuaciones en los datos de entrenamiento. Los modelos tienen que generalizar a partir de los datos presentados a las situaciones no vistas previamente.
Estas tecnologías son parte de nuestro ADN como empresa y están presentes desde la gestación de Monitor Plus, y en el correr de estos 17 años hemos incorporado tanto técnicas de aprendizaje supervisado como no supervisados.
Los algoritmos de Aprendizaje Automático que hemos desarrollado e incorporado a MONITOR PLUS son: Clasificador Naive Bayes, Scoring Dinámico, Data Mining Online, las Reglas Adaptivas, Clustering K-Medias, las Redes Neuronales de aprendizaje profundo y Regresión Logística.
Para concluir, existe la premisa de que si un algoritmo clasificador es bueno… posiblemente utilizar varios sea aun mejor.
En tal sentido, estas técnicas son ensambladas para generar un único clasificador final que proporciona la mejor performance en niveles de detección como así también en la relación de Falsos Positivos.