Aprendizaje automático pasado y presente

Blog

Megaphone

Publicado

09 may. 2017

Categoría

Ciencia de datos

Compartir

De: John Manslow

Main image

En los últimos años se ha producido una explosión de interés en el aprendizaje automático, con empresas como Amazon, Facebook, Google, IBM y Microsoft que invierten miles de millones de dólares en adquisiciones e I + D. Esto ha causado un aumento de diez veces en el número de solicitudes de patentes de aprendizaje automático en la última década y se ha traducido en el desarrollo de numerosos nuevos productos y funcionalidades. El aprendizaje automático permite a: Amazon realizar optimizaciones dinámicas de precios, Microsoft ofrecer traducción simultánea en Skype y Google clasificar las páginas web basándose en interpretaciones más matizadas de su contenido y de las consultas de búsqueda de los usuarios. Entonces, ¿de dónde viene el aprendizaje automático y por qué hay tanto interés en él ahora?

La expresión "aprendizaje automático" fue acuñada a finales de la década de 1950 por investigadores de inteligencia artificial que creían que la mejor manera de hacer que los ordenadores se comportaran inteligentemente era darles la capacidad de aprender. La investigación anterior se había centrado en el uso de expertos humanos para escribir las reglas que las computadoras podrían seguir, pero rápidamente se hizo evidente que, incluso para problemas simples como jugar a las damas, la escritura de reglas eficaces era muy difícil. A finales de la década de 1950 y a lo largo de la década de 1960, se desarrollaron algoritmos sencillos de aprendizaje automático y se aplicaron con éxito a una serie de problemas que anteriormente no se podían resolver. A pesar de estos primeros éxitos, las décadas de 1970 y 1980 fueron, en su mayor parte, décadas de decepción y desilusión. El progreso fue lento; la investigación fue poco financiada y hubo muy poco interés comercial serio en aplicar el aprendizaje automático a los problemas del mundo real.

A finales de la década de 1980, sin embargo, hubo grandes avances: se descubrió una forma de formación de redes neuronales arbitrariamente complejas; y el problema de comportarse de manera óptima en un entorno con gratificaciones retrasadas se resolvió mediante el aprendizaje por refuerzo.

A principios de los años noventa, la investigación en el aprendizaje automático se llevó a cabo con mayor rigor matemático, lo que condujo al desarrollo de nuevos algoritmos y métodos de núcleo, como las redes neuronales bayesianas, las máquinas de vectores de soporte (SVMs) y los procesos gaussianos, que mejoró significativamente el rendimiento del mundo real. El aprendizaje automático estaba finalmente listo para la explotación comercial y una serie de primeros innovadores comenzaron a aplicarlo a problemas como la detección de fraude, la puntuación de crédito y la predicción de Churn. El éxito del aprendizaje automático sobre los problemas del mundo real y su claro potencial para un mayor desarrollo llevó a un aumento de la financiación de la investigación, y el campo comenzó a atraer a los investigadores de matemáticas y física, así como de informática.

Durante la década de 1990, la cantidad de almacenamiento en PCs de escritorio se multiplicó por mil y la carrera a 1 GHz que ocurrió entre AMD e Intel a finales de la década, resultó en un aumento similar en la potencia de procesamiento. Para el año 2000, la mayoría de los PCs de escritorio tenían suficiente memoria para almacenar la cantidad de datos que se requiere para aprender soluciones eficaces a problemas complejos y suficiente potencia de procesamiento para que el aprendizaje tenga lugar en un tiempo razonable. La tecnología había llegado incluso a la etapa en la que el aprendizaje automático se podría utilizar en juegos de ordenador, competiendo contra el jugador en igualdad de condiciones en Colin MacRae Rally 2.0 de Codemasters y permitiendo al jugador entrenar a su propio avatar en tiempo real en Black and White de Lionhead.

A mediados de los años 2000, se logró la computación de propósito general en unidades de procesamiento gráfico (GPGPU), se desarrollaron procesadores multinúcleo de bajo costo y surgió la computación en la nube, lo que incrementó aún más la potencia de procesamiento. Al mismo tiempo, el crecimiento de Internet provocó la revolución de Big Data: se pusieron a disposición enormes conjuntos de datos, que permitían aplicar algoritmos de aprendizaje automático cada vez más complejos y potentes a problemas del mundo real. El aprendizaje con redes neuronales profundas (DNNs) (las redes neuronales con un gran número de capas interconectadas de neuronas) se hizo práctico y se encontraron DNNs que rápidamente superan todos los enfoques anteriores en campos como el reconocimiento de voz y el etiquetado de imágenes, eventualmente superando el rendimiento humano.

La última década ha sido objeto de una amplia explotación comercial del aprendizaje automático, que se ha convertido en la tecnología de elección para los líderes del mercado en una amplia gama de sectores, debido a su capacidad de extraer con fiabilidad relaciones extremadamente complejas a partir de datos, que proporcionan ideas únicas y hacen predicciones precisas. Los avances teóricos de la década de 1990 proporcionaron algoritmos de aprendizaje automático, tales como redes neuronales bayesianas y SVMs que funcionan bien en entornos donde los datos son escasos, y los desarrollos que ocurrieron a fines de los años 2000 proporcionaron algoritmos como DNNs que ofrecen un rendimiento sin rival con Big Data.

Hoy en día, los algoritmos de aprendizaje automático se ejecutan en casi todas las plataformas: desde los procesadores incrustados en sistemas de calefacción central hasta grandes redes de computación en la nube de procesamiento paralelo y se utilizan comercialmente para todo: desde la lectura de códigos postales, el procesamiento de cheques, la generación de puntuación de crédito, la detección de fraudes, la traducción de texto, la recomendación de películas, la combinación de jugadores en juegos en línea, la optimización de los precios, la clasificación de los resultados de búsqueda, la filtración de spam, la animación de personajes virtuales, la optimización de centros de datos, la reproducción de videojuegos, el etiquetado de imágenes, la conducción de vehículos autónomos, hasta la identificación de contenido pirateado.

El comercio sólo está empezando a rayar la superficie de lo que el aprendizaje automático tiene que ofrecer, pero no hay duda acerca de su potencial para transformar los procesos empresariales y crear clases totalmente nuevas de productos. El aprendizaje automático ya no es la reserva del investigador y el académico, pero se ha establecido firmemente como una herramienta para los negocios.

Las próximas publicaciones en esta serie introducirán los principios generales del aprendizaje automático y examinarán los aspectos internos de algunos de los algoritmos de aprendizaje automático más poderosos y ampliamente utilizados: SVM, redes bayesianas, árboles de decisión, redes neuronales bayesianas y redes neuronales profundas, y describirán cómo pueden aplicarse en la práctica para resolver los problemas del mundo real.

La próxima versión de la plataforma de análisis de datos de WPS verá la adición de muchas de estas valiosas técnicas de aprendizaje automático más tarde en 2017, ofreciendo la oportunidad de obtener un mayor entendimiento de los datos con un mínimo de alboroto, utilizando el sólido y consistente conjunto de aplicaciones WPS.

Acerca de John Manslow

John se unió a World Programming en 2014 como ingeniero superior de software de I + D en el equipo de matemáticas y estadísticas. Actualmente está desarrollando funcionalidades de redes neuronales profundas de última generación, para la plataforma de WPS, que debiera lanzarse en 2017. John tiene un Ph.D. en Aprendizaje automático de la Universidad de Southampton y más de 20 años de experiencia comercial con aprendizaje automático y métodos estadísticos. Tiene más de diez patentes, ha contribuido a siete libros sobre la IA de juegos, se ha sentado en los comités de revisión de la AAAI y ha dado conferencias en la Universidad de Southampton.