Apprendimento automatico passato e presente

Blog

Megaphone

Inserito

09 mag 2017

Categoria

Scienza dei dati

Condividi

Di: John Manslow

Main image

Negli ultimi anni si è sviluppato un forte interesse per l'apprendimento automatico, con imprese del calibro di Amazon, Facebook, Google, IBM e Microsoft, che investono miliardi di dollari in acquisizioni e R&S. Questo ha decuplicato il numero di depositi di brevetti relativi all'apprendimento automatico nell'ultimo decennio e si è tradotto nello sviluppo di numerosi prodotti e funzionalità nuovi. L'apprendimento automatico consente ad Amazon di eseguire le ottimizzazioni dinamiche dei prezzi, a Microsoft di offrire la traduzione simultanea in Skype e a Google di classificare le pagine Web basandosi in interpretazioni più raffinate del contenuto e delle query di ricerca degli utenti. Quindi, da dove proviene l'apprendimento automatico e perché c'è molto interesse ora?

L'espressione "apprendimento automatico" è stata coniata alla fine degli anni '50 dai ricercatori nel campo dell'intelligenza artificiale che credevano che il modo migliore di far comportare i computer in modo intelligente era quello di conferire loro la capacità di apprendere. La ricerca precedente si era concentrata sull'utilizzo di esperti per scrivere le regole che i computer avrebbero potuto seguire, ma subito ci si rese conto che, anche per problemi semplici come il gioco della dama, la scrittura di regole efficaci era estremamente difficile. Alla fine degli anni '50 e durante gli anni '60, i semplici algoritmi di apprendimento automatico sono stati sviluppati e applicati con successo a numerosi problemi che in precedenza era impossibile risolvere. Nonostante questi primi successi, gli anni '70 e '80 erano, per la maggior parte, decenni di delusione e disillusione; il progresso era lento, la ricerca riceveva scarsi finanziamenti e c'era pochissimo interesse commerciale serio nell'applicazione dell'apprendimento automatico ai problemi del mondo reale.

Alla fine degli anni '80, tuttavia, ci sono state grandi scoperte: è stato scoperto un modo di addestrare reti neurali arbitrariamente complesse e il problema di comportarsi in modo ottimale in un ambiente con gratificazioni ritardate è stato risolto dall'apprendimento per rinforzo.

Nei primi anni '90, la ricerca sull'apprendimento automatico è stata realizzata con un maggior rigore matematico e ha portato allo sviluppo di nuovi algoritmi e metodi kernel (come le reti neurali bayesiane, le macchine a vettori di supporto o SVM e i processi gaussiani) che ne hanno migliorato in modo significativo le prestazioni nel mondo reale. L'apprendimento automatico era finalmente pronto per l'uso commerciale e diversi nuovi utenti hanno cominciato ad applicarlo a problemi, come ad esempio il rilevamento delle frodi, il credit scoring (punteggio di affidabilità creditizia) e la previsione del churn. Il successo dell'apprendimento automatico sui problemi del mondo reale e il suo chiaro potenziale per ulteriori sviluppi hanno portato ad un aumento dei finanziamenti per la ricerca e il settore ha cominciato ad attirare ricercatori, in campo matematico e fisico, nonché informatico.

Negli anni '90, la quantità di risorse di archiviazione nei PC desktop si è moltiplicata per mille e la corsa a 1 GHz, che si è verificata tra AMD e Intel alla fine del decennio, ha determinato un aumento simile della potenza di elaborazione. Entro il 2000, la maggior parte dei PC desktop aveva abbastanza memoria per archiviare la quantità di dati necessaria per imparare soluzioni efficaci a problemi complessi e sufficiente potenza di elaborazione affinché l'apprendimento avvenisse in un lasso di tempo ragionevole. La tecnologia aveva anche raggiunto la fase in cui l'apprendimento automatico si poteva utilizzare nei giochi per computer, competendo contro il giocatore allo stesso livello in Colin McRae Rally 2.0 di Codemasters e consentendo al giocatore di addestrare il proprio avatar in tempo reale in Black and White di Lionhead.

A metà degli anni 2000, è stato possibile realizzare l'elaborazione universale su unità di elaborazione grafica (GPGPU), sono stati sviluppati i processori multicore a basso costo ed è emerso il cloud computing, determinando ulteriori aumenti sostanziali alla potenza di elaborazione. Allo stesso tempo, la crescita dell'Internet ha provocato la rivoluzione dei Big Data: sono diventati disponibili numerosi set di dati, che consentono di applicare algoritmi di apprendimento automatico sempre più complessi e potenti ai problemi del mondo reale. L'apprendimento con reti neurali profonde (DNN, ovvero reti neurali con un gran numero di strati interconnessi di neuroni) è diventato pratico e si è riscontrato che le DNN hanno superato rapidamente tutti le strategie precedenti in settori quali il riconoscimento vocale e l'etichettatura delle immagini, superando in tal modo le prestazioni umane.

L'ultimo decennio ha visto la diffusione dell'uso commerciale dell'apprendimento automatico, che è diventato la tecnologia scelta per i leader di mercato in un'ampia gamma di settori, grazie alla sua capacità di estrarre dai dati in modo affidabile relazioni estremamente complesse, fornire informazioni approfondite uniche e previsioni precise. I progressi teorici degli anni '90 prevedevano algoritmi di apprendimento automatico, come reti neurali bayesiane e SVM che funzionano bene in ambienti dove i dati sono scarsi, e gli sviluppi che si sono verificati alla fine degli anni 2000 hanno fornito algoritmi come DNN che offrono prestazioni ineguagliabili con Big Data.

Oggi, gli algoritmi di apprendimento automatico vengono eseguiti su quasi tutte le piattaforme: dai processori incorporati nei sistemi di riscaldamento centralizzato a grandi reti di elaborazione parallela in cloud computing e vengono utilizzati commercialmente per tutto, dalla lettura di codici postali, all'elaborazione di assegni, alla generazione di punteggi di affidabilità creditizia, al rilevamento delle frodi, al riconoscimento vocale, alla traduzione del testo, alla raccomandazione di film, all'abbinamento di giocatori in giochi online, all'ottimizzazione dei prezzi, alla classificazione dei risultati della ricerca, al filtraggio dello spam, all'animazione di caratteri virtuali, all'ottimizzazione dei centri di dati, alla riproduzione dei videogiochi, all'etichettatura delle immagini, alla conduzione di veicoli autonomi, fino all'identificazione di contenuti pirata.

Questo settore sta solo iniziando a sfiorare appena ciò che l'apprendimento automatico deve offrire, ma non c'è dubbio circa il suo potenziale per trasformare processi aziendali e creare classi di prodotti completamente nuove. L'apprendimento automatico non è più dominio esclusivo del ricercatore e l'accademico, ma si è stabilito fermamente come strumento per il commercio.

I prossimi post di questa serie introdurranno i principi generali dell'apprendimento automatico, esamineranno le qualità di alcuni degli algoritmi di apprendimento automatico più potenti e ampiamente usati (SVM, reti bayesiane, alberi delle decisioni, reti neurali bayesiane e reti neurali profonde) e descriveranno come si possono applicare in pratica per risolvere i problemi del mondo reale.

La prossima versione della piattaforma di analisi dati di WPS vedrà l'aggiunta di molte di queste preziose tecniche di apprendimento automatico alla fine del 2017, offrendo l'opportunità di acquisire maggiori informazioni approfondite sui dati, con un minimo di problemi, tramite la solida e coerente suite di software WPS.

Informazioni su John Manslow

John è entrato a far parte di World Programming nel 2014 come ingegnere software senior di R&S nel team di matematica e statistica. Attualmente sta sviluppando funzionalità all'avanguardia delle reti neuronali profonde per la piattaforma WPS che verrà rilasciata nel 2017. John ha un dottorato di ricerca in Apprendimento automatico presso l'Università di Southampton e più di 20 anni di esperienza commerciale con l'apprendimento automatico e i metodi statistici. Ha più di dieci brevetti, ha contribuito a sette libri sull'IA dei giochi, ha partecipato a comitati di valutazione per l'AAAI e ha tenuto lezioni all'Università di Southampton.