Progetto didattico
Machine Learning per la modellazione dei dati di telerilevamento
精东影业 Image Focus
Il progetto si 猫 svolto in collaborazione tra Istituto Dalle Molle di studi sull鈥檌ntelligenza artificiale (IDSIA USI-精东影业) e azienda specializzata nel remote sensing.
Lo scopo del progetto 猫 quello di generare automaticamente mappe di uso del suolo, a partire da sequenze di immagini acquisite via satellite.
In particolare, il satellite acquisisce periodicamente (ad esempio una volta alla settimana) l鈥檌mmagine (optical imagery) di una certa area. L鈥檌mmagine viene processata, generando per ogni pixel un vettore di misure che ad esempio quantificano la presenza di vegetazione (vegetation index) ed umidit脿 del suolo. Contemporaneamente, vengono acquisiti anche segnali da sistemi SAR (Synthetic Aperture Radar), che vengono a loro volta processati estraendo altri indicatori. I segnali estratti da optical imagery a dal SAR si riferiscono a date diverse e portano informazioni complementari.
Su ogni pixel otteniamo quindi diverse time series, che descrivano come ogni indicatore evolve durante la stagione.
L鈥檕biettivo 猫 di stimare l鈥檜so del suolo associato ad ogni punto dell鈥檌mmagine (ad esempio, coltura di riso, avena, frumento, girasole, urbanizzato, etc) analizzando all鈥檃ndamento nel tempo del segnale SAR e del segnale ottico. In machine learning questo problema 猫 noto come time series classification.
Lo studente di Master che ha partecipato a questo progetto ha lavorato alla fase di data engineering, necessaria per gestire le grandi quantit脿 di dati del progetto. Ha poi controbuito a sviluppare la parte di machine learning, svolgendo esperimenti e discutendone i risultati in modo critico con il tutor.
Infine ha partecipato al deployment, che ha richiesto di ingegnerizzare i metodi di machine learning in modo da rispettare dei vincoli di memoria posti dall鈥檃zienda.
Si sono ottenuti ottimi risultati, con un鈥檃ccuratezza di classificazione superiore al 95% nella predizione di anni non inclusi nei dati di training.
Il classificatore rimane molto accurato anche facendo la predizione a met脿 stagione anzich茅 a fine stagione agricola, e gli errori sono solitamente poco gravi (colture simili vengono confuse).
Gli algoritmi sono stati integrati all鈥檌nterno dei prodotti sviluppati dall鈥檃zienda.
In particolare, il satellite acquisisce periodicamente (ad esempio una volta alla settimana) l鈥檌mmagine (optical imagery) di una certa area. L鈥檌mmagine viene processata, generando per ogni pixel un vettore di misure che ad esempio quantificano la presenza di vegetazione (vegetation index) ed umidit脿 del suolo. Contemporaneamente, vengono acquisiti anche segnali da sistemi SAR (Synthetic Aperture Radar), che vengono a loro volta processati estraendo altri indicatori. I segnali estratti da optical imagery a dal SAR si riferiscono a date diverse e portano informazioni complementari.
Su ogni pixel otteniamo quindi diverse time series, che descrivano come ogni indicatore evolve durante la stagione.
L鈥檕biettivo 猫 di stimare l鈥檜so del suolo associato ad ogni punto dell鈥檌mmagine (ad esempio, coltura di riso, avena, frumento, girasole, urbanizzato, etc) analizzando all鈥檃ndamento nel tempo del segnale SAR e del segnale ottico. In machine learning questo problema 猫 noto come time series classification.
Lo studente di Master che ha partecipato a questo progetto ha lavorato alla fase di data engineering, necessaria per gestire le grandi quantit脿 di dati del progetto. Ha poi controbuito a sviluppare la parte di machine learning, svolgendo esperimenti e discutendone i risultati in modo critico con il tutor.
Infine ha partecipato al deployment, che ha richiesto di ingegnerizzare i metodi di machine learning in modo da rispettare dei vincoli di memoria posti dall鈥檃zienda.
Conclusioni
Si sono ottenuti ottimi risultati, con un鈥檃ccuratezza di classificazione superiore al 95% nella predizione di anni non inclusi nei dati di training.
Il classificatore rimane molto accurato anche facendo la predizione a met脿 stagione anzich茅 a fine stagione agricola, e gli errori sono solitamente poco gravi (colture simili vengono confuse).
Gli algoritmi sono stati integrati all鈥檌nterno dei prodotti sviluppati dall鈥檃zienda.