Migliorare i sistemi di monitoraggio del conducente Il caso per i dati sintetici

Miglioramento dei sistemi di monitoraggio del conducente tramite dati sintetici

I sistemi di monitoraggio del conducente (DMS) che valutano l’attenzione al volante stanno rapidamente diventando la principale funzionalità di sicurezza automobilistica in tutto il mondo. Ad esempio, nell’UE, l’ente regolatore per la sicurezza dei veicoli, EuroNCAP, richiede che tutte le nuove auto incorporino un DMS per conformarsi alla sua valutazione di sicurezza.

In mezzo a questa spinta, le startup stanno beneficiando delle opportunità di business nello spazio del DMS, offrendo soluzioni che vanno dalle metriche cardiache alla rilevazione del sonno iniziale. Tra queste, la svedese Devant sta sfruttando il potenziale dei dati sintetici.

Lanciata nel 2021, la startup genera dati sintetici di esseri umani digitali realistici per supportare l’addestramento, la convalida e il test delle reti di apprendimento automatico, come quelle dietro ai sistemi di monitoraggio del conducente. In particolare, sviluppa esseri umani simulati in 3D che sono diversi sia nell’aspetto che nel comportamento in diverse situazioni.

Ma come esattamente i dati sintetici possono migliorare il DMS? TNW ha parlato con Richard Bremer, co-fondatore e CEO di Devant, per saperne di più.

Il vuoto che i dati sintetici possono colmare

L’interesse per i dati sintetici è cominciato nei primi anni ’90 e non ci è voluto molto perché l’industria tecnologica si rendesse conto del valore della tecnologia nell’accelerare l’apprendimento automatico.

Il settore automobilistico è stato uno dei primi sostenitori dei dati sintetici, adottandoli a metà degli anni 2010 per lo sviluppo di veicoli autonomi, sistemi avanzati di assistenza alla guida (ADAS) e, più di recente, DMS.

Opinioni dei conducenti sulla guida distratta nell’UE, 2019. Fonte: ESRA Survey/Pires et al.

I sistemi di monitoraggio del conducente e dell’occupante (DMS e OMS) utilizzano tipicamente telecamere e sensori a infrarossi per raccogliere informazioni in tempo reale sul conducente e sui passeggeri. Grazie alla visione artificiale e all’apprendimento automatico, queste informazioni vengono quindi analizzate, monitorando ad esempio lo sguardo o le espressioni facciali del conducente, per determinarne l’attenzione e l’attenzione alla strada.

Ciò significa che per funzionare al meglio, sia il DMS che l’OMS devono essere addestrati su grandi quantità di dati di alta qualità, che comprendono immagini e registrazioni che catturano il maggior numero possibile di situazioni diverse. Pensate a conducenti che inviano messaggi sul telefono, bevono al volante o addirittura si sporgono sui sedili posteriori per fermare i propri figli che litigano.

“Per ogni rete di intelligenza artificiale, la quantità e la qualità dei dati sono essenziali.”

Anche se finora i dati provenienti dalle telecamere e persino da attori professionisti hanno alimentato lo sviluppo del DMS, utilizzare solo queste fonti per catturare ogni situazione immaginabile comporta molteplici sfide. È costoso, richiede tempo, è limitato in termini di variabilità e associato a preoccupazioni sulla privacy.

Ecco dove entra in gioco il valore dei dati sintetici, secondo Bremer. “Il potenziale e la parte interessante dei dati sintetici è che si può ridurre il tempo e i costi e aumentare le prestazioni della rete.”

Come funziona la tecnologia di Devant

La startup con sede a Norrköping utilizza un processo passo-passo sulla sua piattaforma, combinando diversi tipi di risorse 3D per creare immagini e animazioni. Nel caso dell’automotive, questo contenuto può essere costituito da cabine e persone in 3D, integrate con dettagli come accessori, abbigliamento o occhiali.

Animazione di un conducente che si china all’indietro. Credit: Devant

Per garantire un risultato di alta qualità che non influisca sulle prestazioni di una rete di apprendimento automatico, l’affidabilità e l’accuratezza dei dati vengono convalidate tramite una serie di sistemi di valutazione della qualità lungo tutto il processo.

“Per quanto riguarda ciò che abbiamo costruito, si tratta principalmente di assicurarsi che i dati siano stati testati e convalidati”, afferma Bremer.

L’obiettivo di Devant per i suoi modelli umani in 3D è triplice: allinearsi a come appaiono nel mondo reale, ampliare la loro diversità e offrire la più ampia gamma possibile di scenari diversi e soddisfare le esigenze del cliente.

Per questo motivo, la startup svedese offre uno strumento di configurazione per gli utenti, in modo che possano selezionare i parametri corrispondenti alle loro esigenze. Gli aggiustamenti possono riguardare variabili più generiche (come età, etnia e sesso) o dettagli più specifici, tra cui abbigliamento, frequenza dei movimenti delle palpebre o condizioni di illuminazione all’interno di un veicolo.

Animazione di distrazione da telefono. Credit: Devant

A giugno, l’azienda si è unita alla società australiana Seeing Machines, sviluppatrice di (DMS e OMS) utilizzati dai principali produttori di automobili.

Attraverso questa partnership, Seeing Machines utilizzerà le simulazioni 3D di Devant per addestrare e convalidare le sue reti di apprendimento automatico, al fine di migliorare ulteriormente i suoi sistemi di monitoraggio all’interno dell’abitacolo e creare un dataset su larga scala dei comportamenti dei conducenti distratti in linea con i requisiti EuroNCAP.

La qualità è tanto essenziale quanto la quantità

Per sfruttare appieno il potenziale dei dati sintetici, non si tratta solo di premere un pulsante e generare milioni di immagini in pochi giorni, spiega Bremer. Importante è anche la qualità e l’accuratezza dei dati.

Il presupposto è semplice. “Perché qualsiasi rete di intelligenza artificiale funzioni al meglio possibile, quantità sufficiente e qualità sufficiente sono essenziali”.

L’aspetto promettente dei dati generati al computer è che “sappiamo esattamente, fino al livello di pixel, cosa contiene ogni singola immagine grazie ai suoi metadati associati”, afferma Bremer. Al contrario, quando si tratta di dati del mondo reale, “non si ha quel livello di controllo granulare e accuratezza come avviene con i dati sintetici”.

Animazione di un conducente che si inclina all’indietro. Credito: Devant

Ma c’è una controindicazione. Più si aumenta la qualità dei dati aggiungendo più parametri e realismo per coprire la vasta quantità di scenari e comportamenti umani possibili, più diventa complesso. Ciò, a sua volta, aumenta i tempi di rendering.

“Ecco perché nessuno prima di noi ha adottato questo approccio di qualità ai dati sintetici, perché è così costoso in termini di tempi di rendering”, afferma Bremer. In effetti, Devant ha lottato per un bel po’ di tempo per risolvere il puzzle del mantenimento della qualità, ottimizzando al tempo stesso la velocità.

Limitazioni attuali

Nonostante il vantaggio evidente dei dati sintetici in termini di quantità e della loro capacità di fornire simulazioni accurate e di alta qualità, Bremer sottolinea che la tecnologia non dovrebbe essere vista come “una soluzione miracolosa”. Almeno, non ancora.

Invece, sostiene, la sostituzione dei dati del mondo reale con il loro equivalente generato al computer dovrebbe essere fatta con un approccio graduale e cauto.

“Penso che la cosa più importante da ricordare qui è che i sistemi DMS sono sistemi vitali per la vita”, osserva. E ci sono ancora diverse sfide da affrontare, che vanno oltre la necessità di avere migliaia di modelli 3D per garantire una copertura sufficiente.

Richard Bremer, cofondatore e CEO di Devant. Credito: Devant

La prima sfida consiste nell’individuare una soglia per ciò che costituisce dati buoni e cattivi, che Devant esplorerà in collaborazione con Seeing Machines. La seconda sfida è identificare esattamente quali dati la rete di apprendimento automatico riconoscerà come sufficientemente importanti da utilizzare.

La startup sta anche facendo uno sforzo aggiuntivo per coprire più aspetti dell’ottica della telecamera. “Simulare diversi parametri della telecamera è molto complesso, specialmente quando devi farlo entro un tempo limitato di rendering per immagine”, spiega Bremer.

La strada da seguire

Fino ad ora, Devant ha lavorato sui diversi livelli di distrazione del conducente, concentrandosi in particolare sulla simulazione realistica dell’occhio, con i suoi diversi movimenti, comportamenti delle palpebre e dimensioni variabili della pupilla.

Attraverso la partnership con Seeing Machines, la startup mira a salire sulla scala della complessità e continuare ad aggiungere funzionalità che copriranno l’intero protocollo EuroNCAP. Da lì, Bremer vede la sonnolenza come “la cosa successiva naturale”, con l’ubriachezza come un’altra possibilità interessante nella lista dell’azienda.

La decisione di Devant di sviluppare dati sintetici incentrati sull’essere umano per l’industria automobilistica è stata mirata fin dall’inizio, guidata dall’opportunità commerciale offerta dall’attenzione sempre maggiore ai DMS e dalle imminenti normative dell’UE. Secondo Bremer, si trattava anche di generare un valore effettivo e utilizzare la tecnologia in modo che beneficiasse le persone.

Oltre allo spazio automobilistico, la startup immagina altre potenziali industrie in cui la sua tecnologia potrebbe avere un impatto positivo, ad esempio addestrare sistemi di intelligenza artificiale a rilevare segni di malattie in fase precoce.