La Voce si Reinventa: come l'AI trasforma le telco

Durante il MWC di Barcellona del 14 marzo 2026, Andy Hicks (GlobalData) ha lanciato il white paper "Reinventing Voice", spiegando come il passaggio a un core vocale convergente e IA-native permetta agli operatori di telecomunicazioni di innovare i propri servizi e accrescere il valore dei prodotti voce di prossima generazione.

Per decenni la voce ha rappresentato la spina dorsale economica delle telecomunicazioni.

Poi è arrivato il broadband mobile, e gli operatori hanno spostato attenzione e investimenti sui dati, lasciando le infrastrutture vocali invecchiare in silenzio. Oggi, secondo un'analisi approfondita di GlobalData, quella stagione di abbandono è finita e il settore si trova davanti a una scelta: reinventare la voce oppure perdere rilevanza competitiva.

Il contesto: Un'infrastruttura ferma nel tempo

La stragrande maggioranza degli operatori di telecomunicazioni gestisce oggi infrastrutture vocali frammentate: reti a commutazione di circuito per il 2G e il 3G, VoLTE per il 4G, e implementazioni VoNR ancora parziali per il 5G. Il risultato è una moltiplicazione di sistemi paralleli, costosi da mantenere e impossibili da innovare con rapidità.

Nei mercati emergenti la situazione è ancora più critica: i rapporti CAPEX/ricavi raggiungono livelli quasi doppi rispetto ai mercati maturi, e le infrastrutture legacy introducono rischi di sicurezza e comprimono l'ARPU medio per utente.

"Le tecnologie vocali legacy non sono solo costose: sono una trappola strategica che blocca l'innovazione e degrada l'esperienza utente."

A complicare la transizione si aggiungono tre vincoli strutturali: la persistenza dei feature phone in molti mercati per ragioni di accessibilità economica, le normative che impongono continuità del servizio universale, e la dipendenza del roaming internazionale da accordi bilaterali fondati su architetture 3G, difficili da abbandonare senza rischiare copertura e NPS.

La risposta: Dal silos alla sinergia, il voice core convergente

La soluzione proposta da GlobalData è chiara: un voice core convergente, software-defined, capace di supportare simultaneamente tecnologie di accesso eterogenee, dal legacy 2G alle reti non terrestri (NTN), su un'unica piattaforma unificata.

Il cambiamento architetturale chiave è il passaggio da deployment NFV su macchine virtuali a carichi di lavoro containerizzati su bare metal. I server bare metal garantiscono performance deterministiche per i servizi voce, sensibili alla latenza, mentre i container offrono scalabilità elastica e velocità di aggiornamento. Questa combinazione è il prerequisito per un'infrastruttura pronta all'AI.

Perché il container su bare metal? Performance + Flessibilità

I server bare metal eliminano l'overhead della virtualizzazione per i servizi a bassa latenza, mentre i container permettono di scalare capacità vocale in minuti anziché ore. È la base tecnica senza cui l'AI embedded nel network layer non può funzionare in modo affidabile.

Intelligenza artificiale: AI trasformativa per le comunicazioni vocali mobili

Il documento GlobalData identifica l'AI come la tecnologia più dirompente nel settore TLC, con un'applicazione alla voce di impatto particolarmente elevato. I benefici operano su tre livelli distinti:

Qualità della chiamata: Noise cancellation intelligente, soppressione delle interferenze, ripristino del segnale degradato. L'AI isola la voce del parlante da traffico, vento, ambienti affollati e migliora continuamente con i volumi di traffico.
AI embedded nel network layer: Modelli addestrati su dati di telemetria (latenza, jitter, packet loss, congestion patterns) per predire il degrado della qualità e ottimizzare routing, allocazione di banda e utilizzo delle risorse in tempo reale. Device-agnostic: funziona su smartphone premium, dispositivi low-cost e IoT.
Assistenti AI durante le chiamate live: Note-taking, promemoria, esecuzione di task e traduzione in tempo reale integrati direttamente nell'esperienza di chiamata. Nuove forme di produttività e engagement senza cambiare abitudini d'uso.

Il futuro: La voce diventa multimodale

La transizione più significativa che GlobalData descrive è quella da comunicazione vocale unimodale (una telefonata tradizionale) a un framework di interazione multimodale che integra dati, video e intelligenza artificiale. Gli IMS data channel standardizzati sono il pilastro tecnico di questa evoluzione: permettono lo scambio bidirezionale di dati durante una sessione vocale attiva, senza abbandonare la semplicità dell'interfaccia di chiamata.

Le capacità concrete: video a due vie, avatar animati, condivisione di contenuti, traduzione vocale bidirezionale in tempo reale, riassunti automatici della chiamata, raccomandazioni contestuali. Per gli operatori, questo apre un orizzonte di monetizzazione completamente nuovo: servizi premium bundled nei piani 5G-Advanced, integrazione nel telco super-app, offerte verticali per healthcare, finance e customer service industriale.

"La voce non è un servizio legacy in declino. È un asset strategico in profonda trasformazione."

Casi reali: Chi è già passato all'azione

Il whitepaper porta tre esempi concreti di operatori che hanno già avviato questa trasformazione:

Thailandia (AIS): Servizio AI Calling con traduzione linguistica in tempo reale durante le chiamate. Voice-to-voice e voice-to-text con sottotitoli in diretta.
Arabia Saudita (stc Bank): Customer engagement AI-powered con supporto 24/7 e self-service vocale in ambiente finanziario regolamentato.
Cina (China Mobile): Partnership con Ant Group per servizi vocali di healthcare. Hotline vocale dedicata agli anziani: medici, referti, consulti remoti.

Tre mercati diversi, tre modelli di business distinti, un denominatore comune: la voce come layer di engagement intelligente, non più semplice canale di trasferimento audio.

Conclusione: Reinventare la voce non è opzionale

Gli operatori che abbracceranno questa trasformazione, convergendo le infrastrutture e adottando architetture cloud-native e integrando AI e capacità multimodali, potranno ridurre sensibilmente la complessità operativa, migliorare l'esperienza cliente e sbloccare opportunità di monetizzazione sostenibili verso il 6G e oltre. Chi aspetterà, rischia di cedere terreno in modo difficilmente recuperabile.

Fonte: GlobalData — Reinventing Voice: A Converged, AI-Enabled, and Multimodal Voice Core for the Next Generation of Telecommunications, Dicembre 2025. Analista: Andy Hicks, Senior Principal Analyst. Presentato al MWC 2026, Barcellona.

Clicca qui per scaricare il paper.