Microsoft sta compiendo significativi progressi nel campo dell’intelligenza artificiale, in particolare con il lancio di Copilot Vision. Questa nuova funzionalità, introdotta per la prima volta nell’ottobre 2024 per il browser Edge, consente agli utenti di interrogare i contenuti delle pagine web. Recentemente, Copilot Vision ha ampliato le sue capacità integrandosi nell’app mobile di Copilot, arricchendosi di funzionalità multimodali per analizzare video e foto in tempo reale.
Copilot Vision: nuove funzionalità e disponibilità
A partire dal 4 aprile 2025, Microsoft ha celebrato il suo cinquantesimo anniversario presentando una serie di innovazioni legate a Copilot. Tra queste, l’annuncio che Copilot Vision è ora accessibile anche tramite l’applicazione su dispositivi Android e iOS. Attualmente, questa funzione è disponibile solo per gli abbonati a Copilot Pro negli Stati Uniti attraverso la modalità vocale dell’app.
Caratteristiche multimodali di Copilot Vision
La novità principale consiste nella capacità di analizzare video e immagini memorizzati sul dispositivo dell’utente. Questo permette all’assistente AI di rispondere a domande specifiche basate su ciò che viene visualizzato dalla fotocamera del dispositivo. Ad esempio, è possibile chiedere suggerimenti su come arredare un ufficio vuoto semplicemente puntando la fotocamera verso lo spazio.
Confronto con Google Gemini Live
È importante notare che Google ha precedentemente introdotto funzionalità simili con Gemini Live, presentate durante il MWC 2025. Queste caratteristiche consentono agli utenti di condividere in tempo reale lo schermo del proprio dispositivo o la vista della fotocamera, ponendo domande direttamente all’assistente AI.
- Copilot Vision (Microsoft)
- Gemini Live (Google)
- Progetto Astra (Google)
L’introduzione e l’evoluzione continua delle funzioni AI da parte sia di Microsoft che di Google evidenziano una competizione serrata nel settore degli assistenti virtuali.
Lascia un commento