Visualizza la classifica
Zoom Speech si posiziona tra i primi modelli nella classifica Open ASR Leaderboard Visualizza la classifica
close banner
Zoom AI Services: Scribe API
Zoom AI Services: Scribe API

L’API di conversione da voce a testo più accurata al mondo

Trascrizione di qualità affidabile, resa possibile dal modello ASR Pro di Zoom.

 

Classificato come uno dei modelli migliori nella classifica HuggingFace Open ASR, Scribe API offre sia servizi di sincronizzazione rapida che di trascrizione batch, basati sullo stesso sistema ASR che supporta milioni di riunioni Zoom ogni giorno.

Zoom AI Services: Scribe API
Funzionalità
Funzionalità

Tutto quello che ti serve per la sintesi vocale

Dal quasi tempo reale all’elaborazione batch, Zoom Scribe API offre servizi di trascrizione con grande precisione e velocità.

Trascrizione con sincronizzazione veloce

Trascrizione sincronizzata rapida

Accedi alla trascrizione sincrona a bassa latenza per singoli file audio. Elabora un file alla volta con risposta immediata dopo il completamento.

Trascrizione batch

Trascrizione batch

Elabora file audio e video preregistrati su larga scala. Supporto per MP3, WAV, MP4, FLAC, OGG e altro ancora con rilevamento automatico del formato.

Data/ora a livello di parola

Marcatori temporali a livello di parola

Ottieni tempi precisi di inizio e fine per ogni parola, consentendo una generazione perfetta dei sottotitoli, la ricerca audio e l’indicizzazione dei contenuti.

Usa il tuo spazio di archiviazione

Utilizza il tuo spazio di archiviazione

Archivia le trascrizioni in modo sicuro nel bucket AWS S3 per migliorare il controllo dei dati e la conformità.

Diarizzazione del relatori

Diarizzazione degli oratori

Etichetta automaticamente i diversi relatori nelle conversazioni con più partecipanti con alta precisione (presto disponibile).

Supporto in diverse lingue

Supporto in diverse lingue

Trascrivi in diverse lingue e dialetti con solidi modelli di accento addestrati su diversi dataset. (Presto disponibile)

Prova ora

Verifica tu stesso

Fai clic sul microfono per utilizzare l’input audio del tuo browser per simulare una trascrizione. Demo disponibile solo in inglese.

Zoom Scribe API Playground
Fai clic sul microfono per avviare una trascrizione dimostrativa
Output di trascrizione
Latency: Confidence:

La trascrizione apparirà qui...

Prestazioni
Prestazioni

Zoom Speech si posiziona tra i primi modelli nella classifica Open ASR Leaderboard

Siamo orgogliosi di condividere che la tecnologia di riconoscimento vocale di Zoom è tra i modelli migliori dell’Open ASR Leaderboard, un benchmark globale per le prestazioni di riconoscimento automatico del parlato (ASR). Questo traguardo riflette la nostra incessante ricerca dell’eccellenza nella tecnologia vocale e la forza della Scribe API di Zoom AI Services.
I punti di forza chiave del modello includono:

  • Precisione ai massimi livelli: il nostro framework di innovazione scalabile migliora continuamente la qualità del modello, garantendo risultati di trascrizione di altissimo livello proprio dove l’accuratezza e la leggibilità sono fondamentali.
  • Padronanza della terminologia Enterprise: ottimizzato per contesti aziendali e tecnici, il modello gestisce con precisione nomi di aziende, termini relativi ai prodotti e gergo specifico del settore: un vantaggio fondamentale per riunioni, chiamate all’assistenza e documentazione professionale.
  • Riduzione delle allucinazioni: le strategie di modellazione avanzate di Zoom riducono al minimo le “allucinazioni” nella trascrizione, in modo che ciò che viene riconosciuto rifletta fedelmente l’intenzione di chi parla, senza parole artificiali o estranee.
Prima gli sviluppatori
Prima gli sviluppatori

Inizia a trascrivere in pochi minuti

  • API semplici e ben documentate
  • API REST e specifiche OpenAPI
  • Gestione completa degli errori
  • Richiamate automatiche webhook per lavori asincroni
Prezzi
Prezzi

Prezzi semplici e trasparenti

Applica crediti prepagati al tuo utilizzo di Scribe API con tariffe trasparenti.

Scribe API Fast

Risorse per sviluppatori

Tutto ciò che ti serve per integrare, costruire e distribuire con Zoom Scribe API.

Pronto a creare con un’API leader per il riconoscimento vocale