Oggi lanciamo DenkHub Transcriber, un'app desktop gratuita e open source per trascrivere file audio e video usando l'intelligenza artificiale, direttamente sul tuo computer. Nessun dato viene inviato a server esterni, nessun account richiesto, nessun abbonamento. Dopo il primo avvio, funziona anche senza internet.

L'app è basata su Whisper, il modello di riconoscimento vocale di OpenAI addestrato su 680.000 ore di audio in 99 lingue, nella sua versione ottimizzata in C++ che lo rende eseguibile su qualsiasi computer, senza GPU dedicata. Noi ci abbiamo costruito sopra un'interfaccia semplice: trascini un file, premi un bottone, leggi il testo.

Scarica gratis per macOS e Windows

Cosa fa

Trascrive audio e video in testo, con precisione che varia in base al modello AI scelto, dal Tiny (75 MB, velocissimo) al Large v3-turbo (3.1 GB, precisione paragonabile ai servizi cloud a pagamento). I modelli si scaricano on-demand: parti con quello leggero, e se ti serve più qualità scarichi quello più potente.

L'app accetta tutti i formati principali: MP3, WAV, OGG, M4A, OPUS per l'audio. MP4, MOV, AVI, MKV per il video, l'audio viene estratto automaticamente. Supporta italiano, inglese, francese, spagnolo e tedesco con rilevamento automatico della lingua.

Un dettaglio che ci piace: supporta il formato OPUS di WhatsApp. I messaggi vocali che non hai mai voglia di ascoltare? Li trascini nell'app e li leggi.

Leggi anche
DenkHub Manager: il workspace editoriale per social manager e clienti è in pre-alpha
Oggi apriamo gli inviti alla pre-alpha di DenkHub Manager, un workspace dove social manager e clienti pianificano, preparano, approvano e pubblicano contenuti social senza passaggi persi. Calendario, schede contenuto, revisione via link e pubblicazione diretta su Instagram e Facebook.
Leggi l'articolo →

Le cose che abbiamo curato

Whisper fa il lavoro pesante. Quello che abbiamo cercato di fare noi è costruire un'esperienza d'uso che renda la trascrizione comoda, non solo possibile.

Il testo è sincronizzato con l'audio. Ogni parola è cliccabile: un click e la riproduzione parte da quel punto esatto. Il player supporta velocità 1x, 1.5x, 2x.

La correzione è inline. Whisper sbaglia un nome proprio o un termine tecnico? Click destro, correggi, salvato. Undo e redo funzionano come in qualsiasi editor.

Tutto si salva automaticamente in una cronologia con ricerca full-text. Hai fatto trenta trascrizioni e ti serve ritrovare un passaggio specifico? Scrivi una parola e l'app cerca in tutte le trascrizioni passate. Non devi organizzare niente, è già tutto indicizzato.

L'esportazione è un click. Copia negli appunti o esporta come .txt.

Cinque modelli, tu scegli

  • Tiny (75 MB) - velocissimo, trascrive 5 minuti di audio in circa 30 secondi
  • Base (142 MB) - buon compromesso per uso quotidiano
  • Small (466 MB) - precisione buona, tempi ragionevoli
  • Medium (1.5 GB) - alta precisione per contenuti importanti
  • Large v3-turbo (3.1 GB) - il migliore, compete con servizi da 15-30 euro al mese

Scarichi solo quelli che ti servono. Se cambi idea, li rimuovi e ne scarichi altri.

Scarica DenkHub Transcriber

Tutto in locale, tutto tuo

Ne abbiamo parlato a lungo nel nostro articolo su Perplexity e la privacy: quando un servizio cloud ti dice "i tuoi dati sono al sicuro", ti sta chiedendo un atto di fede. Con DenkHub Transcriber la questione non si pone.

Non c'è un server dove i file vengono caricati. Non c'è telemetria. Non c'è un backend cloud. L'unica connessione avviene quando scarichi un modello AI. Dopo, puoi staccare il WiFi e l'app funziona uguale. Le trascrizioni stanno in un database SQLite sul tuo disco. I modelli stanno dove decidi tu. Se disinstalli l'app, non resta niente da nessuna parte che non sia il tuo computer.

A chi è pensata

Giornalisti che trascrivono interviste e preferiscono che restino sul loro computer. Ricercatori che lavorano con interviste qualitative e focus group. Studenti che vogliono trasformare lezioni registrate in appunti cercabili. Podcaster che hanno bisogno di sottotitoli. Avvocati che trascrivono verbali e deposizioni. Chiunque riceva troppi vocali su WhatsApp e preferisca leggerli.

Requisiti e installazione

L'installer pesa circa 124 MB su macOS e 100 MB su Windows. I modelli AI si scaricano a parte. Zero dipendenze: non serve Python, non serve una GPU.

Funziona su macOS 12+ (Apple Silicon) e Windows 10+ (64-bit). Servono almeno 4 GB di RAM, 8 consigliati per i modelli più grandi.

Al primo avvio un wizard ti guida nella configurazione: scegli dove salvare i modelli, dove salvare le trascrizioni, scarichi il primo modello. Cinque minuti e sei operativo.

Nota: l'app non è firmata con certificati Apple o Microsoft, normale per software open source indipendente. Il sistema operativo mostra un avviso al primo avvio che si supera in un click.

Open source, licenza MIT

Il codice è pubblico e ispezionabile su GitHub: github.com/denkhub-io/denkhub-transcriber. Il progetto è rilasciato sotto licenza MIT. Tutto quello su cui è costruito è software libero: Whisper, whisper.cpp, Electron, FFmpeg, SQLite.

Puoi leggere il codice, fare una fork, proporre modifiche, segnalare bug. Nessun costo nascosto. Nessun piano premium. Nessun "gratis per 7 giorni".

Cos'è il Playground di DenkHub

DenkHub Transcriber è un progetto del nostro Playground, una sezione di DenkHub dove pubblichiamo progetti gratuiti e open source che chiunque può usare, modificare e migliorare. Non sono prodotti commerciali, non hanno piani a pagamento. Sono esperimenti costruiti per essere utili: li mettiamo a disposizione e chi vuole può prenderli, studiarli, farli propri.

L'idea è che la tecnologia più interessante oggi è accessibile: i modelli sono open source, gli strumenti ci sono, le librerie pure. Quello che manca spesso è qualcuno che metta insieme i pezzi e li renda utilizzabili senza dover essere sviluppatori. Il Playground esiste per questo.

Transcriber è il primo progetto. Non sarà l'ultimo.

Scarica gratis su denkhub.io