Un assistente AI in tempo reale che ascolta le tue chiamate e ti aiuta a rispondere alle domande difficili al momento. Trascrive le conversazioni in diretta e funziona in modo invisibile sul tuo sistema - solo tu puoi vederlo.

Per chiunque si trovi in conversazioni ad alta pressione - candidati in colloqui tecnici, professionisti delle vendite che gestiscono obiezioni, studenti in esami orali o dirigenti in riunioni importanti. Se hai bisogno di sembrare sicuro su argomenti difficili, ci pensiamo noi.

In cosa è diverso dagli altri strumenti?

La maggior parte degli strumenti AI crea riassunti dopo la fine della riunione. GeekBye funziona in diretta - rispondendo alle domande mentre vengono poste e dandoti spunti durante la conversazione. È come avere un esperto che ti sussurra all'orecchio.

Gli altri nella chiamata lo vedranno?

No. GeekBye funziona localmente e non entra mai come partecipante o bot. L'overlay è visibile solo a te - non apparirà nelle registrazioni, nelle condivisioni schermo o nelle liste dei partecipanti.

Quali piattaforme supporta?

Zoom, Microsoft Teams, Google Meet, Webex e qualsiasi piattaforma browser. Per Zoom: usa la versione 6.1.6 o precedente, oppure abilita [Cattura avanzata con filtro finestre](https://support.zoom.us/hc/en/article?id=zm_kb&sysparm_article=KB0063824#:~:text=Advanced%20capture%20with%20window%20filtering,from%20the%20Zoom%20desktop%20app.).

Cosa è incluso gratis?

Risposte AI limitate al mese - sufficienti per provarlo in alcuni colloqui o riunioni. Tutte le funzionalità base incluse. La versione Pro rimuove i limiti e aggiunge il supporto multilingue.

I miei dati sono al sicuro?

Sì. I tuoi dati sono crittografati e non vendiamo mai le tue informazioni.

GeekBye funziona per i colloqui di codice?

Sì. GeekBye cattura il tuo schermo in tempo reale e fornisce soluzioni per problemi di algoritmi, domande di progettazione di sistemi, sfide di debugging e ottimizzazione del codice. Funziona con qualsiasi ambiente di codifica o piattaforma di valutazione online.

Può aiutare con i colloqui comportamentali?

Assolutamente. GeekBye ascolta le domande comportamentali e suggerisce risposte strutturate con il metodo STAR, punti di discussione pertinenti e risposte di follow-up basate sul contesto della conversazione.

Quali lingue supporta GeekBye?

GeekBye supporta 33 lingue sia per la trascrizione che per le risposte AI. Puoi impostare la lingua di trascrizione indipendentemente dalla lingua di output dell'AI, il che è utile per chi non è madrelingua inglese e sostiene colloqui in inglese.

Quanto sono veloci le risposte AI?

Le risposte iniziano ad apparire entro 2-3 secondi dalla pressione del tasto rapido. L'AI inizia a generare immediatamente mentre continui la conversazione, quindi non ci sono pause imbarazzanti.

Funziona su macOS e Windows?

Sì. GeekBye funziona nativamente su macOS (14.0 Sonoma o successivo) e Windows. L'invisibilità alla cattura dello schermo funziona su entrambe le piattaforme utilizzando la protezione nativa dei contenuti a livello di sistema operativo.

L'intervistatore può rilevare GeekBye?

No. GeekBye utilizza la protezione nativa dei contenuti del sistema operativo per escludersi da tutte le catture dello schermo, registrazioni e condivisioni. Non entra mai nelle chiamate come bot o partecipante. Non ci sono estensioni del browser, codice iniettato o tracce di rete.

Cosa succede dopo la fine di una riunione?

GeekBye genera un riepilogo completo della riunione con punti chiave, azioni da intraprendere e suggerimenti di miglioramento. Valuta anche la tua performance su sei metriche di comunicazione con feedback specifico basato sulla trascrizione.

C'è un limite alla durata della riunione?

No. I piani Gratuito e Pro supportano entrambi una durata illimitata delle riunioni. La trascrizione funziona in modo continuo per tutta la durata della riunione, senza interruzioni.

Posso usare GeekBye per le chiamate commerciali?

Sì. I professionisti delle vendite usano GeekBye per gestire le obiezioni in tempo reale, ricevere coaching sulle tattiche di negoziazione e ottenere punti di discussione istantanei durante le chiamate con i clienti. Funziona con qualsiasi piattaforma di riunione.

Devo installare qualcos'altro?

Su macOS, l'installazione del driver audio virtuale BlackHole (gratuito, open source) abilita l'acquisizione dell'audio di sistema per la trascrizione. Su Windows, non è necessario alcun software aggiuntivo. GeekBye si occupa di tutto il resto.

Posso cancellare il mio abbonamento in qualsiasi momento?

Sì. Puoi cancellare il tuo abbonamento Pro in qualsiasi momento. Il tuo accesso continua fino alla fine del periodo di fatturazione corrente. Il piano Lifetime è un acquisto una tantum senza addebiti ricorrenti.

GeekBye conserva le mie registrazioni dei colloqui?

Tutte le trascrizioni e le registrazioni sono archiviate localmente sul tuo dispositivo in un database crittografato. Nulla viene caricato su server cloud. Hai il pieno controllo per visualizzare, esportare o eliminare i tuoi dati in qualsiasi momento.

Come funzionano le scorciatoie da tastiera?

Premi Cmd+Enter (macOS) o Ctrl+Enter (Windows) per catturare lo schermo e ottenere una risposta AI istantanea. Premi Cmd+Shift+. per aprire il report della riunione. Puoi scegliere tra tre schemi di scorciatoie predefiniti durante la configurazione per evitare conflitti con il tuo editor di codice.

Perché la Trascrizione AI Fraintende i Termini Tecnici (e Come l'Abbiamo Risolto)

Il 2 luglio abbiamo fatto una sessione di test e abbiamo posto a GeekBye una domanda semplice, a voce alta: "What is the pointer in C++?" (cos'è il puntatore in C++?)

Il transcript live ha risposto con la poesia:

[23:16:37] You: Tell me, what is the point in life? [23:16:52] You: Handy Plus. [23:17:02] You: What the pointer in Plus Plus? [23:17:09] You: C.

Stessa sessione, le metriche di salute hanno raccontato il resto: 3 connessioni di trascrizione cadute in 163 secondi e un buco di 51 secondi nel transcript. E un altro indizio che si è rivelato il più importante: il nostro passaggio di recupero post-sessione — che ritrascrive l'audio salvato in locale per colmare i buchi — ha quasi azzeccato la frase: "a pointer in plus, plus? What the pointer in plus, plus C++."

L'audio era a posto. Il modello live semplicemente non aveva motivo di aspettarsi C++.

Questa è la storia di GeekBye v2.0.11, raccontata a partire dai transcript reali e dai log di produzione.

Perché i modelli vocali fraintendono il tuo vocabolario

Il riconoscimento vocale è un problema di previsione. Davanti a un audio ambiguo, il modello sceglie le parole più probabili — e per un modello generalista "point in life" (il senso della vita) è una frase molto più probabile di "pointer in C++" (il puntatore in C++). Ogni ingegnere che ha visto un transcript di riunione rendere Kubernetes come "cube and eddies" ha già incontrato questo fallimento.

La soluzione non è un microfono migliore. È il keyterm biasing: dire al modello, prima che la sessione inizi, quali parole improbabili sono probabili per te. Il nostro provider di speech-to-text supporta fino a 50 termini di biasing per sessione. E qui viene la parte imbarazzante: l'impianto per quei termini esisteva end-to-end nel nostro stack — client, backend, provider — e niente l'aveva mai popolato. Ogni sessione girava senza alcun aiuto di dominio.

Fix 1: il tuo profilo diventa il vocabolario del modello

GeekBye conosce già il tuo dominio — è nel tuo profilo attivo. La v2.0.11 deriva i keyterm di biasing dal nome e dalla descrizione del profilo: termini con simboli (C++, Node.js), acronimi (SQL, AWS), nomi in camel case (TypeScript, PostgreSQL) e nomi propri. Un profilo che menziona il tuo stack ora rende quello stack atteso invece che esotico.

Il giorno in cui il fix ha peggiorato tutto

La nostra prima versione trattava ogni parola con la maiuscola come un nome proprio. Su una build di test interna (non è mai arrivata ai clienti), un profilo scritto in prosa ha spedito al modello questa lista di biasing:

Senior, Writing, Direct, For, Includes, Write, Role, Intent…

Orientare un modello vocale verso la parola "For" è peggio che non orientarlo affatto. Nella sessione di test immediatamente successiva, la parola "speak" — pronunciata chiaramente, più volte — è tornata come "Clicky", "Hey, Vicky" e "Peter Paderty". La lezione ci è costata un pomeriggio: fare biasing solo con termini distintivi. Le parole con la maiuscola ora contano solo quando compaiono a metà frase (un vero segnale di nome proprio); i titoli markdown, dove ogni parola è maiuscola, non contribuiscono mai. Quello stesso profilo ora deriva esattamente LinkedIn, AI, CEO, MCP — e la sessione di validazione ha trascritto correttamente audio multilingue con cambi rapidi per 199 secondi di fila, 189 segmenti di transcript, zero errori.

Fix 2: la race condition che faceva cadere le connessioni

I keyterm spiegavano le parole fraintese. Non spiegavano le tre connessioni cadute.

Quella traccia portava a qualcosa di più sottile. Il nostro provider committa (finalizza) la trascrizione in base alla propria voice activity detection, circa un secondo dopo l'inizio del silenzio. Il nostro client invia anche un commit di sicurezza 250 millisecondi dopo l'inizio del silenzio, per svuotare eventuali frasi parziali rimaste in sospeso. La conferma del provider di aver già committato impiega da uno a tre secondi per tornare indietro. Fai i conti con questi tre numeri: ogni volta che il provider committava per primo, il nostro commit di sicurezza scattava contro un buffer quasi vuoto — e la risposta del provider non era solo un rifiuto cortese. Faceva cadere la connessione. Ogni pausa nel parlato era un lancio di moneta.

La v2.0.11 introduce due livelli di difesa:

Nell'app: quando arriva un transcript committato, il client ora sa che il buffer del provider è appena stato svuotato e salta il commit di sicurezza ridondante.
Nel nostro backend, lo stesso giorno: il proxy che sta tra l'app e il provider rispecchia esattamente la contabilità audio del provider — vede ogni frame audio e ogni conferma di commit con latenza zero — e si rifiuta semplicemente di inoltrare qualsiasi commit che il provider rifiuterebbe. Questo livello protegge tutte le versioni del client in una volta sola, compresi gli utenti che non hanno ancora aggiornato.

L'abbiamo visto funzionare in produzione entro un'ora. La guardia ha intercettato commit destinati a fallire con 178ms e 256ms di audio nel buffer — ognuno dei quali, prima di quel giorno, era una connessione caduta garantita e un buco negli appunti di riunione di qualcuno. Una sessione continua di 60 minuti quel pomeriggio ha registrato cinque intercettazioni e zero cadute. Prima del fix, quella stessa mattina un utente reale aveva riavviato la registrazione cinque volte in sei minuti combattendo esattamente contro questo bug.

Due fix minori al seguito

Gli insight AI ora aspettano la sostanza. Quei frammenti confusi iniziali alimentavano i suggerimenti live di GeekBye, che producevano con sicurezza argomenti come "Defining Life's Ultimate Purpose" da una domanda su C++ fraintesa. I suggerimenti ora aspettano che la sessione abbia una vera massa conversazionale.

Il testo recuperato riceve lo speaker giusto. Il passaggio di recupero che aveva trascritto correttamente la nostra domanda su C++ l'aveva attribuita a "Them". La timeline dell'audio salvato in locale ora registra chi stava parlando, così i segmenti recuperati vengono attribuiti correttamente a You o Them.

Il tabellone

Metrica (misurata, non stimata)	Prima	Dopo v2.0.11 + guardia backend
Cadute di connessione nella sessione di test	3 in 163s	0
Buco più lungo nel transcript	51s	~6s di gap peggiore in validazione
"pointer in C++"	"point in life"	corretto, con vocabolario orientato
Commit destinati a fallire arrivati al provider	tutti	0 (intercettati nel backend)

Se stai costruendo su API di speech in tempo reale

Tre lezioni trasferibili da questa release:

Alimenta la funzione di biasing. Se il tuo provider STT supporta keyterm/phrase hints, popolarla con un vocabolario piccolo e distintivo è il guadagno di accuratezza più economico che ci sia — e popolarla con parole comuni è una perdita di accuratezza.
Non gareggiare mai con la state machine del provider dal lato sbagliato di un round-trip di rete. Il nostro client non poteva vincere una gara di informazioni da 250ms contro 3s. La guardia va messa dove i due segnali convergono — per noi, il proxy del backend.
Valida su una build reale prima di pubblicare. La regressione dei keyterm è stata individuata perché ogni release di GeekBye viene testata come build firmata e notarizzata contro la produzione prima di uscire. La versione difettosa è esistita per qualche ora su una macchina interna, non sul tuo Mac.

GeekBye v2.0.11 è già disponibile — se sei sulla v2, ce l'hai già tramite aggiornamento automatico. Per il lavoro di affidabilità su cui questa release si appoggia, leggi perché il tuo notetaker AI si blocca con il Wi-Fi instabile e cosa è cambiato in GeekBye v2. Per come funziona la trascrizione live giorno per giorno, parti da trascrizione in tempo reale in GeekBye.