Un assistent d'IA en temps real que escolta les teves trucades i t'ajuda a respondre preguntes difícils al moment. Transcriu converses en directe i s'executa de manera invisible al teu sistema - només tu pots veure'l.

Qualsevol persona en converses d'alta pressió: persones que busquen feina en entrevistes tècniques, professionals de vendes gestionant objeccions, estudiants en exàmens orals o executius en reunions importants. Si necessites semblar segur en temes difícils, t'ho posem fàcil.

En què es diferencia dels prenedors de notes?

La majoria d'eines d'IA creen resums després que acabi la reunió. GeekBye funciona en directe: respon preguntes mentre es fan i et dona punts de discussió durant la conversa. Com tenir un expert xiuxiuejant-te a l'orella.

Els altres a la trucada ho veuran?

No. GeekBye s'executa localment i mai s'uneix com a participant o bot. La capa només és visible per a tu: no apareixerà en gravacions de pantalla, en compartir pantalla ni en llistes de participants.

Quines plataformes suporta?

Zoom, Microsoft Teams, Google Meet, Webex i qualsevol plataforma basada en navegador. Per a Zoom: utilitza la versió 6.1.6 o anterior, o habilita [Captura avançada amb filtrat de finestres](https://support.zoom.us/hc/en/article?id=zm_kb&sysparm_article=KB0063824#:~:text=Advanced%20capture%20with%20window%20filtering,from%20the%20Zoom%20desktop%20app.).

Què inclou la versió gratuïta?

Respostes d'IA limitades al mes - suficients per provar en algunes entrevistes o reunions. Totes les funcionalitats principals incloses. Pro elimina els límits i afegeix suport multiidioma.

Les meves dades estan segures?

Sí. Les teves dades estan encriptades i mai venem la teva informació.

Funciona GeekBye per a entrevistes de programació?

Sí. GeekBye captura la teva pantalla en temps real i proporciona solucions per a problemes d'algorismes, preguntes de disseny de sistemes, reptes de depuració i optimització de codi. Funciona amb qualsevol entorn de programació o plataforma d'avaluació en línia.

Pot ajudar amb entrevistes de comportament?

Per descomptat. GeekBye escolta les preguntes de comportament i suggereix respostes estructurades amb el mètode STAR, punts de discussió rellevants i respostes de seguiment basades en el context de la conversa.

Quins idiomes suporta GeekBye?

GeekBye suporta 33 idiomes tant per a la transcripció com per a les respostes d'IA. Pots configurar l'idioma de transcripció de manera independent de l'idioma de sortida de la IA, cosa que és útil per a parlants no nadius d'anglès que fan entrevistes en anglès.

Com de ràpides són les respostes de la IA?

Les respostes comencen a aparèixer en 2-3 segons després de prémer la drecera. La IA comença a generar immediatament mentre continues la teva conversa, de manera que no hi ha cap pausa incòmoda.

Funciona a macOS i Windows?

Sí. GeekBye s'executa de manera nativa tant a macOS (14.0 Sonoma o posterior) com a Windows. La invisibilitat de captura de pantalla funciona a ambdues plataformes utilitzant protecció de contingut nativa a nivell de sistema operatiu.

Pot l'entrevistador detectar GeekBye?

No. GeekBye utilitza protecció de contingut nativa del sistema operatiu per excloure's de totes les captures de pantalla, gravacions i comparticions. Mai s'uneix a trucades com a bot o participant. No hi ha extensions de navegador, ni codi injectat, ni rastres de xarxa.

Què passa després que acabi una reunió?

GeekBye genera un resum complet de la reunió incloent punts clau, accions pendents i suggeriments de millora. També puntua el teu rendiment en sis mètriques de comunicació amb comentaris específics basats en la transcripció.

Hi ha un límit de durada de la reunió?

No. Els plans Gratuït i Pro admeten durada il·limitada de reunions. La transcripció funciona contínuament mentre duri la teva reunió sense talls ni interrupcions.

Puc utilitzar GeekBye per a trucades de vendes?

Sí. Els professionals de vendes utilitzen GeekBye per gestionar objeccions en temps real, rebre coaching sobre tàctiques de negociació i obtenir punts de discussió instantanis durant les trucades amb clients. Funciona amb qualsevol plataforma de reunions.

Necessito instal·lar alguna cosa més?

A macOS, instal·lar el controlador d'àudio virtual BlackHole (gratuït, codi obert) permet la captura d'àudio del sistema per a la transcripció. A Windows, no cal cap programari addicional. GeekBye s'encarrega de tot el resta.

Puc cancel·lar la subscripció en qualsevol moment?

Sí. Pots cancel·lar la teva subscripció Pro en qualsevol moment. El teu accés continua fins al final del teu període de facturació actual. El pla de per Vida és una compra única sense càrrecs recurrents.

GeekBye emmagatzema les meves gravacions d'entrevistes?

Totes les transcripcions i gravacions s'emmagatzemen localment al teu dispositiu en una base de dades encriptada. No es puja res a servidors al núvol. Tens control total per veure, exportar o eliminar les teves dades en qualsevol moment.

Com funcionen les dreceres de teclat?

Prem Cmd+Enter (macOS) o Ctrl+Enter (Windows) per capturar la teva pantalla i obtenir una resposta instantània de la IA. Prem Cmd+Shift+. per obrir l'informe de la reunió. Pots triar entre tres esquemes de dreceres predefinits durant la configuració per evitar conflictes amb el teu editor de codi.

Per què la transcripció amb IA sent malament els termes tècnics (i com ho vam arreglar)

El 2 de juliol vam executar una sessió de prova i vam fer a GeekBye una pregunta senzilla en veu alta: "What is the pointer in C++?"

El transcript en directe va respondre amb poesia:

[23:16:37] You: Tell me, what is the point in life? [23:16:52] You: Handy Plus. [23:17:02] You: What the pointer in Plus Plus? [23:17:09] You: C.

A la mateixa sessió, les mètriques de salut explicaven la resta: 3 connexions de transcripció caigudes en 163 segons i un forat de 51 segons al transcript. I una pista més que va acabar sent la més important: la nostra passada de recuperació post-sessió — que torna a transcriure l'àudio desat localment per omplir forats — va encertar gairebé la frase: "a pointer in plus, plus? What the pointer in plus, plus C++."

L'àudio estava bé. El model en directe simplement no tenia cap motiu per esperar C++.

Aquesta és la història de GeekBye v2.0.11, explicada a partir dels transcripts reals i dels logs de producció.

Per què els models de veu senten malament el teu vocabulari

El reconeixement de veu és un problema de predicció. Davant d'un àudio ambigu, el model tria les paraules més probables — i per a un model de propòsit general, "point in life" (el sentit de la vida) és una frase molt més probable que "pointer in C++" (un punter en C++). Qualsevol enginyer que hagi vist un transcript de reunió convertir Kubernetes en "cube and eddies" coneix aquest error.

La solució no és un micròfon millor. És el keyterm biasing: dir-li al model, abans que comenci la sessió, quines paraules improbables són probables per a tu. El nostre proveïdor de veu admet fins a 50 termes de biasing per sessió. I aquí ve la part vergonyosa: la canonada per a aquests termes existia d'extrem a extrem al nostre stack — client, backend, proveïdor — i mai res no l'havia omplert. Cada sessió funcionava amb zero ajuda de domini.

Solució 1: el teu perfil es converteix en el vocabulari del model

GeekBye ja coneix el teu domini — és al teu perfil actiu. La v2.0.11 deriva keyterms de biasing del nom i la descripció del perfil: termes amb símbols (C++, Node.js), acrònims (SQL, AWS), noms en camel case (TypeScript, PostgreSQL) i noms propis. Un perfil que esmenta el teu stack ara fa que aquest stack sigui esperat en lloc d'exòtic.

El dia que la solució ho va empitjorar tot

La nostra primera versió tractava cada paraula amb majúscula inicial com un nom propi. En una build de prova interna (això no va arribar mai als clients), un perfil escrit en prosa va enviar aquesta llista de biasing al model:

Senior, Writing, Direct, For, Includes, Write, Role, Intent…

Esbiaixar un model de veu cap a la paraula "For" és pitjor que no esbiaixar-lo gens. A la següent sessió de prova, la paraula "speak" — pronunciada amb claredat, diverses vegades — va tornar com "Clicky", "Hey, Vicky" i "Peter Paderty". La lliçó ens va costar una tarda: esbiaixa només amb termes distintius. Les paraules amb majúscula ara només compten quan apareixen a mitja frase (un senyal genuí de nom propi); els encapçalaments de markdown, on cada paraula va amb majúscula, no hi contribueixen mai. Aquell mateix perfil ara deriva exactament LinkedIn, AI, CEO, MCP — i la sessió de validació va transcriure correctament àudio multilingüe i de canvi ràpid durant 199 segons seguits, 189 segments de transcript, zero errors.

Solució 2: la cursa que feia caure les connexions

Els keyterms explicaven les paraules mal enteses. No explicaven les tres connexions caigudes.

Aquell rastre portava a un lloc més subtil. El nostre proveïdor fa commit (finalitza) de la transcripció segons la seva pròpia detecció d'activitat de veu, aproximadament un segon després que comenci el silenci. El nostre client també envia un commit de seguretat 250 mil·lisegons després del silenci, per buidar qualsevol frase parcial penjada. La confirmació del proveïdor que ja ha fet commit triga entre un i tres segons a tornar. Fes els comptes amb aquests tres números: sempre que el proveïdor feia commit primer, el nostre commit de seguretat es disparava contra un buffer gairebé buit — i la resposta del proveïdor no era només un rebuig educat. Feia caure la connexió. Cada pausa en la parla era llançar una moneda a l'aire.

La v2.0.11 incorpora dues capes contra això:

A l'app: quan arriba un transcript commitejat, el client ara sap que el buffer del proveïdor s'acaba de buidar i s'estalvia el commit de seguretat redundant.
Al nostre backend, el mateix dia: el proxy que hi ha entre l'app i el proveïdor replica exactament la comptabilitat d'àudio del proveïdor — veu cada frame d'àudio i cada confirmació de commit amb latència zero — i simplement es nega a reenviar qualsevol commit que el proveïdor rebutjaria. Aquesta capa protegeix totes les versions del client alhora, inclosos els usuaris que encara no s'han actualitzat.

El vam veure funcionar en producció en menys d'una hora. La guarda va interceptar commits condemnats que portaven 178ms i 256ms d'àudio al buffer — cadascun, abans d'aquell dia, una connexió caiguda garantida i un forat a les notes de reunió d'algú. Una sessió contínua de 60 minuts aquella tarda va registrar cinc intercepcions i zero caigudes. Abans de la solució, un usuari real aquell mateix matí havia reiniciat la gravació cinc vegades en sis minuts lluitant exactament contra aquest bug.

Dues correccions més petites que hi viatgen

Els insights d'IA ara esperen que hi hagi substància. Aquells fragments inintel·ligibles del principi alimentaven abans els xips de suggeriments en directe de GeekBye, que produïen amb tota confiança temes com "Defining Life's Ultimate Purpose" a partir d'una pregunta de C++ mal entesa. Els suggeriments ara esperen fins que la sessió té massa conversacional real.

El text recuperat rep el parlant correcte. La passada de recuperació que va transcriure correctament la nostra pregunta de C++ l'havia atribuïda a "Them". La línia de temps de l'àudio desat localment ara registra qui parlava, de manera que els segments recuperats s'atribueixen correctament a You o Them.

El marcador

Mètrica (mesurada, no estimada)	Abans	Després de v2.0.11 + guarda al backend
Caigudes de connexió a la sessió de prova	3 en 163s	0
Forat més llarg al transcript	51s	~6s de forat màxim en validació
"pointer in C++"	"point in life"	correcte, vocabulari esbiaixat
Commits condemnats que arriben al proveïdor	tots	0 (interceptats al backend)

Si estàs construint sobre APIs de veu en temps real

Tres lliçons transferibles d'aquesta versió:

Alimenta la funció de biasing. Si el teu proveïdor de STT admet keyterms/phrase hints, omplir-la amb un vocabulari petit i distintiu és el guany de precisió més barat que existeix — i omplir-la amb paraules comunes és una pèrdua de precisió.
No competeixis mai amb la màquina d'estats del proveïdor des del costat equivocat d'un viatge d'anada i tornada per la xarxa. El nostre client no podia guanyar una cursa d'informació de 250ms contra 3s. La guarda ha d'anar allà on convergeixen els dos senyals — en el nostre cas, el proxy del backend.
Valida amb una build real abans de publicar. La regressió dels keyterms es va detectar perquè cada versió de GeekBye es prova com a build signada i notaritzada contra producció abans de sortir. La versió dolenta va existir unes hores en una màquina interna, no al teu Mac.

GeekBye v2.0.11 ja està disponible — si ets a la v2, ja la tens via actualització automàtica. Per als fonaments de fiabilitat sobre els quals es construeix aquesta versió, consulta per què el teu notetaker d'IA es para amb mala Wi-Fi i què ha canviat a GeekBye v2. Per saber com funciona la transcripció en directe en el dia a dia, comença per transcripció en temps real a GeekBye.