GeekBye क्या है?

एक रियल-टाइम AI असिस्टेंट जो आपकी कॉल्स सुनता है और मौके पर कठिन सवालों का जवाब देने में मदद करता है। यह बातचीत को लाइव ट्रांसक्राइब करता है और आपके सिस्टम पर अदृश्य रूप से चलता है - केवल आप इसे देख सकते हैं।

यह किसके लिए है?

तनावपूर्ण बातचीत में कोई भी - टेक्निकल इंटरव्यू में नौकरी खोजने वाले, आपत्तियां संभालने वाले सेल्स पेशेवर, मौखिक परीक्षा में छात्र, या महत्वपूर्ण मीटिंग्स में अधिकारी। अगर आपको कठिन विषयों पर आत्मविश्वास से बोलना है, तो हम आपके साथ हैं।

यह नोट-टेकर्स से कैसे अलग है?

ज्यादातर AI टूल्स आपकी मीटिंग खत्म होने के बाद सारांश बनाते हैं। GeekBye लाइव काम करता है - सवाल पूछे जाते ही उनका जवाब देता है और बातचीत के दौरान आपको बात करने के पॉइंट्स देता है। जैसे एक विशेषज्ञ आपके कान में फुसफुसा रहा हो।

क्या कॉल पर दूसरे लोग इसे देख पाएंगे?

नहीं। GeekBye आपके कंप्यूटर पर चलता है और कभी प्रतिभागी या बॉट के रूप में जुड़ता नहीं। ओवरले केवल आपको दिखाई देता है - यह स्क्रीन रिकॉर्डिंग, स्क्रीन शेयर, या प्रतिभागियों की सूची में नहीं दिखेगा।

यह कौन से प्लेटफॉर्म सपोर्ट करता है?

Zoom, Microsoft Teams, Google Meet, Webex, और कोई भी ब्राउज़र-आधारित प्लेटफॉर्म। Zoom के लिए: version 6.1.6 या पहले वाला उपयोग करें, या [Advanced capture with window filtering](https://support.zoom.us/hc/en/article?id=zm_kb&sysparm_article=KB0063824#:~:text=Advanced%20capture%20with%20window%20filtering,from%20the%20Zoom%20desktop%20app.) सक्षम करें।

मुफ्त में क्या शामिल है?

प्रति माह सीमित AI रिस्पॉन्स - कुछ इंटरव्यू या मीटिंग्स में परीक्षण के लिए पर्याप्त। सभी मुख्य सुविधाएं शामिल। Pro सीमाएं हटाता है और बहु-भाषा समर्थन जोड़ता है।

क्या मेरा डेटा सुरक्षित है?

हां। आपका डेटा एन्क्रिप्टेड है और हम आपकी जानकारी कभी नहीं बेचते।

क्या GeekBye कोडिंग इंटरव्यू में काम करता है?

हां। GeekBye रियल-टाइम में आपकी स्क्रीन कैप्चर करता है और एल्गोरिदम समस्याओं, सिस्टम डिज़ाइन सवालों, डीबगिंग चुनौतियों और कोड ऑप्टिमाइज़ेशन के लिए समाधान प्रदान करता है। यह किसी भी कोडिंग वातावरण या ऑनलाइन मूल्यांकन प्लेटफॉर्म के साथ काम करता है।

क्या यह बिहेवियरल इंटरव्यू में मदद कर सकता है?

बिल्कुल। GeekBye बिहेवियरल सवालों को सुनता है और संरचित STAR-मेथड रिस्पॉन्स, प्रासंगिक बात करने के पॉइंट्स और बातचीत के संदर्भ के आधार पर फॉलो-अप जवाब सुझाता है।

GeekBye कौन सी भाषाएं सपोर्ट करता है?

GeekBye ट्रांसक्रिप्शन और AI रिस्पॉन्स दोनों के लिए 33 भाषाएं सपोर्ट करता है। आप अपनी ट्रांसक्रिप्शन भाषा को AI आउटपुट भाषा से अलग सेट कर सकते हैं, जो अंग्रेज़ी में इंटरव्यू देने वाले गैर-अंग्रेज़ी भाषी लोगों के लिए उपयोगी है।

AI रिस्पॉन्स कितनी तेज़ हैं?

शॉर्टकट दबाने के 2-3 सेकंड के भीतर रिस्पॉन्स आने शुरू हो जाते हैं। AI तुरंत जनरेट करना शुरू कर देता है जबकि आप अपनी बातचीत जारी रखते हैं, इसलिए कोई अजीब रुकावट नहीं होती।

क्या यह macOS और Windows पर काम करता है?

हां। GeekBye macOS (14.0 Sonoma या बाद का) और Windows दोनों पर नेटिव रूप से चलता है। स्क्रीन कैप्चर इनविज़िबिलिटी दोनों प्लेटफॉर्म पर नेटिव OS-लेवल कंटेंट प्रोटेक्शन का उपयोग करके काम करती है।

क्या इंटरव्यूअर GeekBye का पता लगा सकता है?

नहीं। GeekBye ऑपरेटिंग सिस्टम के नेटिव कंटेंट प्रोटेक्शन का उपयोग करके खुद को सभी स्क्रीन कैप्चर, रिकॉर्डिंग और शेयर से बाहर रखता है। यह कभी भी बॉट या प्रतिभागी के रूप में कॉल में शामिल नहीं होता। कोई ब्राउज़र एक्सटेंशन नहीं, कोई इंजेक्टेड कोड नहीं, और कोई नेटवर्क ट्रेस नहीं।

मीटिंग खत्म होने के बाद क्या होता है?

GeekBye एक पूर्ण मीटिंग सारांश बनाता है जिसमें मुख्य बिंदु, कार्य-सूची और सुधार सुझाव शामिल होते हैं। यह छह कम्युनिकेशन मेट्रिक्स पर आपके प्रदर्शन को स्कोर भी करता है, साथ ही ट्रांसक्रिप्ट-आधारित विशिष्ट फीडबैक देता है।

ट्रांसक्रिप्शन कैसे काम करता है?

GeekBye आपके माइक्रोफोन ऑडियो और मीटिंग प्लेटफॉर्म के सिस्टम ऑडियो दोनों को एक साथ कैप्चर करता है। यह AI स्पीच रिकग्निशन का उपयोग करके रियल-टाइम में ट्रांसक्राइब करता है, ताकि आपको बातचीत के दोनों पक्षों का पूरा रिकॉर्ड मिल सके।

क्या मीटिंग की अवधि की कोई सीमा है?

नहीं। फ्री और Pro दोनों प्लान असीमित मीटिंग अवधि को सपोर्ट करते हैं। ट्रांसक्रिप्शन बिना किसी कटऑफ या रुकावट के जब तक आपकी मीटिंग चलती है तब तक लगातार चलता रहता है।

क्या मैं सेल्स कॉल के लिए GeekBye का उपयोग कर सकता/सकती हूं?

हां। सेल्स पेशेवर GeekBye का उपयोग रियल-टाइम में आपत्तियां संभालने, बातचीत की रणनीतियों पर कोचिंग पाने और क्लाइंट कॉल के दौरान तुरंत बात करने के पॉइंट्स प्राप्त करने के लिए करते हैं। यह किसी भी मीटिंग प्लेटफॉर्म के साथ काम करता है।

क्या मुझे कुछ और इंस्टॉल करने की ज़रूरत है?

macOS पर, BlackHole वर्चुअल ऑडियो ड्राइवर (मुफ्त, ओपन सोर्स) इंस्टॉल करने से ट्रांसक्रिप्शन के लिए सिस्टम ऑडियो कैप्चर सक्षम हो जाता है। Windows पर, किसी अतिरिक्त सॉफ्टवेयर की ज़रूरत नहीं है। GeekBye बाकी सब संभालता है।

क्या मैं कभी भी अपनी सदस्यता रद्द कर सकता/सकती हूं?

हां। आप अपनी Pro सदस्यता कभी भी रद्द कर सकते हैं। आपकी एक्सेस मौजूदा बिलिंग अवधि के अंत तक जारी रहती है। Lifetime प्लान एकबारगी खरीदारी है जिसमें कोई आवर्ती शुल्क नहीं है।

क्या GeekBye मेरी इंटरव्यू रिकॉर्डिंग स्टोर करता है?

सभी ट्रांसक्रिप्ट और रिकॉर्डिंग आपके डिवाइस पर एन्क्रिप्टेड डेटाबेस में स्थानीय रूप से स्टोर होती हैं। क्लाउड सर्वर पर कुछ भी अपलोड नहीं किया जाता। आपके पास कभी भी अपना डेटा देखने, निर्यात करने या हटाने का पूरा नियंत्रण है।

कीबोर्ड शॉर्टकट कैसे काम करते हैं?

अपनी स्क्रीन कैप्चर करने और तुरंत AI रिस्पॉन्स पाने के लिए Cmd+Enter (macOS) या Ctrl+Enter (Windows) दबाएं। अपनी मीटिंग रिपोर्ट खोलने के लिए Cmd+Shift+. दबाएं। आप सेटअप के दौरान तीन प्रीसेट शॉर्टकट स्कीम में से चुन सकते हैं ताकि आपके कोड एडिटर से कोई टकराव न हो।

AI ट्रांसक्रिप्शन तकनीकी शब्दों को गलत क्यों सुनता है (और हमने इसे कैसे ठीक किया)

2 जुलाई को हमने एक टेस्ट सेशन चलाया और GeekBye से बोलकर एक सीधा-सा सवाल पूछा: "What is the pointer in C++?" (C++ में पॉइंटर क्या है?)

लाइव ट्रांसक्रिप्ट ने जवाब में शायरी सुना दी:

[23:16:37] You: Tell me, what is the point in life? [23:16:52] You: Handy Plus. [23:17:02] You: What the pointer in Plus Plus? [23:17:09] You: C.

यानी "pointer in C++" (C++ का पॉइंटर) बन गया "point in life" (जिंदगी का मकसद)। उसी सेशन के हेल्थ मेट्रिक्स ने बाकी कहानी बताई: 163 सेकंड में 3 बार ट्रांसक्रिप्शन कनेक्शन गिरा और ट्रांसक्रिप्ट में 51 सेकंड का छेद। और एक सुराग ऐसा था जो बाद में सबसे अहम साबित हुआ: हमारा सेशन के बाद चलने वाला रिकवरी पास — जो गैप भरने के लिए लोकली सेव किए गए ऑडियो को दोबारा ट्रांसक्राइब करता है — उस वाक्य को लगभग सही पकड़ गया: "a pointer in plus, plus? What the pointer in plus, plus C++."

ऑडियो बिल्कुल ठीक था। लाइव मॉडल के पास बस C++ की उम्मीद करने की कोई वजह नहीं थी।

यह GeekBye v2.0.11 की कहानी है, असली ट्रांसक्रिप्ट्स और प्रोडक्शन लॉग्स की जुबानी।

स्पीच मॉडल आपकी शब्दावली गलत क्यों सुनते हैं

स्पीच रिकग्निशन एक प्रेडिक्शन की समस्या है। अस्पष्ट ऑडियो मिलने पर मॉडल सबसे संभावित शब्द चुनता है — और एक जनरल-पर्पस मॉडल के लिए "point in life" जैसा वाक्यांश "pointer in C++" से कहीं ज्यादा संभावित है। जिस भी इंजीनियर ने मीटिंग ट्रांसक्रिप्ट में Kubernetes को "cube and eddies" बनते देखा है, वह इस नाकामी से मिल चुका है।

इसका इलाज बेहतर माइक्रोफोन नहीं है। इलाज है keyterm biasing: सेशन शुरू होने से पहले मॉडल को बताना कि कौन से असामान्य शब्द आपके लिए सामान्य हैं। हमारा स्पीच प्रोवाइडर प्रति सेशन 50 biasing terms तक सपोर्ट करता है। और अब शर्मिंदगी वाली बात: इन terms की पूरी प्लंबिंग हमारे स्टैक में एंड-टू-एंड मौजूद थी — क्लाइंट, backend, प्रोवाइडर — लेकिन उसमें कभी किसी ने कुछ भरा ही नहीं था। हर सेशन शून्य डोमेन मदद के साथ चल रहा था।

फिक्स 1: आपका प्रोफाइल मॉडल की शब्दावली बन जाता है

GeekBye आपकी डोमेन पहले से जानता है — वह आपके एक्टिव प्रोफाइल में लिखी है। v2.0.11 प्रोफाइल के नाम और विवरण से biasing keyterms निकालता है: सिंबल वाले शब्द (C++, Node.js), संक्षिप्त रूप (SQL, AWS), camel-case नाम (TypeScript, PostgreSQL), और proper nouns। आपके स्टैक का जिक्र करने वाला प्रोफाइल अब उस स्टैक को अजीब नहीं, बल्कि अपेक्षित बना देता है।

वह दिन जब फिक्स ने सब कुछ बिगाड़ दिया

हमारे पहले वर्जन ने हर capitalized शब्द को proper noun मान लिया। एक इंटरनल टेस्ट बिल्ड पर (यह कभी ग्राहकों तक नहीं पहुंचा), गद्य में लिखे एक प्रोफाइल ने मॉडल को यह biasing लिस्ट भेज दी:

Senior, Writing, Direct, For, Includes, Write, Role, Intent…

स्पीच मॉडल को "For" जैसे शब्द की ओर bias करना, bias न करने से भी बदतर है। ठीक अगले टेस्ट सेशन में, साफ-साफ और कई बार बोला गया शब्द "speak" लौटकर आया "Clicky", "Hey, Vicky" और "Peter Paderty" बनकर। इस सबक की कीमत हमारी एक दोपहर थी: सिर्फ विशिष्ट (distinctive) terms से bias करो। Capitalized शब्द अब सिर्फ तभी गिने जाते हैं जब वे वाक्य के बीच में आएं (जो proper noun का असली संकेत है); markdown हेडिंग्स, जहां हर शब्द capitalized होता है, कभी योगदान नहीं देतीं। वही प्रोफाइल अब ठीक-ठीक LinkedIn, AI, CEO, MCP निकालता है — और वैलिडेशन सेशन ने बहुभाषी, तेजी से स्विच होते ऑडियो को लगातार 199 सेकंड तक सही ट्रांसक्राइब किया, 189 ट्रांसक्रिप्ट सेगमेंट, शून्य गलतियां।

फिक्स 2: वह रेस जो कनेक्शन गिरा रही थी

Keyterms ने गलत सुने गए शब्दों की गुत्थी सुलझा दी। लेकिन तीन कनेक्शन ड्रॉप्स की नहीं।

वह सुराग कहीं ज्यादा बारीक जगह ले गया। हमारा प्रोवाइडर अपनी voice-activity detection के आधार पर, खामोशी के करीब एक सेकंड बाद, ट्रांसक्रिप्शन को खुद commit (फाइनल) कर देता है। हमारा क्लाइंट भी किसी अधूरे लटके वाक्य को flush करने के लिए, खामोशी के 250 मिलीसेकंड बाद एक safety commit भेजता है। प्रोवाइडर की यह पुष्टि कि उसने पहले ही commit कर दिया है, वापस पहुंचने में एक से तीन सेकंड लेती है। अब इन तीन आंकड़ों का हिसाब लगाइए: जब भी प्रोवाइडर पहले commit करता, हमारा safety commit लगभग खाली बफर पर दागा जाता — और उस पर प्रोवाइडर की प्रतिक्रिया कोई विनम्र इनकार नहीं थी। वह कनेक्शन ही गिरा देता था। बोलते-बोलते हर ठहराव एक सिक्का उछालने जैसा था।

v2.0.11 इसके खिलाफ दो परतें लेकर आया है:

ऐप में: जब कोई committed ट्रांसक्रिप्ट पहुंचता है, तो क्लाइंट अब जानता है कि प्रोवाइडर का बफर अभी-अभी flush हुआ है, और वह फालतू safety commit को छोड़ देता है।
हमारे backend में, उसी दिन: ऐप और प्रोवाइडर के बीच बैठा proxy प्रोवाइडर की ऑडियो अकाउंटिंग की हूबहू नकल रखता है — वह हर ऑडियो फ्रेम और हर commit पुष्टि को शून्य लेटेंसी पर देखता है — और ऐसे किसी भी commit को आगे भेजने से ही मना कर देता है जिसे प्रोवाइडर ठुकराने वाला हो। यह परत एक साथ हर क्लाइंट वर्जन की रक्षा करती है, उन यूज़र्स की भी जिन्होंने अपडेट नहीं किया है।

हमने इसे एक घंटे के भीतर प्रोडक्शन में काम करते देखा। Guard ने 178ms और 256ms बफर्ड ऑडियो वाले बर्बाद commits को रोका — उस दिन से पहले इनमें से हर एक का मतलब था पक्का कनेक्शन ड्रॉप और किसी की मीटिंग नोट्स में एक गैप। उसी दोपहर 60 मिनट के लगातार सेशन में पांच बार रोका गया और शून्य ड्रॉप दर्ज हुए। फिक्स से पहले, उसी सुबह एक असली यूज़र ने ठीक इसी बग से जूझते हुए छह मिनट में पांच बार अपनी रिकॉर्डिंग रीस्टार्ट की थी।

साथ में आए दो छोटे फिक्स

AI insights अब ठोस सामग्री का इंतजार करते हैं। शुरुआत के वे बिगड़े हुए टुकड़े पहले GeekBye के लाइव सजेशन चिप्स में चले जाते थे, जो एक गलत सुने गए C++ सवाल से "Defining Life's Ultimate Purpose" (जीवन का परम उद्देश्य परिभाषित करना) जैसे टॉपिक पूरे आत्मविश्वास से बना देते थे। सुझाव अब तब तक रुकते हैं जब तक सेशन में असली बातचीत का वजन न आ जाए।

रिकवर हुए टेक्स्ट को सही वक्ता मिलता है। जिस रिकवरी पास ने हमारा C++ सवाल सही ट्रांसक्राइब किया था, उसने उसे "Them" (सामने वाले) के नाम कर दिया था। लोकली सेव होने वाली ऑडियो टाइमलाइन अब यह भी दर्ज करती है कि कौन बोल रहा था, इसलिए रिकवर हुए सेगमेंट सही तरीके से You या Them को मिलते हैं।

स्कोरबोर्ड

मेट्रिक (मापा गया, अनुमान नहीं)	पहले	v2.0.11 + backend guard के बाद
टेस्ट सेशन में कनेक्शन ड्रॉप	163s में 3	0
ट्रांसक्रिप्ट का सबसे लंबा छेद	51s	वैलिडेशन में सबसे खराब गैप ~6s
"pointer in C++"	"point in life"	सही, biased शब्दावली के साथ
प्रोवाइडर तक पहुंचने वाले बर्बाद commits	सारे के सारे	0 (backend पर रोके गए)

अगर आप realtime speech APIs पर कुछ बना रहे हैं

इस रिलीज़ से तीन सबक जो कहीं भी काम आएंगे:

Biasing फीचर को खुराक दो। अगर आपका STT प्रोवाइडर keyterms/phrase hints सपोर्ट करता है, तो उसमें एक छोटी, विशिष्ट शब्दावली भरना accuracy की सबसे सस्ती जीत है — और उसमें आम शब्द भरना accuracy का घाटा।
नेटवर्क राउंड-ट्रिप के गलत छोर से प्रोवाइडर की अपनी state machine से कभी रेस मत लगाओ। हमारा क्लाइंट 250ms बनाम 3 सेकंड की सूचना-रेस नहीं जीत सकता था। Guard वहां होना चाहिए जहां दोनों सिग्नल मिलते हैं — हमारे लिए वह जगह backend proxy थी।
पब्लिश करने से पहले लाइव बिल्ड पर वैलिडेट करो। Keyterms वाला regression इसलिए पकड़ा गया क्योंकि GeekBye की हर रिलीज़ शिप होने से पहले एक signed, notarized बिल्ड के रूप में प्रोडक्शन के खिलाफ टेस्ट होती है। खराब वर्जन कुछ घंटों तक सिर्फ एक इंटरनल मशीन पर रहा, आपके Mac पर नहीं।

GeekBye v2.0.11 अब लाइव है — अगर आप v2 पर हैं, तो auto-update के जरिए यह आपके पास पहले से है। जिस विश्वसनीयता की नींव पर यह रिलीज़ खड़ी है, उसके लिए पढ़ें खराब Wi-Fi पर आपका AI notetaker क्यों रुक जाता है और GeekBye v2 में क्या बदला। लाइव ट्रांसक्रिप्शन रोजमर्रा में कैसे काम करता है, इसके लिए शुरुआत करें GeekBye में रियल-टाइम ट्रांसक्रिप्शन से।