GeekByeとは何ですか？

通話を聞いて、難しい質問にその場で回答するのを助けるリアルタイムAIアシスタントです。会話をライブで文字起こしし、システム上で目に見えず動作します - あなただけが見ることができます。

どんな人向けですか？

プレッシャーのかかる会話をする方向けです。技術面接に臨む求職者、異議に対応する営業担当者、口頭試験を受ける学生、重要な会議に出席する役員など。難しいトピックについて自信を持って話す必要がある方のためのツールです。

議事録ツールと何が違いますか？

ほとんどのAIツールは会議終了後に要約を作成します。GeekByeはリアルタイムで動作し、質問されたその場で回答を提供し、会話中にトークポイントを表示します。まるで耳元で専門家がささやいてくれるような感覚です。

通話中の他の人に見えますか？

いいえ。GeekByeはローカルで動作し、参加者やボットとして参加しません。オーバーレイはあなたにだけ見えます - 画面録画、画面共有、参加者リストには表示されません。

どのプラットフォームに対応していますか？

Zoom、Microsoft Teams、Google Meet、Webex、およびすべてのブラウザベースのプラットフォーム。Zoomの場合：バージョン6.1.6以前を使用するか、[ウィンドウフィルタリングを使用した高度なキャプチャ](https://support.zoom.us/hc/en/article?id=zm_kb&sysparm_article=KB0063824#:~:text=Advanced%20capture%20with%20window%20filtering,from%20the%20Zoom%20desktop%20app.)を有効にしてください。

無料プランには何が含まれていますか？

月間のAI回答数に制限がありますが、いくつかの面接や会議でテストするには十分です。すべての基本機能を利用できます。Proプランでは制限が解除され、多言語サポートも追加されます。

データは安全ですか？

はい。データは暗号化されており、情報を販売することはありません。

GeekByeはコーディング面接で使えますか？

はい。GeekByeはリアルタイムで画面をキャプチャし、アルゴリズムの問題、システム設計の質問、デバッグの課題、コード最適化のソリューションを提供します。あらゆるコーディング環境やオンライン評価プラットフォームで動作します。

行動面接でも役立ちますか？

もちろんです。GeekByeは行動面接の質問を聞き、構造化されたSTARメソッドの回答、関連するトークポイント、会話のコンテキストに基づくフォローアップの回答を提案します。

GeekByeはどの言語に対応していますか？

GeekByeは文字起こしとAI回答の両方で33言語に対応しています。文字起こし言語をAI出力言語とは別に設定できるため、英語で面接を受ける非ネイティブ英語話者に便利です。

AI回答の速度はどのくらいですか？

ショートカットを押してから2〜3秒以内に回答のストリーミングが始まります。会話を続けている間にAIがすぐに生成を開始するため、気まずい沈黙はありません。

macOSとWindowsの両方で動作しますか？

はい。GeekByeはmacOS（14.0 Sonoma以降）とWindowsの両方でネイティブに動作します。画面キャプチャの不可視性は、ネイティブのOSレベルのコンテンツ保護を使用して両方のプラットフォームで機能します。

面接官はGeekByeを検出できますか？

いいえ。GeekByeはOSのネイティブコンテンツ保護を使用して、すべての画面キャプチャ、録画、共有から自身を除外します。ボットや参加者として通話に参加することはありません。ブラウザ拡張機能も、注入コードも、ネットワークの痕跡もありません。

会議が終わるとどうなりますか？

GeekByeは重要ポイント、アクションアイテム、改善提案を含む完全な会議サマリーを生成します。さらに、6つのコミュニケーション指標に基づいてパフォーマンスを評価し、トランスクリプトに基づいた具体的なフィードバックを提供します。

文字起こしはどのように機能しますか？

GeekByeはマイクの音声と会議プラットフォームのシステム音声を同時にキャプチャします。AIの音声認識を使用してリアルタイムで文字起こしするため、会話の両者の完全な記録を取得できます。

会議の長さに制限はありますか？

いいえ。無料プランとProプランの両方で無制限の会議時間をサポートしています。文字起こしは会議が続く限り中断やカットオフなしで継続的に実行されます。

GeekByeを営業通話に使えますか？

はい。営業のプロフェッショナルはGeekByeを使って、リアルタイムで異議に対処し、交渉戦術のコーチングを受け、クライアント通話中に即座にトークポイントを取得しています。あらゆる会議プラットフォームで動作します。

他に何かインストールする必要がありますか？

macOSでは、BlackHole仮想オーディオドライバー（無料、オープンソース）をインストールすると、文字起こし用のシステム音声キャプチャが有効になります。Windowsでは追加ソフトウェアは不要です。GeekByeがその他すべてを処理します。

いつでもサブスクリプションをキャンセルできますか？

はい。Proサブスクリプションはいつでもキャンセルできます。現在の請求期間の終了まではアクセスが継続します。Lifetimeプランは一回限りの購入で、定期的な課金はありません。

GeekByeは面接の録音を保存しますか？

すべての文字起こしと録音は、暗号化されたデータベースでデバイスにローカル保存されます。クラウドサーバーにはアップロードされません。データの閲覧、エクスポート、削除はいつでも自由に行えます。

キーボードショートカットはどのように機能しますか？

Cmd+Enter（macOS）またはCtrl+Enter（Windows）を押して画面をキャプチャし、即座にAI回答を取得します。Cmd+Shift+.を押して会議レポートを開きます。セットアップ時に3つのプリセットショートカットスキームから選択して、コードエディタとの競合を避けることができます。

AIノートテイカーはなぜ会議の途中で録音を止めるのか

7月2日、GeekByeは会議の録音を勝手に終了しました。データベースの行がすべてを物語っています。ended_reason = 'idle'、継続時間519秒、トランスクリプトエントリ99件 — 最後の1件が書き込まれたのは、アプリが「誰もいない」と判断する2秒前でした。

相手の参加者は説明の真っ最中でした。トランスクリプトの最終行は、文字どおり文の断片です: "...executes it or turns it on or so—"。

初めてではありませんでした。その前の晩にも、別のセッションが同じ形で終了していました。2つの会議が、私たち自身の信頼性機能によって殺されたのです。これはその診断と、GeekBye v2.0.9で出荷された修正の記録 — そして同じリリースで修正した、もう一つのより恐ろしいバグの話です。

あなたの声しか聞こえない、善意のタイマー

アイドル自動クローズには、ちゃんとした理由があります。録音を一晩中回しっぱなしにして忘れる人がいますし、開きっぱなしの会議タブは音声を延々と垂れ流し続けます。そこでGeekByeは非アクティブ状態を監視します。有声のアクティビティが60秒間ないと、小さな "Still recording?"(まだ録音中ですか?)プロンプトを表示し、その30秒後、応答がなければセッションを終了します — すべてを保存した上で、丁寧に。

欠陥は一語にありました: 有声(voiced)。アクティビティの時計は持続的なマイクのエネルギーだけをカウントしていたのです。これは意図的な設計判断で、愚かなものではありません — システム音声の生のエネルギーをカウントすると、ミュート中でも音が鳴っているタブが死んだセッションを永遠に生かし続けてしまい、それこそがこの機能が防ぐために存在する失敗そのものだからです。主に聞き役に回る会議は、会議ウィンドウ検出でカバーされるはずでした。

ただし、会議検出はすべての会議を見つけられるわけではありません。ブラウザのタブ、珍しいクライアント、視聴中のプレゼンテーション — これらは検出されません。そして検出されていない会議で90秒間聞き役に回ると — 誰かがDatabricksのパイプラインを説明している間なら、完全に普通のことです — あなたはアイドルの時計から見て、空っぽの部屋と区別がつかなくなるのです。

殺されたセッションのタイムラインを確認してみましょう。こちらのマイクからの最後のトランスクリプトは、終了の68秒前でした。それから相手が話す60秒(完璧に文字起こしされたのに、時計には無視された)、気づかれなかったプロンプト、30秒のカウントダウン、そしてキル — 相手の最後の言葉の2秒後でした。

修正: トランスクリプトは生存の証明

修正内容は、振り返ると恥ずかしくなるほど単純です。届いたトランスクリプトこそ、セッションがアイドルではないことの最強の証拠である。 誰が話したかは関係ありません。音声モデルがたった今、言葉を認識した — それこそが会議そのものなのです。

そこでv2.0.9は、どちら側からのものであれ、トランスクリプトが到着するたびにアクティビティの時計にスタンプを押します。システム音声の生のエネルギーは今でもカウントされません — 音楽も、保留音も、空調のうなりも、死んだセッションを不死にはできませんし、録音のハードキャップは今もすべての最終防衛線として機能します。認識された発話だけがセッションを生かし続ける。これがまさに正しい境界線です。

コードレビューから得た、伝える価値のあるディテールを一つ。修正の最初のバージョンは、話者帰属パスの内側で時計にスタンプを押していました — このパスは、一部のトランスクリプトが正当にスキップし得るものです。レビューは、将来の変更が、まさに重要なトランスクリプト(相手側の発話)についてこのバグを静かに再発させかねないことを見抜きました。スタンプは今では無条件で、あらゆる分岐より前に置かれ、誰かがそれを動かせば失敗するテストが付いています。

同じリリースが、もっと恐ろしいものを修正した

これらの修正をテストしている最中に、別のバグを身をもって踏み抜きました。インターフェースプロセスのクラッシュが、デスクトップ全体をクリック不能にしたのです。

GeekByeのオーバーレイは、画面を覆う透明で常に最前面のウィンドウです。デフォルトではクリックスルーで、パネルを使っているときだけインターフェースがインタラクティブに切り替えます。その切り替えはインターフェースプロセスから来ます — つまり、パネルを開いた状態でそのプロセスがクラッシュすると、不可視のウィンドウは、背後に生きたUIが何もないままインタラクティブモードに留まります。デスクトップへのクリックはすべて、死んだ不可視のペインに着弾する。唯一の脱出方法は、アプリの強制終了でした。

v2.0.9のクラッシュハンドラは、クリックスルーを即座に復元し、インターフェースをリロードします — クラッシュループが永遠に回らないよう、1分あたり3回のリロード上限付きです(上限を超えるとアプリはリロードを諦めますが、あなたのデスクトップは使える状態のまま。そこが肝心な部分です)。こちらもコードレビューが研ぎ澄ませました。リカバリはオーバーレイウィンドウに限定してスコープされています。クラッシュした通常のウィンドウ — たとえばアップデートダイアログ — にまで一律にクリックスルーを適用していたら、正反対のロックアウトを生んでいたからです。

この修正は、自分の手で乱暴に検証できます。GeekByeのパネルを開き、アクティビティモニタで "GeekBye Helper (Renderer)" プロセスを強制終了し、アプリが1秒以内にデスクトップを取り戻すのを見てください。

この一対のバグが教えてくれたこと

「ユーザーはここにいるか?」の代理指標は、どれもどこかで失敗する。 マイクのエネルギーは聞き役で失敗する。ウィンドウ検出はブラウザで失敗する。認識されたトランスクリプトが失敗するのは...今のところ見つかっていません。代理指標ではなく、プロダクトそのものだからです。
レンダラー駆動のものには、すべてクラッシュ時のストーリーが必要。 死んだUIプロセスがOSレベルの状態(マウスキャプチャ、常に最前面、コンテンツ保護)を残し得るなら、リセットの責任はメインプロセスが持たなければなりません。
自分たち自身が最もヘビーなユーザーであることは、バグ発見の戦略になる。 どちらのバグも、ほんの一握りの顧客が気づくより前に、実際の会議で私たちを直撃しました。数か月前に可観測性のために追加していた ended_reason カラムのおかげで、診断は推測ではなくデータベースクエリで済んだのです。

どちらの修正も、診断から公証済みリリースの出荷まで1日以内に到達し、それぞれリグレッションテスト付きのレビュー済みPRで運ばれました。GeekBye v2をお使いなら、v2.0.9以降、自動アップデートですでに適用されています。

このリリースの物語の続きは、同シリーズのAI文字起こしはなぜ専門用語を聞き間違えるのか(v2.0.11)、信頼性の土台となった悪いWi-FiでAIノートテイカーが止まる理由、そしてオーバーレイがあなたのクリックを奪わずに画面共有中に不可視のままでいる仕組みをご覧ください。

AIノートテイカーはなぜ会議の途中で録音を止めるのか

あなたの声しか聞こえない、善意のタイマー

修正: トランスクリプトは生存の証明

同じリリースが、もっと恐ろしいものを修正した

この一対のバグが教えてくれたこと

関連記事

AI文字起こしはなぜ専門用語を聞き間違えるのか(そして私たちはどう直したか)

会議からエージェントへ：話したことを、AIが実行できる仕事に変える

Claude Code vs Codex：本当のスキルは「エージェント・リテラシー」