Chris
Chris10 min de lectura

Claude Code vs Codex: la veritable habilitat és la literàcia agèntica

Tothom pregunta quin és millor. És la pregunta equivocada. Heus aquí en què et fa millor cada eina — i l'habilitat de 2026 que de debò importa: dirigir, despatxar i verificar agents.

Agents IA de Codi
Claude Code
Codex
Literàcia Agèntica
Eines IA
Claude Code vs Codex: la veritable habilitat és la literàcia agèntica

Tothom es fa la mateixa pregunta ara mateix: Claude Code vs Codex — quin és millor? La sento constantment. I crec que és la pregunta equivocada.

La millor pregunta és: en què et fa millor cada eina quan treballes amb agents? Perquè l'habilitat de 2026 no és triar un guanyador. És la literàcia agèntica — la capacitat de confiar feina real a un agent IA i de fiar-te del que torna.

Heus aquí el resum, just al principi: Claude Code fa que dirigir agents sembli natural. Codex fa que despatxar agents sembli natural. Aquesta diferència pot importar més que quin model encapçala un benchmark aquest mes, perquè t'està ensenyant un hàbit. I els hàbits són els que perduren.

Aquest és el moment Mac vs Windows dels agents

No perquè Claude sigui Mac i Codex sigui Windows — això és massa bonic. La qüestió és que les interfícies entrenen el comportament. Mac i Windows no només competien en funcions; van ensenyar a tota una generació per a què serveix un ordinador — on viu la feina, quant hauria d'amagar o mostrar la màquina, quant control hauries de tenir.

Claude i Codex ho estan fent ara amb els agents. Ens ensenyen en silenci per a què serveix un agent. I per això això importa fins i tot si no escrius mai una línia de codi.

Per què això no és només una baralla de desenvolupadors

El vocabulari sona intimidador — work trees, hooks, sandboxes, diffs — així que molta gent suposa que aquestes eines no són per a ells. Crec que és exactament al revés. És un dels primers debats sobre IA en què la gent no tècnica s'hauria d'obrir pas a la força, perquè els agents de codi són on apareixen primer els hàbits agèntics que tots farem servir.

Un chatbot respon. Un agent agafa una feina. Aquesta segona part — l'agent que agafa la feina — és el que tots hem d'aprendre a dirigir amb fluïdesa. Li dones una carpeta, un objectiu, una definició de "fet" i un límit del que té permès tocar. Després llegeix fitxers, executa eines, comprova què ha passat i torna amb una cosa que pots inspeccionar.

Aquest patró va aparèixer primer a la programació per una raó senzilla: el codi té una prova incorporada del que significa "bo". Funciona o no? La major part de la feina de coneixement mai no va ser tan neta. Ara els agents s'estan tornant prou bons perquè el mateix bucle — assigna una tasca, fixa un objectiu, usa eines, torna proves — s'estengui a la resta de la feina de coneixement. El món de la programació només ens dona el vocabulari primer.

Traduint l'argot

Un cop tradueixes els termes, tot el conjunt d'eines deixa de fer por. Aquestes són només les parts de qualsevol encàrrec seriós:

La paraula que fa por Què significa de debò
Context El rerefons i els fitxers que l'agent pot llegir
Permisos Què té permès tocar l'agent
Eines / MCP Els ajudants que pot cridar (navegador, terminal, les teves apps)
Mode pla Fer-lo pensar abans d'actuar
Hooks Comprovacions que s'executen automàticament
Sandbox / work tree Un lloc aïllat per treballar sense tocar tota la resta
Diff / prova El rebut que mostra què ha fet realment

Context, permisos, eines, punts de control, ajudants i proves. Això és senzillament com es veu fer feina de debò.

Claude Code: la cabina de pilotatge (dirigir)

Claude Code es percep com una cabina de pilotatge que estàs pilotant. Estàs a prop del model. Parles de la feina mentre passa. Li pots demanar que llegeixi el codi i et digui què està passant. Li pots demanar que t'entrevisti abans d'escriure l'especificació. El pots aturar, corregir, fer-lo repensar el pla.

Aquesta proximitat és un avantatge real quan la part difícil és el gust. Quan la feina és difusa — criteri de disseny, escriptura, arquitectura o simplement esbrinar la pregunta real — vols l'agent a prop. Li pots portar una versió a mig fer del problema, una cosa que encara no saps anomenar, i resoldre-ho junts.

Els usuaris seriosos de Claude no només fan xerrades. Usen el mode pla abans d'editar. Mantenen una nota permanent del projecte que diu com funciona el projecte, les ordres, les regles. Connecten hooks perquè les comprovacions importants s'executin automàticament. Reparteixen la feina entre sessions i llancen subagents.

El risc: muntes tu mateix bona part d'aquest sistema. Tu gestiones la finestra de context. Tu decideixes quan planificar, quan afegir un hook, quan executar un flux de treball. Si ets disciplinat, és increïblement potent. Si no, la conversa es converteix en un calaix de sastre i el context s'omple.

Codex: la taula de despatx (despatxar)

Codex es percep diferent. Es percep com una taula de despatx. Un fil llegeix una carpeta, un altre redacta un document, un altre comprova un paquet, un altre condueix un navegador — tot al mateix temps. La cua de feina és visible. Les feines queden separades. Les sortides són fàcils d'inspeccionar.

Això canvia el que estàs disposat a cedir. Amb Codex encara demanes ajuda per pensar, però molt més sovint dius: vés a fer aquesta part, porta'm els resultats i mostra'm la prova. Per al programari aquesta prova és un diff, una sortida de test, una pull request. Per a la feina de coneixement pot ser una llista de fonts, un document renderitzat o una taula comparativa. El sandbox vol dir que l'agent té un lloc aïllat per provar coses, i les automatitzacions en segon pla volen dir que pot despertar-se i executar-se més tard sense que el vigilis.

Apilat tot junt, això és una manera de fer que la feina dels agents sigui fàcil de gestionar — de delegar, separar i verificar.

El risc: una execució acabada pot fer que la feina sembli més acabada del que realment és. L'agent torna i diu "tasca completa", i a la superfície hi ha tots els senyals de progrés. Però potser ha seguit la instrucció massa literalment, ha optimitzat la completesa per damunt de la qualitat o ha produït un munt que triga més a revisar del que hauria trigat fer la tasca tu mateix.

La regla de decisió

Així doncs, a quina recorres? Una regla pràctica:

  • Usa Claude quan el problema necessita una conversa abans de poder convertir-se en un encàrrec — gust, ambigüitat, criteri de disseny, escriptura, arquitectura. Quan la forma de la pregunta és la part difícil.
  • Usa Codex quan la feina es pot escriure i delegar — quan hi ha fonts, fitxers, eines, comprovacions i artefactes per convocar; quan el paral·lelisme importa; quan una tasca repetida hauria de convertir-se en un flux de treball durador en lloc d'un sol intercanvi útil.
  • Usa les dues quan hi ha molt en joc. Deixa que un model planifiqui i l'altre critiqui. Deixa que un implementi i l'altre revisi. Deixa que un produeixi l'artefacte i un altre l'inspeccioni contra l'estàndard.

I vés amb compte amb quin mode de fallada entrenes. Claude et pot seduir amb una conversa estupenda i fer-te sentir més a prop de la feina del que estàs. Codex et pot convèncer que un flux de treball està acabat quan no ho està. Totes dues encara requereixen criteri. Totes dues encara requereixen proves.

La part que no es pot saltar — i on encaixa GeekBye

Heus aquí el centre honest de tot això: no desapareixes a l'era dels agents. Et mous cap a la part de la feina que no es pot saltar — decidir quina feina hauria d'existir, què vol dir "fet", quins riscos importen, quina prova compta i quan la sortida està a punt per sortir de la màquina.

Aquest mateix criteri apareix ara a la sala on es decideixen les carreres. Les entrevistes tècniques sondegen cada cop més com treballes amb agents IA — no només si pots escriure un algorisme des de zero. Sigui quina sigui l'eina que prefereixis, la metahabilitat és idèntica: dirigir, despatxar, verificar.

Aquí és on GeekBye es guanya el lloc. És l'assistent que s'executa al teu dispositiu i t'ajuda a aplicar aquest criteri en directe:

  • Ajuda i transcripció en temps real, perquè puguis pensar amb claredat sota pressió en lloc de quedar-te bloquejat — la funció Listen captura les dues bandes de la conversa a mesura que passa.
  • Privat per disseny. Les captures de pantalla es processen amb OCR al dispositiu i la teva biblioteca es queda a la teva màquina — els teus rebuts, no el servidor d'una altra persona.
  • Invisible durant les comparticions de pantalla, fent servir protecció de captura a nivell de sistema operatiu en lloc d'un truc de navegador.
  • Proves de les quals pots aprendre després. Cada sessió deixa un resum, punts clau i mètriques de rendiment, de manera que cada entrevista afina la següent.

Si t'estàs preparant per a rols d'enginyeria, la literàcia agèntica és l'entrevista ara — i la nostra guia per a entrevistes tècniques amb GeekBye explica com demostrar-la.

Preguntes freqüents

Això és només per a desenvolupadors? No. Els agents de codi són simplement on van arribar primer els hàbits, perquè el codi té una prova incorporada. El mateix bucle — assigna, fixa un objectiu, usa eines, exigeix proves — ja s'aplica a la recerca, l'escriptura i la feina operativa.

Amb quin hauria de començar, Claude Code o Codex? Comença amb el que coincideixi amb el teu coll d'ampolla. Si la teva part difícil és pensar a fons problemes difusos, comença amb Claude (dirigir). Si el teu coll d'ampolla és moure i verificar molta feina ben definida, comença amb Codex (despatxar).

Què és, exactament, la literàcia agèntica? L'habilitat d'escriure encàrrecs que tornen com a feina inspeccionada: saber quan dirigir, quan despatxar i quan verificar — i no confiar mai en un agent només perquè sona segur.

He de triar-ne un? No. Els usuaris més forts executen tots dos i deixen que es comprovin mútuament — un planifica, l'altre critica; un construeix, l'altre revisa.

En resum

No redueixis Claude Code vs Codex a un debat d'eines de codi, ni tan sols a un debat Mac vs Windows. Observa què et fa més fàcil cada eina imaginar — i què et fa més fàcil oblidar. Claude manté l'agent a prop mentre la feina encara s'està aclarint. Codex fa que la feina dels agents sembli assignable, paral·lela i inspeccionable. Els millors operadors fan servir totes dues.

La pregunta més important no és quin agent és més llest. És: quina feina sóc capaç d'executar ara i quina prova em faria confiar-hi? Respon això, construeix l'hàbit i ja vas per davant.