CLASE 03 · EMPRESA · PLATAFORMA · MODELO · COSTE · DECISIÓN

Qué motor llevas debajo del capó

"Uso Claude" o "uso ChatGPT" no significa nada. Dentro hay varios motores con velocidades, capacidades y precios muy distintos. Si usas el motor equivocado, pagas hasta siete veces más por hacer exactamente lo mismo. En esta clase aprendes a abrir el capó.

Actualizado a mayo de 2026. Los nombres de modelos cambian cada pocos meses. La lógica para elegir, no.

Empezar la clase ↓ Saltar al resumen final
01

Recordatorio: empresa, plataforma, modelo

Si has visto la Clase 02, esto te suena. Lo repaso en una página para que no haya que volver atrás.

Técnico

Tres niveles que la gente mezcla constantemente y que conviene tener separados:

Empresa: quien fabrica el sistema de IA. Anthropic, OpenAI, Google, DeepSeek, xAI, Meta.

Plataforma: la marca o producto público. Claude (de Anthropic), ChatGPT (de OpenAI), Gemini (de Google).

Modelo: el motor concreto que está respondiendo. Es lo que de verdad importa, porque es lo que define velocidad, capacidad y coste.

Cada empresa tiene normalmente una sola plataforma de cara al público, pero dentro de esa plataforma conviven varios modelos, organizados por capacidad y precio.

Cuando pagas la suscripción, no estás pagando "por usar Claude" o "por usar ChatGPT". Estás pagando por acceder a un conjunto de modelos, y cada respuesta que recibes la genera uno de ellos. Cuál concretamente, depende de qué hayas seleccionado o qué decida la plataforma por defecto.

Kuki lenguaje

Imagínalo como un concesionario de coches.

La empresa es la marca: BMW, Audi, Toyota.

La plataforma es la línea de producto: Serie 3, A4, Corolla.

El modelo es la versión concreta: 320d, A4 2.0 TDI híbrido, Corolla 1.8 hybrid.

Cuando alguien dice "tengo un BMW Serie 3", no te ha dicho casi nada. ¿Es el de gasoil de hace cinco años? ¿Es el último híbrido? ¿Es el M3 que va a 280? Hablar de Serie 3 sin más es como hablar de Claude o ChatGPT sin precisar el modelo: estás dando una marca, no una capacidad.

Y aquí va la pieza clave: lo que te cobran y lo que te da, depende del modelo, no de la marca.

02

Panorama: los modelos de los tres grandes

A día de hoy hay tres empresas que dominan el mercado profesional. Cada una con su lineup. Aquí los tienes.

Técnico

Anthropic (plataforma: Claude)

Opus 4.7. El modelo más potente. Razonamiento profundo, mejor para tareas muy complejas.

Sonnet 4.6. El modelo equilibrado. Caballo de batalla para casi todo.

Haiku 4.5. El modelo rápido y barato. Para tareas simples y volumen alto.

OpenAI (plataforma: ChatGPT)

GPT-5.5. El más reciente, lanzado en abril de 2026.

GPT-5.4 Pro. El de máxima capacidad para tareas críticas.

GPT-5.4 Thinking. Razonamiento alto, equivalente al Opus en su categoría.

GPT-5.4 Mini. Rápido y barato, para tareas estándar.

GPT-5.3 Instant. El modelo por defecto, optimizado para velocidad.

Google (plataforma: Gemini)

Gemini 3.1 Pro. Flagship actual, ventana de contexto de 2 millones de tokens (la más grande del mercado).

Gemini 3 Deep Think. Razonamiento profundo, solo en planes Ultra.

Gemini 3 Flash. Rápido y económico, frontier-class quality.

Gemini 3.1 Flash-Lite. El más barato del mercado de los tres grandes.

Estructura común a las tres empresas: Todas siguen el mismo patrón: un modelo top (Opus, Pro, Pro), un modelo medio (Sonnet, Mini, Flash), y un modelo rápido y barato (Haiku, Instant, Flash-Lite). Saber esto te orienta aunque cambien los nombres.

Kuki lenguaje

Si te sirve la metáfora del concesionario, cada empresa tiene su gama:

Anthropic vende el deportivo (Opus), el sedán equilibrado (Sonnet) y el utilitario eficiente (Haiku).

OpenAI vende el deportivo de pista (GPT-5.4 Pro), el sedán de razonamiento (Thinking), el coche urbano (Mini) y el citycar de cada día (Instant).

Google vende el todoterreno con maletero gigante (Gemini 3.1 Pro), el deportivo de pensar largo (Deep Think), y dos eficientes (Flash y Flash-Lite).

Misma lógica de gama en las tres. La marca es distinta, los nombres cambian, pero la estructura es la misma: hay un caro y potente, hay uno medio que casi siempre te basta, y hay uno barato para tareas tontas.

Si te aprendes ese patrón, da igual que mañana saquen el GPT-6 o el Opus 5: lo nuevo va a encajar en uno de esos tres cajones.

Lineup: los tres grandes a mayo de 2026

Anthropic Plataforma: Claude
  • Opus 4.7
  • Sonnet 4.6
  • Haiku 4.5
OpenAI Plataforma: ChatGPT
  • GPT-5.5
  • GPT-5.4 Pro
  • GPT-5.4 Thinking
  • GPT-5.4 Mini
  • GPT-5.3 Instant
Google Plataforma: Gemini
  • Gemini 3.1 Pro
  • Gemini 3 Deep Think
  • Gemini 3 Flash
  • Gemini 3.1 Flash-Lite
03

La trampa del coste

Aquí está la lección más rentable del campus. Lee con atención.

Técnico

Los modelos no se cobran por mensaje sino por token procesado. Y los precios entre el modelo top y el modelo medio de cada empresa pueden tener una diferencia brutal.

Comparativa de precios por millón de tokens (mayo 2026):

ModeloInputOutput
Claude Opus 4.7$5$25
Claude Sonnet 4.6$0.75$3.75
Claude Haiku 4.5$0.20$1
GPT-5.4 Pro$30$180
GPT-5.4 (estándar)$2$12
GPT-5.4 Mini$0.75$4.50
Gemini 3.1 Pro$2$12
Gemini 3 Flash$0.50$3
Gemini 3.1 Flash-Lite$0.25$1.50
← Desliza para ver toda la tabla →

Lectura clave:

Sonnet 4.6 cuesta aproximadamente siete veces menos que Opus 4.7 para hacer lo mismo. Y para el 90% de tareas, basta.

GPT-5.4 Pro es 15 veces más caro que GPT-5.4 estándar. Solo se justifica para tareas donde el coste de equivocarse es altísimo.

Gemini 3.1 Flash-Lite cuesta 8 veces menos que Gemini 3.1 Pro. Para clasificar correos o etiquetar contenido, sobra.

Regla práctica que cambia todo: Trabaja siempre con el modelo medio (Sonnet, GPT-5.4 estándar, Gemini 3 Flash) por defecto. Sube al top (Opus, Pro) solo cuando el medio se atasque, no por costumbre. Esto te puede dividir la factura entre cinco o entre diez sin tocar nada más.

Kuki lenguaje

Imagínate que tienes que hacer la compra del súper. Tienes tres opciones:

Coger el Ferrari (Opus, GPT-Pro, Gemini Pro). Te cobran 5€ por kilómetro. Llegas en 8 minutos.

Coger el utilitario (Sonnet, GPT estándar, Gemini Flash). Te cobran 0,75€ por kilómetro. Llegas en 12 minutos.

Coger la bici eléctrica (Haiku, GPT Mini, Flash-Lite). Te cobran 0,20€. Llegas en 18 minutos.

Para ir al súper que está a 3 km, ¿qué coges?

Ninguna persona sensata elegiría el Ferrari para ir a por leche. Y sin embargo, en IA, todo el mundo va por defecto en Ferrari sin saberlo. La plataforma muchas veces tiene Opus como predeterminado, o tú lo seleccionaste un día y no lo cambiaste, y cada conversación trivial te está costando como una carrera de velocidad.

El cambio mental que necesitas: el medio basta para casi todo. Solo coges el grande cuando vas a hacer un viaje de verdad complicado, donde necesitas potencia. Para todo lo demás, el utilitario.

Si solo te llevas una idea de toda esta clase, que sea esta: comprueba qué modelo tienes seleccionado por defecto y bájalo al medio. Probablemente acabas de ahorrar dinero suficiente para pagar la suscripción del año entero.

04

Razonamiento alto vs rápido

Hay otra dimensión que no es solo precio. Es cuánto tiempo dejas que el modelo piense antes de contestar.

Técnico

A partir de 2025, los modelos punteros incorporan un mecanismo de razonamiento extendido (también llamado "thinking" o "reasoning"). En lugar de generar la respuesta del tirón, el modelo se permite "pensar" internamente antes, descartando hipótesis, planteando opciones, validando.

Cómo se manifiesta en cada plataforma:

Claude: los modelos como Opus 4.7 y Sonnet 4.6 tienen razonamiento extendido activable. En Claude Code se controla con el comando /effort max.

ChatGPT: la línea Thinking (GPT-5.4 Thinking, GPT-5.4 Pro) está específicamente entrenada para razonar más. Se puede ajustar el "thinking time" desde la interfaz.

Gemini: Gemini 3 Deep Think es el modo de razonamiento profundo. Disponible solo en plan Ultra.

Coste del razonamiento: Cuando el modelo piensa más, gasta más tokens internos. Eso significa más coste y más tiempo de respuesta. La diferencia puede ser de 3 a 10 veces más caro y más lento que una respuesta normal.

Cuándo merece la pena: Tareas con muchos pasos lógicos (programación compleja, debugging, matemáticas). Decisiones donde equivocarse es caro (legal, fiscal, contractual). Análisis profundo de documentos largos. Trabajo agéntico complejo donde la IA tiene que planificar y ejecutar.

Cuándo NO merece la pena: Conversación normal. Preguntas factuales simples. Resúmenes. Generación de texto creativo estándar. Cualquier cosa que alguien informado contestaría sin pensárselo mucho.

Kuki lenguaje

El razonamiento alto es como pedirle a una experta que se siente, lo piense bien y te dé una respuesta razonada. La respuesta rápida es como preguntarle al pasar.

Si tienes que decidir si demandar a alguien, pides hora con tu abogada, ella se lee el caso, lo piensa, te llama dos días después y te dice "haz esto". Eso es razonamiento alto.

Si tienes que saber a qué hora abre el banco, no le pides hora a tu abogada. Lo googleas. Eso es razonamiento rápido.

El error que comete mucha gente: pone el modo "pensar profundo" para preguntar a la IA "qué cenamos hoy". Le estás pidiendo a tu abogada que medite sobre tu menú. Tarda más, cuesta más, y la respuesta no es mejor que una rápida.

Otro error frecuente, el contrario: le preguntas a la respuesta rápida algo legal complejo, y el modelo te suelta una respuesta que suena segura pero está medio inventada. Ahí sí tenías que haber pagado a la abogada.

Aprender a distinguir cuándo estás en una situación o en otra vale dinero y vale prestigio.

05

Cómo se cambia el modelo en cada entorno

Ya sabes qué modelo elegir. Ahora, cómo seleccionarlo concretamente en cada sitio.

Técnico

En la plataforma web:

Claude.ai: desplegable arriba a la izquierda del chat. Selecciona Sonnet 4.6 por defecto, sube a Opus 4.7 solo cuando lo necesites.

ChatGPT.com: desplegable también arriba. La opción "Auto" suele ir a Instant. Puedes forzar Thinking o Pro desde el menú.

Gemini: desplegable en la cabecera. Selecciona el modelo según tu plan (3 Flash o 3.1 Pro).

En el IDE (Visual Studio Code con Claude Code):

/model

Te muestra las opciones disponibles. Eliges con flechas o número.

Otros comandos útiles:

/effort max → activa razonamiento alto en el modelo actual /context → ver cuánto contexto has gastado /memory → gestionar memoria persistente del proyecto

En el terminal (Termius, Bash): Cuando entras al terminal y arrancas Claude Code, ves arriba el modelo activo. Si te dice "auto" u "Opus", cámbialo con /model para no comer cuota innecesaria.

Aviso práctico: Algunos clientes de terminal (especialmente versiones antiguas de Claude Code instaladas en servidores que no se han actualizado) no soportan todos los comandos. Si /effort max no te funciona en un sitio, es porque la versión instalada está desfasada. Actualízala o usa esa máquina solo para tareas ejecutivas, no para construir.

Kuki lenguaje

Elegir el modelo es como elegir la marcha del coche.

En la plataforma web es como un coche automático con palanca: tienes un botón visible donde eliges. Sencillo.

En el IDE es como un coche con cambio manual moderno: escribes /model y eliges.

En el terminal es lo mismo que el IDE pero más directo: misma orden, misma elección, sin interfaz gráfica.

La regla universal: mira siempre qué marcha llevas puesta antes de empezar. Igual que no arrancas un coche sin saber si está en primera o en quinta, no empieces a hablar con la IA sin saber qué modelo está respondiendo.

Y un detalle: los comandos /model, /effort max, /context y /memory te van a salvar la vida cuando entres al IDE en serio. Apúntalos, porque la primera vez que los uses es como descubrir que tu coche tiene cruise control.

06

Tabla práctica: qué modelo para qué tarea

La chuleta que vas a abrir en cada duda. Decisión por situación.

Técnico
TareaModelo recomendadoPor qué
Conversación normal, dudas, brainstormingSonnet 4.6 / GPT-5.4 estándar / Gemini 3 FlashEl medio basta y es barato.
Generar imágenes o diagramasEl integrado en cada plataforma webNo depende del modelo de texto.
Resumir un PDF corto (menos de 50 páginas)El medioSuficiente y rápido.
Resumir un documento muy largo (cientos de páginas)Gemini 3.1 ProTiene 2M de contexto, es el único que te lo aguanta del tirón.
Programación rutinaria, fixes, refactorsSonnet 4.6Es el caballo de batalla del código.
Debugging complejo o arquitecturaOpus 4.7 / GPT-5.4 ThinkingAquí sí se nota el razonamiento alto.
Generar código para una skill / agenteSonnet 4.6 con /effort maxPunto medio entre coste y calidad.
Análisis legal, fiscal, contractualOpus 4.7 con razonamiento altoEl coste de equivocarse es muy alto.
Clasificar correos, etiquetar contenidoHaiku 4.5 / GPT-5.4 Mini / Flash-LiteVolumen alto, tarea simple.
Trabajo agéntico complejo (multi-paso)Opus 4.7 o GPT-5.4 ThinkingNecesitas planificación profunda.
Una pregunta tonta de "qué hora es"El más barato disponible o ni esoPara esto no enciendas el modelo.
← Desliza para ver toda la tabla →

Regla universal:

Por defecto: el medio. Sube al grande solo si el medio se atasca o si la tarea es crítica. Baja al pequeño solo si tienes volumen alto de tareas simples.

Kuki lenguaje

Piénsalo como la cocinera de tu casa.

Para hacer la cena de un martes normal, usa la sartén buena (medio).

Para una cena de Navidad con 18 invitadas, saca la batería de cobre con el horno profesional (top).

Para hervir agua, no enciendas el horno: usa el cazo (pequeño).

La cocinera profesional sabe usar las tres. La que va lenta es la que para todo coge la batería de cobre, porque limpia más, calienta más despacio y desgasta antes el material.

Tú con la IA tienes que ser la cocinera profesional, no la que coge siempre la sartén grande "por si acaso". Y cuando llegue una cena de gala (un proyecto crítico, una decisión legal importante, un debug muy complicado), entonces sí: saca la batería buena, paga el coste extra, y haz las cosas como Dios manda.

Resumen final: la regla de los tres motores

Técnico

La conclusión de la clase, en cinco puntos:

1. Empresa, plataforma y modelo no son lo mismo. Habla siempre del modelo cuando hables de capacidades concretas.

2. Las tres empresas grandes tienen estructura igual: un modelo top (caro y potente), un modelo medio (equilibrado y rentable), un modelo pequeño (rápido y barato).

3. Por defecto, el medio basta. Sonnet 4.6 / GPT-5.4 estándar / Gemini 3 Flash. Los grandes solo cuando se atascan.

4. El razonamiento alto es una segunda dimensión. Activa "thinking" o /effort max cuando la tarea sea compleja, no por defecto.

5. Los nombres de modelos cambian cada pocos meses, la lógica no. Aprende el patrón y no te vas a perder con la siguiente generación.

Kuki lenguaje

Quédate con esto:

Cuando te subes a un coche, miras qué marcha llevas. Cuando hablas con una IA, mira qué motor llevas debajo. Si no lo miras, vas todo el rato en primera con el motor rugiendo, gastando gasolina por nada.

La próxima vez que abras Claude, ChatGPT o Gemini:

1. Mira arriba qué modelo está seleccionado.

2. Si pone el grande (Opus, Pro), bájalo al medio.

3. Solo súbelo al grande cuando una tarea concreta lo pida.

4. Y cuando termines esa tarea, vuelve a bajarlo.

Eso es todo. Eso te ahorra cantidades absurdas de dinero. Y es la diferencia entre alguien que usa la IA y alguien que la entiende.

Creado por ERK Labs