Clase 03: Empresa, plataforma y modelo

Técnico

Tres niveles que la gente mezcla constantemente y que conviene tener separados:

Empresa: quien fabrica el sistema de IA. Anthropic, OpenAI, Google, DeepSeek, xAI, Meta.

Plataforma: la marca o producto público. Claude (de Anthropic), ChatGPT (de OpenAI), Gemini (de Google).

Modelo: el motor concreto que está respondiendo. Es lo que de verdad importa, porque es lo que define velocidad, capacidad y coste.

Cada empresa tiene normalmente una sola plataforma de cara al público, pero dentro de esa plataforma conviven varios modelos, organizados por capacidad y precio.

Cuando pagas la suscripción, no estás pagando "por usar Claude" o "por usar ChatGPT". Estás pagando por acceder a un conjunto de modelos, y cada respuesta que recibes la genera uno de ellos. Cuál concretamente, depende de qué hayas seleccionado o qué decida la plataforma por defecto.

Kuki lenguaje

Imagínalo como un concesionario de coches.

La empresa es la marca: BMW, Audi, Toyota.

La plataforma es la línea de producto: Serie 3, A4, Corolla.

El modelo es la versión concreta: 320d, A4 2.0 TDI híbrido, Corolla 1.8 hybrid.

Cuando alguien dice "tengo un BMW Serie 3", no te ha dicho casi nada. ¿Es el de gasoil de hace cinco años? ¿Es el último híbrido? ¿Es el M3 que va a 280? Hablar de Serie 3 sin más es como hablar de Claude o ChatGPT sin precisar el modelo: estás dando una marca, no una capacidad.

Y aquí va la pieza clave: lo que te cobran y lo que te da, depende del modelo, no de la marca.

Técnico

Anthropic (plataforma: Claude)

Opus 4.7. El modelo más potente. Razonamiento profundo, mejor para tareas muy complejas.

Sonnet 4.6. El modelo equilibrado. Caballo de batalla para casi todo.

Haiku 4.5. El modelo rápido y barato. Para tareas simples y volumen alto.

OpenAI (plataforma: ChatGPT)

GPT-5.5. El más reciente, lanzado en abril de 2026.

GPT-5.4 Pro. El de máxima capacidad para tareas críticas.

GPT-5.4 Thinking. Razonamiento alto, equivalente al Opus en su categoría.

GPT-5.4 Mini. Rápido y barato, para tareas estándar.

GPT-5.3 Instant. El modelo por defecto, optimizado para velocidad.

Google (plataforma: Gemini)

Gemini 3.1 Pro. Flagship actual, ventana de contexto de 2 millones de tokens (la más grande del mercado).

Gemini 3 Deep Think. Razonamiento profundo, solo en planes Ultra.

Gemini 3 Flash. Rápido y económico, frontier-class quality.

Gemini 3.1 Flash-Lite. El más barato del mercado de los tres grandes.

Estructura común a las tres empresas: Todas siguen el mismo patrón: un modelo top (Opus, Pro, Pro), un modelo medio (Sonnet, Mini, Flash), y un modelo rápido y barato (Haiku, Instant, Flash-Lite). Saber esto te orienta aunque cambien los nombres.

Kuki lenguaje

Si te sirve la metáfora del concesionario, cada empresa tiene su gama:

Anthropic vende el deportivo (Opus), el sedán equilibrado (Sonnet) y el utilitario eficiente (Haiku).

OpenAI vende el deportivo de pista (GPT-5.4 Pro), el sedán de razonamiento (Thinking), el coche urbano (Mini) y el citycar de cada día (Instant).

Google vende el todoterreno con maletero gigante (Gemini 3.1 Pro), el deportivo de pensar largo (Deep Think), y dos eficientes (Flash y Flash-Lite).

Misma lógica de gama en las tres. La marca es distinta, los nombres cambian, pero la estructura es la misma: hay un caro y potente, hay uno medio que casi siempre te basta, y hay uno barato para tareas tontas.

Si te aprendes ese patrón, da igual que mañana saquen el GPT-6 o el Opus 5: lo nuevo va a encajar en uno de esos tres cajones.

Lineup: los tres grandes a mayo de 2026

Anthropic Plataforma: Claude

Opus 4.7
Sonnet 4.6
Haiku 4.5

OpenAI Plataforma: ChatGPT

GPT-5.5
GPT-5.4 Pro
GPT-5.4 Thinking
GPT-5.4 Mini
GPT-5.3 Instant

Google Plataforma: Gemini

Gemini 3.1 Pro
Gemini 3 Deep Think
Gemini 3 Flash
Gemini 3.1 Flash-Lite

Técnico

Los modelos no se cobran por mensaje sino por token procesado. Y los precios entre el modelo top y el modelo medio de cada empresa pueden tener una diferencia brutal.

Comparativa de precios por millón de tokens (mayo 2026):

Modelo	Input	Output
Claude Opus 4.7	$5	$25
Claude Sonnet 4.6	$0.75	$3.75
Claude Haiku 4.5	$0.20	$1
GPT-5.4 Pro	$30	$180
GPT-5.4 (estándar)	$2	$12
GPT-5.4 Mini	$0.75	$4.50
Gemini 3.1 Pro	$2	$12
Gemini 3 Flash	$0.50	$3
Gemini 3.1 Flash-Lite	$0.25	$1.50

← Desliza para ver toda la tabla →

Lectura clave:

Sonnet 4.6 cuesta aproximadamente siete veces menos que Opus 4.7 para hacer lo mismo. Y para el 90% de tareas, basta.

GPT-5.4 Pro es 15 veces más caro que GPT-5.4 estándar. Solo se justifica para tareas donde el coste de equivocarse es altísimo.

Gemini 3.1 Flash-Lite cuesta 8 veces menos que Gemini 3.1 Pro. Para clasificar correos o etiquetar contenido, sobra.

Regla práctica que cambia todo: Trabaja siempre con el modelo medio (Sonnet, GPT-5.4 estándar, Gemini 3 Flash) por defecto. Sube al top (Opus, Pro) solo cuando el medio se atasque, no por costumbre. Esto te puede dividir la factura entre cinco o entre diez sin tocar nada más.

Kuki lenguaje

Imagínate que tienes que hacer la compra del súper. Tienes tres opciones:

Coger el Ferrari (Opus, GPT-Pro, Gemini Pro). Te cobran 5€ por kilómetro. Llegas en 8 minutos.

Coger el utilitario (Sonnet, GPT estándar, Gemini Flash). Te cobran 0,75€ por kilómetro. Llegas en 12 minutos.

Coger la bici eléctrica (Haiku, GPT Mini, Flash-Lite). Te cobran 0,20€. Llegas en 18 minutos.

Para ir al súper que está a 3 km, ¿qué coges?

Ninguna persona sensata elegiría el Ferrari para ir a por leche. Y sin embargo, en IA, todo el mundo va por defecto en Ferrari sin saberlo. La plataforma muchas veces tiene Opus como predeterminado, o tú lo seleccionaste un día y no lo cambiaste, y cada conversación trivial te está costando como una carrera de velocidad.

El cambio mental que necesitas: el medio basta para casi todo. Solo coges el grande cuando vas a hacer un viaje de verdad complicado, donde necesitas potencia. Para todo lo demás, el utilitario.

Si solo te llevas una idea de toda esta clase, que sea esta: comprueba qué modelo tienes seleccionado por defecto y bájalo al medio. Probablemente acabas de ahorrar dinero suficiente para pagar la suscripción del año entero.

Técnico

A partir de 2025, los modelos punteros incorporan un mecanismo de razonamiento extendido (también llamado "thinking" o "reasoning"). En lugar de generar la respuesta del tirón, el modelo se permite "pensar" internamente antes, descartando hipótesis, planteando opciones, validando.

Cómo se manifiesta en cada plataforma:

Claude: los modelos como Opus 4.7 y Sonnet 4.6 tienen razonamiento extendido activable. En Claude Code se controla con el comando /effort max.

ChatGPT: la línea Thinking (GPT-5.4 Thinking, GPT-5.4 Pro) está específicamente entrenada para razonar más. Se puede ajustar el "thinking time" desde la interfaz.

Gemini: Gemini 3 Deep Think es el modo de razonamiento profundo. Disponible solo en plan Ultra.

Coste del razonamiento: Cuando el modelo piensa más, gasta más tokens internos. Eso significa más coste y más tiempo de respuesta. La diferencia puede ser de 3 a 10 veces más caro y más lento que una respuesta normal.

Cuándo merece la pena: Tareas con muchos pasos lógicos (programación compleja, debugging, matemáticas). Decisiones donde equivocarse es caro (legal, fiscal, contractual). Análisis profundo de documentos largos. Trabajo agéntico complejo donde la IA tiene que planificar y ejecutar.

Cuándo NO merece la pena: Conversación normal. Preguntas factuales simples. Resúmenes. Generación de texto creativo estándar. Cualquier cosa que alguien informado contestaría sin pensárselo mucho.

Kuki lenguaje

El razonamiento alto es como pedirle a una experta que se siente, lo piense bien y te dé una respuesta razonada. La respuesta rápida es como preguntarle al pasar.

Si tienes que decidir si demandar a alguien, pides hora con tu abogada, ella se lee el caso, lo piensa, te llama dos días después y te dice "haz esto". Eso es razonamiento alto.

Si tienes que saber a qué hora abre el banco, no le pides hora a tu abogada. Lo googleas. Eso es razonamiento rápido.

El error que comete mucha gente: pone el modo "pensar profundo" para preguntar a la IA "qué cenamos hoy". Le estás pidiendo a tu abogada que medite sobre tu menú. Tarda más, cuesta más, y la respuesta no es mejor que una rápida.

Otro error frecuente, el contrario: le preguntas a la respuesta rápida algo legal complejo, y el modelo te suelta una respuesta que suena segura pero está medio inventada. Ahí sí tenías que haber pagado a la abogada.

Aprender a distinguir cuándo estás en una situación o en otra vale dinero y vale prestigio.

Técnico

En la plataforma web:

Claude.ai: desplegable arriba a la izquierda del chat. Selecciona Sonnet 4.6 por defecto, sube a Opus 4.7 solo cuando lo necesites.

ChatGPT.com: desplegable también arriba. La opción "Auto" suele ir a Instant. Puedes forzar Thinking o Pro desde el menú.

Gemini: desplegable en la cabecera. Selecciona el modelo según tu plan (3 Flash o 3.1 Pro).

En el IDE (Visual Studio Code con Claude Code):

/model

Te muestra las opciones disponibles. Eliges con flechas o número.

Otros comandos útiles:

/effort max     → activa razonamiento alto en el modelo actual
/context        → ver cuánto contexto has gastado
/memory         → gestionar memoria persistente del proyecto

En el terminal (Termius, Bash): Cuando entras al terminal y arrancas Claude Code, ves arriba el modelo activo. Si te dice "auto" u "Opus", cámbialo con /model para no comer cuota innecesaria.

Aviso práctico: Algunos clientes de terminal (especialmente versiones antiguas de Claude Code instaladas en servidores que no se han actualizado) no soportan todos los comandos. Si /effort max no te funciona en un sitio, es porque la versión instalada está desfasada. Actualízala o usa esa máquina solo para tareas ejecutivas, no para construir.

Kuki lenguaje

Elegir el modelo es como elegir la marcha del coche.

En la plataforma web es como un coche automático con palanca: tienes un botón visible donde eliges. Sencillo.

En el IDE es como un coche con cambio manual moderno: escribes /model y eliges.

En el terminal es lo mismo que el IDE pero más directo: misma orden, misma elección, sin interfaz gráfica.

La regla universal: mira siempre qué marcha llevas puesta antes de empezar. Igual que no arrancas un coche sin saber si está en primera o en quinta, no empieces a hablar con la IA sin saber qué modelo está respondiendo.

Y un detalle: los comandos /model, /effort max, /context y /memory te van a salvar la vida cuando entres al IDE en serio. Apúntalos, porque la primera vez que los uses es como descubrir que tu coche tiene cruise control.

Técnico

Tarea	Modelo recomendado	Por qué
Conversación normal, dudas, brainstorming	Sonnet 4.6 / GPT-5.4 estándar / Gemini 3 Flash	El medio basta y es barato.
Generar imágenes o diagramas	El integrado en cada plataforma web	No depende del modelo de texto.
Resumir un PDF corto (menos de 50 páginas)	El medio	Suficiente y rápido.
Resumir un documento muy largo (cientos de páginas)	Gemini 3.1 Pro	Tiene 2M de contexto, es el único que te lo aguanta del tirón.
Programación rutinaria, fixes, refactors	Sonnet 4.6	Es el caballo de batalla del código.
Debugging complejo o arquitectura	Opus 4.7 / GPT-5.4 Thinking	Aquí sí se nota el razonamiento alto.
Generar código para una skill / agente	Sonnet 4.6 con `/effort max`	Punto medio entre coste y calidad.
Análisis legal, fiscal, contractual	Opus 4.7 con razonamiento alto	El coste de equivocarse es muy alto.
Clasificar correos, etiquetar contenido	Haiku 4.5 / GPT-5.4 Mini / Flash-Lite	Volumen alto, tarea simple.
Trabajo agéntico complejo (multi-paso)	Opus 4.7 o GPT-5.4 Thinking	Necesitas planificación profunda.
Una pregunta tonta de "qué hora es"	El más barato disponible o ni eso	Para esto no enciendas el modelo.

← Desliza para ver toda la tabla →

Regla universal:

Por defecto: el medio. Sube al grande solo si el medio se atasca o si la tarea es crítica. Baja al pequeño solo si tienes volumen alto de tareas simples.

Kuki lenguaje

Piénsalo como la cocinera de tu casa.

Para hacer la cena de un martes normal, usa la sartén buena (medio).

Para una cena de Navidad con 18 invitadas, saca la batería de cobre con el horno profesional (top).

Para hervir agua, no enciendas el horno: usa el cazo (pequeño).

La cocinera profesional sabe usar las tres. La que va lenta es la que para todo coge la batería de cobre, porque limpia más, calienta más despacio y desgasta antes el material.

Tú con la IA tienes que ser la cocinera profesional, no la que coge siempre la sartén grande "por si acaso". Y cuando llegue una cena de gala (un proyecto crítico, una decisión legal importante, un debug muy complicado), entonces sí: saca la batería buena, paga el coste extra, y haz las cosas como Dios manda.

Resumen final: la regla de los tres motores

Técnico

La conclusión de la clase, en cinco puntos:

1. Empresa, plataforma y modelo no son lo mismo. Habla siempre del modelo cuando hables de capacidades concretas.

2. Las tres empresas grandes tienen estructura igual: un modelo top (caro y potente), un modelo medio (equilibrado y rentable), un modelo pequeño (rápido y barato).

3. Por defecto, el medio basta. Sonnet 4.6 / GPT-5.4 estándar / Gemini 3 Flash. Los grandes solo cuando se atascan.

4. El razonamiento alto es una segunda dimensión. Activa "thinking" o /effort max cuando la tarea sea compleja, no por defecto.

5. Los nombres de modelos cambian cada pocos meses, la lógica no. Aprende el patrón y no te vas a perder con la siguiente generación.

Kuki lenguaje

Quédate con esto:

Cuando te subes a un coche, miras qué marcha llevas. Cuando hablas con una IA, mira qué motor llevas debajo. Si no lo miras, vas todo el rato en primera con el motor rugiendo, gastando gasolina por nada.

La próxima vez que abras Claude, ChatGPT o Gemini:

1. Mira arriba qué modelo está seleccionado.

2. Si pone el grande (Opus, Pro), bájalo al medio.

3. Solo súbelo al grande cuando una tarea concreta lo pida.

4. Y cuando termines esa tarea, vuelve a bajarlo.

Eso es todo. Eso te ahorra cantidades absurdas de dinero. Y es la diferencia entre alguien que usa la IA y alguien que la entiende.

Qué motor llevas debajo del capó

Recordatorio: empresa, plataforma, modelo

Panorama: los modelos de los tres grandes

La trampa del coste

Razonamiento alto vs rápido

Cómo se cambia el modelo en cada entorno

Tabla práctica: qué modelo para qué tarea

Resumen final: la regla de los tres motores