SONNET CODE
← Volver a todos los artículos
Desarrollo de IA23 de junio de 2026·11 min de lectura

Google lanza Gemini 2.5 Pro Deep Think con ventana de contexto de 2 millones de tokens

Qué lanzó Google el 22 de junio y el espacio de la matriz de enrutamiento que ocupa

El 22 de junio de 2026, Google puso Gemini 2.5 Pro Deep Think en disponibilidad general en la Gemini API, AI Studio y Vertex AI: la ventana de contexto de 2 millones de tokens y el modo de razonamiento extendido Deep Think que duplica el cómputo en problemas difíciles ahora son ampliamente accesibles para todo comprador con un contrato de Google Cloud, todo desarrollador con una clave de AI Studio y todo integrador que ya construyó la infraestructura de la capa de enrutamiento en el plano de control de Vertex AI. El precio se ubica en aproximadamente 2,50 USD de entrada / 15 USD de salida por millón de tokens para el modo estándar y aproximadamente 4 veces eso para Deep Think: la superficie multimodal de texto/código/imagen/audio/video/datos estructurados es la misma con la que Gemini 2.5 Pro ya se lanzó, y Deep Think es el interruptor que va encima, no un SKU aparte.

El conjunto de benchmarks que Google publicó es el que la matriz de enrutamiento del comprador tiene que calificar:

  • MMLU-Pro: 89,8%, el más alto de cualquier modelo disponible públicamente en la disponibilidad general en esta fecha.
  • GPQA Diamond (ciencia de nivel posgrado): 82,4%, la señal de industria regulada que vale la pena calificar con honestidad cuando la cola de fallos por vertical es densa en razonamiento técnico que el modelo de nivel commodity no puede seguir.
  • SWE-bench Verified: 76,4%, la señal de codificación agéntica que la hoja de cálculo de adquisiciones ahora lee junto a las entradas de Opus 4.7 de Anthropic y GPT-5.5 de OpenAI.
  • HumanEval+: 94,1%, la cifra de HumanEval+ más alta jamás registrada al momento de la disponibilidad general.

El espacio de razonamiento de frontera de la matriz de enrutamiento de grado de adquisición que todo comprador mantiene para el plan FY27 acaba de ganar una tercera entrada creíble de un laboratorio estadounidense junto a Anthropic Opus 4.7 y OpenAI GPT-5.5, y una cuarta que ya no es alcanzable, con Claude Fable 5 y Claude Mythos 5 suspendidos para exportación desde el 12 de junio de 2026 por la directiva de control de exportaciones del gobierno estadounidense que aterrizó tres días después del lanzamiento de Fable 5 el 9 de junio. La pregunta de la matriz de enrutamiento para el próximo ciclo de lanzamientos no es qué laboratorio lidera el titular de la tabla de clasificación; es qué laboratorio llena la cola de fallos por vertical del comprador con un modelo que el comprador todavía pueda conseguir mañana, y Google acaba de señalar la respuesta para el espacio de razonamiento.

Por qué Deep Think cambia la matemática de la matriz de enrutamiento del comprador

Deep Think no es un modelo aparte. Es un interruptor de inferencia extendida sobre Gemini 2.5 Pro que permite que el modelo gaste significativamente más cómputo en problemas complejos antes de generar una respuesta: la misma forma que Anthropic lanzó como pensamiento adaptativo en Fable 5 y que OpenAI lanzó como la perilla de "esfuerzo de razonamiento" en GPT-5.5. La prima de precio —aproximadamente 4 veces la tarifa estándar— codifica el multiplicador de cómputo directamente en la partida por token del comprador, y el interruptor se convierte en una decisión de la matriz de enrutamiento que la capa de juicio senior del comprador califica por vertical:

  • Para la cola de verticales fáciles de calificar (clasificación de atención al cliente de alto volumen, canalizaciones de extracción estructurada, orquestación determinista de uso de herramientas), el modo estándar de 2.5 Pro a 2,50 USD/15 USD es lo que la capa de enrutamiento debería servir. Deep Think en la cola fácil es la prima de 4x sobre el trabajo que el modelo ya termina a la tarifa estándar: el comprador que enruta cada solicitud a través de Deep Think porque "el titular del benchmark es más alto con el interruptor activado" es el comprador que le prende fuego a la factura de la nube sin ninguna mejora de precisión por vertical que la capa de juicio senior pueda detectar.
  • Para la cola de verticales difíciles de calificar (razonamiento técnico de nivel posgrado, decisiones de varios pasos en dominios regulados, tareas de codificación agéntica donde el modo de fallo es la completación silenciosamente errónea en lugar del bloqueo visible), el interruptor Deep Think es la entrada de la matriz de enrutamiento que la capa de juicio senior por vertical debe calificar contra Opus 4.7 con pensamiento extendido y GPT-5.5 con el esfuerzo de razonamiento subido. La cifra de 76,4% en SWE-bench Verified con Deep Think es el titular que mete al espacio en el sprint de diligencia; la tasa de aprobación por vertical en el conjunto de oro propio del comprador es lo que lo gana.
  • Para el espacio de 2 millones de tokens, la decisión de la matriz de enrutamiento es si la cola de contexto largo del vertical del comprador es una que el Gemini 2.5 Pro más barato por token debería servir en modo estándar (comprensión de bases de código grandes, recuperación multidocumento en verticales regulados, auditoría de flujos de trabajo agénticos de traza larga) frente a pagar la prima de Opus 4.7 / GPT-5.5 por el mismo envolvente de ventana de contexto. La ventana de 2M ya no es una característica exclusiva de la frontera; es una palanca de la matriz de enrutamiento para el comprador que tiene la capa de juicio senior para calificar la cola de contexto largo con honestidad.

Los proveedores que la matriz de enrutamiento del comprador todavía puede llamar mañana en la trifecta de razonamiento de frontera + contexto largo + codificación agéntica al momento de esta disponibilidad general: Anthropic Opus 4.7 con pensamiento extendido (el modelo de calidad por defecto contra el que la matriz de enrutamiento califica todo lo demás), OpenAI GPT-5.5 con esfuerzo de razonamiento (el líder de Terminal-Bench 2.0 con 82,7% y el modelo de frontera con la tasa de alucinación más baja del conjunto público de benchmarks) y Google Gemini 2.5 Pro con Deep Think (la entrada más nueva, la más barata por token a la tarifa estándar, la única con el envolvente de ventana de contexto de 2M a este punto de precio). El comprador que ejecuta la actualización de la matriz de enrutamiento FY27 con los tres calificando con honestidad contra el conjunto de oro por vertical gana la curva de costos por vertical; el comprador que se ancla a un único laboratorio porque el contrato de adquisición ya está firmado pierde la curva de costos y paga la prima de Deep Think en la cola de verticales equivocada porque el repliegue de la capa de enrutamiento nunca se afinó.

Qué señala la elección de distribución por AI Studio + Vertex AI

Google no limitó Deep Think detrás de un SKU empresarial aparte ni de una vista previa cerrada de Vertex AI. La disponibilidad general se lanzó en las tres superficies de Gemini API, AI Studio y Vertex AI simultáneamente: la vía de clave de grado de desarrollador, la vía de prototipado de consumidor y la vía del plano de control empresarial. Esa es una señal de distribución que la hoja de cálculo de adquisiciones tiene que leer con cuidado:

  • Vertex AI es la superficie de grado empresarial donde la matriz de enrutamiento se aplica dentro del envolvente de Google Cloud existente del comprador: controles de servicio de VPC, claves de cifrado gestionadas por el cliente, registro de auditoría, acceso a modelos vinculado a IAM, fijación de región de residencia. El interruptor Deep Think es ahora una bandera de característica de la capa de enrutamiento de Vertex AI que el equipo central de plataforma del comprador posee, no una vía de escape del equipo de desarrollo.
  • AI Studio es la superficie de prototipado rápido donde un equipo de producto vertical puede probar la hipótesis de tasa de aprobación por vertical contra el modo estándar y el modo Deep Think en la misma tarde, sin presentar una solicitud de tenant de Vertex AI. El traspaso operativo posterior al envolvente de Vertex AI es responsabilidad del comprador, y el comprador que no tenga bien ensayada la vía de portabilidad de prompts y configuración de enrutamiento de Vertex AI a AI Studio para fin del Q3 es el comprador que lanza el prototipo por vertical en AI Studio y luego no puede promoverlo al envolvente de Vertex AI sin recalificar la capa de juicio senior por vertical desde cero porque la configuración de la matriz de enrutamiento está codificada contra la superficie equivocada.
  • La Gemini API es la vía directa del proveedor del modelo que el integrador posee cuando el envolvente de plano de control preferido del comprador no es Vertex AI: la capa de enrutamiento multinube que el comprador mantiene porque la función de adquisiciones no se compromete con un único hiperescalador. La superficie de la Gemini API recibe el mismo precio y la misma disponibilidad general al mismo tiempo; la diferencia es que el registro de auditoría, los controles de servicio de VPC, la vinculación a IAM y la fijación de región de residencia son responsabilidad del comprador de cablear en el sustrato del integrador, no de Google.

La disponibilidad general simultánea en las tres superficies le dice al comprador que el modelo ya no es un producto exclusivo de Vertex; es una entrada de la matriz de enrutamiento que el comprador puede canalizar a través de cualquiera de los envolventes de plano de control que el contrato de adquisición FY27 ya tenga codificado.

El sprint de diligencia por vertical para ejecutar este trimestre

El modo de fallo estándar del lado del comprador tras la disponibilidad general de un modelo de razonamiento de frontera se ve así: el equipo de plataforma lee el titular del benchmark, presenta un ticket de matriz de enrutamiento para probar el nuevo modelo en la carga de trabajo de alto costo, la bandera de característica de la capa de enrutamiento se activa para un vertical, la tasa de aprobación por vertical en el conjunto de oro no mejora visiblemente, el equipo de plataforma concluye que el nuevo modelo no es mejor y revierte. El vertical que se benefició de Deep Think —la cola difícil de calificar donde la capa de juicio senior era lo único que atrapaba las completaciones silenciosamente erróneas— nunca recibe la actualización de la matriz de enrutamiento, y el comprador del futuro que ejecutó el sprint de diligencia por vertical con honestidad lanza la curva de costos por vertical 6 meses antes que el comprador que activó la bandera de característica una sola vez.

El sprint de diligencia que el comprador que lee este anuncio con cuidado ejecuta este trimestre:

  1. Recalificar el conjunto de oro por vertical contra el modo estándar de Gemini 2.5 Pro, el modo Deep Think de Gemini 2.5 Pro, Opus 4.7 con pensamiento extendido y GPT-5.5 con el esfuerzo de razonamiento ajustado a la prima equivalente. La paridad de tasa de aprobación con el mismo cómputo efectivo por solicitud es la cifra del titular; la composición de la cola de fallos por vertical (tasa de completación silenciosamente errónea, tasa de deriva de instrucciones, tasa de alucinación, tasa de corrección de llamadas a herramientas) es la calificación a nivel de espacio que la matriz de enrutamiento realmente codifica.
  2. Calcular el costo efectivo por salida aceptada por vertical: no la tarifa de lista por token, sino el costo por vertical neto de la tasa de retrabajo de la capa de juicio senior. El vertical donde el modo estándar de Gemini 2.5 Pro le gana a Opus 4.7 en costo por salida aceptada es la entrada de la matriz de enrutamiento que el plan FY27 del comprador debería codificar; el vertical donde Deep Think se paga solo contra la tasa de retrabajo de la capa de juicio senior es el que la matriz de enrutamiento debería activar; el vertical donde Opus 4.7 todavía se paga solo es el que el comprador no debería reequilibrar solo porque se lanzó la nueva entrada.
  3. Cablear el envolvente de contexto de 2M en la cola de contexto largo de la carga de trabajo del vertical: comprensión de bases de código grandes, recuperación multidocumento en verticales regulados, auditoría de flujos de trabajo agénticos de traza larga. La tasa de aprobación por vertical en el límite de 2M es la calificación a nivel de espacio que a la matriz de enrutamiento del comprador le ha estado faltando porque la matriz de enrutamiento anterior no tenía un modelo de 2M de calidad de frontera a este punto de precio contra el cual calificar.
  4. Recalibrar la calibración de la capa de juicio senior para cada vertical donde cambió la entrada de la matriz de enrutamiento. La calibración previa de la capa era contra el titular anterior de la matriz de enrutamiento; la nueva entrada necesita nuevos conjuntos de oro, nuevas rúbricas de modos de fallo y una cadencia renovada de la cola de revisores senior. El comprador que activa la bandera de característica sin recalibrar la capa es el comprador que pierde la ganancia de precisión por vertical porque la capa ahora atrapa los modos de fallo equivocados.

Qué significa el espacio de Fable 5 suspendido para exportación para la matriz de enrutamiento

El espacio de la matriz de enrutamiento que la disponibilidad general de Gemini 2.5 Pro Deep Think también cambia es el que Fable 5 se suponía que iba a llenar para el comprador que precalificó el plan FY27 contra el modelo que se lanzó el 9 de junio y fue suspendido para exportación el 12 de junio. El puntaje de 95% en SWE-bench que alcanzó Fable 5 fue el titular; la suspensión para exportación es la realidad de adquisiciones que el comprador tiene que codificar en el plan FY27: el modelo existe, el comprador no puede adquirirlo hoy en un contrato vigente hacia adelante, y el espacio de la matriz de enrutamiento que el comprador precalificó contra él tiene que rellenarse con un modelo que el comprador todavía pueda conseguir mañana.

Gemini 2.5 Pro Deep Think es uno de los tres candidatos que el comprador todavía puede conseguir para el espacio de razonamiento de frontera, junto a Opus 4.7 y GPT-5.5, ambos de los cuales también siguen siendo alcanzables en contratos vigentes hacia adelante. El comprador que ejecutó el plan FY27 contra Fable 5 en la columna de lo que desearíamos tener y contra Opus 4.7 en la columna de lo que todavía podemos conseguir ahora tiene una tercera entrada en la segunda columna contra la cual el sprint de diligencia puede recalificar. El comprador que no precalificó la columna de lo que todavía podemos conseguir y ahora está mirando un hueco en la matriz de enrutamiento es el que tiene que ejecutar el sprint completo de diligencia por vertical en el Q3 en lugar del Q4, y paga la penalización de tiempo de adquisición de ejecutar el sprint contra la fecha límite del plan FY27 en lugar de adelantarse a ella.

Qué significa para el integrador y la capa de entrenamiento de IA

El anuncio del proveedor del modelo reorganiza el titular de la matriz de enrutamiento; el sprint de diligencia por vertical es el trabajo que traduce el titular en una decisión de adquisición que el comprador pueda defender en el comité FY27. Ese sprint tiene tres componentes que el comprador casi siempre subdimensiona en recursos:

  • Curación del conjunto de oro por vertical y renovación de rúbricas: los activos contra los que la capa de juicio senior realmente califica. El benchmark del titular es genérico; el conjunto de oro por vertical es la composición de la cola de fallos propia del comprador, codificada por expertos del dominio que pueden distinguir la completación silenciosamente errónea de la completación visiblemente correcta en la misma representación de superficie. El integrador que no mantiene el conjunto de oro por vertical como un activo de primera clase es el integrador que recalifica la matriz de enrutamiento contra una rúbrica obsoleta y pierde la conclusión del sprint de diligencia frente al comprador del futuro que sí lo hizo.
  • Calibración de la capa de juicio senior: el grupo de humanos en el ciclo al que el comprador enruta la cola difícil por vertical, y cuyas decisiones calibradas alimentan la próxima renovación del conjunto de oro. La capa no es un respaldo; es la capa de calibración para la matriz de enrutamiento en sí, y el comprador que ejecuta la capa contra un banco genérico de trabajadores de multitud pierde la ganancia de precisión por vertical porque el juicio senior de la capa no coincide con el modo de fallo por vertical que la nueva entrada habría atrapado.
  • Infraestructura de la matriz de enrutamiento a través de las superficies de AI Studio / Vertex AI / Gemini API / Bedrock / Foundry / API directa del proveedor: el envolvente de plano de control multisuperficie y multiproveedor contra el que el plan FY27 del comprador realmente se ejecuta. El integrador que construyó la matriz de enrutamiento como una bandera de característica exclusiva de Vertex no tiene la infraestructura para calificar la entrada de Opus 4.7 contra la entrada de Gemini 2.5 Pro Deep Think contra la entrada de GPT-5.5 en la misma carga de trabajo por vertical; el integrador que construyó la matriz de enrutamiento como un sustrato agnóstico al proveedor es aquel cuyo comprador puede ejecutar el sprint de diligencia en días, no en trimestres.

El comprador que entra al Q3 con el conjunto de oro por vertical, la capa de juicio senior calibrada para la nueva entrada y la infraestructura de la matriz de enrutamiento portable a través de las tres superficies es el comprador que convierte el anuncio del 22 de junio en una ventaja compuesta de curva de costos por vertical. El comprador que activa la bandera de característica en la carga de trabajo de alto costo, no observa ninguna mejora en el titular y revierte es el comprador que pierde la ganancia de precisión por vertical para la que se diseñó el espacio, y lo descubre seis meses después cuando el comprador del futuro lanza el informe de tasa de aprobación por vertical que cierra la decisión de adquisición que el plan FY27 se suponía que iba a codificar.

El espacio de razonamiento de frontera acaba de ganar una tercera entrada creíble que el comprador todavía puede conseguir mañana. El sprint de diligencia por vertical es el trabajo que decide a través de qué entrada el plan FY27 debería enrutar la carga de trabajo por vertical. El comprador que ejecuta el sprint con honestidad gana la curva de costos; el comprador que se ancla al benchmark del titular la pierde.