SONNET CODE
← Volver a todos los artículos
Desarrollo de IA2 de julio de 2026·9 min de lectura

MAI-Code-1-Flash de Microsoft llega en GA a Copilot Enterprise

Lo que Microsoft lanzó el 26 de junio y por qué cambió el carril empresarial de enrutamiento

Microsoft llevó a MAI-Code-1-Flash a disponibilidad general para Copilot Business y Copilot Enterprise el 26 de junio de 2026, tras el debut del modelo en Copilot Pro el 2 de junio y la expansión de superficies del 18 de junio. MAI-Code-1-Flash es el primer modelo de programación de tier-de-frontera propio de Microsoft AI — un transformador MoE-esparso de 137B totales / 5B activos por token con una ventana de contexto de 256K tokens, ajustado para programación agéntica rápida, de baja latencia y alto volumen. Los propios números de Microsoft lo colocan en 51.2% en SWE-Bench Pro, contra 35.2% para Claude Haiku 4.5 de Anthropic. La facturación por uso lista $0.75 por M de tokens de entrada, $0.075 por M de entrada cacheada, y $4.50 por M de salida — y los administradores de Copilot Business y Enterprise deben habilitar la política del modelo antes de que sus usuarios puedan acceder.

Las lecturas operativamente importantes:

  • Microsoft ahora es dueña de la capa de modelo-de-programación en Copilot, no solo de las capas de IDE e integración-de-proveedor. La superficie de Copilot históricamente enrutaba a Anthropic / OpenAI / Google como sustrato; MAI-Code-1-Flash es el primer sustrato nativo de Microsoft en esa superficie. La afirmación de neutralidad-de-proveedor que Copilot solía hacer contra Cursor ahora es una pregunta de política de enrutamiento, no una afirmación de marca-de-proveedor.
  • El precio está deliberadamente posicionado por debajo del tier Haiku / Flash. $0.75/$4.50 por M se sitúa bajo Claude Haiku 4.5 ($1/$5) y Gemini 3.5 Flash ($1.50/$9) en la superficie de programación de tier-rápido, y viene con una ventaja de 16 puntos en precisión en SWE-Bench Pro contra Haiku 4.5. El equipo que enruta cargas de trabajo de agente-de-programación iterativas de alto volumen contra el tier Haiku o Flash sin volver a ejecutar su shootout por-carga-de-trabajo contra MAI-Code-1-Flash está dejando margen sobre la mesa por un sustrato cuya precisión-por-dólar acaba de moverse.
  • La puerta de política-de-admin es el artefacto de control empresarial que el plan de adquisiciones de FY27 ya necesitaba. Los administradores de Copilot Business y Enterprise activan o desactivan el modelo en los ajustes de Copilot, y el toggle aplica por-tenant. Eso significa que MAI-Code-1-Flash es opt-in a nivel de tenant — la envolvente de portabilidad-de-proveedor sobre el contrato permanente permanece intacta, y el flujo de aprobación-por-modelo del tenant (revisión de compliance, auditoría de egreso-de-datos, política de uso-de-herramientas) es la puerta que el sustrato tiene que superar antes de que el bucle del agente-de-programación pueda correr contra él.
  • La ventana de contexto de 256K tokens es la especificación portante, no el conteo de 137B parámetros. La superficie de programación iterativa de alto volumen (auto-completación, reescritura por-archivo, sugerencia por-hunk) califica contra latencia-por-sugerencia y contexto-por-sugerencia, no contra clase de sustrato de 1M tokens. 256K es la ventana correcta para la clase de carga de trabajo contra la que el modelo está priceado.

La lectura estructural no es Microsoft lanzó un modelo de Copilot. Es que el carril empresarial de enrutamiento de agente-de-programación en Copilot Business y Enterprise ahora tiene un sustrato de tier-rápido nativo de Microsoft a un punto de precio más bajo que los proveedores no-Microsoft del tier-rápido, con control de política-de-admin alcanzado por tenant que la función de adquisiciones ya necesitaba, y la matriz de enrutamiento de FY27 redactada hace seis meses necesita un re-shootout por-clase-de-carga-de-trabajo dentro del sprint.

Lo que MAI-Code-1-Flash reestructura para la matriz de enrutamiento anclada en Copilot

La ruta-por-defecto del tier-rápido en Copilot Business y Enterprise ahora es un carril propiedad-de-Microsoft, no un carril intermediado-por-Anthropic-o-Google. Hace seis meses, el modelo mental era enrutar cargas iterativas de alto volumen de Copilot a Claude Haiku 4.5 o Gemini 3.5 Flash como el tier rápido, escalar a Sonnet u Opus para las cargas más duras. La envolvente de precio-y-precisión de MAI-Code-1-Flash colapsa el default del tier-rápido: enrutar cargas iterativas de alto volumen de Copilot a MAI-Code-1-Flash como el default del tier-rápido, escalar a Sonnet 5 u Opus 4.8 para las cargas con brecha-de-verificador-abierta, y reservar los proveedores no-Microsoft del tier-rápido para las clases de carga de trabajo donde la portabilidad respalda la palanca de negociación.

El toggle de política-de-admin se convierte en el artefacto de cambio-de-sustrato por-tenant contra el cual la función de adquisiciones lanza. El panel de política-de-modelo del administrador de Copilot Enterprise es donde la decisión de sustrato de enrutamiento realmente aterriza para el tenant empresarial — no el memo del CIO, no el mazo de diapositivas del AI Council. El toggle de política es opt-in, por-tenant, y reversible. La función de adquisiciones que trata el toggle como el artefacto de cambio-de-sustrato lanza el cambio dentro del sprint; la función que lo trata como un checkbox de operaciones-de-TI lanza el cambio en el trimestre después del siguiente.

El contrato permanente de frontera-de-programación con dos proveedores obtiene un ancla más fuerte del lado Microsoft. El mapa de frontera anclado en Copilot con cuatro proveedores (Microsoft MAI-Code / MAI-Code-1-Flash, Anthropic Opus 4.8 / Sonnet 5, OpenAI GPT-5.6 Sol, Google Gemini 3.5 Flash / Gemini 3 Deep Think) califica contra portabilidad por-clase-de-carga-de-trabajo, no lealtad al proveedor. MAI-Code-1-Flash fortalece el lado Microsoft del ancla dual-proveedor en el tier rápido donde los proveedores no-Microsoft previamente tenían el liderazgo de precio-por-tarea-exitosa; la negociación del contrato permanente este trimestre corre contra una oferta Microsoft más fuerte que la del trimestre pasado.

La envolvente de facturación por-uso en Copilot Business y Enterprise obtiene un ancla más barata. La transición del 1 de junio a Créditos-de-IA basados-en-uso hizo del costo por-carga-de-trabajo la métrica portante para la partida de Copilot; MAI-Code-1-Flash a $0.75/$4.50 baja el costo por-sugerencia en la superficie iterativa de alto volumen aproximadamente 40% versus el ancla Haiku 4.5 a $1/$5. El gasto anualizado de la partida-de-Copilot mejora contra el mismo bucle de agente-de-programación — el cambio está en la política de enrutamiento, no en la cadena de herramientas.

Dónde el lanzamiento de MAI-Code-1-Flash es señal y dónde es ruido

Señal: Microsoft ahora es dueña de la capa de modelo-de-programación en Copilot Business y Enterprise. La afirmación de neutralidad-de-proveedor que Copilot solía hacer ahora es una pregunta de política de enrutamiento, no una afirmación de marca-de-proveedor. Cada tenant empresarial de Copilot cuya arquitectura de FY27 fue escrita contra Copilot enruta a modelos de terceros es candidato para una re-auditoría contra Copilot enruta a un default nativo-de-Microsoft con escalación a terceros.

Señal: la ventaja de 16 puntos en precisión en SWE-Bench Pro versus Haiku 4.5 a un precio más bajo es la noticia real. La frontera de precisión-por-dólar en el tier rápido se movió. Cada clase de carga de trabajo de agente-de-programación iterativa de alto volumen cuya decisión de enrutamiento de FY27 se tomó al 35.2% de precisión de Haiku 4.5 es candidata para re-shootout al 51.2% de precisión de MAI-Code-1-Flash a un costo por-token más bajo.

Ruido: MAI-Code-1-Flash reemplaza el mapa de frontera Copilot con cuatro proveedores es el marco incorrecto. Los proveedores no-Microsoft permanecen en los carriles de escalación-y-portabilidad. El marco correcto es MAI-Code-1-Flash se convierte en el default del tier-rápido en Copilot Business y Enterprise; Sonnet 5 permanece como el default de programación protegida por verificador en el tier superior; Opus 4.8 permanece como el camino de escalación para brecha-de-verificador-abierta; los proveedores no-Microsoft del tier-rápido permanecen como las anclas de portabilidad sobre la negociación del contrato permanente.

Ruido: el toggle de política-de-admin es un detalle de compliance es el marco incorrecto. El toggle es el artefacto de control empresarial contra el cual corre la decisión de cambio-de-sustrato. La función de adquisiciones que trata el toggle como la decisión de cambio-de-sustrato lanza el cambio dentro del sprint; la función que lo trata como un paso rutinario de operaciones-de-TI lanza el cambio en el trimestre después del siguiente.

Lo que el equipo de ingeniería debería hacer en las próximas dos semanas

Ejecutar el shootout por-clase-de-carga-de-trabajo con MAI-Code-1-Flash contra Haiku 4.5 y Gemini 3.5 Flash dentro de dos semanas. Para las tres clases principales de carga de trabajo iterativa de alto volumen del equipo (reescrituras por-archivo contra pruebas explícitas, auto-completación por-hunk contra contratos de tipo explícitos, completación de salida-estructurada contra esquemas deterministas), medir tasa-de-aprobación por-clase, latencia-por-sugerencia por-clase, costo-por-token por-clase, y brecha-de-cobertura-del-verificador por-clase. La salida es el artefacto de actualización de política-de-enrutamiento contra el que corre la negociación del contrato permanente de Copilot.

Coordinar el toggle de política-de-admin con los flujos de revisión-de-compliance y auditoría-de-egreso-de-datos este sprint. El panel de política-de-modelo del administrador de Copilot Enterprise es el artefacto sobre el que aterriza la decisión de cambio-de-sustrato. La función de adquisiciones que ejecuta el cambio-de-sustrato por-tenant necesita el sign-off de revisión-de-compliance, la auditoría de egreso-de-datos y la re-delimitación de la política de uso-de-herramientas en el mismo sprint. Lanzar el toggle dentro del sprint con los sign-offs adjuntos; no lanzar el toggle sin ellos.

Actualizar la política de enrutamiento por-prompt para voltear el default del tier-rápido de Haiku 4.5 a MAI-Code-1-Flash en tenants de Copilot Business y Enterprise. El artefacto de política-de-enrutamiento en el repo del equipo es donde aterriza el cambio de sustrato. Lanzar el flip de ruta-por-defecto contra cargas de trabajo iterativas de alto volumen este sprint, y escribir el camino de escalación contra las clases de carga de trabajo de brecha-de-cobertura-del-verificador que el shootout identificó.

Re-calificar la superficie de throughput-de-programación anclada en Copilot contra la nueva envolvente de costo por-sugerencia. El presupuesto por-sugerencia y el gasto por-semana de la partida-de-Copilot se fijaron contra el costo por-token del tier rápido anterior. Re-calificar el presupuesto contra la caída de costo de ~40% y lanzar el presupuesto de throughput-de-programación actualizado dentro del sprint. La superficie de throughput por-semana anclada en Copilot del equipo mejora sin un nuevo orquestador.

Lo que MAI-Code-1-Flash abarata pero no reemplaza

MAI-Code-1-Flash comprime el costo por-sugerencia del carril de enrutamiento por-defecto del tier-rápido anclado en Copilot, no el juicio-senior de decidir qué clases de carga de trabajo tienen forma-de-tier-rápido, escribir el verificador contra el que califica la decisión de enrutamiento del tier-rápido, ser dueño del flujo de sign-off de política-de-admin por-tenant a través del cual se lanza el cambio de sustrato, y ejecutar la revisión-de-código de la política-de-enrutamiento por-ciclo contra el bucle de agente-de-programación anclado en Copilot del equipo. Los equipos que confunden el costo por-sugerencia abaratado con el juicio abaratado enrutan las cargas con brecha-de-verificador-abierta contra un sustrato cuyo modo de falla no es capturable en el tier rápido, y leen el post-mortem por-ciclo sobre la brecha de la política-de-enrutamiento que el shootout habría expuesto. Los equipos que mantienen el juicio-senior en el centro de la decisión de cambio-de-sustrato traducen el cambio a mejoras de throughput por-semana anclado en Copilot que el mapa de tiers anterior no podía producir.

La pregunta de enrutamiento de modelo ya no es cuál modelo es el default de Copilot; es para qué clases de carga de trabajo el sustrato MAI-Code-1-Flash es el default del tier-rápido, para qué clases de carga de trabajo el sustrato Sonnet 5 es el default del tier-superior, para qué clases de carga de trabajo el sustrato Opus 4.8 es el camino de escalación, y qué envolvente de portabilidad por-proveedor respalda el contrato permanente de Copilot Business y Enterprise contra el mapa de frontera anclado en Copilot con cuatro proveedores.


En SONNET CODE ejecutamos la práctica de Desarrollo de IA contra el artefacto de política de enrutamiento por-prompt — shootouts por-clase-de-carga-de-trabajo sobre el tier-rápido anclado en Copilot, flujos de cambio-de-sustrato de política-de-admin por-tenant, y revisiones-de-código de política-de-enrutamiento por-ciclo contra el bucle de agente-de-programación anclado en Copilot del equipo. Si el tenant de Copilot Enterprise de tu equipo todavía enruta cargas iterativas de alto volumen contra el ancla Haiku 4.5 o Gemini Flash, agenda una llamada — te llevaremos a través del flujo de cambio-de-sustrato que lanzamos dentro de un sprint contra el nuevo default del tier-rápido nativo-de-Microsoft.