GitHub Copilot pasa a cobro por uso: AI Credits reemplazan planes

Lo que cambió el 1 de junio de 2026

GitHub activó el mayor cambio de precios que la categoría de asistentes de programación ha visto desde el lanzamiento de Copilot. Todos los planes de Copilot — Free, Pro, Pro+, Business, Enterprise — están ahora en cobro por uso. Las Premium Request Units (PRUs), la abstracción que ocultaba el medidor detrás de un conteo mensual fijo, desaparecieron. En su lugar: GitHub AI Credits, facturados contra el consumo real de tokens de entrada, salida y caché al precio publicado de la API por modelo.

Las cifras clave del anuncio del 1 de junio:

Copilot Pro — $10/mes, $10 de AI Credits incluidos al mes.
Copilot Pro+ — $39/mes, $39 de AI Credits incluidos al mes.
Copilot Business — $19/usuario/mes, $19 de AI Credits por usuario al mes.
Copilot Enterprise — $39/usuario/mes, $39 de AI Credits por usuario al mes.
Excedentes — facturados al final del ciclo al precio API por modelo; los administradores pueden poner topes de presupuesto por usuario.

La experiencia de factura-en-vista-previa de mayo permitió a los administradores ver el medidor mensual proyectado contra la línea base de PRU antes del cambio. El patrón coincide con lo que Cursor, Codex y Claude Code ya hacen — el mapa permanente de cuatro proveedores para herramientas de programación premium ahora está medido de forma uniforme, con el nivel-plano-con-paquete-incluido como la única simplificación visible al consumidor.

Por qué terminó la era de los planes planos

La generación de agentes de larga duración rompió la economía de los planes planos. Un usuario Pro que ejecutaba un bucle interactivo de autocompletar en 2024 generaba un costo de tokens predecible por día; el mismo usuario en 2026 despachando agentes paralelos en worktrees de git, ejecutando refactorizaciones nocturnas y enrutando a modelos frontera para subtareas difíciles genera un costo de tokens que oscila 10x a 100x entre un día tranquilo de planeación y un día activo de migración.

Los precios planos bajo esa distribución fuerzan uno de dos desenlaces:

El proveedor absorbe la cola larga. Los usuarios intensivos subsidian la exposición al costo marginal del modelo, y el margen bruto del proveedor se comprime cada trimestre conforme sube la tarifa por token del modelo frontera.
El proveedor limita el uso. Las PRUs eran el tope blando — le compraron al proveedor un año de pista al hacer opaco el medidor, pero el medidor seguía corriendo y los usuarios de Copilot fueron quienes leyeron los avisos de limitación en el IDE para el primer trimestre de 2026.

El cobro por uso hace visible el costo al comprador, le permite enrutar su propio presupuesto por característica y elimina la compresión de margen bruto que forzó la generación de agentes de larga duración. También hace honesta la conversación de adquisiciones: la partida de FY27 ya no es asientos × $/mes — es asientos × paquete-de-créditos-incluidos + consumo variable por equipo medido mensualmente.

Lo que el plan de FY27 tiene que codificar

Cuatro cambios que se siguen cuando el espacio del asistente de programación cruza de precio-plano a precio-medido en todo el mapa permanente de proveedores.

La partida de costo variable por equipo se convierte en un artefacto de adquisición de primer nivel. El equipo que ejecuta el plan permanente de FY27 contra la hoja de cálculo de tarifa plana anterior es el equipo al que sorprende la primera factura por excedente cuando un sprint activo de migración dispara el medidor por usuario. La remediación es el tope de presupuesto-de-tokens mensual por equipo, la atribución de consumo por característica (autocompletado vs. despacho de agente vs. ejecución en segundo plano), y la banda de variación mensual que la función FinOps puede respaldar contra el presupuesto permanente.

La decisión de enrutamiento por modelo pasa de ser una preferencia de experiencia-de-desarrollador a una optimización de costo unitario. Bajo el cobro por uso, la elección del desarrollador entre enrutar este prompt por el modelo pequeño y rápido y enrutarlo por el modelo frontera ya no es una preferencia de calidad; es una decisión de costo-unitario por prompt. El equipo que escribe explícitamente la política de enrutamiento por tarea — modelo pequeño para autocompletar, modelo intermedio para ediciones en línea, modelo frontera para ejecuciones de agente de horizonte largo, con la matriz de enrutamiento mantenida como un artefacto listo para revisión de código — recupera la curva de productividad-por-dólar que expone el sustrato medido.

El compromiso de portabilidad de doble proveedor se convierte en el ancla del contrato permanente. Un mapa de cuatro proveedores (Cursor bajo SpaceX, Claude Code bajo Anthropic, Codex bajo OpenAI, Copilot bajo Microsoft) ahora todos en cobro por uso uniforme es exactamente la forma donde el contrato permanente debería anclarse contra dos proveedores y conseguir el resto como segunda fuente. La palanca de portabilidad es el contrato de flujo de trabajo por equipo — la política por prompt, el arnés de verificación por agente, la configuración de arranque por repositorio — escrito de forma suficientemente portable como para que un trimestre de aviso sobre un cambio de precios por proveedor le permita al equipo enrutar la carga permanente al proveedor de segunda fuente sin reescribir el flujo.

El presupuesto de atención-de-ingeniería-senior se convierte en el regulador portante. El sustrato medido expone el costo de cada pulsación que reentra en una invocación al modelo frontera. El equipo que confunde el costo-por-pulsación abaratado con el costo-por-decisión abaratado publica el primer post-mortem del trimestre medido sobre el bucle de agente que consumió $40,000 de tokens de modelo frontera contra una especificación ambigua que el equipo no había apretado antes de despachar la ejecución. La función FinOps por sí sola no puede cargar ese regulador — el regulador es el presupuesto de atención-de-ingeniería-senior del equipo contra la decisión por despacho, con el contrato de verificación por despacho como el artefacto permanente.

Dónde golpea más fuerte al equipo de producto-integrado-con-IA

El equipo de producto que lanza características de IA contra una API de modelo frontera ha estado en cobro por uso desde el día uno — la novedad es que el sustrato del asistente de programación que el equipo usa para construir esas características ahora también está medido. La lectura compuesta es real: el presupuesto de inferencia por característica del lado de producción y el presupuesto de asistente de programación por equipo del lado de desarrollo corren ambos contra la misma hoja de cálculo de FinOps, oscilan ambos con la misma generación de agentes de larga duración, recompensan ambos la misma disciplina de enrutamiento por prompt.

Los equipos que ya tienen el presupuesto de inferencia por característica bajo control se adaptarán al cambio de Copilot en un trimestre. Los equipos que han estado tratando su factura de modelo frontera como un costo fijo de hacer negocios encontrarán ambos presupuestos comportándose mal al mismo tiempo, y el plan de FY27 que no presupuestó ninguna de las dos oscilaciones será el plan de FY27 que se vuelva a cortar en el ciclo de pronóstico de agosto.

La pregunta de adquisición ya no es qué nivel de asiento compra el equipo; es cuáles dos de los cuatro proveedores medidos anclan el contrato permanente, cuál tope de presupuesto-de-tokens por equipo respalda la función FinOps, cuál política de enrutamiento por tarea mantiene la función de ingeniería como un artefacto listo para revisión de código, y cuál presupuesto de atención-de-ingeniería-senior regula la decisión por despacho a la que el sustrato medido ahora le pone precio. Los equipos que hacen la pregunta correcta este trimestre recuperan la ganancia de productividad que expone el sustrato medido; los equipos que hacen la incorrecta se compran la factura de agosto cuya decisión de despacho nadie en el equipo asumió.

En SONNET CODE corremos nuestro propio equipo de ingeniería sobre el mismo sustrato medido, y la política de enrutamiento por tarea más el presupuesto de inferencia por característica son los dos artefactos que entregamos a los clientes en cada engagement de integración con IA. Si tu equipo está reconstruyendo el plan de adquisiciones de FY27 alrededor del nuevo medidor, agenda una llamada — te llevamos por la política de enrutamiento por tarea que corremos contra el mapa de cuatro proveedores.