Los $1.2B de ingresos de Surge AI superan los $870M de Scale AI en 2024

Qué señala para el slot de entrenamiento de IA la inversión de ingresos de Surge sobre Scale

El slot de adquisición de datos de entrenamiento de IA del plan FY27 del comprador acaba de ver destronado a su titular, y la hoja de cálculo de adquisición ahora lee la inversión que el envolvente de cobertura de analistas ha venido telegrafiando durante dos trimestres: Surge AI, financiada con recursos propios, alcanzó los $1.2 mil millones en ingresos en 2024, superando los $870 millones de Scale AI — sin rondas de capital de riesgo, sin un banco público de etiquetadores de crowd-worker, sin el modelo de precios de RLHF agrupado-y-subsidiado con el que el titular anterior cabalgó hasta el liderazgo de categoría. La mecánica del titular es que Surge cobra hasta 10x la tarifa del banco de commodity por trabajo de RLHF complejo, de alto valor, de laboratorios de frontera, paga a sus anotadores aprobados de 30 a 40 centavos por minuto trabajado — $18 a $24 por hora — muy por encima de la tarifa típica de crowd-worker, y empaqueta el pool de expertos senior de dominio contra la cola de fallos del vertical de industria regulada que el banco agrupado de commodity no puede calificar.

Las señales complementarias que la hoja de cálculo de adquisición ahora lee junto a la inversión de ingresos:

Los principales laboratorios de IA — Google, OpenAI, Meta, Anthropic — gastan cada uno del orden de $1 mil millones al año en datos de entrenamiento provistos por humanos, una cifra de gasto de categoría que coloca la partida de entrenamiento de IA por vertical del comprador frente a un sustrato de adquisición que es más grande que la partida de licenciamiento de modelos junto a la cual se ubica en el plan FY27.
Los contratos empresariales de Surge comienzan en $50,000 a $60,000 anuales y escalan hacia arriba — la forma de contrato de servicio gestionado del pool de expertos senior de dominio, no la forma de partida de facturación medida por tarifa-API-por-tarea contra la que fijó precios el banco de commodity.
Los niveles pagos de Scale van de $49 a $1,999 por mes con opciones empresariales que incluyen infraestructura personalizada, integraciones avanzadas y soporte de guante blanco, y los comentarios públicos describen a Scale usando ofertas agrupadas y precios de RLHF subsidiados para mantener su cuota de mercado — la defensa de poder de fijación de precios del sustrato de commodity que el titular ejecuta cuando el pool de expertos senior de dominio está tomando el extremo de industria regulada de la cuña.
Los modelos entrenados con RLHF producen 40% menos salidas tóxicas que los modelos entrenados únicamente con datos sintéticos — la señal de calidad de resultado que el comité de seguridad y cumplimiento del comprador ahora lee por encima de la señal de precisión por vertical, y la partida que el plan FY27 ya no puede diferir a el proveedor del modelo se encargará del alineamiento por nosotros.

La pregunta de adquisición para todo comprador cuyo plan FY27 tenga una partida de entrenamiento de IA ya no es ¿ejecutamos el pipeline de datos de RLHF por vertical?; es qué sustrato — pool premium de expertos de dominio o banco agrupado de commodity — llena cuál slot por vertical del sustrato de datos de entrenamiento del comprador, y el sprint de diligencia que califica la composición del slot tiene que ejecutarse este trimestre.

Por qué el pool premium de expertos de dominio gana la cola de industria regulada

El modelo de precios del banco agrupado de commodity con el que cabalgó el titular anterior es la forma del sustrato de crowd-worker: un gran pool de anotadores con entrenamiento de grado general, pagados a una baja tarifa por tarea, calificados contra un envolvente de calidad por tarea que la capa de control de calidad del sustrato de la plataforma impone. El sustrato es eficiente a escala en tareas que el envolvente de calidad por tarea puede calificar — etiquetado de clasificación de imágenes, dibujo de bounding-box, transcripción, ranking genérico de respuestas conversacionales. El sustrato no sobrevive al contacto con la cola de fallos del vertical de industria regulada porque la cola de fallos es, por construcción, la cola que el envolvente de calidad por tarea no puede calificar: la completación-silenciosamente-incorrecta donde la respuesta del modelo es gramaticalmente perfecta, plausiblemente correcta, internamente consistente, e incorrecta de una manera que solo el experto senior de dominio puede detectar.

El pool premium de expertos de dominio es el sustrato de capa de criterio senior: un pool más pequeño de anotadores con experiencia específica de dominio, pagados a una tarifa premium por minuto trabajado, calificados contra la composición de cola de fallos por vertical que la capa de criterio senior codifica. El sustrato es ineficiente a la escala del banco de commodity en tareas que el envolvente de calidad por tarea puede calificar — el costo unitario por anotación aceptada es mayor porque el tiempo por tarea es más largo y la tarifa por minuto es múltiplos de la tarifa de crowd-worker — pero el sustrato gana la cola del vertical de industria regulada porque la cola de fallos es exactamente el sustrato que la capa de criterio senior fue diseñada para calificar. El comprador que ejecuta el pipeline de datos de RLHF por vertical contra el sustrato del banco agrupado de commodity en la cola de industria regulada es el comprador que paga la tarifa por tarea más barata y envía la completación-silenciosamente-incorrecta a la cola de fallos por vertical que el comité de cumplimiento del comprador eventualmente encontrará — y paga el costo del ciclo de reentrenamiento post-despliegue, la regresión de precisión por vertical, y la pérdida de credibilidad de adquisición frente al comprador de más adelante que pagó la prima del pool de expertos senior de dominio por adelantado y entregó la ganancia de precisión por vertical que el plan FY27 se suponía debía codificar.

La inversión de ingresos es la señal de fijación de precios de mercado de que el pool premium de expertos de dominio ya ganó la cola de industria regulada en el ciclo presupuestario FY26. El comprador que no codifica la inversión en el plan FY27 es el comprador que difiere la ganancia de precisión por vertical por un ciclo de release completo mientras el comprador de más adelante se capitaliza contra él.

Qué le dice a la hoja de cálculo de adquisición la partida de $1B por laboratorio de frontera

La cifra de $1 mil millones al año por laboratorio de frontera en datos de entrenamiento provistos por humanos es el ancla de tamaño de mercado del sustrato contra el que la partida de la hoja de cálculo de adquisición se califica. Cuatro laboratorios de frontera a $1B cada uno es un piso de $4 mil millones para el sustrato de datos de entrenamiento de IA — y el piso no incluye el gasto de RLHF por vertical del lado del comprador empresarial que el plan FY27 ahora codifica contra el sustrato del lado del proveedor del modelo. La cifra de gasto de categoría le dice al comprador que el sustrato no es una amortización de costo fijo que el comprador puede evitar pagándole al proveedor del modelo por acceso a un modelo alineado de fábrica; es una partida de gasto operativo por vertical que el plan FY27 del comprador tiene que calificar contra su propia cola de fallos por vertical, porque:

El sustrato de alineamiento del proveedor del modelo se califica contra el conjunto dorado del proveedor del modelo — el envolvente cross-vertical, cross-industria, cross-modo-de-fallo contra el que se entrenó el clasificador de seguridad del proveedor del modelo. El sustrato de alineamiento del proveedor del modelo es necesario pero no suficiente para la cola de fallos por vertical del comprador: el modo de fallo por vertical del comprador es, por construcción, el modo de fallo que el conjunto dorado del proveedor del modelo no pudo calificar porque el modo de fallo es específico-por-vertical y el conjunto dorado del proveedor del modelo es agnóstico-por-vertical.
La capa de criterio senior por vertical del comprador es el sustrato que califica la cola de fallos por vertical, y el sustrato tiene que estar construido sobre el pool de expertos de dominio por vertical que el comprador mantiene — ya sea internamente (el comprador contrata al pool de expertos senior de dominio internamente, el plan FY27 codifica la partida de headcount, el equipo de plataforma es dueño de la cadencia de calibración de la capa) o externamente (el comprador contrata el pool de expertos senior de dominio de un proveedor de sustrato premium de RLHF como Surge, el plan FY27 codifica la partida de contrato de servicio gestionado, el equipo de plataforma es dueño de la cadencia de calibración de la capa y el proveedor es dueño del mantenimiento del pool de anotadores por tarifa-por-minuto).
El costo de mantenimiento del pool de anotadores que el proveedor de sustrato premium de RLHF amortiza a través de la partida del lado del comprador es el costo que la partida de headcount interno del comprador de otra manera tendría que absorber — reclutar expertos senior de dominio a $18 a $24 por hora, entrenarlos en la rúbrica de modo de fallo por vertical, calibrarlos contra el conjunto dorado por vertical del comprador, retenerlos contra el envolvente de salario y beneficios que un pool competitivo de expertos senior de dominio ahora exige. La tarifa por minuto del proveedor de sustrato premium de RLHF es la señal de fijación de precios make-versus-buy que la función de adquisición FY27 del comprador lee contra la alternativa de headcount interno.

El sprint de diligencia para ejecutar este trimestre sobre el slot de entrenamiento de IA

El comprador que entra al Q3 con el sprint de diligencia del slot de entrenamiento de IA ya ejecutado es el comprador cuyo plan FY27 codifica la partida de entrenamiento de IA por vertical contra el sustrato que la cola de fallos por vertical del comprador realmente requiere — no contra el sustrato al que el contrato de adquisición anterior llegó por defecto porque la partida FY26 todavía no tenía que calificar la ganancia de precisión por vertical honestamente.

El sprint tiene cuatro componentes que el equipo central de plataforma del comprador ya no puede diferir:

Mapear la composición de la cola de fallos por vertical — para cada vertical contra el que el plan FY27 del comprador envía un producto integrado con IA, el equipo de plataforma tiene que documentar la forma del modo de fallo por vertical que la capa de criterio senior necesita calificar: tasa de completación-silenciosamente-incorrecta, tasa de razonamiento-plausible-pero-incorrecto, tasa de deriva-de-instrucción, tasa de violación-específica-de-dominio-regulado, tasa de corrección-de-llamada-a-herramienta. El mapa de cola de fallos por vertical es el activo contra el que el sprint de diligencia de selección de sustrato se califica; el comprador que ejecuta el sprint contra una cola de fallos no documentada es el comprador que elige el sustrato contra la porción fácil-de-calificar de la carga de trabajo y envía la pérdida por desajuste de sustrato a la cola difícil-de-calificar.
Calificar a los candidatos de sustrato de datos de RLHF por vertical contra la cola de fallos por vertical — pool premium de expertos de dominio (forma-Surge: pool de anotadores senior, tarifa-por-minuto, contrato de servicio gestionado), banco agrupado de commodity (forma-Scale: gran pool de anotadores, tarifa-por-tarea, precios de nivel agrupado), y la alternativa interna del comprador (headcount FTE, pool interno gestionado, calibración de capa por vertical propia). Cada candidato tiene un perfil distinto de tasa-de-aprobación-por-dólar por vertical contra la cola de fallos por vertical; la conclusión del sprint de diligencia es la asignación de sustrato por vertical que el plan FY27 debería codificar, no una decisión de adquisición de sustrato único para todos los verticales.
Calibrar la capa de criterio senior por vertical contra el sustrato elegido — la calibración de la capa es el activo específico del sustrato que decide si el pipeline de datos de RLHF por vertical produce la ganancia de precisión por vertical o la regresión de precisión por vertical. La capa necesita conjuntos dorados por vertical, rúbricas de modo de fallo por vertical, objetivos de acuerdo entre anotadores por vertical, y una cadencia de actualización que siga el ciclo de release del proveedor del modelo. El comprador que ejecuta la capa contra una rúbrica genérica sobre un sustrato que califica contra la cola de fallos por vertical es el comprador que pierde la ganancia de precisión por vertical que el sustrato fue diseñado para entregar.
Conectar el pipeline de datos de RLHF por vertical al sustrato de la matriz de enrutamiento — el sustrato de datos de RLHF por vertical está aguas arriba de la decisión de matriz de enrutamiento por vertical que el plan FY27 del comprador codifica (Gemini 2.5 Pro Deep Think vs. Opus 4.7 vs. GPT-5.5 vs. open-weights-frontier). Los datos de RLHF por vertical que el comprador recopila tienen que ser portables a través de la frontera del sustrato del proveedor del modelo, porque la volatilidad de suspensión de exportación contra la que el plan FY27 ahora se califica (Fable 5 / Mythos 5 el 12 de junio, el próximo shock de disponibilidad de proveedor de modelo contra el que la función de adquisición tiene que defenderse) significa que el sustrato de datos de entrenamiento por vertical no puede quedar atado a la API de fine-tuning de un solo proveedor de modelo. El filtro de portabilidad de sustrato es el filtro de portabilidad de matriz de enrutamiento que el slot de agent-framework ya codificó; el slot de entrenamiento de IA ahora tiene que codificarlo también.

Cómo se ve la partida make-versus-buy para el plan FY27

Para el comprador cuya cola de fallos por vertical es densa en experiencia de dominio de industria regulada que el banco de commodity no puede calificar, la partida make-versus-buy se resuelve a favor del pool premium de expertos de dominio: la tarifa por minuto es múltiplos de la tarifa del banco de commodity pero el poder de fijación de precios del sustrato coincide con la capacidad de calificación de cola de fallos por vertical que la capa de criterio senior del comprador requiere, y la forma de contrato de servicio gestionado le permite al comprador escalar el pipeline de datos de RLHF por vertical contra la cadencia de lanzamiento de productos verticales del plan FY27 sin absorber el envolvente de reclutamiento-y-retención de expertos senior de dominio en el plan de headcount interno.

Para el comprador cuya carga de trabajo por vertical es densa en tareas de etiquetado de commodity que el envolvente de calidad por tarea puede calificar, la partida make-versus-buy se resuelve a favor del banco agrupado de commodity — la tarifa por tarea es el sustrato de precios correcto, la cola de fallos por vertical es lo suficientemente superficial como para que el envolvente de calidad por tarea atrape el modo de fallo, y los precios de nivel agrupado mapean a la forma de partida de volumen del plan FY27.

Para el comprador cuya carga de trabajo por vertical se ubica entre ambos — la mayoría de los compradores de industria regulada en servicios financieros, salud, sector público, seguros, ciencias de la vida, manufactura regulada y servicios públicos regulados — el make-versus-buy se resuelve a favor de una composición de sustrato que el plan FY27 codifica: banco agrupado de commodity para la cola-fácil-por-vertical (el nivel de volumen que el envolvente de calidad por tarea califica), más pool premium de expertos de dominio para la cola-difícil-por-vertical (el nivel de capa-de-criterio-senior que el pool-de-anotadores-por-tarifa-por-minuto califica), más headcount interno de expertos senior de dominio para la calibración-de-capa-de-matriz-de-enrutamiento que el comprador no puede tercerizar porque la cadencia de calibración es el activo de credibilidad-de-adquisición-por-vertical del que el plan FY27 del comprador es dueño de extremo a extremo.

Qué significa el adelanto de composición de sustrato para el pipeline del comprador

La inversión de ingresos es la señal de fijación de precios de mercado de que el pool premium de expertos de dominio ya ganó la cola de industria regulada. El sprint de diligencia de cuatro componentes es el trabajo que traduce la señal en la partida FY27 por vertical del comprador. El pipeline integrador que tiene la capacidad de mapeo de cola de fallos por vertical, la capacidad de calificación de sustrato de RLHF por vertical, la capacidad de calibración de capa de criterio senior por vertical, y la capacidad de plomería de portabilidad de sustrato de matriz de enrutamiento al mismo tiempo es el integrador cuyo calendario FY27 ya está reservado contra el adelanto aguas abajo del comprador — y el comprador que no ha retenido al integrador con la capacidad de sprint de diligencia a escala es el comprador cuyo plan FY27 envía la pérdida por desajuste de sustrato a la cola difícil por vertical mientras el comprador de más adelante se capitaliza contra la ventaja de composición de sustrato.

El slot de datos de entrenamiento de IA acaba de ver destronado a su titular en el ciclo presupuestario FY26. El plan FY27 del comprador tiene que codificar la composición de sustrato que la cola de fallos por vertical realmente requiere — no el sustrato al que la partida FY26 llegó por defecto. El sprint de diligencia es el trabajo que cierra la brecha; el comprador que lo ejecuta honestamente gana la curva de precisión por vertical, y el comprador que lo difiere pierde la ganancia de precisión por vertical ante un desajuste de sustrato que a la capa de criterio senior nunca se le dio el conjunto dorado para atrapar.