Newsletter diario de IA
Nº 020 · Martes, 30 de junio de 2026
California enchufa a Claude en todo su gobierno, Taiwán registra a Super Micro y un modelo abierto se cuela por delante de Opus 4.7
Día de adopción y de fricción. Por arriba, California convierte a Claude en el asistente estándar de todas sus agencias estatales con un 50% de descuento —el mayor despliegue de Anthropic en el sector público de EE. UU.—, mientras la geopolítica del hardware muerde: Taiwán registra las oficinas de Super Micro por el contrabando de chips de Nvidia y la acción cae más de un 9%. En plataformas, X se suma a Slack y AWS y lanza un MCP hospedado que enchufa la API de X a cualquier agente sin montar nada. Y en modelos, el open source Ornith-1.0 vive su pico de atención por adelantar a Claude Opus 4.7 en SWE-Bench, con la comunidad dividida sobre si la cifra es real. En X, la guerra del coste manda: Meta veta Claude Code y Codex puertas adentro por miedo a la destilación, Coinbase recorta a la mitad su factura de IA huyendo a modelos chinos, y Chamath levanta 135 millones para construir software dirigido por negocio. Y en herramientas, todo gira en torno a lo mismo: routing, inferencia local y MCP para bajar la factura de tokens.
3 apartados · 11 piezas · 9 min de lectura
Lo grande
4 piezasCalifornia da Claude a todas sus agencias estatales con un 50% de descuento
El gobernador Gavin Newsom anuncia una alianza "first-of-its-kind" con Anthropic: Claude disponible para todas las agencias del estado y para los gobiernos locales —ciudades y condados— con un 50% de descuento, más formación gratuita a los empleados públicos y soporte técnico de los desarrolladores de Anthropic. Es el primer asistente de IA que llega a todo el estado, a través del nuevo portal de servicios compartidos (SITeS) del Departamento de Tecnología de California; el DMV (atención al cliente) y la agencia de sanidad (flujos internos) ya lo usaban. California, quinta economía del mundo, se convierte así en el mayor despliegue de Claude en el sector público estadounidense.
Qué significa: la adopción institucional pasa de piloto a contrato a escala estatal. Para quien construye sobre Claude, una administración entera estandarizando sobre un modelo sube el suelo de expectativas y abre la puerta a integraciones con el sector público. Y marca contraste: Anthropic gana la pelea estatal mientras sigue enfrentada al gobierno federal por el uso de sus modelos top.
Taiwán registra las oficinas de Super Micro al ampliar la investigación de contrabando de chips de Nvidia
La fiscalía de Keelung registró el lunes las oficinas de Super Micro en Taiwán y las de tres empresas afiliadas —entre ellas el operador de centros de datos Chief Telecom y el distribuidor Albatron—, además de los domicilios de seis personas, dentro de la investigación por exportación ilegal de servidores con GPUs de Nvidia hacia China. La pesquisa amplía los cargos federales de EE. UU. de marzo, que apuntaban a un esquema de unos 2.500 millones de dólares en servidores con chips de Nvidia canalizados vía empresas pantalla en el Sudeste Asiático. La cotización lo acusó: las acciones de Super Micro cayeron más de un 9%. La compañía no está imputada.
Qué significa: el control de exportación de GPUs deja de ser papel y golpea a un proveedor clave de servidores para IA y a su cadena de suministro. Otro recordatorio de que el hardware sobre el que descansa el cómputo —su disponibilidad y su precio— está sujeto a un riesgo geopolítico que acaba trasladándose al coste de entrenar e inferir.
X lanza un MCP hospedado: cualquier agente accede a la API de X en tiempo real sin montar nada
X anunció su "hosted X MCP", un servidor MCP oficial que expone la API de X como herramientas llamables: Grok, Cursor o cualquier cliente compatible con MCP puede buscar posts, leer tendencias y noticias, gestionar marcadores o publicar artículos con los permisos de la cuenta, sin desplegar infraestructura. El servidor carga la especificación OpenAPI de la API de X al arrancar y convierte cada operación en una tool. Llega en la misma semana en que Slack y AWS también se han posicionado como hosts de MCP.
Qué significa: convierte a X en una fuente de contexto en vivo enchufable a cualquier agente con una simple tool call. Para quien construye, baja casi a cero la fricción de dar a un agente acceso a datos sociales en tiempo real —social listening, monitorización de marca, señales de mercado— y confirma que "ser host de MCP" se está volviendo la jugada de plataforma del momento.
Ornith-1.0, abierto y con licencia MIT, adelanta a Claude Opus 4.7 en SWE-Bench y vive hoy su pico de tracción
La familia open source Ornith-1.0 de DeepReinforce —de un modelo denso de 9B hasta un buque insignia MoE de 397B, todo con licencia MIT— escala hoy en Hacker News. El 397B saca 82,4 en SWE-Bench Verified, por delante de Claude Opus 4.7 (80,8), aunque por debajo de Opus 4.8 (87,6) y del GLM-5.2 de 744B (81,0). Su novedad técnica: el modelo aprende a escribir su propio "scaffold" de refuerzo en lugar de usar un arnés fijo diseñado por humanos. La comunidad lo recibe dividida —pruebas entusiastas frente a la sospecha de "benchmaxing": SWE-Bench Verified es de los benchmarks de coding más fáciles de exprimir, y hay estudios que cifran en torno al 20% los parches "resueltos" que fallan al pasarlos por tests más duros.
Qué significa: va marcado como "Seguimiento" porque el lanzamiento es del 25 de junio, no de las últimas 24 horas; lo de hoy es el pico de atención y el debate sobre si la cifra aguanta. La lectura para quien construye: un modelo abierto que roza al frontera cerrado de la generación anterior, descargable y barato de correr, sigue estrechando el margen entre "premium" y "commodity" en coding —con el asterisco de medirlo en tu propia tarea, no en el leaderboard.
De X / conversación social
3 piezasExclusiva: Meta ordena a sus ingenieros limitar Claude Code y Codex por miedo a la destilación
The Information publica que Meta ha pedido a sus ingenieros restringir el uso de Claude Code (Anthropic) y Codex (OpenAI) por temor a que las salidas de esas herramientas contaminen sus propios datos de entrenamiento vía "destilación". Un memo interno advierte de que esa filtración podría desencadenar "escaladas serias con empresas socias" por el lado contractual. El hilo encendió el debate porque toca el funcionamiento básico: estas herramientas mandan contexto de código a servidores externos, así que cada vez que un ingeniero pide ayuda con un script de entrenamiento, trozos del código propietario salen de los muros de Meta.
Por qué importa: retrata lo seria que se está poniendo la guerra de los asistentes de coding —hasta el punto de que un gigante prefiere vetar las mejores herramientas del mercado puertas adentro para proteger su modelo. Señal de que la frontera ya no es solo la calidad, sino quién aprende de quién.
"Hemos levantado una Series A de 135M$": Chamath vuelve a CEO con 8090
Chamath Palihapitiya anuncia en X que su startup de coding con IA, 8090, ha cerrado una Series A de 135 millones de dólares liderada por Salesforce Ventures —con WndrCo, Craft Ventures, The Production Board y LAUNCH, más ángeles como Nikesh Arora y Adam D'Angelo— y que vuelve a un rol operativo a tiempo completo como CEO, el primero desde que dejó Facebook. Su producto, "Software Factory", es un agente de coding para equipos corporativos en sectores muy regulados —salud, seguros, aeroespacial, finanzas, gobierno de EE. UU.— con controles tipo audit trail y la tesis de mantener al líder de negocio al mando "del spec al deploy".
Por qué importa: dinero gordo y un nombre de peso apostando por "construir software dirigido por negocio, no por devs", justo el posicionamiento builder-con-IA. Buena señal de hacia dónde va la categoría enterprise: agentes con gobernanza para los clientes más exigentes.
Coinbase "echa" a OpenAI y Anthropic y recorta un 50% su factura de IA con modelos chinos
Un hilo con tracción resume el movimiento de Coinbase: una de las mayores cotizadas cripto del mundo puso por defecto a sus ingenieros modelos chinos de pesos abiertos —GLM-5.2 de Zhipu y Kimi 2.7 Code— y recortó cerca del 50% de su gasto interno en IA, sin capar el uso. El CEO Brian Armstrong detalló cinco palancas: defaults en el gateway (GLM-5.2 a 1,40$/millón de tokens frente a los 5$ de Opus), routing por tarea, caché (del 5% al 60% de aciertos), contexto recortado y visibilidad del gasto atada al impacto. El 91% de los ingenieros nunca llegaba a sus antiguos límites. El asterisco que discute el hilo: Coinbase es una entidad financiera registrada y esos modelos aparecen citados en una investigación de seguridad del Congreso.
Por qué importa: el caso de empresa más concreto de la ola "virar a modelos chinos por coste" (Lindy, Snowflake), con pricing abierto presionando a los laboratorios de EE. UU. La palanca no es un modelo mágico: es routing + caché + defaults bien puestos.
Herramientas, repos y técnicas
4 piezasztxz16/fastllm: librería de inferencia en C++ que corre modelos DeepSeek con solo 10 GB de VRAM
Librería de inferencia en C++ sin dependencias de backend, en tendencia hoy por correr modelos DeepSeek "a tope" en cualquier GPU de 10 GB o más, con soporte tanto para modelos densos como MoE. Encaja con la ola del día: lo que puedas resolver en local no paga API.
Para qué sirve
montar inferencia propia de un modelo grande sobre hardware modesto —prototipos, tareas sensibles o trabajo de volumen que no quieres mandar a la nube— como pata local de un stack mixto local + API.
Switchboard: enruta cada prompt al modelo adecuado en vez de capar presupuestos
Lanzamiento de Show HN que ataca el coste de tokens con routing: manda lo fácil al modelo barato o local y lo difícil al frontera, en lugar de recortar presupuesto a quien construye. Es exactamente la palanca que repiten los que de verdad bajan la factura, hoy presente en toda la edición.
Para qué sirve
meter una capa de routing delante de tu stack para reducir el gasto sin recortar capacidad ni frustrar al equipo. A probar antes de tocar límites de uso a mano.
Dribble: un IDE de bases de datos open source con IA
Recién salido en Show HN: un IDE de bases de datos open source para trabajar consultas, esquema y exploración con un agente al lado, en vez de saltar entre la consola de la base y otra pestaña con el chat.
Para qué sirve
útil para builders con stack tipo Prisma/Neon que quieren un copiloto pegado a la base de datos para iterar el esquema y depurar queries sin cambiar de contexto.
mcp-charts: añade gráficos a tu MCP de datos en pocas líneas
Show HN que añade visualizaciones a un servidor MCP de datos con poco código: gráficos sobre la información expuesta vía MCP sin montar un front a mano. Pequeña pieza que encaja con el día de "todos se hacen host de MCP".
Para qué sirve
dar salida visual a un dashboard agéntico o a un MCP de datos interno —reportes, métricas— sin construir una capa de gráficos desde cero.
Fin de la edición Nº 020