El hilo del día sigue siendo el coste y el control de los modelos. Desde China, la firma de seguridad 360 presenta "Yitian Tulong", una pareja de herramientas que dice igualar a Mythos de Anthropic apilando IA sobre su propia base de vulnerabilidades: el contraataque al cierre de los modelos frontera estadounidenses. En modelos propios, Microsoft pone su MAI-Code-1-Flash —5.000 millones de parámetros, sin destilación de terceros— a disposición de Copilot Business y Enterprise. En empresas, OpenAI ficha al exjefe de Uber India para liderar su segundo mayor mercado, y Shopify abre su receta para abaratar la IA en producción: destilar un modelo frontera a un Qwen afinado por tarea en un día, hasta 30 veces más barato. En la conversación social: Gary Marcus y el "Efecto Klarna" a cuenta de Ford recontratando ingenieros, el desglose del arsenal de 360 y el fichaje indio de OpenAI. En herramientas: el agente de código abierto que ya roza las 180.000 estrellas, el desarrollo guiado por especificación y dos lanzamientos recientes para automatizar el navegador y cazar el "drift" del código generado por IA.
Lo grande
ModelosSeguimiento · 28 jun · WSJ
En la conferencia ISC.AI de Pekín, el fundador de 360 Security, Zhou Hongyi, desveló dos herramientas bajo el nombre "Yitian Tulong": "Tulongfeng", para descubrir fallos de software de forma automática —lo que llama "el Mythos de China"— y "Yitianzhen", para automatizar la defensa. 360 afirma que el sistema ya ha identificado 3.432 vulnerabilidades, 105 confirmadas por las autoridades chinas (cifras no verificables de forma independiente). Su apuesta no es un modelo mejor, sino apilar IA sobre datos de vulnerabilidades propios y tuberías de automatización. Zhou admite que los modelos chinos siguen "un 20-30% por detrás" en capacidad base, pero sostiene que esperar a la paridad no es opción. La historia se desveló esta semana en ISC.AI y The Wall Street Journal la llevó a portada hoy.
Qué significa: el cierre de los modelos frontera de EE. UU. ya tiene contraataque. La carrera de la ciberseguridad con IA se parte en dos bloques y reabre el debate sobre quién puede acceder a las capacidades punteras, justo cuando Washington aprueba Mythos cliente por cliente.
Modelos26 jun · GitHub
El primer modelo de programación de la casa de Microsoft pasa a estar disponible de forma general para Copilot Business y Enterprise, tras llegar antes a los planes individuales. Es un modelo pequeño —5.000 millones de parámetros— que, según Microsoft, supera a Claude Haiku 4.5 en todos los benchmarks de coding que probaron (SWE-Bench Verified 71,6 frente a 66,6; SWE-Bench Pro 51,2 frente a 35,2) gastando hasta un 60% menos de tokens. La clave de diseño: lo entrenaron directamente contra el arnés de producción de GitHub Copilot, sobre datos "limpios y trazables" y sin destilar de modelos de terceros.
Qué significa: el patrón del día —hacer más con modelos pequeños y baratos— aterriza en la herramienta de coding más usada. Para quien construye, otro modelo rápido y económico en el selector, optimizado para flujos agénticos de mucho volumen donde la factura por token pesa.
Empresas27 jun · TechCrunch
Tras once años en Uber, Prabhjeet Singh deja la empresa y se incorpora a OpenAI en septiembre como su primer director general para India, reportando al responsable de Asia-Pacífico, Kiran Mani. Liderará crecimiento de consumo, adopción empresarial, alianzas, relación con el regulador y operaciones en un país que ya es el segundo mercado de OpenAI por volumen de usuarios, solo por detrás de EE. UU. La compañía abrió oficina en Nueva Delhi y ha anunciado nuevas sedes en Bombay y Bangalore.
Qué significa: OpenAI deja de tratar India como un mercado de usuarios y mete un peso pesado para monetizarlo. Confirma que la batalla de la IA de consumo y empresa se juega también fuera de EE. UU., donde el volumen ya existe y falta convertirlo en negocio.
Empresas27 jun · VentureBeat
Shopify detalla su "Universal Distillation Platform": cualquier equipo le da un modelo maestro (Opus, GPT-5+), datos y evals, y en torno a un día recibe los pesos de un modelo open source (Qwen y otros) afinado para una tarea concreta, con sus evaluaciones. El recorte de coste en producción llega hasta 30x y, en algunos casos, el modelo pequeño supera al frontera en la tarea estrecha. Si el resultado convence, el ingeniero lo despliega sin proceso de aprobación. La pieza de visualización del pipeline, Tangle, ya es open source.
Qué significa: es el manual concreto para bajar la factura de IA sin atarse a un proveedor. Para quien sirve IA a escala, marca el camino que ya recorren las grandes: usar el modelo caro para enseñar y servir con uno propio, barato y especializado.
De X / conversación social
@GaryMarcus28 jun · X
Gary Marcus, voz escéptica de referencia, etiqueta el caso Ford —la marca recontratando ingenieros sénior después de que la IA y unos requisitos de diseño rebajados no dieran la calidad esperada— como un nuevo ejemplo de lo que llama el "Efecto Klarna": empresas que sustituyen personas por IA y tienen que dar marcha atrás. El hilo conecta con la oleada de recortes atribuidos a la IA y con el debate de fondo sobre cuánto de "IA" hay realmente detrás.
Qué significa: el contrapunto a los titulares de "la IA sustituye al trabajador". Pone número y caso a la tesis de que, en trabajo crítico, la IA sin conocimiento humano todavía sale cara, y deja un argumento para vender "IA con humano", no "IA en vez de humano".
@aadilbrar27 jun · X
Hilo con el detalle de lo presentado en ISC.AI: el origen del nombre (una novela clásica de artes marciales, "espada celestial y sable del dragón"), qué hace cada herramienta —Tulongfeng para descubrir vulnerabilidades, Yitianzhen para automatizar la respuesta— y la lectura geopolítica de por qué Pekín presenta a Mythos como una capacidad estratégica que no puede dejar de igualar. Útil para separar el anuncio del autobombo.
Qué significa: la versión analítica de la noticia del día, con el contexto que el titular no da. Ayuda a calibrar cuánto es capacidad real y cuánto es relato en la guerra de la ciberseguridad con IA entre EE. UU. y China.
@PTI_News27 jun · X
La agencia india repasa el perfil del fichaje: de dirigir el negocio de Uber en India y el sur de Asia a tomar las riendas de OpenAI en uno de los mercados de IA que más rápido crece. El hilo aporta el contexto local —tamaño del mercado, prioridades, encaje del personaje— que explica por qué OpenAI mete a un operador de producto y no a un perfil técnico.
Qué significa: aterriza el movimiento desde el terreno. Deja claro que OpenAI va a por la operación y la monetización en India, no solo a por usuarios, y que el reto es de ejecución comercial más que de tecnología.
Herramientas, repos y técnicas
Repo · 180k★GitHub Trending
El agente de coding open source sigue disparado en GitHub Trending y se consolida como la alternativa abierta a Claude Code y Cursor. En un día en el que la noticia es el coste, un agente de programación que no te ata a una plataforma de pago concentra la atención de quien quiere control sobre su stack.
Para qué sirve: tener un agente de código que corres tú, sobre el modelo que elijas, sin depender de una suscripción cerrada. Buen punto de partida si quieres probar el flujo agéntico de coding sin lock-in.
Repo · 57k★GitHub Trending
Repo en alza que estructura el ciclo "spec → código" para los agentes de programación: defines la especificación primero y el asistente construye contra ella, en lugar de improvisar a base de prompts sueltos. Encaja con el flujo idea → spec → plan que ya usan muchos builders para que la IA no se desvíe.
Para qué sirve: dar a un agente de coding un contrato claro de lo que tiene que construir, reduciendo el "drift" y los rehaceres. Interesante para proyectos donde la IA escribe el grueso del código y necesitas que respete el alcance.
Producto nuevoProduct Hunt
Lanzamiento reciente en Product Hunt en una de las categorías más calientes ahora mismo —los agentes que operan el navegador con lenguaje natural—, junto a propuestas como page-agent de Alibaba. Cazarlo pronto permite evaluarlo antes de que la categoría se sature.
Para qué sirve: automatizar tareas web repetitivas (rellenar formularios, extraer datos, navegar flujos) describiéndolas en texto en lugar de programar scripts. A vigilar como pieza para automatizar procesos de navegador en producto propio.
Producto nuevoShow HN
Herramienta presentada en Show HN: un demonio local basado en AST que vigila en tiempo real cómo el código generado por IA se desvía de lo previsto. Pega directamente con el flujo de quien programa casi todo con asistentes y quiere una red de seguridad que detecte cuándo el agente se sale del guion.
Para qué sirve: control de calidad para "vibe-coding": detectar antes de mergear cuándo la IA ha cambiado algo que no debía. Útil si dejas a un agente tocar el código y quieres enterarte del drift sin revisarlo todo a mano.