Newsletter diario de IA

OpenAI estrena su propio chip, Anthropic acusa a Alibaba de exprimir a Claude y Google retrasa Gemini 3.5 Pro

25 de junio de 2026 · Europe/Madrid

Día de movimientos de primer nivel. OpenAI presenta con Broadcom su primer chip propio, Jalapeño, un acelerador de inferencia diseñado en nueve meses y un 50% más barato que una GPU comparable: el primer paso serio para soltarse de Nvidia. En el frente geopolítico, Anthropic acusa a Alibaba de orquestar la mayor campaña de "destilación adversarial" que ha visto —casi 25.000 cuentas falsas y 28,8 millones de conversaciones con Claude— para entrenar a Qwen. En modelos, mal día para Google: retrasa Gemini 3.5 Pro a julio mientras pierde investigadores clave, y un nuevo ranking coloca al chino GLM-5.2 entre los cuatro mejores del mundo por delante de Gemini. En la conversación social: el desglose del chip de OpenAI, el hilo sobre la acusación a Alibaba y la lectura de la fuga de talento de DeepMind. Y en herramientas: ojos web para tus agentes, un formato para pasarle tu identidad visual al código, memoria de codebase por MCP, un escáner de seguridad de skills y un agente que conduce tu Chrome ya logueado.

Lo grande

Empresas24 jun · OpenAI

OpenAI y Broadcom presentan Jalapeño, su primer chip propio: inferencia de LLMs a la mitad de coste

OpenAI estrena su primer silicio a medida, diseñado de punta a punta por la compañía y fabricado por Broadcom. Jalapeño es un ASIC reticle-sized pensado solo para inferencia de LLMs —no cómputo general como una GPU—, que según el CEO de Broadcom, Hock Tan, sale un 50% más barato que una GPU de IA típica y con mejor rendimiento por vatio que los aceleradores líderes actuales. Lo más llamativo es el ritmo: del esquema a estar listo para fabricar en nueve meses, cuando lo normal son años, usando los propios modelos de OpenAI para acelerar el diseño. El despliegue arranca a finales de 2026 a escala de gigavatios (1,3 GW+ el año que viene) con Microsoft y otros socios de datacenter; el chip ataca la inferencia, no el entrenamiento, donde Nvidia sigue mandando.

Qué significa: el coste de servir modelos es el gasto que de verdad escala cuando un producto crece, y OpenAI acaba de buscarse una vía para recortarlo a la mitad y depender menos de Nvidia. Si la jugada cuaja, la presión bajará el precio de la inferencia para todos —justo la factura que más duele a quien construye sobre APIs.

Empresas24 jun · Reuters

Anthropic acusa a Alibaba de la mayor campaña de destilación que ha visto contra Claude

En una carta enviada el 10 de junio a la Casa Blanca y al Senado de EE. UU., Anthropic afirma que operadores ligados al laboratorio Qwen de Alibaba abrieron cerca de 25.000 cuentas fraudulentas y generaron 28,8 millones de conversaciones con Claude entre el 22 de abril y el 5 de junio. El objetivo, según la empresa, era "destilación adversarial": exprimir las capacidades del modelo —ingeniería de software y razonamiento agéntico, sobre todo— para entrenar sistemas rivales a una fracción del coste. Anthropic lo describe como el mayor ataque de este tipo que ha detectado y lo enmarca en un patrón más amplio de laboratorios chinos cosechando salidas de los modelos frontera de EE. UU.

Qué significa: es la batalla de fondo que explica por qué los pesos abiertos chinos avanzan tan rápido y tan barato, y por qué el tema se ha vuelto regulatorio. Para quien construye, marca el terreno: los modelos abiertos competitivos que aparecen cada semana no salen de la nada, y su disponibilidad —y precio— depende de cómo se resuelva esta pelea.

Modelos24 jun · Business Insider

Google retrasa Gemini 3.5 Pro a julio mientras se le marchan investigadores clave

Gemini 3.5 Pro ya no llega este mes: Google lo pospone a julio para afinar calidad tras las pruebas con clientes enterprise, según fuentes citadas por Business Insider. El checkpoint actual no convence a DeepMind y arrastra "pereza" en tareas largas y complejas. El retraso lo deja a la par de GPT-5.6 y Claude Opus 4.7, ambos apuntando a mediados de julio, y llega en plena fuga de talento: Jonas Adler y Alexander Pritzel, contribuidores clave de Gemini, se van a Anthropic, justo después de John Jumper (AlphaFold) y Noam Shazeer (coautor del paper de los Transformers).

Qué significa: Google sigue sin lanzar un modelo frontera desde febrero mientras OpenAI y Anthropic encadenan releases. Para quien planifica su stack, el calendario de mediados de julio se concentra: tres modelos punteros casi a la vez, con la duda de si Google llega con algo que de verdad mueva la aguja.

ModelosSeguimiento · 24 jun

Un nuevo ranking mete a GLM-5.2 en el Top 4 mundial, por delante de Google

El modelo de pesos abiertos GLM-5.2, de la china Z.ai, escala a la cuarta posición global en una clasificación reciente y adelanta a Gemini de Google. Es el siguiente capítulo de un modelo que en días anteriores ya apretaba a los frontera de EE. UU.: comparativas independientes lo sitúan a en torno a un punto de Claude Opus 4.8 en benchmarks de coding (74,4 vs 75,1 en FrontierSWE) pero con un precio de salida 5 a 7 veces menor en tokens.

Qué significa: el patrón se repite —calidad casi de frontera por una fracción del precio, y con pesos que puedes desplegar tú. Para quien construye con IA, refuerza la pregunta del mes: cuánto trabajo de coding puede pasar a un modelo abierto barato sin perder casi nada de calidad.

De X / conversación social

@kimmonismus24 jun · X

"Alibaba sigue destilando a Claude a gran escala para entrenar Qwen": el hilo sobre la acusación de Anthropic

El hilo recoge y desmenuza la exclusiva de Bloomberg: la campaña de las ~25.000 cuentas falsas, los 28,8 millones de intercambios y el marco de "destilación adversarial" como vía barata para entrenar modelos rivales. Buen resumen del caso y del debate que abre sobre cómo se entrenan los pesos abiertos chinos.

Qué significa: la versión condensada de la noticia de portada con el contexto de por qué importa. Pone número a una sospecha que llevaba meses en el aire y conecta los puntos entre los modelos abiertos que salen baratos y de dónde aprenden.

@martinvars24 jun · X

"OpenAI entra en la carrera del silicio a medida": el mapa de quién fabrica su propio chip

Martin Varsavsky aprovecha el lanzamiento de Jalapeño —"a la mitad del precio de una GPU comparable", según Broadcom— para repasar la lista creciente de quién está construyendo silicio propio (Google, Amazon, Microsoft, Meta…) antes de llegar a su tesis sobre lo que esto le hace a Nvidia. Lectura de tablero, no de titular.

Qué significa: ayuda a situar el chip de OpenAI dentro de un movimiento más amplio en vez de como noticia aislada. El hilo deja claro que el verdadero pulso no es un chip, sino si la inferencia deja de ser un cuello de botella controlado por un solo proveedor.

@Hesamation24 jun · X

"Google está en serios problemas": el hilo que junta la fuga de talento de DeepMind

El hilo encadena las salidas recientes —Adler y Pritzel a Anthropic, después de Jumper (AlphaFold) y Shazeer (Transformers)— y las cruza con el retraso de Gemini 3.5 Pro para argumentar que el problema de Google no es un modelo, sino una sangría de gente. Debate caliente en los comentarios sobre si es estructural o coyuntural.

Qué significa: el contexto humano detrás del retraso. Sirve para leer mejor a quién conviene apostar en la carrera frontera de aquí a fin de año, más allá de los benchmarks del día.

Herramientas, repos y técnicas

Repo · 40.1k★GitHub Trending

Panniantong/Agent-Reach: dale a tu agente ojos para ver y leer todo internet

Repo disparado en trending: una capa de acceso web para agentes —búsqueda más lectura de páginas— para que un agente trabaje con contexto en vivo del internet entero, no solo con lo que tiene en el prompt. Categoría calientísima estos días junto a navegadores y sandboxes para agentes.

Para qué sirve: montar agentes que consultan y leen la web al vuelo (research, monitorización, soporte) sin cablear tú cada fuente. Buen punto de partida si necesitas que tu agente "mire fuera" antes de responder.

Repo · 17.6k★GitHub Trending

google-labs-code/design.md: un formato para describirle tu identidad visual a un agente de código

Repo de Google Labs en trending que estandariza cómo le pasas estilo, branding y reglas visuales a un coding agent: un único archivo que el agente lee para que lo que genere se parezca a tu marca y no a "salida de IA genérica". Técnica concreta, no otra librería.

Para qué sirve: dejar de pelear con cada prompt para que el agente respete tu paleta, tipografía y tono. Defines la identidad una vez y la reutilizas en todo lo que construyas con IA.

Repo · 14.3k★GitHub Trending

DeusData/codebase-memory-mcp: memoria de codebase de alto rendimiento vía MCP

Servidor MCP que da a los agentes una capa de memoria y contexto del propio código: indexa el repositorio y lo sirve al agente para que entienda la base sin recargar todo en cada turno. Va en la línea de abaratar el contexto, el cuello de botella real de coding con agentes.

Para qué sirve: que tu agente de código "recuerde" el proyecto entre sesiones y gaste menos tokens recontextualizando. Útil en cuanto el repo crece y el contexto deja de caber.

Repo · 10.4k★GitHub Trending

NVIDIA/SkillSpector: escáner de seguridad para skills de agentes

Repo de NVIDIA que detecta vulnerabilidades en las skills que se instalan en los agentes —justo cuando los repos más estrellados de las últimas semanas son colecciones de skills, prompts y markdown de procedencia variada. Pone el foco de seguridad sobre algo que se está copiando y pegando sin mirar.

Para qué sirve: auditar una skill antes de meterla en tu agente, sobre todo si la sacaste de un repo de terceros. Buen reflejo a adoptar ahora que el ecosistema de skills crece sin control.

Producto nuevoShow HN

chrome-use: conduce desde cualquier agente tu Chrome ya logueado

Lanzamiento recién salido en Show HN: deja que un agente de IA opere tu navegador Chrome con las sesiones ya abiertas, sin re-login ni captchas de por medio. Es el patrón "computer-use" aplicado al sitio donde ya tienes todo iniciado.

Para qué sirve: automatizar tareas web que viven detrás de un login (paneles, herramientas internas, redes) sin montar autenticación aparte. Atajo directo para flujos repetitivos en el navegador.

Edición del 25 de junio. Las noticias de "Lo grande" y "De X" tienen fecha publicada dentro de las últimas 24 horas según la fuente citada; GLM-5.2 entra como seguimiento por el desarrollo nuevo del día (nuevo ranking). Los repos y herramientas se incluyen por su tracción o lanzamiento reciente.