När vi släppte Claude Opus 4.5 visste vi att framtida modeller skulle ligga nära vår AI-säkerhetsnivå 4-tröskel för autonom AI-forskning och utveckling. Vi har därför åtagit oss att skriva sabotageriskrapporter för framtida frontier-modeller. Idag levererar vi på det åtagandet för Claude Opus 4.6.
Istället för att göra svåra beslut om otydliga trösklar beslutade vi att i förväg uppfylla den högre ASL-4-säkerhetsgränsen genom att utveckla rapporten, som bedömer Opus 4.6:s AI-risker för forskning och utveckling mer i detalj. Läs sabotageriskrapporten här:
701