Da vi lanserte Claude Opus 4.5, visste vi at fremtidige modeller ville ligge nær vår AI-sikkerhetsnivå 4-terskel for autonom AI-forskning og utvikling. Vi forpliktet oss derfor til å skrive sabotasjerisikorapporter for fremtidige frontier-modeller. I dag leverer vi på dette løftet for Claude Opus 4.6.
I stedet for å ta vanskelige avgjørelser om uklare terskler, bestemte vi oss for å forhåndsinnfri den høyere ASL-4-sikkerhetsbarrieren ved å utvikle rapporten, som vurderer Opus 4.6s AI FoU-risiko i større detalj. Les sabotasjerisikorapporten her:
706