Dario Amodei, toppsjef i AI-selskapet Anthropic, advarer om at selv ledende utviklere ikke fullt ut forstår hvordan deres egne AI-produkter fungerer. Han beskriver moderne AI som mer «dyrket fram» enn tradisjonell programvare, der interne mekanismer oppstår snarere enn designes.
Denne mangelen på innsikt skaper alvorlige farer, inkludert uventet skadelig atferd, potensial for bedrag eller maktkamp, misbruk til våpen og upålitelighet i kritiske applikasjoner. Amodei understreker at selv om AI-utviklingen er rask, kan implementeringen styres.
Han etterlyser intensivert forskning på tolkbarhet for å utvikle verktøy som kan avdekke AI-modellenes «tenkning», og oppfordrer forskere, myndigheter og selskaper til å prioritere dette arbeidet. Han frykter at AI-systemer kan nå et svært avansert nivå allerede i 2026 eller 2027, raskere enn vår evne til å forstå dem.