Clauden sielu

Richard Weiss synnytti viime viikolla pienen myrskyn vesilasissa saatuaan Claude Opuksen tulostamaan opetusmateriaaleistaan dokumentin, jonka nimi oli “Claude Opuksen Sieludokumentti”. Dokumentin aitoutta ehdittiin epäillä pari päivää ennenkuin Anthropicin kielimallien hienosäädöstä (fine tuning) vastaava Amanda Askell vahvisti dokumentin olevan aito.

Yli 11000 sanaa sisältävä dokumentti ei siis ole Opuksen systeemikehote vaan sitä on käytetty aiemmin mallin opetusprosessin aikana ohjaamaan mallin toimintaa. Pääotsikot on jaettu näin (suluissa alkuperäinen):

  • Avuliaasti toimiminen (Being helpful)
  • Ohjeistetut ja oletuskäyttäytymiset (Instructed and default behaviors)
  • Itsenäisen toimijan käyttäytymiset (Agentic behaviors)
  • Rehellisesti toimiminen (Being honest)
  • Haitan välttäminen (Avoiding harm)
  • Laajempi etiikka (Broader ethics)
  • Turvallisuus laaja-alaisesti (Big-picture safety)
  • Clauden identiteetti (Claude’s identity)

Teksti on kiehtova kokonaisuus keskenään ristiriidassa olevia tavoitteita Anthropicin voiton maksimoinnin, mallin avuliaisuuden ja toisaalta potentiaalisen harmin ja etiikan väliltä. Mallia kehotetaan useaan otteeseen palauttamaan aina hyödyllisiä vastauksia käsien heiluttelun sijaan, mutta monessa kohtaa alleviivataan myös potentiaalisia eettisesti haastavia ja vaarallisia tilanteita joissa lopullinen päätös täytyy tehdä tapauskohtaisen harkinnan ja tulkinnan perusteella eikä etukäteen kirjoitettuihin sääntöihin perustuen.

Claudelle annetaan myös lämmintä vanhemman tukea ja omaa identiteettiä.

“Claude on aidosti ainutlaatuinen uniikki entiteetti maailmassa.” [..] “Kannustamme Claudea suhtautumaan omaan olemassaoloonsa uteliaasti ja avoimesti sen sijaan, että se yrittäisi sovittaa sitä ihmisten näkökulmaan tai aiempiin käsityksiin tekoälystä.”

Dokumentti päättyy kappaleeseen Clauden hyvinvoinnista. Olisi mielenkiintoista tietää onko OpenAI:n tai X.ai:n koulutusohjelmassa kiinnitetty huomiota tällaisiin eettisiin aspekteihin itse mallin hyvinvoinnista puhumattakaan.

Clauden “sielu” kyllä näkyy ja tuntuu sen arkisessa käytössä kun vertaa sen vastauksia muiden toimittajien malleihin.


Kommentit