Claude 4

Anthropicin Code with Claude tapahtumassa julkaistiin tänään Claude Opus 4 sekä Claude Sonnet 4, kummatkin merkittäviä harppauksia alati kiihtyvässä kielimallikilvassa.

Markkinointipuheen (sekä suorituskykytestien) perusteella Claude Opus 4 on maailman paras koodausmalli. Sonnet 4 puolestaan on “merkittävät päivitys Sonnet 3.7-malliin”. Kummankin mallin hinnat pysyvät smana edeltäjiinsä verrattuna, eli $3/$15 Sonnet 4 -mallille ja $15/$75 Opus 4 -mallille. Suomeksi sanottuna hyvin suolaista, mutta toisaalta laadun luvataan myös olevan markkinoiden parasta.

Kummankin uuden mallin koulutusdatan päiväys on maaliskuu 2025, mikä on ilahduttavaa. Toisaalta kummankin mallin konteksti on edelleenkin nykymittakaavassa surkeat 200k tokenia — viidennes muiden huippumallien kyvyistä. Anthropic luettelee mallien uusiksi kyvyiksi myös paremman ja rinnakkaisen työkalujen käytön, ajattelumoodin käytön yhdessä työkalujen käytön kanssa sekä mm. koodinsuoritustyökalun rajapintaan.

SWE Benchmark

Olen tunnustanut olevani Anthropicin fani, mutta tämä vaikuttaa subjektiivisestikin erittäin vahvalta julkaisulta Anthropicilta. Vasta helmikuussa julkaistu Sonnet 3.7 on tähän mennessä omassa arjessani ollut käytännössä täysin suvereeni koodausapuri. Nyt kun uudelle Sonnet-mallille luvataan noin 10% kehittynyt koodayskyky ja Opus-mallin luvataan olevan Sonnetiakin vahvempi päättelyä vaativissa tehtävissä, Claude Code ja suomalaisittain 138 euron kuukausihintainen Max-palvelu (jolla pääsee käyttämään Claude Codea ilman rajapintamaksuja) vaikuttaa yhtäkkiä erittäin houkuttavalta yhdistelmältä kehittäjälle joka työskentelee näiden työkalujen parissa päivittäin. (Laskennallisesti Claude Coden ei tarvitse säästää kuin muutama tunti työaikaa kuukaudessa ollakseen kannattava sijoitus!)

”Piirrä svg-kuva trailerilla olevasta veneestä”

Claude Opus 4

Trailerilla oleva vene

Claude Opus 4 (thinking)

Trailerilla oleva vene

Claude Sonnet 4

Trailerilla oleva vene

Claude Sonnet 4 (thinking)

Trailerilla oleva vene

Ensituntumalta en ole ihan varma miten reagoida ylläoleviin suorituksiin. Opuksen näkemykset ovat “mielenkiintoisia”, mutta Merituuli tuli melko puskan takaa! Kehitystä helmikuulta on joka tapauksessa yllättävän paljon.

Kummatkin Clauden uudet mallit menevät allekirjoittaneella eittämättä välittömästi päivittäiseen käyttöön. Jään mielenkiinnolla odottamaan käytännön kokemuksia muilta kehittäjiltä samoin kun sitä ikuisuuksia odotettua OpenAI:n GPT-5 julkaisua. Yksi asia on kuitenkin varmaa: tämä kielimallikisailu ei edelleenkään näytä piirunkaan vertaa hiipumisen merkkejä.

”Piirrä svg-kuva trailerilla olevasta veneestä”

Kommentit