Claude Opus 4.5

Lippulaivamalli Opuksen päivitystä on odotettu kielimalli pitkällä siitä asti kun Sonnet 4.5 julkaistiin syyskuun lopulla ja nyt se on viimein täällä. Opuksen myyntipuheen alku onkin ilmeisesti kopioitu Sonnetin sivulta: “Opus 4.5 on maailman paras malli ohjelmointiin, agentteihin sekä tietokoneen käyttöön”.

Kohokohdat: multimodaalinen (vain teksti / kuva), kontekstin koko 200k tokenia sisään / 64k ulos, koulutusdatan päiväys maaliskuu 2025. Uuden mallin hinta on laskenut kolmannekseen edellisestä ollen nyt $5/$25. Opus on edelleen kallein kaikista huippumalleista, mutta se käyttää nyt myös aiempaa vähemmän tokeneita ajatteluun, joten rajapintakyselyiden kokonaiskustannus tulee lähelle tai jopa edullisemmaksi kuin Sonnet-mallia käytettäessä.

Mallista julkaistiin myös yli 150-sivuinen (!!) systeemikortti (pdf) jossa avataan kattavasti mm. suorituskykyä, turvallisuutta, sekä uusia työkaluja.

SWE-Bench

Yhden päivän käytön ja julkaistujen suorituskykytestien perusteella uusi Opus on erittäin vahva malli. Harmittavasti normaalilla Pro-tilauksella ei saa käyttöön Opus-mallia Claude Coden kanssa vaan sitä varten pitää joko ottaa 138 tai 275 euron hintainen kuukausitilaus, tai käyttää rajapinta-avaimia mikä tulee tehokäyttäjälle nopeasti tätäkin kalliimmaksi. (Opus 4.5 kuitenkin on käytettävissä Claude.ai-palvelussa myös 22 euron hintaisella Pro-kuukausitilauksella.)

”Piirrä svg-kuva trailerilla olevasta veneestä”

Otto 1

Trailerilla oleva vene

Otto 2 (thinking)

Trailerilla oleva vene

Vaikeampi versio 2:

Piirrä svg-kuva trailerilla olevasta veneestä. Traileri tulee olla kuvattuna sivusta, vetoakseli oikealla. Kuvassa pitää näkyä yksinkertainen moottorivene, perämoottori, veneen tuulilasi, sekä trailerin sivutuet.

Trailerilla oleva vene

Muuta

Ero venekuvien ja käytännön koodauskyvyn välillä on yllättävän suuri. Uusi Opus tuntuu käytössä hyvin samanhenkiseltä kuin edellisetkin Claude-mallit, sitä on helppo käyttää ja ohjata haluamaansa suuntaan. Mikä tärkeintä, lopputulos ainakin koodin osalta vaikuttaa erittäin hyvältä.

Anthropicin nykyinen malliperhe yhdessä Claude Coden kanssa on tällä hetkellä omaan käyttööni ehdottomasti parhaiten sopiva työkalualusta. Monet kollegat pitävät enemmän ChatGPT:n tyylistä ja vasta julkaistu Gemini 3 on nyt myös vahva kilpailija, mutta uskon että Anthropicilla ei ole vaikeuksia pitää suurta osaa asiakkaistaan tyytyväisinä tällä kattauksella — ainakin hetken.


Kommentit