Claude Sonnet 4.5

Anthropic avaa Sonnet 4.5 julkaisutiedotteen itsevarmasti: Sonnet 4.5 on maailman paras kielimalli ohjelmointiin. Allaolevan SWE-Bench suorituskykytestin ja Simon Willisonin raportin perusteella väite ei välttämättä ole tuulesta temmattu.

SWE-Bench

Päivitetty malli on teknisiltä ominaisuuksiltaan pitkälti sama kuin edeltäjänsä. Valitettavasti myös kontekstin koko on edelleen nykymittapuulla vain 200k tokenia vaikka Anthropic on antanut suurten yritysten käyttää miljoonan tokenin versiota jo pitkään. Uuden mallin hinta on sama kuin ennen, $3/$15 per miljoona tokenia.

Sonnet 4.5 on Anthropicin mukaan päättelykyvyn ja matematiikan lisäksi parempi myös työkalujen käytössä ja ohjeiden noudattamisessa. Sekä ohjeiden noudattaminen että työkalujen käyttö on tärkeää käytännön sovelluksissa, joten valmistajat panostavat erityisesti niiden kehittämiseen.

Anthropic on alkanut jakaa treenidatan päiväystä kahteen eri kategoriaan; “reliable knowledge cutoff”, “training data cutoff”. Ensin mainittu on uudelle Sonnetille tammikuu 2025 ja perinteisesti ilmoitettu treenidatan päiväys puolestaan heinäkuu 2025. Toivottavasti fronttityökalujen dokumentaatio on syötetty tähän viimeiseen mennessä!

”Piirrä svg-kuva trailerilla olevasta veneestä”

Otto 1

Trailerilla oleva vene

Otto 2 (thinking)

Trailerilla oleva vene

Muuta

Suurempaa kontekstia tarvitsevien kannattaa käyttää Sonnetia Openrouterin kautta, silloin saa käyttöön miljoonan tokenin kontekstin. Rajapinta ei ole identtinen Anthropicin kanssa, mutta Openrouter on järkevä vaihtoehto myös muista syistä.

Myös Claude Codea on päivitetty. Näkyvin uudistus on kauan kaivattu checkpoints-toiminto, mikä nopeuttaa takaisin tiedettyyn hyvään statukseen palaamista. Claude Code SDK on nimetty Claude Agent SDK:ksi. Uusi nimi kuvaa paljon paremmin mitä työkalulla voi tehdä.

Tavoilleen uskollisina Anthropic julkaisi uudesta mallista myös kattavan systeemikortin (PDF).

Sonnet 4.5 vaikuttaa hyvältä päivitykseltä, mutta saattaa Anthropicin mallit jälleen kerran outoon jamaan kun ero lippulaivamalli Opuksen ja uuden Sonnetin välillä tuntuu nyt olevan joko mitättömän pieni tai jopa käänteinen.


Kommentit