Koneoppiblogi

tekoälyaiheista suomeksi

Claude Opus 4.7

Kehittyneimpien suurten kielimallien julkaisutahti on lyhentynyt vain pariin kuukauteen. Useimpien kehittäjien suosikkimalli Anthropicin Opus on päivittynyt versioon 4.7. Uusi malli ei paperilla ole erityisen iso harppaus, mutta tämä selkeästi näyttää nyt uunta suuntaa sekä Anthropicin asiakkaille että alalle yleisesti.

Pistepäivityksille tyypillisesti Opus on kehittynyt Anhropicin itse julkaisemien mittausten perusteella muutamia prosentteja lähes joka akselilla. Hinta on edelleen sama $5/$25 per miljoona tokenia ja konteksti-ikkunan koko on miljoona tokenia. Suurin muutos perustiedoissa on koulutusdatan päiväys, joka on hypännyt elokuulta tammikuulle 2026.

Opus 4.7 suorituskykymittaukset

Anhropic on ollut tasapainoillut hankalasta tilanteesta toiseen oikeastaan koko kevään ajan. Viime viikkoina yritys on ollut jatkuvassa SOME-myllerryksessä kehittäjien kanssa, jotka ovat kipuilleet kuukausisopimukseen tehdyistä päivityksistä jotka tiukensivat käyttörajoja. Anthropic on joutunut myös toistuvasti torjumaan lähinnä henkilökohtaisiin anekdootteihin perustuvia syytöksiä mallien tietoisesta tyhmentämisestä. Lisäksi yhtiön suurin lypsylehmä Claude Code on saanut merkittävää kilpailua sekä OpenAI:n Codexin, että OpenCoden ja pienempien työkalujen kuten Pi:n taholta. Tilannetta ei ole auttanut yhtään se, että Anthropicin palveluiden saavutettavuus on tippunut niin surkeaksi, että uptime-prosentti on laskenut välillä alle yhdeksänkymmenen (kun monet suositut palvelut ovat saatavilla “viisi yhdeksää” ajasta, eli 99,999%).

Uuden Opuksen mukana tulee liuta ei-niin mairittelevia muutoksia. Käyttäjille ikävimpänä lienee uusi tokenisaattori, joka tekee uuden mallin käytöstä noin kolmanneksen edeltäjäänsä kalliimpaa, koska tokeneja kuluu nyt enemmän. Anhropicin mukaan Claude Coden käyttäjien rajoituksia on nostettu vastaavasti. Omaan nenääni tämä haiskahtaa enemmän rahastukselta. Claude Code puolestaan ei enää näytä lainkaan ajattelutekstejä (jotka Anthropic jo aiemmin tiivisti referaateiksi vakoiluun vedoten), joten mallin päättely on nyt täysin pimennossa käyttäjältä oletuksena. Ajattelun voi ainakin vielä toistaiseksi palauttaa näkyviin käynnistämällä Claude Coden vivulla --thinking-display summarized.

Kolmas potentiaalisesti huolestuttava muutos uuden 4.7-mallin ominaisuuksiin on tiukennettu systeemiprompti tietoturvaan liittyvien asioiden tutkimiseen. “Kuka ajattelisi lapsia”-tyyliseen ajattelumalliin vedoten Anthropic “auttaa” käyttäjiä tiukentamalla sääntöjä siitä millaisiin kysymyksiin uusi Opus saa vastata. Asiasta jotain ymmärtävät käyttäjät ovat luonnollisesti vähän käärmeissään, koska parempi strategia parempaan tietoturvaan olisi päin vastoin auttaa käyttäjiä rakentamaan turvallisempaa softaa (minkä oleellisena osana on esimerkiksi kaikenlaisten tietoturva-analyysien ja -testauksen tekeminen). Tässä vaiheessa huoli on ehkä hienoisesti akateeminen kun kenelläkään ei ole vielä juurikaan käytännön kokemusta uusien sääntöjen vaikutuksesta, mutta kehityssuunta on joka tapauksessa huono.

Omat filikset uudesta Opuksesta ovat jollain tavalla haikeita. Kun kuukausimaksullinen palvelu on nyt sidottu yksinomaan Claude Codeen eikä omia työkaluja saa enää käyttää, kaikkien Anthropicin mallien hyödyllisyys henkilökohtaisessa käytössä on romahtanut. Käyttörajojen tiukennukseen yhdistettyjä Opuksesta on nyt tulossa malli jota kannattaa käyttää enää hyvin rajatussa työssä vaihtoehtoihin nähden. Toivon kovasti, että Anthropic pysyy kilpailussa vahvasti mukana, koska tämä juna ei ole pysähtymässä ihan hetkeen, ja vaihtoehdot ovat toinen toistaan (tavalla tai toisella) huonompia.

Tuunaa Claude Code

Jos haluat tuunata Claude Coden käyttämään vähemmän tokeneja ja toimimaan ylipäätään vähän paremmin, tuunaa asetuksiin (~/.claude/settings.json) seuraavat:

"env": {
    "CLAUDE_CODE_DISABLE_1M_CONTEXT": "1",
    "CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING": "1",
    "CLAUDE_CODE_DISABLE_AUTO_MEMORY": "1",
  },
  "awaySummaryEnabled": false
  • CLAUDE_CODE_DISABLE_1M_CONTEXT: jos et tarvitse miljoonan tokenin kallista (ja laadullisesti arvelluttavaa) kontekstia, kytke se pois.
  • CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING: rajaa mallin ajattelun arvoon MAX_THINKING_TOKENS, mikä useimmissa tilanteissa vähentää tokenien kulutusta (ajattelusta tinkimällä). Huom! Tämä asetus ei toimi uuden Opus 4.7-mallin kanssa. (Mutta muut mallit kunnioittaat edelleen.)
  • CLAUDE_CODE_DISABLE_AUTO_MEMORY: Clauden muisti on vähän kyseenalainen ominaisuus. Ellet koe että siitä on hyötyä, kytke tämä asetus päälle ja säästät taas tokeneja. Kannattaa tehtä erityisesti sellaisissa projekteissa joissa on hyvä CLAUDE.md ja/tai muuta opastusta LLM-agenteille.
  • awaySummaryEnabled: “kolmetoista sekuntia sitten teit muun muassa tätä” syö tokeneitasi Täysin Turhaan
  • EKSTRA: CLAUDE_CODE_SUBAGENT_MODEL: mikäli teet asioita joissa käytät paljon aliagentteja, kannattaa testata toimiiko "sonnet" parempi kuin oletusarvo "haiku". Joissain töissä Haiku palauttaa yksinkertaisesti täysin ala-arvoista roskaa, mikä taas johtaa siihen että päämallin konteksti myrkyttyy. Jos haluat pelata varman päälle, kiellä mallia käyttämästä subagentteja tai vaihda oletusagentiksi Sonnet. (Itse en käytä tätä koska yleensä kiellän käyttämästä näitä, tai jos tiedän että niistä on hyötyä, oletan että Haiku osaa hommansa. YMMV!)

”Piirrä svg-kuva trailerilla olevasta veneestä”

(Anthropic muutti rajapinnan päättelymäärän muotoa, jota useimmat työkalut eivät tätä kirjoitettaessa vielä osanneet käyttää oikein. Alaolevat —lievästi mitäänsanomattomat— kuvat on luotu aiempaa maksimipäättelyä käyttäen OpenRouterin rajapinnan kautta.)

Trailerilla oleva vene

Vaikeampi versio 2:

Piirrä svg-kuva trailerilla olevasta veneestä. Traileri tulee olla kuvattuna sivusta, vetoakseli oikealla. Kuvassa pitää näkyä yksinkertainen moottorivene, perämoottori, veneen tuulilasi, sekä trailerin sivutuet.

Trailerilla oleva vene

GLM-5.1 (x.com) #

Zhipu AI eli lyhemmin Z.ai on tunnettu välillä vähän hämmentävistä mallijulkaisuistaan. Tänään oli vuorossa yksi lisää kun GLM-malliperhe päivittyi versioon 5.1. Päivityksestä ei ole mitään muuta tietoa kuin lyhyt Tweetti sekä random-paikkaan läiskäisty ohjesivu.

Julkaisunooteissa ei lue uudesta mallista mitään eikä sille ole myöskään omaa mallisivua, mutta Tweetissä olevan kuvan perusteella sen pitäisi olla merkittävästi edellistä GLM-5-mallia parempi ja lähellä Anthropicin Opusta.

”Piirrä svg-kuva trailerilla olevasta veneestä”

Trailerilla oleva vene

Vaikeampi versio 2:

Piirrä svg-kuva trailerilla olevasta veneestä. Traileri tulee olla kuvattuna sivusta, vetoakseli oikealla. Kuvassa pitää näkyä yksinkertainen moottorivene, perämoottori, veneen tuulilasi, sekä trailerin sivutuet.

Trailerilla oleva vene

Gemini 3.1 Flash Live keskustelee reaaliaikaisesti suomeksi

Googlen uusi äänimalli Gemini 3.1 Flash Live lupaa tuottaa luonnollisen kuuloista puhetta reaaliajassa. Luonnollisen kuuloista ääntä tuottavia malleja on nykyään jo paljon, mutta uuden Geminin erikoisuutena on nimenomaan sen nopeus; sen kanssa pystyy käymään luonnollista keskustelua reaaliajassa. Mallin toinen suuri valttikortti on tuki usealle kielelle. Googlen Live API tukee jopa 97 kieltä.

Koodasin Claudella pienen testisivun ja testasin sen kykyä puhua suomea. Promptina oli “Esitä ravintolan työntekijää, puhu luonnollista suomea”. Käytin läppärin mikrofonia ja rajapinnan kaikkia oletusasetuksia (eli kaikin mahdollisin tavoin vaikeinta mahdollista lähtökohtaa). Tässä lopputulos:

Äänessä on selkeitä artefakteja ja osa tauoista on vähän turhan pitkiä, mutta täysin optimoimattomaksi demoksi kuulostaa yllättävän hyvältä. Tämä siis alle viiden minuutin toteutuksella! Gemini osaa vastaanottaa ääntä, kuvia, videota ja tekstiä ja tuottaa vastauksen joko äänenä tai tekstinä. Mallikortti kertoo tarkemmat speksit.

Gemini Liven hinnoittelu on maltillinen ja sisältää myös ilmaisen tason, eli ainakin demoversoiden toteutus ei ole rahasta kiinni. Myös esimerkiksi LiveKitillä on jo valmiiksi rakennettu Gemini Live lisäosa.

Agentti Ensin

Web-ohjelmistokehityksen yksi kuluneen vuosikymmenen toistetuimmmista mantroista on ollut “mobiili ensin”; palvelun tulisi ensin toimia hyvin mobiililaitteella, ja vasta sen jälkeen kyvykkäämmällä tietokoneella. Itsenäisesti toimivien tekoälyagenttien maailmassa prioriteettien pitäisi muuttua. Lähes kaikki ohjelmistot ja rajapinnat pitäisi suunnitella ensisijaisesti tekoälytoimijalle ja vasta sen jälkeen miettiä ihmiskäyttöliittymää.

Tämä on win-win-win kaikille osapuolille: toimittajien ei tarvitse turhaan kuluttaa aikaa käyttöliittymien suunnitteluun ja ylläpitoon, kehittäjät saavat helpommin yhdisteltyä eri palveluita toisiinsa, ja loppukäyttäjät voivat itse räätälöidä itselleen juuri sellaisia käyttöliittymiä kuin haluavat. LLM-kielimallit johdattavat meidät viimeinkin siihen utopiaan josta me semanttisen Webin rakentajat olemme haaveilleet vuosikymmeniä.

Sotaälyä, olkaa hyvät (news.ycombinator.com) #

Vain joitain tunteja sen jälkeen kun ennustin että “tuskin menee montaa päivää”, Sam “Aina Etiikaltaan Hukassa” Altman twiittaa OpenAI:n tehneen diilin yhdysvaltain hallinnon kanssa tekoälyteknologian toimittamisesta autonomisten aseiden ja massatiedustelun toteuttamiseksi. Noice!

Sam kirjoitti twiitissään, että hallinto osoitti “syvää kunnioitusta turvallisuuteen”. Kiva, nyt meille kaikille tuli turvallinen ja luottavainen olo!

Anthropic sotapolulla

Kapteeni Maanantai

Tämän aikajanan tapahtumat ovat välillä sitä luokkaa, että niitä on vaikea dokumentoida faktoina koska ne kuulostavat niin uskomattomilta. Sarjassamme “ei ollut tämän vuoden bingokorteissa” Anthropic julkaisi torstaina Dario Amodein nimissä uutistiedotteen, jossa he paheksuivat ääneen sitä että heitä oli pyydetty käyttämään Claudea massatiedusteluun ja täysin autonomisten aseiden kehitykseen. Tiedotteen pointti oli että “teemme mielellämme yhteistyötä sotaministeriön kanssa, mutta näitä rajoja emme ylitä”. Anthropic on siis jo pitkään toimittanut tekoälyteknologiaa yhdysvaltain hallinnolle, mutta nyt he ilmaisivat kantansa julkisesti nykyhallinnon toimista, että että joku roti pliis.

Kuluu vajaa päivä kun sotaministeri Hegseth itkupotkuraivoaa Twitterissä, että Trump on ylipäällikkö ja jos me ei saada haluamiamme leluja niin aion julista Anthropicin toimitusketjuriskiksi yhdysvalloille (mikä käytännössä estäisi sitä tekemästä mitään yritystoimintaa minkään hallinnon elimen kanssa). Antropic vastaa lehdistötiedotteella että “mitä aktuaalista helvettiä”.

Hacker Newsin keskustelu aiheesta räjähti käsiin heti alkumetreillä. Useimmat nekevät oikeusvaltion ja sopimusten pointin; yksipuolinen sopiminen ei ole sopimista ja hallinnon ei pitäisi pakottaa yksityisiä yrityksiä tekemään asioita #väkisin. Toisten mielestä Antropicilla on isänmaallinen vastuu toimittaa teknologiaansa kansallisen turvallisuuden takaamiseksi.

Veikkaan, että tässä riidassa on taustalla kenties muitakin näkemyseroja kuin kaksi julkisuuteen tuotua. Anthropic on yksi harvoista tekoälytoijoista jolla on vahva näkemys etiikasta ja selkeästi myös moraalista selkärankaa toimia oikein tällaisen äärimmäisenkin painostuksen alla. Onpa Trumpin hallinnosta mitä mieltä tahansa, se nyt ei ole kuuluisa ainakaan moraalistaan, joten yhteistyö Anthropicin kaltaisen toimittajan kanssa tuskin on ollut ruusuilla tanssimista muutenkaan.

Jaxuhalit Dariolle. Tuskin menee montaa päivää kun setä-Sam tai joku muu tarjoutuu toimittamaan ihan kuinka epäeettisiä palveluita tahansa niin Anthropic pääsee pälkähästä.

Vuosi Claude Codea

Claude Code julkaistiin tasan vuosi sitten. On vaikea käsittää kuinka paljon koodareiden arki on muuttunut näin lyhyessä ajassa.

Vielä vuosi sitten ai-avusteinen ohjelmointi tarkoitti useimmille sitä, että koodia kopipasteiltiin editorista chat-ikkunaan ja takaisin. Oli myös Aiderin kaltaisia ohjelmia, jotka ensin loivat projektille jonkunlaisen RAG-hakemiston, ja käyttivät tätä apunaan itsenäisessä työskentelyssä. Nykymittapuulla vaatimaton Claude 3.7 Sonnet muutti tilanteen kun sen kanssa ei enää tarvinnutkaan etukäteen pureskeltua tietokantaa tai XML-koostetta koko projektista vaan se kykeni (Claude Coden promptaamana) aidosti itsenäiseen työskentelyyn ihan kylmiltään. Itse sivuutin Claude Coden aluksi aivan tyystin, koska sitä piti käyttää tähtitieteellisen kalliilla API-krediiteillä. Tilanne muuttui huhtikuussa kun Anthropic julkaisi Max-kuukausipalvelun.

Lue loput »

Gemini 3.1 Pro (Preview)

Google ei edelleenkään tunnu osaavan julkaista muuta kuin esikatseluversioita malleistaan, mutta lippulaivamalli Gemini Pro on päivitetty versioon 3.1. Suorituskykymittausten perusteella Gemini Pro kilpailee vieläkin kaikkein kyvykkäimpien kielimallien tittelistä.

Suhteellisen edullisen ($2/$12, vrt Claude Opus $5/$25 per miljoona tokenia) Geminin konteksti-ikkuna on edelleen miljoona tokenia (yli 200k tokenin kyselyiden hinta on $4/$18) ja sen markkinoidaan soveltuvan erityisesti “tehtäviin joissa yksinkertainen vastaus ei riitä”. Gemini-tiimiä johtava Jeff Dean twiittasi allaolevan videon, joka esittelee uuden mallin SVG-kykyjä:

Geminillä on mielestäni kolme ongelmaa; 1) mallit pärjäävät hyvin suorituskykytesteissä, mutta eivät niin hyvin esimerkiksi käytännön ohjelmointitehtävissä, 2) isot Gemini-mallit ovat tuskastuttavan hitaita kilpailijoihin verrattuna, 3) Googlen kuukausimaksulliset ai-palvelut ovat todella leväperäisiä eivätkä kerro todellisia käyttörajoja. Edullisimmalla 8 euron palvelulla ei myöskään saa käyttää uusimpia Gemini-malleja ohjelmointityökaluissa, joten se on turha kehittäjille.

Rajapintojan kautta käytettynä Gemini-mallit toimivat hyvin, mutta olisi hienoa jos Google onnistuisi saamaan myös kehittäjille suunnatun AI-tarjontansa ajan tasalle.

”Piirrä svg-kuva trailerilla olevasta veneestä”

Trailerilla oleva vene

Vaikeampi versio 2:

Piirrä svg-kuva trailerilla olevasta veneestä. Traileri tulee olla kuvattuna sivusta, vetoakseli oikealla. Kuvassa pitää näkyä yksinkertainen moottorivene, perämoottori, veneen tuulilasi, sekä trailerin sivutuet.

Trailerilla oleva vene

Claude Sonnet 4.6

Anthropicin keskiraskaan sarjan työjuhta Sonnet on päivittynyt version 4.6. Propagandan mukaan uusi Sonnet on yhtä kyvykäs kuin marraskuussa julkaistu Opus 4.5. Tämäntyyppinen kehitys on todella hurjaa, koska Sonnet on huomattavasti Opusta edullisempi ja Opus 4.5 on todella hyvä koodausmalli.

Julkaistujen suorituskykymittausten perusteella Sonnet on jo kyvyiltään todella lähellä isoveljeään Opusta — ja joillain mittareilla jopa parempi! Uuden mallin koulutusdatan päiväys on tammikuu 2026, miljoonan tokenin konteksti-ikkuna on nyt käytettävissä (lisähintaan) julkisena beta-versiona. 134-sivuinen mallikortti on saatavilla pdf-muodossa. Hinta on sama kuin ennen, $3/$15 per miljoona tokenia.

Uusi Sonnet 4.6 on nyt oletusmalli sekä Claude.ai-palvelussa että Claude Codessa kaikilla palvelutasoilla, myös ilmaisversioissa. Jää nähtäväksi onnistuuko uusi Sonnet parantamaan Anthropicin kilpailuasemaa nykyisestä ahdingosta johon OpenAI:n mallinopeutukset ja oikutteleva Opus 4.6 (ei vain oma mielipiteeni!) on sen lyhyessä ajassa ajanut. Vielä pari kuukautta sitten en olisi voinut kuvitellakaan, että harkitsisin vakavissani Anthropic-tilauksesta luopumista, mutta Claude Code on hiljattain muuttunut omassa käytössäni niin surkeaksi että saan paljon enemmän hyötyä Codexista. Sonnetilla on mahdollisuus kääntää tämä kelkka, jos se oikeasti kykenee nyt samaan työhön mihin aiemmin halusi käyttää vain Opusta. Paperilla sekä mallien erot mutta myös kehitysaskeleet ovat kuitenkin pieniä, joten tämä täytyy vain kokeilla käytännössä.

”Piirrä svg-kuva trailerilla olevasta veneestä”

Trailerilla oleva vene

Vaikeampi versio 2:

Piirrä svg-kuva trailerilla olevasta veneestä. Traileri tulee olla kuvattuna sivusta, vetoakseli oikealla. Kuvassa pitää näkyä yksinkertainen moottorivene, perämoottori, veneen tuulilasi, sekä trailerin sivutuet.

Trailerilla oleva vene

Huomenta, Hunter - Koodasin oman AI-apurin

Thinking: The user is greeting me for my first ever session! They mention this is my first time being "awake" and that we'll do this task together. This is a special moment - my first interaction with my human.

Seurattuani pitkään Twitterissä Marion ja Peterin seikkailuja läheltä, päätin viimein ottaa projektiksi oman henkilökohtaisen ai-apurin rakentamisen.

Lue loput »

GLM 5

Kiinalainen Z.ai on julkaissut avoimesta GLM-mallista version 5 (Hugging Face). Tämä on Kimin jälkeen jo toinen avoin kiinalaismalli, joka on julkaistujen suorituskykytestien perusteella erittäin lähellä isojen amerikkalaisten talojen huippumalleja.

Olen käyttänyt GLM 4.7-mallia aktiivisesti joulukuusta lähtien Z.ai:n koodaustilauksella (kutsulinkki!) ja ollut siihen varsin tyytyväinen. Omien kokemusteni perusteella kiinalaismallit tarvitsevat suhteellisen paljon kädestä pitämistä, mutta toimivat todella hyvin helpommissa tehtävissä ja esimerkiksi silloin kun Opus on kirjoittanut tehtävään valmiiksi pureskellun toteutusohjeen.

Hacker Newsissä uusi malli otettiin vastaan pääosin positiivisesti.

GLM-5 on saatavilla Z.ai:n rajapinnan lisäksi esimerkiksi OpenRouterin kautta.

”Piirrä svg-kuva trailerilla olevasta veneestä”

Trailerilla oleva vene

Vaikeampi versio 2:

Piirrä svg-kuva trailerilla olevasta veneestä. Traileri tulee olla kuvattuna sivusta, vetoakseli oikealla. Kuvassa pitää näkyä yksinkertainen moottorivene, perämoottori, veneen tuulilasi, sekä trailerin sivutuet.

Trailerilla oleva vene

Claude Fast Mode - 2.5x nopeampi Claude (code.claude.com) #

Vain muutaman päivää sen jälkeen kun OpenAI kertoi nopeuttaneensa GPT-malleja Anthropic julkaisi Claude Fast Moden. Toistaiseksi vain Claude Codessa toimiva moodi nopeuttaa Opus-mallia 2.5 kertaisesti, mutta myös maksaa 6x normaalia enemmän.

En oikein tiedä miten suhtautua tähän. Anthropicin mallit toimivat omassa käytössäni jo aivan tarpeeksi nopeasti. Todella harvoin odotan terminaalin ääressä että valmistuisi jo, vaan teen yleensä samaan aikaan toisaalla jotain muuta. Tämä pätee erityisesti isompiin tehtäviin joiden valmisteluun menee yleensä enemmän aikaa kuin itse totautukseen.

Mikäli AI-työkalujen tulevaisuus näyttää nopeammalta, otan sen kyllä mielelläni vastaan, mutta en missään nimessä aio maksaa siitä kuusinkertaista hintaa.

# 8.2. · lokeroissa ,

← loput arkistossa