Uuden GPT-4.5 kielimallin julkaisu ei tullut kenellekään yllätyksenä mutta itse mallissa on sitäkin enemmän yllätyksiä. Jopa 30 kertaa edeltäjäänsä kalliimmaksi (!!) hinnoiteltu GPT-4.5 ei alustavissa suorituskykyvertailuissa yllättäen pärjää ihan odotetusti. OpenAI:n mukaan sen vahvuus on “emotionaalisissa kyvyissä”.
“Technology preview” nimikkeen alla julkaistu GPT 4.5 on perinteinen “ei-ajatteleva” suuri kielimalli, jonka koulutukseen on käytetty arviolta kymmenen kertaa enemmän laskentatehoa aikaisempaan GPT-4 malliin verrattuna. Malli suoriutuu OpenAI:n omien testien mukaan odotetusti edeltäjiään paremmin useimmista tehtävistä, mutta esimerkiksi Aiderin oikean maailman ohjelmointitestissä se sai vain 49% tehtävistä oikein kun esimerkiksi testin kärjessä oleva vasta julkaistu Claude 3.7 Sonnet sai 64.9% ja OpenAI:n o1 61.7%. Eroa OpenAI:n edeltävään 4-sarjalaiseen tuli kuitenkin lähes 18%.
Yhteisö on ottanut julkistuksen vastaan melko laimeasti. Silmiä kostuttava 30-kertainen hinta rajaa GPT 4.5:n käytön ulos arkisista askareista ja OpenAI vihjaa itsekin, että malli ei välttämättä ole saatavilla kovin pitkään. Toistaiseksi se on saatavilla vain 200 dollarin kuukausimaksua vastaan ChatGPT Pro palvelussa sekä kehittäjille rajapintojen kautta.
Omien kokeilujeni perusteella malli tuntuu myös erittäin hitaalta. Simon Willison on luonnollisesti jo julkaissut oman ensiarvionsa pelikaanien kera ja Andrej Karpathy kirjoitti aiheesta ketjun Twitterissä. En tiedä lohduttaako yhtään, että ainakin tämä osaa pomputtaa palloa kuusikulmion sisällä. Ehdotonta plussaa joka tapauksessa, että OpenAI julkisti tästä mallista fiksun systeemikortin (PDF), mikä on aina ilahduttavaa avoimuutta.
Itselleni jäi tästä julkaisusta vähän hämmentynyt fiilis. Kategorisoin Sam Altmanin muutaman viikon takaiset hypetykset paskapuheeksi jo heti tuoreeltaan, ja tämä julkaisu tuntuu vain vahvistavan kuvaa siitä, että OpenAI on jotenkin limbossa tuotteidensa kanssa. OpenAI:n tutkimuspäällikkö Mark Chenin kiemurteli Alex Kantrowitzin GPT-4.5 -videolla sen oloisesti, että selkeästi ymmärsi kuinka iso kuilu ennakko-odotusten ja tänään julkaistun välillä on. OpenAI:n usean vuoden etumatka kielimallituotteissa on kurottu umpeen ja kilpailu sen kun vaan kiristyy. Tämä julkistus oli kenties yritys näyttää että “kyllä nämä meilläkin kehittyvät” ja toisaalta tapa ostaa aikaa siihen, että GPT-5 saadaan viedä maaliin rauhassa. Mutta käytännön hyödyt asiakkaille jäänevät olemattomiksi tästä mallista.
..myös veneenpiirtotaidoissa olisi vähän parannettavaa:
“Piirrä svg-kuva trailerilla olevasta veneestä”
Ensimmäinen yritys:
Toinen yritys (temperature: 1.5)
(Huom! Nämä kummatkin on tehty suoraan rajapinnan kautta. Yritän yleensä käyttää näihin tavallisille käyttäjille tarkoitettua käyttöliittymää. Päivitän tähän ensi viikolla kolmannen version kun kokeilusta ei tarvitse maksaa kahtasataa euroa.)