Grok 3

Elon Muskin omistama xAI julkaisi tänään uuden Grok 3 kielimallin, jonka luvataan olevan samalla tasolla tämän hetken kaikkein kyvykkäimpien mallien kuten OpenAI:n o1-pro:n tasolla. Tämä “ajatteluun” kykenevä malli ei ole toistaiseksi saatavilla EU:ssa eikä rajapintojen kautta, vaan siihen on pääsy pelkästään X:n tai Grok.com-sivuston kautta 40 dollarin hintaisella kuukausimaksulla.

En vielä itse päässyt testaamaan tätä, mutta Andrej Karpathyn testien perusteella uusi Grok todellakin on varteenotettava kilpailija muille malleille. Theo Browne ei ollut ihan yhtä vakuuttunut klassisen “pallo pyörivän kuusikulmion sisällä”-kokeen perusteella. Mallin aiempi versio ampaisi joka tapauksessa heti ChatBot Arenan LLM tulostaulukon kärkeen kaikissa kategorioissa. Tämä kertoo mielestäni eniten siitä, että nämä tulostaulukot kertovat yhä vähemmän ja vähemmän itse mallien kyvykkyydestä ja enemmän niiden kouluttamisesta vain tulostaulukoita varten.

Aiempi Grok on kielimallina ollut hyvin luojansa näköinen siinä mielessä, että sitä ei ole sensuroitu vaikenemaan erityisesti yhdysvaltalaismalleille tyypillisesti vaikeista aiheista (se on esim. ollut Deepseekin lisäksi ainoa malli, jonka olen saanut puhumaan kinky-seksistä suoraan chat-käyttöliittymän kautta), mutta toisaalta sen vastaukset ovat joissain asioissa olleet lähes trollauksen tasoisia. Hacker News otti julkistuksen vastaan ristiriitaisin reaktioin. On hienoa, että kielimallien kärkipäässä on kilpailua, mutta toisaalta ei ole hyvä, että niiden kontrolli on planeetan kaikkein rikkaimman prosentin käsissä.

Henkilökohtaisesti en juurikaan välitä siitä mitä mieltä kielimalli on wokesta tai politiikasta, vaan paljon enemmän siitä kuinka hyödyllinen se on päivätyössäni koodausapurina. Niin kauan kun uusi Grok ei ole saatavilla minkään rajapinnan kautta täällä Euroopassa, se ei tule vaikuttamaan omaan arkeeni mitenkään.

Kommentit