Gemini 2.5 Pro
Googlen tuore Gemini 2.5 Pro on perheen ensimmäinen malli, joka vaikuttaa aidosti hyödylliseltä koodaamiseen. “Ajatteluun” kykenevällä mallilla on suuri miljoonan tokenin konteksti (65k ulospäin) ja se on multimodaalinen, eli ymmärtää tekstin lisäksi myös kuvia. Koulutusdatan päiväys on tammikuu 2025, mikä on myös positiivinen päivitys verrattuna kilpailijoihin.
Uusi Gemini pomppasi heti julkaisun jälkeen Aiderin LLM Leaderboardin kärkeen yllättävän isolla erolla saaden koodaustestistä 72.9% oikein kun toisena oleva Claude 3.7 saa 64.9%. Tämä on merkittävä hyppäys, etenkin kun edellinen 2.0 Pro sai vain säälittävät 35.6%. Käytännössä tämä tarkoittaa sitä, että uusi Gemini on nyt yksi parhaista työkaluista koodaukseen.
Tämäkin malli julkaistiin niin hätäisesti, että se ei ole saatavilla vielä juuri missään muualla kuin Googlen omassa AI Studio testilaboratoriossa, testasin tätä yhden kokonaisen päivän siellä. Olen positiivisesti yllättynyt. Käytin uutta Geminiä työparina valmistellessani melko kompleksista teknistä spesifikaatiodokumenttia Django/Python chat-sovellukseen.
Lähdin yleismalkaisesta selityksestä ja muutamasta ranskalaisesta viivasta, päädyin päivän päätteeksi yli 6000 sanaa sisältävään Markdown-dokumenttiin joka oli kenties yksi parhaista mitä olen koskaan saanut aikaiseksi. Työ oli pitkälti edestakaisin jumppailua erilaisten tarkennusten ja arkkitehtuuristen valintojen välillä. Kirjoitin Geminille omia näkemyksiäni ja pyysin sitä kommentoimaan ja kysymään lisää. Lopuksi pyysin sitä kirjoittamaan kaiken käsitellyn auki kokonaiseksi dokumentiksi. Kirjoitusvaihe kesti Geminiltä yli 2 minuuttia, mutta lopputulos todellakin säväytti positiivisesti.
Gemini on tätä kirjoittaessa saatavilla jo myös Vertex AI -rajapinnan kautta ja toivottavasti myös muissa työkaluissa kuten Githubin Copilotissakin pian. Olin jotenkin asennoitunut siihen, että nyt kun Clauden uusi 3.7 julkaistiin niin kestäisi taas vähintään kuukausia ellei vuosi kunnes ohjelmoijat saavat jotain aidosti hyödyllistä. Olen iloinen ollessani väärässä! Gemini vaikuttaa selkeästi hyödylliseltä työkalulta koodaukseen. Toivottavasti uusi 2.5 Pro pääsee “kokeellinen”-leimastaan pian.
Simon Willison on luonnollisesti julkaissut jo oman arvionsa.
”Piirrä svg-kuva trailerilla olevasta veneestä”
Geminin näkemys on tyylikäs, vaikkakin vähän puutteellinen. Itse tiedostoon lisätyt kommentit ovat mielenkiintoinen lisä!