DeepSeek-V3.2 - Avoin huippumalli? (api-docs.deepseek.com)

Raportoin harvoin avoimista kielimalleista, koska en henkilökohtaisesti ole vielä nähnyt niiden hyötyä oikean elämän sovelluksissa. Pienimmät avoimet mallit ovat hyvin vaatimattomia kyvyiltään, suuremmista puolestaan saa eniten hyötyä vasta jos tiimissä on osaamista kouluttaa niistä omaan käyttöön soveltuvia täsmämalleja. Deepseek on yksi avoimista malliperheistä joka on nähnyt runsaasti käytännön sovelluksia. Uusin 3.2-versio lupaa jopa GPT-5 tason kyvykkyyttä.

Tech Report paperi (pdf) avaa mallin teknisiä kehitysaskeleita syvemmin. DeepSeek-V3.2-Speciale-variantin luvataan päihittävän päättelykyvyssä OpenAI:n GPT-5-mallin ja saavuttavan matematiikan olympiatehtävissä kultamitallitason Geminin ja GPT-5-mallin tavoin. Avoimen lähdekoodin MIT-lisensoitu malli on käytettävissä Hugging Face sivustolta ja valmiiksi hostattuna esimerkiksi Openrouterin kautta.

Mikäli mallin aidot kyvyt yltävät lähellekään luvattua tasoa, sen käyttö $0.28/$0.42 hintaan (konteksti 131k/64k) Openrouterin kautta (tai edullisesti itse ylläpidettynä) voi joihinkin tarkoituksiin tarjota erittäin hyvän hinta-laatusuhteen.

”Piirrä svg-kuva trailerilla olevasta veneestä”

DeepSeek-V3.2

Trailerilla oleva vene

DeepSeek-V3.2-Speciale

Trailerilla oleva vene

Vaikeampi versio 2:

Piirrä svg-kuva trailerilla olevasta veneestä. Traileri tulee olla kuvattuna sivusta, vetoakseli oikealla. Kuvassa pitää näkyä yksinkertainen moottorivene, perämoottori, veneen tuulilasi, sekä trailerin sivutuet.

Trailerilla oleva vene

Trailerikuvat eivät säväyttäneet. Speciale käytti ylläolevan miettimiseen yli 11 minuuttia (!!) ja tuotti erittäin pitkän ajatteluprosessin. Näistä ei ehkä kannata kuitenkaan vetää liian suoria johtopäätöksiä, sillä uuden Opus 4.5-mallin trailerit näyttivät myös aika heikoilta, vaikka malli on tämän hetken ehdottomasti osaavin koodimalli.

Deepseek on hyvä osoitus siitä, että kiinalaiset tekoälytalot eivät ole millään muotoa putoamasta läntisten kilpailijoiden kelkasta, vaan kilpailu on edelleen hyvin tasaista. Tästä mallista nähdään varmasti lähitulevaisuudessa optimoituja ja eri tarkoituksiin hiottuja versioita, jotka saattavat sekoittaa yhdysvaltalaisjättien pakkaa entisestään.


Kommentit