Mistral OCR

Mistral on julkaissut uuden tekstintunnistuspalvelun, joka lukee kuvia tai PDF-tiedostoja ja muuntaa ne tekstiksi ja kuviksi. Tekstintunnistus (OCR) on yksi käytetyimmistä koneoppimisen lajeista, sillä on todella paljon hyödyllisiä käytännön sovellutuksia. Hienoa että meillä on tälle sektorille nyt myös Eurooppalainen vaihtoehto.

Mistral OCR on käytettävissä rajapinnan kautta, mutta myös “rajoitetusti saatavilla itse ylläpidettäväksi”. Julkistustiedotteen sivulla olevat esimerkit vaikuttavat päteviltä ja mallin suorituskyvyn luvataan päihittävän sekä Googlen että OpenAI:n vastaavat. Mistral OCR on myös monikielinen, joskaan suomen kieltä ei ole mainittu suorituskykymittauksissa.

Otin tarkoituksella vinon kuvan kannettavan näytöllä olevasta vanhasta TES-dokumentista, pakkasin sen häviöllisellä 30% laadulla jpg-muotoon ja syötin sen Mistralille. Sain takaisin täysin virheettömän tekstin Markdown-muodossa. (Palautuneessa tekstissä ei ollut alareunan sivunumeroa, mutta en myöskään pyytänyt sitä. Tämän voi tulkita joko positiiviseksi tai negatiiviseksi, mutta mielestäni tässä kontekstissa päätös oli hyvä.) Tämä oli toki todella helppo tehtävä OCR-algoritmille. Oikeat koettelut tulevat esimerkiksi käsin kirjoitetusta tekstistä, ryppyisistä tai huonosti skannatuista dokumenteista ja tekstistä jota malli ei ymmärrä.

Mallin hinta on ilmoitettu pelkästään dollareina, 1 dollari per 1000 sivua. Rajapinnassa krediittejä ostetaan euroilla, mutta siellä ei ainakaan vielä näy mitään hintatietoja OCR-mallille, joten jäi vähän epäselväksi mitä tämä lysti maksaa euroissa.

Kommentit