Artikkelit Maatalous

teksti: Marjatta Sihvonen

Moni tieteellinen keksintö syntyy muun tutkimuksen ohessa tai tutkijan työstäessä itsekseen jotakin, johon muut eivät vielä usko. Martin Lidauerin johtaman biometrisen genetiikan tutkijaryhmän sinnikkään työn syntyi matemaattinen läpimurto ja MiX99-tietokoneohjelmisto – eläinjalostusta uudistava menestystuote.

Erikoistutkija ja MiX99-ohjelmakoodin kehittäjä Martin Lidauer tarttuu kynään ja piirtää taululle matriisin, jossa miljoona kertaa miljoona lypsylehmän eri ominaisuuksiin vaikuttavaa tekijää yhdistyy.

Matriisi kuvaa laskentaa, jonka avulla eri lypsylehmien perinnöllisistä ominaisuuksista voidaan valita mahdollisimman optimaalisia yhdistelmiä ja luoda terveitä, tuottoisia ja hedelmällisiä eläimiä. Matriisi havainnollistaa myös valtavaa tietomäärää, jota tutkijat työstävät.

Kaikki alkoi jo eräässä tekniikkaan erikoistuneessa lukiossa. Tai ehkä sitäkin aikaisemmin, itävaltalaisella maitotilalla, josta Lidauer on kotoisin.

– Opiskelin maataloutta ja kotieläingenetiikkaa. Kun tulin Suomeen, täällä haluttiin siirtää lypsykarjan geneettinen arvostelu uuteen aikakauteen. Alettiin kehittää koelypsymallia.

robolehma_jouni_hyvarinen
piirros: Jouni Hyvärinen

Lehmien matematiikkaa

Lidauerin ryhmä käyttää kvantitatiivisen genetiikan ja biometrian menetelmiä. Jo ennen koelypsymallia jalostusarvojen laskemiseen oli tehty useita tilastollisia menetelmiä. Ne ovat kehittyneet kymmenen vuoden hyppäyksinä, yhdessä tietokoneiden laskentakapasiteetin kanssa.
– Lypsykarjan jalostus on hyvin laskentaintensiivistä. Suomessa osaaminen on ollut aina kovatasoista, Lidauer sanoo.

Koelypsymallia edelsivät sonnien jalostusarvoja mallintava sire model ja lehmien ja sonnien tiedot yhdistävä animal model.

Lidauer kääntyy jälleen matriisin puoleen. Jo 1990-luvulla käytetyssä eläinmallissa miljoonan lehmän ja sonnin tiedoista rakentuu 1,5 miljoonaa tuntematonta tekijää. Näin suurta matriisia ei voi kääntää, mikä on välttämätöntä tuntemattomien tekijöiden ratkaisemiseksi, eikä sitä voi edes tallentaa. Tutkijat kiersivät ongelman lukemalla tietoja sisään jatkuvana virtana.

– Ohjelmointitaituri Ismo Stranden, joka työskentelee yhä ryhmässämme, rakensi yhdessä Faban ja Maatalouden Laskentakeskuksen kanssa menetelmän, jolla tämä voidaan tehdä. He olivat toinen ryhmä maailmassa, joka onnistui siinä.

Ydinvoimalan algoritmi kotieläimiin

Koelypsymallissa laskennan koko kasvoi jälleen kymmenkertaiseksi. Eikä siihen edes tyydytty, vaan tutkijaryhmä innostui keksiessään, että jos koelypsymalliin yhdistetään satunnaisregressio, voitaisiin päästä yhä tarkempiin ennusteisiin ja mallintaa lehmän koko lypsykauden tuotos.

Oli vuosi 1997, ja MiX99 alkoi hahmottua. Edessä oli kuitenkin vielä monta umpikujaa.
– Rakensin ohjelmaa ja käytin samoja laskenta-algoritmeja kuin ennenkin. Projektin keskellä huomasin, etten pääse eteenpäin. Mutta sitten tapahtui jotain!

Lidauer, Stranden ja Esa Mäntysaari lähtivät matemaattiselle löytöretkelle oman alansa ulkopuolelle. He kysyivät itseltään, miksi eläinjalostajat käyttävät aina samoja algoritmeja, vaikka insinööritieteissä oli tekeillä jotakin mielenkiintoisempaa. He löysivät preconditioned conjugated gradient -algoritmin, jota käytetään esimerkiksi ydinvoimaloiden jäähdytyksen suunnittelussa.

Kaksi muuta tutkijaryhmää oli kuitenkin keksinyt saman ajatuksen jo aiemmin ja epäonnistunut yrityksissään. Samoin kävi Lidauerin ryhmälle.
– Yhtälöt eivät vain konvergoituneet. Ydinvoimalan jäähdytystä simuloitaessa ratkaistaan 20 000 tuntematonta. Meillä niitä oli kymmenen miljoonaa. Muut asiantuntijat eivät olleet nähneet niin isoa systeemiä, Lidauer selittää.

Aikaa ei ollut loputtomasti. Rahoittaja, eläinjalostusteollisuus, odotti tutkijoilta tuloksia, joten ryhmän oli hylättävä mielenkiintoiset kokeilut tuloksettomina.

Sitten sattuma puuttui tapahtumien kulkuun takaiskun muodossa. Tutkijoiden oli tarkoitus keskittyä tilastotietojen käsittelyyn, mutta niiden saaminen viivästyi kahdella kuukaudella. Oli selvää, että he palasivat algoritmikokeilun pariin.

– Sanoin itselleni, että mieti nyt tarkkaan, Martin. Algoritmiin liittyy tiettyjä alkuoletuksia, kuten positiivinen definiitti. Lopulta purin kaikki oletukset, heitin ne ulos koodistani – ja algoritmi toimi!

Samaan aikaan Ismo Stranden sai iteroivan laskennan ratkaisut toimimaan. MiX99 oli syntynyt.

Geenitiedot jo mukana laskennassa

Nykyisin MiX99-ohjelmaa käytetään koko maailmassa, ja sen tekijänoikeudet ovat Luonnonvarakeskuksella. Käyttömaksu on noin 15 000 euroa vuodessa, ja ohjelma tuottaa kymmenen prosenttia tutkimusryhmän liikevaihdosta.

Uudet asiakkaat ottavat yleensä itse yhteyttä Lidauerin ryhmään. Toimivan mallin maine kantaa.
– MiX99 tuo meille myös uusia hyödyllisiä tutkimuskumppanuuksia ja tutkimusrahoitusta. Käyttäjissä on paljon myös jalostusyrityksiä, jotka ostavat meiltä vain ohjelman ja käyttäjätuen.

Suurin osa käyttäjistä on lypsykarjan jalostajia, mutta ohjelmaa kehitettiin alusta lähtien niin, että sitä voidaan käyttää minkä tahansa kotieläimen jalostusarvojen laskemiseen, niin sikojen, kirjolohien kuin hevostenkin.

Nyt MiX99 hyödyntää jo nautojen tarkkoja geenitietoja, ja lähitulevaisuudessa nautojen dna-testaus on Lidauerin mukaan rutiinia maatiloilla. Suomessa on nyt noin 40 000 genotyypitettyä lehmää, ja sonneja testataan K-50 SNP -testillä, josta saadaan 50 000 perintötekijän tiedot.

– Geenitiedoilla ennusteemme varmuus paranee huikeasti! Tiedonsaanti myös nopeutuu: saamme dna-testistä suoraan sen tiedon, joka saataisiin, jos tutkitulla naudalla olisi jo 20 lypsävää lehmäjälkeläistä. Tämä on seuraava vallankumous kotieläingenetiikan alalla, mutta se vaatii taas uutta laskentaa ja tehoa.