DATALOGER SKAL BIDRAGE TIL AT KORTLÆGGE UKENDTE MIKROBER I ”MIKROBIOLOGIENS MØRKE STOF”

DATALOGER SKAL BIDRAGE TIL AT KORTLÆGGE UKENDTE MIKROBER I ”MIKROBIOLOGIENS MØRKE STOF”

Bakterier er en af fremtidens vigtigste ressourcer. Forskere på tværs af Aalborg Universitet arbejder nu sammen for at kortlægge flere genomer fra bakterier ved at kombinere tre traditionelt adskilte områder: DNA-sekventering, grafbaseret analyse og maskinlæring.

Bakterier er overalt. De kan gøre os syge. De kan holde os raske. De kan rense vores spildevand og indgår i produktionen af enzymer til vaskemiddel. Bakterier har med andre ord uanede anvendelsesmuligheder. Men hvis vi skal udnytte potentialet til fulde, kræver det, at vi ved endnu mere om bakteriernes arvemasse. Og her er udfordringen: i dag kender vi genomerne på langt under én procent af bakterier i naturen. De resterende omtales ofte ”mikrobiologiens mørke stof”.

I projektet ”Data Science meets Microbial Dark Matter” vil forskere fra Institut for Kemi og Biovidenskab og Institut for Datalogi på Aalborg Universitet kombinere viden om DNA-sekventering, grafanalyser og maskinlæring til at kortlægge flere genomer fra bakterier hurtigere. Projektet er et ud af tre projekter, som forskere fra Aalborg Universitet har fået bevilget gennem VILLUM FONDENS nye Synergy-program.

Professor MSO Mads Albertsen fra Institut for Kemi og Biovidenskab er en af projektlederne, og han er blandt andet foregangsmand til en metode, der kan bruges til at tage ”bakteriers fingeraftryk”. Men han forklarer:

- Vi har alle maskinerne, der skal bruges til at kigge på DNA, og vi kan generere masser af data. Men når vi har data på så massiv skala som nu, har vi brug for datalogiforskernes kompetencer til at udnytte den og til at hjælpe os med at kortlægge endnu flere bakterielle genomer endnu hurtigere.

DNA-ANALYSE BLIVER MERE EVIDENSBASERET

Konkret vil forskerne undersøge, hvordan man kan bruge maskinlæring til at forbedre de enkelte trin i DNA-sekventeringen og bruge grafbaserede metoder til at styre, analysere og udnytte den information, der bliver genereret i de forskellige trin.

Mads Albertsen uddyber:

- Når vi kigger på DNA, kigger vi på små stykker af gangen. For at lave et bakterielt genom, sætter vi dem sammen til større stykker. Men når man har en prøve fra naturen, har man tusindvis af bakterielle genomer på samme tid. Efter at vi har sat DNA-stykkerne sammen, skal vi have dem skilt af igen. Men de værktøjer, der eksisterer i dag, splitter de processer fra hinanden. Og så går information og evidens tabt. Så en af de store udfordringer er at kunne fastslå, at bestemte stykker DNA stammer fra det samme genom.

Derfor vil forskerne forsøge at koble de processer, der sker i hele sekventeringen - fra rå data til færdige bakterielle genomer – med det formål netop bedre at kunne følge ”beslutningen” om, hvorfor et enkelt genom stammer fra én bestemt bakterie.

DET STORE MÅL ER ET KOMPLET LIVETS TRÆ

Fra Institut for Datalogi deltager Professor Katja Hose og Professor MSO Thomas Dyhre Nielsen, der forsker i henholdsvis grafanalyser og maskinlæring. Katja Hose supplerer:

- Datavidenskab og biovidenskab er to meget forskellige discipliner, der begge udvikler sig helt vildt og ofte uafhængigt af hinanden. Det er derfor nærmest umuligt at følge med i de seneste fremskridt på de to områder. I projektet håber vi både på at opnå synergi mellem felterne, men også at skubbe til grænserne for, hvad vi kan bruge hinandens viden til.

Samtidig er det en velkendt problemstilling, at det i dag tager flere år fra, at forskerne generer ny genetisk data i laboratoriet og til, at andre forskere kan bruge det. Derfor er håbet også, at man ved at kombinere datalogifaget og mikrobiologien kan skyde genvej, så kortlægningen af verdens bakterielle mangfoldighed kan ske endnu hurtigere:

- Udover at det selvfølgelig er åbenlyst, at vi kan lære en del af hinanden og af hinandens måde at forske på, så er det også en unik mulighed for os som dataloger til at udforske, hvordan de ting, vi arbejder med, kan udnyttes inden for andre felter, end de oprindelige var tiltænkt, siger Katja Hose.

Projektet er et såkaldt pilotprojekt, men de aalborgensiske forskere håber og tror, at det er startskuddet til et meget større samarbejde:

- Vi starter med at teste en håndfuld prøver, men målet er selvfølgelig, at vi på sigt kan skalere det op til tusindvis af prøver, så vi rent faktisk kan genere mange flere genomer og bidrage til at opbygge databaser, så vi har et komplet livets træ, siger Mads Albertsen.
_____________________________________________________________________________

OM PROJEKTET

Titel: Data Science Meets Microbial Dark Matter

Kontakt: 
Professor MSO Mads Albertsen
Institut for Kemi og Biovidenskab
Aalborg Universitet
Telefon: 2293 2191
E-mail: ma@bio.aau.dk

Professor Katja Hose 
Institut for Datalogi
Aalborg Universitet
Telefon: 9940 8886
E-mail: khose@cs.aau.dk

Bevilling: 3 mio. kr. fra VILLUM FONDENS Villum Synergy-Program

Pressekontakt: 
Nina Hermansen, 
Mail: ninah@cs.aau.dk
Telefon: 2090 1829

Foto: Colourbox