Skip to main content
DA / EN

Forskere om sekventering af data: Vi drukner i data, men tørster efter viden

Tilgængeligheden af DNA-data har revolutioneret moderne biologi og molekylær medicin. En sekventering af en bakteries genom koster i dag kun 200 euro, og det har fået antallet af sekventerede bakterier til at eksplodere. Men data er ikke det samme som viden - de mange DNA-data kan faktisk ikke bruges til ret meget, advarer forskere fra Syddansk Universitet.

Flere og flere genetiske data bliver tilgængelige, og det sker i et drastisk stigende tempo. Men overraskende nok kan alle disse data ikke bruges til at udrede værdifuld information om f. eks., hvordan mikroorganismer interagerer med deres omgivelser, inficerer værter og ændrer deres molekylære programmer i overensstemmelse med skiftende miljømæssige omstændigheder.

Det konkluderer forskere fra Syddansk Universitet i et nyt studie, og det rejser spørgsmålet om værdien af de mange dna-sekvenser, der bliver indsamlet.

Ingen brugbar viden om farlige bakterier

Forskerne, lektor Jan Baumbach og hans ph.d.-studerende Eudes Barbosa fra Institut for Matematik og Datalogi ved Syddansk Universitet i Danmark, har analyseret genomer fra de sidste 20 års sekventering af bakterielt DNA.

De forsøgte at bruge denne enorme bunke data til at besvare et simpelt spørgsmål: Kan man skelne mellem sygdomsfremkaldende og ikke-sygdomsfremkaldende bakterier ved kun at se på deres genom? De fandt ud af, at dette ikke er muligt i flere tilfælde – man kan ikke bruge DNA-sekvenser til at besvare et så enkelt, men yderst vigtigt spørgsmål.

”Hvorfor skal vi så bruge ressourcer på at indsamle endnu flere af denne type data?”, spørger SDU-forskerne.

Pt. er næsten 3.000 bakteriearter blevet sekventeret. Yderligere 24.000 sekventeringsprojekter er i gang, og mange andre projekter arbejder på at sekventere mange flere organismer fra både dyre- og planteriget.

"Man kan spørge sig selv, hvad værdien af alt dette er", siger forskerne.

Deres forskningsresultater viser nu, at når det gælder bakterier, kan videnskaben ikke regne med at kunne udlede nyttig viden om bakteriers evne til at være sygdomfremkaldende (deres patogenicitet) ud fra DNA-sekventering.

"Skal vi så fortsætte med at sekventere DNA af bakterier i så stor skala? Måske kan vi bruge ressourcerne bedre”, mener Baumbach og Barbosa.

Sammen med kolleger fra Max Planck Instituttet for Informatik i Tyskland og Bioinformatik Institut ved Federal University of Minas Gerais i Brasilien har de to forskere udført analyser af 240 helgenom DNA-sekvenser fra Actinobacteria, en af de ældste grupper af livsformer på jorden. Den indeholder arter af stor vigtighed for den medicinske forskning – det er f. eks. Corynebacterium diptheriae (forårsager difteri), Mycobacterium tuberculosis (tuberkulose) og Mycobacterium leprae (spedalskhed). I gennemsnit har deres genomer omkring tre millioner basepar og fem tusinde gener.

Siden videnskabens første genom-sekventering – af influenzavirus i 1995 - har forskere sekventeret flere tusinde bakteriearter og ca. 50 millioner gener. I alt kender vi 10.000 bakteriearter og bakterier-lignende archaea, men det skønnes, at der findes mange flere. Et konservativt bud lyder på et godt stykke over 100 mio.

SDU-forskerne understreger, at de på ingen måde er imod DNA-sekventering som videnskabeligt værktøj.  Man skal dog være opmærksom på teknikkens begrænsede evne til at belyse spørgsmål om bakteriernes smitteevne, patogenicitet og virulens.

»Vi drukner i data, men tørster efter viden", siger Jan Baumbach.

Proteiner er vigtigere end DNA

Han mener, at der er mere værdi i at bruge andre teknikker:

"Moderne sekventeringsteknikker, såkaldte next generation sequencers, kan forventes at give os mere viden end DNA-sekvenserne alene. De giver nemlig også viden om, hvordan de enkelte gener kommer til udtryk. Den slags data kan belyse samspillet mellem generne. De handler nemlig ikke isoleret, men spiller sammen som i et orkester”.

Dette giver mulighed for at måle aktiviteten af gener i en bestemt tilstand (efter infektion, for eksempel) snarere end deres blotte forekomst.

Når vi taler om sygdomsfremkaldende bakterier, findes den vigtigste viden i genernes aktivitet, ikke i deres DNA-sekvens:

"Det er ligesom et flystyrt. Farven på flyet betyder ikke noget. Det afgørende er at afsløre de parallelle sekvenser af aktiviteter, der førte til ulykken”, siger Eudes Barbosa.

 

 

Ref: Briefings in Functional Genomics: On the limits of computational functional genomics of bacterial lifestyle prediction.

Foto af Jan Baumbach: Ricky Molloy/SDU.

Lektor Jan Baumbach kan også mødes på Science In The City festivalen I København fra den 21. – 26. juni. På SDUs stand vil han demonstrere en maskine, der kan analysere de molekyler, der findes i menneskers udåndingsluft. De kan sladre om vores helbred.

Kontakt lektor Jan Baumbach. jbaumbach@imada.sdu.dk. Mobiltelefon: 5170 1281

 

Redaktionen afsluttet: 18.06.2014