Menu

Statistik

Statistikgruppen forsker i matematisk og anvendt statistik, med hovedvægt på exponentielle dispersionsmodeller, extremværdi teori og anvendelser af statistik i biologi. Gruppen indgår i den tværfakultære Forskningsenhed for Statistik ved Syddansk Universitet, som også omfatter biostastikgruppen på Institut for Sundhedstjenesteforskning ved det Sundhedsvidenskabelige Fakultet. 

Ekstremværdi teori  

Ekstremværdi teori vedrører egenskaber ved halen af en fordelingsfunktion, så som mål for, hvor hurtigt halen aftager, ekstreme fraktiler, samt mål for afhængighed mellem flerdimensionale ekstremer. Dette område er således meget forskelligt fra den 'klassiske' statistiske teori, som primært koncentrerer sig om analysen af middelværdier. Når man er interesseret i at estimere de parametre som styrer halen af en fordelingsfunktion, er det klart, at analysen skal baseres på de mest ekstreme observationer i stikprøven, hvilket således kræver en beskrivelse af hvorledes disse ekstreme datapunkter opfører sig. Centralt i ekstremværdi teori står derfor grænsefordelingen for ekstremer, de såkaldte ekstremværdi fordelinger, først introduceret af Fisher og Tippett i 1928. Disse fordelinger fremkommer som de eneste mulige grænsefordelinger for fordelingen af standardiserede maksimummer i stikprøver af uafhængige og identisk fordelte stokastiske variable. Anvendelser af ekstremværdi teori kan findes i discipliner som hydrologi (floders strømning, oversvømmelser), miljøforskning og meteorologi (koncentrationer af forurenende stoffer, ekstrem nedbør, vindhastigheder), (gen-) forsikring (præmieberegninger), finansiering (value-at-risk estimation), geologi (jordskælvsmodellering, værdien af diamanter), og datalogi (netværkstrafik, ventetider for servere), for blot at nævne nogle stykker.   

Eksponentielle dispersionsmodeller  

Eksponentielle dispersionsmodeller er to-parameter familier af sandsynlighedsfordelinger, hvor den ene parameter repræsenterer en eksponentiel familie (frembragt af eksponentiel tiltning), mens den anden repræsenterer en foldningssemigruppe. Klassen af eksponentielle dispersionsmodeller indeholder en række standardfamilier som specialtilfælde, så som Poisson- binomial- og gammafamilierne, normalfordelingen og den inverse Gaussfordeling. En særligt vigtig type af eksponentielle dispersionsmodeller udgøres af de såkaldte Tweediemodeller, som er kendetegnet ved at de er lukket under skalatransformationer, hvilket betyder at deres variansfunktion er en potens. Tweediemodeller fremkommer som grænsefordelinger i en slags central grænseværdisætning, som involverer en kombination af foldning, eksponentiel tiltning og skalering. Potensformen for Tweediemodellernes variansfunktion, også kendt som Taylors potenslov, er observeret empirisk inden for en lang række forskellige områder, som for eksempel i forbindelse med fordelingen af planter og dyr inden for deres habitat, inden for forskellige områder af sundhedsvidenskab og genetik (HIV, børnecancer), samt internettrafik, for blot at nævne nogle få. Teoretisk arbejdes der med at afgrænse attraktionsdomænet for Tweedie konvergenssætningen ved hjælp af teorien for regulært varierende funktioner, samt på at finde analoger til konvergensresultatet inden for andre områder. Senest er det lykkedes at påvise, at Tweedie konvergens kan betragtes som en analog til grænsefordelingen for ekstremer, idet ekstremværdifordelingerne viser sig også at være karakteriseret ved en potensform af den såkaldte slopefunktion. Tweediemodellerne er særdeles nyttige til opbygning af modeller for longitudinale data og såkaldt blandede modeller, og de har således været anvendt til analyse af f.eks. forsikringsdata, fiskeridata og luftforureningsdata.    

Manglende data  

Inden for biologisk antropologi, specielt ved studiet af palæontologisk eller forhistorisk skeletmateriale, er anvendelsen af multivariate metoder ofte begrænset eller umuliggjort pga. manglende data, et problem som skyldes inkomplet bevaring og/eller deformering af de morfologiske strukturer. Forskningen indenfor dette område er rettet mod såvel metriske som diskrete morfologiske variable, herunder geometrisk morfometri, dvs. målepunkt-baserede metoder. Emner der undersøges er: passende metoder for inferens mht. Mahalanobis afstande vha. Hotellings T-test; Mahalanobis afstande modificeret så de kan anvendes på diskrete variable (her savnes test-metoder selv for data uden manglende værdier!), metoder til multipel imputation mhp. inferens baseret på materiale som er virtuelt rekonstrueret vha. geometrisk morfometri.   

Videnskabelige medarbejdere 
Yuri Goegebeur 
Hans Christian Petersen 
Mikael Escobar-Bach
 

Vi samler statistik ved hjælp af cookies for at forbedre brugeroplevelsen.  Læs mere om cookies

Acceptér cookies