Vi nørdere videre! Sammen med Mads Paulsen og Thomas Kjær Rasmussen fra DTU arbejder jeg på en model for, hvilken rute trafikanter vælger gennem et netværk. Her er vejnettet i hovedstadsområdet. Dette kort har 30.000+ vejstykker og 20.000+ knudepunkter. 1/
Vi ønsker en model, som kan forudsige hvor trafikken vil være i netværket. Den skal bruges til at planlægge infrastruktur, måske kørselsafgifter og til at styre trafikken. Vi vil også gerne klare det kollektive trafiknet, med køreplaner osv. 2/
Det er ikke bare i København, man har brug for sådan en model. Det er verden over, fra New York til Ulan Bator. Vi har fat i noget, der betyder noget i den virkelige verden. 3/
Den store forhindring for at lave en god rutevalgsmodel er, at der er sindssygt mange mulige ruter fra A til B. 4/
Der er så mange, at det er håbløst at få en computer til at lave en liste over dem alle sammen. Der er faktisk så mange, at det er svært at regne ud, hvor mange der er - noget i stil med antallet af atomer i universet er et ok bud. 5/
Ikke nok med det. Atomer er sådan set lette, for de ligner hinanden alle sammen. Fysikerne har det let! Ruter, derimod, er svære, for de er alle sammen specielle, de ligner hinanden i varierende grad. 6/
Der har været arbejdet seriøst med rutevalgsmodeller siden 70’erne, da computerne begyndte at gøre det muligt. Forskningen slog hurtigt ind på McFadden-sporet (se tweet fra i går), for den type diskrete valgmodeller fungerede godt i andre sammenhænge. 7/
Men til rutevalg er McFadden-style ikke så godt, for der er jo sindssygt mange ruter. Man har forsøgt at stille det op som om folk lagde alle mulige ruter op ved siden af hinanden, for derefter at vælge den ”bedste” i en eller anden forstand. Der er bare for mange. 8/
Mange mennesker har brugt år af deres liv på at vente på supercomputere, der kværnede i dage og uger for at løse en lille skrabet model, der alligevel ikke var god nok. Det er deres hoveder, jeg kan være lidt bekymret for. 🤓9/
Nu har vi en ny slags model. Vi kan estimere den på 1 sekund, ikke uger. Vi omfatter alle mulige ruter, og får ikke bias fra en lille skæv stikprøve. Vi har styr på at alle ruter er specielle, vi bruger netværkets struktur til at fortælle os, hvor meget de ligner hinanden. 10/
Vi har et datasæt med nogle millioner observerede rutevalg. Vi inkluderer *alle* de sindssygt mange ruter. Og vi estimerer alligevel modellen på et sekund. 11/
Vi bruger forskellige tricks, men det vigtigste er at vende det hele på hovedet og bruge en model fra den duale verden. Vi slipper for højdramatiske ikke-lineære optimeringsproblemer. 12/
I vores model indgår de parametre vi skal bestemme bare lineært. Dem kan vi estimere lynhurtigt med lineær regression, kendt fra gymnasiematematik. 13/
Sådan kan en prædiktion for en enkelt tur se ud. Modellen har fundet et lille antal ret fornuftige ruter ud af de mange muligheder. De gamle modeller ville lægge sandsynlighed overalt, så der er lidt eksplosionsfare nu. 13½/
Et rigtigt forecast lægger 1000vis af sådan nogen oven på hinanden for at få trafikken i hele netværket. Hver prædiktion er løsningen på et konvekst konjugeringsproblem. 13 3/4 /
Det er stadig økonomi: modellen har optimerende agenter.
Man kan godt forestille sig samme ideer brugt i mere klassiske økonomiske settings, hvor den måde som ting/varer ligner hinanden på kan struktureres som et netværk. Fx på giga scannerdata fra supermarkeder. Måske skulle man prøve noget i DK!? 15/
Man skal jo helst være lidt optimistisk på sit projekts vegne og det er jeg også! Det her tror jeg kan blive en game changer inden for rutevalgsmodeller. Hvis jeg får ret, så kommer det til at ændre på praksis. 16/
Og så får vi masser af impact. Disse modeller bliver brugt til planlægning og regulering af trafikinfrastruktur verden over, behind the scenes, og der er rigtig mange milliarder på højkant. 17/slut @KuSamf@ERC_Research
Det må være passende at slutte denne tråd med et billede,
som viser hvor godt modellen egentlig passer.
Vi er faktisk ret tæt på 45 graders linjen allerede (med bare 13 frie parametre) og jeg er ret godt tilfreds. :-)
1/ I dag vil jeg pippe lidt om polarisering. Om hvordan uopmærksomhed og polarising kan hænge sammen. Om hvordan ellers fornuftige mennesker kan være uenige om alt.
2/ Et lille forbehold: jeg vil kun snakke om information og opmærksomhed. Der er mange andre vinkler på polarisering, specielt om social identitet. Dem gemmer vi til en anden dag.
3/ Vi kan tænke på en historie i avisen, som er relateret til en polariseret dagsorden. Læserne har hver især en fordom på, om historien støtter den ene eller den anden side i den polariserede dagsorden.
1/ I dag har jeg tænkt at snakke om rationel uopmærksomhed. Fænomenet er i spil lige her og nu, hvor de beslutter, om du vil bruge tid og mentale kræfter på at læse denne serie tweets.
2/ Vi starter et andet sted. Hvad skal en model kunne for at lave statistiske forudsigelser af, hvad folk vil vælge i konkrete situationer? Det er ret abstrakt, men jeg kaster mig ud i det alligevel...
3/ Der er en stor litteratur om sådan nogle modeller, specielt i økonomi og psykologi. Alt sammen går det ud på at motivere en matematisk struktur, som man kan putte tal ind i, drage konklusioner og lave prognoser.
1/ I dag skal det handle om diskrimination. Med de helt nøgterne teoretiske og matematiske briller på. Det handler om generelle mekanismer, hvorigennem diskrimination kan foregå.
2/ Det hele kommer til at foregå på et billede som dette.
Min forskning befinder sig et sted mellem mikroøkonomisk teori og mikroøkonometri. Jeg arbejder på et Advanced Grant, som jeg har fået af det Europæiske Forskningsråd. Det er en stor pose penge til high-risk, high-gain grundforskning. 1/n
Mit projekt handler om at lave modeller for diskrete valg. Diskret betyder individuelt adskilt og distinkt, og modellerne handler altså valg mellem en række individuelt adskilte og distinkte alternativer. 2/n
Det handler om at forudsige, statistisk, hvordan en population af mennesker vil vælge under givne omstændigheder. Fx hvilke biler folk køber, eller hvilke vej veje de tager på arbejde. 3/n