Du er her

Fremtidige reisevaneundersøkelser:

Big Data eller spørreskjemaer? Ja takk!

Transportetatene er i gang med en ny reisevaneundersøkelse (RVU). Også i denne omgang skal den baseres på spørreundersøkelser. Denne artikkelen vil drøfte mulighetene for å erstatte spørreundersøkelsene med andre datakilder, eksempelvis Big Data.

Venn tipset!

Din venn har blitt sendt en e-post om denne artikkelen.

Tips en venn

Det er en del forvirring rundt forskjellene mellom spørreskjemabaserte data og Big Data. Denne artikkelen vil presenterte ulikhetene mellom disse datatypene, og trekke fram både begrensninger og fordeler ved dem.

Det er mye oppmerksomhet om RVU, blant annet i tilknytting til Bymiljøavtalene. Samtidig er det mye oppmerksomhet om såkalte store data – også i Norge kanskje bedre kjent som Big Data. Reisevaneundersøkelsen skal heretter kjøres kontinuerlig over de fire neste årene og vil i stor grad være basert på tradisjonelle spørreundersøkelser. Det handler ikke nødvendigvis om store eller små data, men riktige data for det man ønsker å studere. Ulike datakilder gir ulik informasjon. Formålet med studien avgjør derfor hvilken datakilde man bør velge.

At Big Data er i vinden i transportforskningen, er det ingen tvil om. Blant annet var Big Data gjenstand for flere presentasjoner på European Transport Conference 2016, en stor internasjonal transportkonferanse som ble holdt i Barcelona i oktober.

Videre skrev The Economist («Listen to the music of the traffic in the city») tidligere i år om hvordan man kan måle mobilitetsstrømmer ved å måle bruken av sosiale medier.

Alt tatt i betraktning, man kan spørre om man i fremtiden vil trenge reisevanedata generert gjennom tradisjonelle spørreundersøkelser.

I denne artikkelen vil vi se nærmere på de mest vanlige datakildene som tradisjonelt er benyttet i reisevanestudier og transportforskning generelt, samt ta en titt på nye datakilder. Så skal vi diskutere fordeler og ulemper knyttet til de ulike datakildene.

Det er viktig å merke seg at hvilke styrker og svakheter man trekker frem, avhenger av hvilket formål man har med studien man skal utføre. Eksempelvis kan data fra et tellepunkt for bil være bra til å måle antall biler, men slike data kan normalt ikke si noe om formålet med reisen.

Hvis man ønsker å undersøke formålet med reisen, er altså tellepunktdata i de fleste tilfeller lite hensiktsmessig.

Videre i artikkelen vil vi drøfte styrker og svakheter ved disse datakildene: De nasjonale reisevaneundersøkelsene, tellepunktdata, CDR-data (Call Detail Record-data, som er passive data fra mobiletelefoner), data fra ulike apper og til slutt andre mulige datakilder.

Den nasjonale reisevaneundersøkelsen (RVU)

Tradisjonelt er reisevaneundersøkelsene i stor grad basert på bruk av spørreskjema. Men slik blir det ikke nødvendigvis i fremtiden. Illustrasjon: SamferdselDe nasjonale reisevaneundersøkelsene er i dag en grunnleggende kilde til informasjon om hvordan det norske folk reiser i ulike deler av landet og for ulike typer formål.

Den som nå er under planlegging (RVU 2016–19) er den åttende reisevane­undersøkelsen som blir gjennomført i Norge. Til forskjell fra de tidligere undersøkelsene, skal denne være kontinuerlig.

De syv foregående ble gjen­nomført i 1985, 1992, 1998, 2001, 2005, 2009 og 2013/14. RVU 2013/14 er den største nasjonale reisevaneundersøkelsen som har vært gjennomført i Norge, med ca. 60 000 intervjuer. Den omfatter et landsrepresentativt basisutvalg på ca. 10 000 intervjuer og et tilleggsutvalg på ca. 50 000 intervjuer.

Reisevaneundersøkelsene omfatter alle typer personreiser, både dagliglivets korte reiser og lengre reiser som gjennomføres sjeldnere, samt bruk av alle typer transportmidler, inkludert gange. Formålet med de nasjonale reisevane­undersøkelsene er å få et detaljert bilde av befolkningens reise­aktivitet og reisemønster.

Undersøkelsene skal blant annet fortelle om:

  • omfanget av befolkningens reiser
  • hensikten med reisene
  • hvordan folk reiser
  • hvordan reiseaktiviteten varierer mellom
    ulike befolkningsgrupper

I en reisevaneundersøkelse innhentes detaljerte opplysninger om intervjupersonen og husholdningen vedkommende tilhører, hvilke reiser han/hun har foretatt på registreringsdagen, lengre reiser (100 km og lengre) samt reiser til/fra Norge som er foretatt siste måned (for flere detaljer, se Hjorthol, mfl. (2014)).

Det er altså snakk om en omfattende spørreundersøkelse som gir et rikt datamateriale, et vell av analysemuligheter og muligheter til å besvare mange problemstillinger. Opp gjennom årene har RVU-ene vært brukt til mange formål og vært et verdifullt bidrag til forsknings- og utredningsarbeid på en rekke områder.

I hovedsak har det samme spørreskjemaet vært brukt i alle de nasjonale RVU-ene. Datamaterialet fra RVU-ene gir derfor også gode muligheter til å studere sosial endring, hva som har skjedd med befolkningens reisevaner over tid og viktige forklaringsfaktorer på eventuell endring.

Det er i første rekke to feilkilder i denne typen undersøkelser ­– respondentenes svar samsvarer ikke med de faktiske reisene de har foretatt, og utvalget man har er ikke generaliserbart for den populasjonen man ønsker å studere (Fowler Jr 2013).

Den første feilkilden innebærer eksempelvis at respondentene kan glemme reiser de har foretatt, de kan misforstå spørsmålene eller bevisst svare feil.

Den andre feilkilden innebærer at det kan være ulike kjennetegn ved henholdsvis respondenter og den øvrige befolkningen. Dette er et problem som har blitt aktualisert de senere årene, hvor det har vært en fallende svarprosent på RVU. I 1985 var svarprosenten på 77, mens den i 2013 var på 20 (Hjorthol, mfl. 2014).

De to feilkildene har også blitt diskutert i den internasjonale litteraturen, blant annet i Pearson, mfl. (2009).

Problematikk knyttet til fallende svarprosent i tillegg til høye kostnader knyttet til innsamling av data er noen av grunnene til at flere land vurderer å erstatte spørreundersøkelser, helt eller delvis, med nye datakilder når reisevaneundersøkelser gjennomføres.

CDR-data

Særlig i land hvor man ikke har en nasjonal reisevaneundersøkelse, eksempelvis Estland, vurderer man å bruke andre datakilder som kan gi tilsvarende informasjon.

En av datakildene som blir benyttet som supplement til eller erstatning for spørreskjemabaserte reisevaneundersøkelser, er CDR-data (Ahas, mfl. 2010, Chen, mfl. 2016). Slike data fremkommer ved at man samler informasjon om hvilken mobilmast en mobiltelefon kobler seg opp mot når den sender eller mottar data (tale, tekst eller mobildata).

For en lang rekke land i verden finnes informasjon om geografisk posisjon på mobilmaster. Illustrasjon: opencellid.org.   Ved hjelp av plasseringen av mobilmasten kan man få en omtrentlig posisjon av mobiltelefonen. Man kan dermed få et relativt godt bilde av hvor mange aktive mobiltelefoner det er i et gitt område på et gitt tidspunkt (Ahas, mfl. 2007). Det er imidlertid viktig å merke seg at det ikke er snakk om nøyaktig stedfesting ved bruk av slike data. De gir en omtrentlig posisjon. For en lang rekke land i verden finnes informasjon om geografisk posisjon på mobilmaster på opencellid.org.  

Videre kan man ved å koble på informasjon om brukeren få informasjon om andre bakgrunnsvariabler, slike som alder og kjønn. Ved å følge bevegelsene til en mobiltelefon over tid, kan man dermed få informasjon om reisemønster – eksempelvis for ulike aldersgrupper.

Et viktig poeng er at abonnenten på mobiltelefontjenesten ikke nødvendigvis er den faktiske brukeren av mobiltelefonen. Eksempelvis kan foreldre være eiere av abonnementet, mens deres barn er de faktiske brukerne.

Det er flere prinsipielle forskjeller mellom CDR-data og data samlet inn via en reisevaneundersøkelse. For det første er formålet med CDR-data primært å skaffe informasjon slik at mobiloperatørene kan fakturere kunden for bruk av telefonene. Formålet er med andre ord ikke primært å samle inn informasjon om reisevaner.

Data i reisevaneundersøkelsene (RVU) er gitt gjennom informert samtykke, ved at respondentene blir spurt om de ønsker å delta. Dette er normalt sett ikke tilfelle for CDR-data. Her har ikke respondentene, altså brukerne av mobiltelefoner, gitt samtykke til bruk av slike data til eksempelvis forskningsformål.

Dette gjør at bruk av CDR-data stiller strenge krav både til mobiloperatører og forskere (for mer informasjon, se Datatilsynet, 2013). Det er imidlertid viktig å ha en åpen diskusjon om denne typen data bør kunne brukes til forskningsformål.

Videre kan man i utgangspunktet ved hjelp av CDR-data ikke fastslå formålet med en reise eller et transportmiddel. Det er imidlertid forsøkt i enkelte studier å kartlegge både formål med reisen og transportmiddel ved bruk av CDR-data alene. Eksempelvis kommer togpassasjerer i klynger ettersom de sitter i samme tog, mens bilister kommer mer spredt forbi en gitt mobilmast. Og man kan anta at personer som er i en butikk kortere enn en gitt tid ikke jobber der, men handler. Resultatet av bruk av slike algoritmer er imidlertid forbundet med stor grad av usikkerhet (Khorgami, mfl. 2016). 

Den store fordelen med CDR-data er at de aller fleste mennesker i dag bruker en mobiltelefon og har den med seg stort hele tiden. Dataene man får ut fra slike analyser representerer derfor en stor del av befolkningen. Imidlertid finnes det flere ulike operatører som tilbyr mobiltelefoni, og for å dekke en størst mulig del av befolkningen må man dermed få informasjon fra alle operatører.

Videre er dette data som allerede blir samlet inn, så marginalkostnaden for innsamling av slike data til transportforskning blir dermed tilnærmet null. Analyser av denne typen data er imidlertid på utviklingsstadiet, og derfor er de svært tidkrevende og dermed kostbare.

Data fra mobilapplikasjoner (apper)

Man kan også samle inn data fra mobiltelefoner ved at man laster ned ulike apper til mobiltelefonen, eksempelvis apper som har som formål å kartlegge reisevanene til brukerne.

I Sverige har man utviklet en app – MEILI, som er åpent tilgjengelig og gratis (open source) – som kartlegger brukernes reisevaner. Det finnes også flere selskaper som selger apper for måling av reisevaner. Ved å laste ned slike apper til sine telefoner sender brukeren informasjon om sin posisjon og sitt reisemiddelvalg til eksempelvis forskere (Fyhri, mfl. 2016).

Det finnes også apper som lagrer posisjonsdata, men som ikke nødvendigvis har til hovedhensikt å kartlegge reisevaner. Slike apper kan allikevel benyttes for å kartlegge reisevaner. Andre apper, som Google Maps eller diverse aktivitetstrackere (f.eks. «Strava»), samler inn store mengder informasjon som også kan brukes til forskning.

Den store fordelen med denne måten å samle inn informasjon på er at man får reisevanedata med høy nøyaktighet på posisjons- og tidsangivelse.

Den store utfordringen er at man ofte mangler informasjon om formålet med reisen eller indirekte må gjette på denne typen informasjon gjennom algoritmer eksempelvis at der du oppholder deg på natten, er der du bor, osv. Alternativt kan man få spørsmål om dette via appen.

Tellepunktdata

Tidligere var manuelle tellinger av biltrafikk, kollektivreisende eller syklende utbredt. I de senere år har man fått teknologi som med relativt stor presisjon kan telle biltrafikk eller syklende.

Det finnes ulike typer automatiske tellinger, blant annet radar og tellesystemer som er gravd ned i veibanen. Dette gir blant annet mulighet til å få mer kontinuerlige data over tid. Dette åpner igjen for at man relativt enkelt kan koble slike data opp mot andre data, eksempelvis vær- og ulykkesdata. Automatiske tellinger samler inn data for biltrafikk, sykling og kollektivtransport en rekke steder i Norge. En oversikt over tellepunkter fra Statens vegvesen finnes på www.vegvesen.no/vegkart/.  Slike tellinger måler ikke formålet med reisen eller bakgrunnsvariabler om den reisende.

Andre datakilder

I utgangspunktet er det kun fantasien som setter grenser for hvilke data man kan benytte til å måle mobilitet. Ny teknologi åpner mange muligheter som ikke fantes tidligere. Stadig nye produkter blir koblet mot internett med posisjonsinformasjon. Dette omtales ofte som «internet of things».

Eksempler på dette er navigasjonssystemer for biler og pulsklokker. Fra Polar-pulsklokker kan man eksempelvis hente ut informasjon om brukeren og bevegelsesmønster. Og TomTom-navigasjonssystem for biler lagrer informasjon om bevegelsesmønsteret til biler som benytter systemet.

Slike navigasjonssystemer er kanskje særlig egnet på strekninger hvor det er lite trafikk og dermed relativt dyrt å måle trafikken på andre måter.

Måling av bruk av sosiale medier (som Twitter, Facebook og Flickr) blir også brukt i en lang rekke studier for å kartlegge eksempelvis hvordan turister reiser og hva de er opptatt av (Bynum Boley, mfl. 2013, Christou 2015, Claster, mfl. 2010). Denne typen data kan gi interessant informasjon om reiseatferd innenfor visse brukergrupper og i avgrensede situasjoner, men det er ofte vanskelig å si noe om utvalgenes representativitet eller gyldighet utover dette.

Oppsummering

Ulike datakilder gir ulik informasjon om reisevaner og trafikkstrømmer. Man vil per i dag miste mye informasjon om reiser og den reisende hvis man erstatter dagens spørreundersøkelser helt med for eksempel CDR-data eller andre datakilder.

Imidlertid kan ny teknologi bidra til å forbedre presisjonen i spørreundersøkelser ved at selve reisen blir målt ved hjelp av en app, mens spørsmål om hensikt og bakgrunnsvariabler, som kjønn og alder, måles ved hjelp av spørreundersøkelser.

Automatiske tellepunktdata for biler, sykler eller kollektivtransport gir en annen informasjon enn spørreundersøkelsesdata. De måler kontinuerlig trafikkstrømmer på gitte punkter. Formålet med studien avgjør hvilke data man bør velge.

Imidlertid kan det være store muligheter for å koble ulike datakilder for å studere de samme problemstillingene fra ulike sider. Eksempelvis studerer man i BYTRANS-prosjektet ved Transportøkonomisk institutt (TØI) effekten av redusert vegkapasitet i Oslo grunnet oppgradering av en rekke tuneller, og her benyttes både tellepunktdata og spørreundersøkelser (Tennøy, mfl. 2015).

Kilder
R. Ahas, A. Aasa, Ü. Mark, T. Pae og A. Kull. (2007). Seasonal tourism spaces in Estonia: Case study with mobile positioning data Tourism Management (Vol. 28, pp. 898-910).

R. Ahas, S. Silm, O. Järv, E. Saluveer og M. Tiru. (2010). Using Mobile Positioning Data to Model Locations Meaningful to Users of Mobile Phones Journal of Urban Technology (Vol. 17, pp. 3-27): Routledge.

B. Bynum Boley, V. P. Magnini og T. L. Tuten. (2013). Social media picture posting and souvenir purchasing behavior: Some initial findings Tourism Management (Vol. 37, pp. 27-30).

C. Chen, J. Ma, Y. Susilo, Y. Liu og M. Wang. (2016). The promises of big data and small data for travel behavior (aka human mobility) analysis Transportation Research Part C: Emerging Technologies (Vol. 68, pp. 285-99).

E. Christou. (2015). Branding Social Media in the Travel Industry Procedia - Social and Behavioral Sciences (Vol. 175, pp. 607-14).

W. B. Claster, M. Cooper og P. Sallis. (2010). Thailand--Tourism and conflict: Modeling sentiment from Twitter tweets using naïve Bayes and unsupervised artificial neural nets 2010 Second International Conference on Computational Intelligence, Modelling and Simulation (pp. 89-94): IEEE.

Datatilsynet. (2013). Big Data - personvernprinsipper under press. https://www.datatilsynet.no/Teknologi/Big-Data/

F. J. Fowler Jr. (2013). Survey research methods: Sage publications.

A. Fyhri, H. B. Sundfør og C. Weber. (2016). Effekt av tilskuddsordning for elsykkel i Oslo på sykkelbruk, transportmiddelfordeling og CO2 utslipp TØI (Vol. 1498/2016).

R. Hjorthol, Ø. Engebretsen og T. P. Uteng. (2014). Den nasjonale reisevaneundersøkelsen 2013/14 - nøkkelrapport TØI (Vol. 1383/2014 ).

S. Khorgami, R. Tolouei, P. Hanson og G. Powell. (2016). Use of mobile phone data in regional traffic models: experience from Highways England European Transport Conference.

D. Pearson, E. Hard, S. Farnsworth, T. Forrest, D. Spillane, M. Ojah, K. Womack, S. Boxill og C. Lewis. (2009). Improving Accuracy in Household and External Travel Surveys: Aug.

A. Tennøy, P. B. Wangsness, J. Aarhaug, F. A. Gregersen og N. Fearnley. (2015). Pilotstudier: Før- og underveisundersøkelser av Østensjøbanen og Smestadtunnelen TØI (Vol. 1455/2015 ).

DEBATTREGLER I SAMFERDSEL
Har du synspunkter på denne saken, så kom gjerne med dem her i kommentarfeltet! Det du skriver vil i de fleste sammenhenger fremstå som mer interessant og troverdig dersom du skriver under fullt navn. Hold deg til saken, vis respekt og raushet overfor andre og deres meninger. Husk at det du skriver kan bli lest av mange!

Ytringer som inneholder trusler eller annen form for sjikane, vil bli fjernet.

Vennlig hilsen
Samferdsel-redaksjonen

comments powered by Disqus

Ansvarlig redaktør:  Kommunikasjonssjef Harald Aas, E-post: ha@toi.no  |  Personvern

Designet og utviklet av CoreTrek AS