Du er her

Tilfeldigheter avgjør en av fire førerprøver

Det er ikke bare ferdighetene det kommer an på for dem som kjører opp til førerprøven. For over en fjerdedel av kandidatene ville resultatet blitt et annet om man hadde hatt en annen sensor.

Venn tipset!

Din venn har blitt sendt en e-post om denne artikkelen.

Tips en venn

Torkel Bjørnskau
Høsten 2002 gjennomførte Statens vegvesen og Transportøkonomisk institutt et eksperiment med førerprøven.  I alt 90 førerkortkandidater fra henholdsvis Oslo, Fredrikstad, Mysen og Drøbak kjørte opp på en og samme oppkjøringsrute ved trafikkstasjonen i Moss. Hver kandidat ble vurdert av en sensor i forsetet (som avgjorde prøven) og en i baksetet som også vurderte kandidaten i henhold til vanlige prosedyrer. I alt 12 sensorer gjennomførte førerprøvene – og disse kom også fra trafikkstasjonene i Oslo, Fredrikstad, Mysen og Drøbak (Follo).

Sensorene vurderer ulikt 

Resultatene viser at sensorene ikke alltid vurderer en og samme kandidat likt. Tabell 1 viser i hvilken grad sensorene har vært enige om kandidaten bør stå eller stryke til førerprøven.

Tabell.1  Sensor1 og Sensor 2s vurdering av samme kandidater. Andel bestått. Prosent av total.

 

Sensor 2

Sensor 1:

Bestått

Ikke bestått

I alt

Bestått

46,7 (42)

15,6 (14)

62,2 (56)

Ikke bestått

12,2 (11)

25,6 (23)

37,8 (34)

I alt

58,9 (53)

41,1 (37)

100,0 (90)

 

Kilde: TØI rapport 662/2003

42 kandidater har blitt vurdert til å bestå prøven av begge sensorene, og 23 er blitt vurdert til stryk av begge. Men 25 kandidater har blitt vurdert til stryk av den ene sensoren og bestått av den andre sensoren. Dette utgjør 28 prosent av alle kandidatene. En rimelig tolkning av dette er at det i 28 prosent av prøvene er kjennetegn ved sensor og ikke ferdighetene til kandidatene som avgjør om kandidaten står eller styrker.

Man vil alltid måtte regne med en viss uoverensstemmelse når to personer skal vurdere en og samme prøve, men om 28 prosent er innenfor det man med rimelighet kan forvente, eller om det er for høyt, er ikke uten videre enkelt å svare på. Vi kjenner ikke til andre undersøkelser av førerprøver som kunne belyst dette. Uoverensstemmelsene i sensorenes vurderinger gjenspeiler seg også i antall feil som registreres på vurderingsskjemaet. Sensorene klassifiserer feil i tre klasser etter alvorlighet. Vi har laget et samlemål på antall feil der disse er vektet etter alvorlighetsgrad (type 1 feil = 1, type 2 feil = 3, type 3 feil = 5).

I figur 1 har vi plottet inn vektet antall feil som de to sensorene har registrert på en og samme kandidat. Her er kandidatene sortert stigende etter antall feil som sensor 1 (dvs. sensor i forsetet).

 

 

  Figur 1  Antall feil (vektet) i følge vurderingene til sensor 1 og sensor 2.

Ideelt sett skulle indeksverdiene til sensor 1 og 2 være identiske for alle kandidatene, og kurvene ville da vært sammenfallende. Vi ser at det er langt fra tilfellet, og avstandene er til dels store. For eksempel har kandidat nr. 74 fått verdi 38 av sensor 1, mens sensor 2 ikke har gitt denne kandidaten verdi 0. Og den kandidaten som har størst verdi, 79 på indeksskåren til sensor 2, har ikke mer enn verdi 41 på indeksskåren i henhold til sensor 1 sin bedømming.

Avstanden i indeksverdiene til sensor1 og sensor 2 varierer mellom 0 og 39. I gjennomsnitt er avstanden på 9,7. Det betyr at i gjennomsnitt har den ene sensoren registrert 10 små feil mer enn den andre, eller 5 større feil. Selv om dette virker mye, er indeksverdiene til sensor 1 og sensor 2 klart positivt korrelerte (Pearsons r = 0,62, p = 0,001). Det er med andre ord en forholdsvis klar tendens til at de kandidatene som har fått en høy verdi i henhold til den ene sensorens vurderinger også har fått en høy verdi i henhold til vurderingene fra den andre sensoren. 

 

Systematiske forskjeller mellom kandidater

Bakgrunnen for undersøkelsen var opprinnelig at Statens vegvesen ønsket å få undersøkt om det var systematiske forskjeller i hvor vanskelig den praktiske førerprøven i klasse B er, avhengig av hva slags trafikkmiljø kandidatene har hatt opplæring i og hva slags trafikkmiljø de kjører opp i. Mange har ment at det er vanskeligere å kjøre opp i storbyen, og at mange storbykandidater derfor velger å kjøre opp på andre steder.

Hvis det er vanskeligere å kjøre opp i storbyen, skulle en også forvente at kandidater fra storbyer er flinkere enn kandidater fra distriktene ved oppkjøringen, i hvert fall når det gjelder bykjøring. Men det kan også tenkes at nettopp fordi storbytrafikken er så mye mer komplisert, så tolererer sensorene i de større byene flere feil ved oppkjøringen enn det sensorer fra mindre områder gjør.

Resultatene viste at kandidatene fra Oslo gjennomgående var svakere enn kandidatene fra Mysen/Drøbak og Fredrikstad. De var altså ikke flinkere slik man på forhånd kanskje hadde ventet.

Hovedforklaringen på disse forskjellene er imidlertid først og fremst at kandidatene fra Oslo gjennomgående var eldre, og at flere var av utenlandsk opprinnelse. Generelt var det klare tendenser til at de som kjørte opp da de var 19 år eller eldre gjorde det dårligere enn de som kjørte opp som 18-åringer. Det var også helt klare tendenser til at utenlandske kandidater hadde høyere strykprosent enn norske kandidater.

Det viste seg at kandidatene fra Oslo gjennomgående hadde flere feil ved kjøring på landevei/motorvei enn kandidater fra Mysen/Drøbak og Fredrikstad, etter kontroll for alder og landbakgrunn. Det viste seg også at kandidatene fra Mysen/Drøbak hadde signifikant flere feil ved bykjøring enn kandidater fra Fredrikstad (og Oslo). Vi fant med andre ord en viss tendens til at det trafikkmiljøet man har erfaring fra under øvelseskjøring påvirker resultatene til prøven. De som har erfaring fra bykjøring gjør det relativt bedre ved bykjøring enn ved landeveiskjøring, mens det omvendte er tilfellet for de som øvelseskjørt mest utenfor byområdene.

Den variabelen som var mest utslagsgivende for antall feil og for sjansen for å bestå prøven, var antall timer ved kjøreskole. Kandidater med mange timer på kjøreskole hadde flere feil og høyre andel stryk enn kandidater med få timer. Samtidig var det klare tendenser til at de eldste kandidatene og de utenlandske kandidatene hadde flere timer på kjøreskole enn andre. Og det er var også klare tendenser til at de med mange timer ved kjøreskole hadde få timer med privat øvelseskjøring.

Forklaringen på at de med mange timer ved kjøreskole i større grad stryker ved oppkjøringen er derfor høyst sannsynlig at disse trenger mange timer for å lære å kjøre bil, men at de også velger å kjøre opp før de har de nødvendige ferdighetene.

 

Hva forklarer ulikhetene?

Vi gjennomførte flere regresjonsanalyser for å finne ut om det var bestemte kjennetegn ved sensor og/eller ved kandidater som kunne forklare hvorfor forskjellene i vurderingene var såpass store.

Resultatene av disse analysene viste at det ikke hadde noen betydning om sensor kom fra en trafikkstasjon i storby eller en på landet. Vi fant imidlertid en viss tendens til forskjeller i vurderingene mellom kvinnelige og mannlige sensorer, og en viss tendens til at de mest erfarne sensorene krysset av for færre feil på vurderingsskjemaet enn de mindre erfarne sensorene. Det var imidlertid ingen signifikant tendens til at det var lettere å bestå prøven med en erfaren sensor. Det betyr antakelig at de erfarne sensorene baserer vurderingene sine mer på skjønn og mindre på avkrysninger på skjemaet enn hva de mindre erfarne gjør.

Et interessant resultat var at mannlige kandidater i større grad besto den praktiske førerprøven med mannlig sensor, og at kvinnelige kandidater i større grad besto prøven med kvinnelig sensor. Det er uvisst hva dette skyldes, men det kan tenkes at mannlige sensorer, som gjennomgående er mer erfarne, aksepterer (og premierer) en kjørestil som er mindre korrekt i forhold til regelverket og mer ”normal” enn det de kvinnelige sensorene gjør. Det kan føre til at mannlige kandidater favoriseres av mannlige sensorer og at kvinnelige kandidater favoriseres av kvinnelige sensorer.

Et annet interessant resultat var at uoverensstemmelsen mellom sensorvurderingene ser ut til å være større med utenlandske enn med norske kandidater. Hva det skyldes er uvisst, men det kan bety at det for mange sensorer er vanskeligere å tolke utenlandske kandidaters kjøreatferd.

Vi må være noe varsomme i tolkningene av hva forskjeller mellom sensorene betyr. Som nevnt var det bare 12 sensorer med i dette forsøket og derfor kan en del av tendensene vi har funnet skyldes rene tilfeldigheter. Like fullt, resultatene tyder på at reliabiliteten ved dagens førerprøve absolutt kan forbedres, og at det kan være systematiske forskjeller i hvordan sensorene vurderer førerprøven.  Statens vegvesen har derfor satt i gang et forprosjekt for å se på mulighetene av å undersøke dette i større målestokk.

DEBATTREGLER I SAMFERDSEL
Har du synspunkter på denne saken, så kom gjerne med dem her i kommentarfeltet! Det du skriver vil i de fleste sammenhenger fremstå som mer interessant og troverdig dersom du skriver under fullt navn. Hold deg til saken, vis respekt og raushet overfor andre og deres meninger. Husk at det du skriver kan bli lest av mange!

Ytringer som inneholder trusler eller annen form for sjikane, vil bli fjernet.

Vennlig hilsen
Samferdsel-redaksjonen

comments powered by Disqus

Ansvarlig redaktør:  Kommunikasjonssjef Harald Aas, E-post: ha@toi.no  |  Personvern

Designet og utviklet av CoreTrek AS