Aukaefni

Aukefni: Hvað skuldar Procar?

Í grein minni í kjarnanum í dag fjallaði ég um Procar. Öllu heldur gerði ég þar tilraun til þess að magnfæra þann skaða sem kaupendur Procar bílanna urðu fyrir. Það er augljóslega ekki auðvelt verk og krefst bæði mikillar vinnu og nokkuð flókinnar aðferðarfræði. Í þessum pistli langar mig að deila með ykkur aðferðarfræðinni á bak við greinina og öðrum áhugaverðum punktum sem komu upp við greininguna.

Aðferðarfræðin

Aðferðin sem ég notaðist við er listuð hér að neðan:

  • Ég safnaði öllum gögnum um fólksbíla af heimasíðunni bilasolur.is. Þar fékk ég:
    • Verð- og aldursupplýsingar, aldur, eldsneyti og skiptingu fyrir um það bil 7 þúsund bíla sem voru á sölu þann daginn.
    • Þessi gögn sögðu mér þó lítið ein og sér þar sem mikill munur er á bílunum á sölu (í gögnunum má finna bíla frá 61 framleiðenda tæplega 2000 módel. Einnig er þar bæði að finna Porsche  911 Turbo Techart á rúmar 16 miljónir sem og Daewoo Lanos á 99 þúsund kall).
    • aukaefni - All cars price and km.png
      Meira er ekki alltaf betra: til þess að finna samband verðs og km þurfti ég að finna sambærilegri bíla og taka einkenni bílanna inn í reikninginn.

       

    • Því ákvað ég taka þau bílamódel sem birtust oftar en 50 sinnum í gögnunum. Sem gaf mér rúmlega þúsund bíla.
    • Því næst fjarlægði ég óæskileg gögn, reglurnar voru einfaldar og eftirfarandi:
      • bílar sem keyrðir voru meira en 200 þúsund km voru fjarlægðir (hefur svo sem engin áhrif á greininguna, en er hreinna).
      • bílar sem voru keyrðir minna en 10 þúsund km (þetta var gert til þess að losna við nýja og mjög nýlega bíla sem þjást af „nýjum bíl keyrt út af bílastæði bílasölunnar og hann hrinur í verði syndróm“)
      • bílar sem kosta minna en 100 þúsund og meira en 3 miljónir, og
      • bílar sem eru 15 ára eða eldri.
    • Þetta skildi mig eftir með eftirfarandi bíla:
    • Aukaefni bilar i sampli
      Bílana þekkjum við öll

       

    • Eftir þetta lýta gögnin, ekki alveg, en þokkalega normal út (sérstaklega þegar þau eru logguð):
    • Distribution of km price and loggs - 4 charts in one.png
      Engin gögn eru fullkomin, en þessi eru ágæt.

       

    • Því næst skellti ég í létta OLS (ég gerði þetta bæði loggað og óloggað):
Aukaefni jafna
Jafna góða (reyndar vantar subscript fyrir módel)

Niðurstöður

Fyrst ætla ég að deila með ykkur því sem kom út úr aðhvarfsgreiningunni:

regression 1 logged.PNG
Athugið, Ford Focus er omitted, því miðast önnur módel við hann.

Í raun er það eina sem við högum áhuga á í töflunni að ofan talan sem fylgir „ln_km“: -23.35. En hún segir okkur það að ef km fjöldi tvöfaldast, þá lækkar verðið á bílnum um 23.35%. Að öllu öðru óbreyttu.

Einnig ætla ég að deila með ykkur absalút útgáfunni, sem er mun áhugaverðari vegna þess að hún segir okkur meira um verð bíla á bílasölum (ekki verið að rugla með logga, sem eru til tómra túlkunarvandræða):

regression 1 abs.PNG
Athugið, Ford Focus er omitted, því miðast önnur módel við hann.

Taflan sýnir öll þau jaðaráhrif sem skipta máli, þegar kemur að þessum bílum. Fyrir áhugsama, sem vilja sjá hvernig verðum annara tegund ber saman við Ford Focus, skil ég eftir töflu sem hægt er að nota til að sjá hvað tölurnar 2 til 14 standa fyrir:

models by group.PNG
Áhugasamir geta parað þessi gögn við það sem er að ofan og fundið út hvers virði bílinn þeirra er.

Til viðbótar reiknaði ég líka þessi áhrif á hvert og eitt módel og með jöfnu að vopni. Niðurstöðurnar voru voða svipaðar. Samband verðs og km fyrir bílana í töflunni að ofan deili ég með ykkur hér að neðan.

Price and km correlation - by model.png
Öll módelin eiga það sameiginlegt að notkun ræður ríkjum þegar það kemur að verði

Ég ætla að kalla þetta gott í bili. Endilega verið í sambandi, skiljið eftir skilaboð eða hóið í mig á Twitter ef þið hafið áhuga að ræða þessa greiningu mína frekar.

 

0 comments on “Aukefni: Hvað skuldar Procar?

Skildu eftir svar

%d bloggers like this: