Hitta.se:s livsstilstjänst säger sig anonymisera sin information genom att expandera sökområdet så allt blir anonymiserat. Men en granskning visar att man presenterar uppgifter för så få som sju personer, det kan rent av vara så lite som två, tre eller fem personer, men det går inte att bevisa.

Om man expanderar sitt webbläsarfönster dyker även lite grafer upp, i praktiken histogram, över inkomst- och skuldfördelningen. Dessa genereras i webklientens webläsare, och hämtas via ett script. Använder man detta script manuellt får man ut exakta procentsatser enligt nedan.
Det data som Hitta.se lämnar ut. Data som kan identifiera platsen är struket.
Avgörande för uttalandet om sju personers urval är siffran 14.29 för lönegrafen. Det är 100/7. Man kunde då tänka sig att det skulle kunna vara fjorton eller tjugoen personers underlag, men övriga procentsatser är alla hela multipler av 14.29. I andra exempel har siffror t ex blivit 11.11, dvs 100/9, och enbart heltalsmultipler av 11.11. Det går också att hitta exempel där allting är 20% eller 40%, och skulle kunna vara så litet urval som fem personer
Tillhörande lönegraf.

Tittar man där man själv har lokalkännedom kan man alltså identifiera i vilket intervall någon har sin lön, då hitta.se:s snittvärden är snittet av de som har värden.

Det senare, att snittvärden är snittet av de som faktiskt har värden, där t ex de som inte har skulder utelämnas, ser man ovan på siffrorna 50 och 50 för de högsta skuldsättningsintervallen klassade som fyra miljoner och mer än fyra miljoner. Här används alltså ett annat, sannolikt mindre, urval än sju personer. Eventuellt så få som två personer. Flyttar man runt lite grann och tittar på rådatat blir detta tydligt.

På andra platser har jag hittat multipler av tre på lönesidan, t ex värdet 33.33% samt värdet 66.67%, där endast tre inkomstnivåer har funnits. Det kan där handla om ett så lågt stickprov som tre personer.

Hitta.se lämnar åtminstone på landsbygden och i randzoner mot grönområden eller hav ut identifierbart data, och sju personer (eller 2-5 personer) är ett för litet stickprov för att kunna hävda anonymitet om man har personkännedom kring platsen. Tjänsten måste göras om så man expanderar till avsevärt större stickprover, lämpligen minst 100 personer med värden.

I övrigt finns det en del artefakter i systemet. Den lägsta snittskuldsättningen på ett antal platser är 41:- SEK. Den högsta skuldsättningen på ett antal platser är 12 844 587. Det tål att funderas på hur dessa siffror uppstår. T ex är 12 844 587 nästan exakt 500000000/39 och 41 är nästan exakt 1600/39.

Om du likt jag har en för liten skärm för att Hitta.se ska visa histogrammen, så fungerar det att zooma ut hela webläsarfönstret genom CMD- i Apple OSX. Zooma ut tillräckligt så syns bägge histogrammen.

Skicka en kommentar Blogger

  1. Såg detta också, men tyckte det var tveksamt att nämna detta. Nu är det förstås offentliga uppgifter men att plotta folks privatekonomi (inkomst och lån) på en karta med tveksam anonymisering tycker jag är direkt oetiskt och snudd på kriminellt.

    Men som trenden ser ut kommer väl snart sjukhusjournalen och valsedlar också finnas sökbart på Internet... som en utländsk bekant uttryckte sig "ni är inte så bra på integritet i Sverige".

    SvaraRadera
    Svar
    1. Varför är tillgängligheten av offentliga uppgifter dålig? Hittills har bara de rika och stormedia haft råd att sammanställa all information om allas inkomst, allas skulder, allas fastighetstillgångar. Vad är fel med att alla får samma tjänst gratis? Och informationen måste ju vara offentlig av rättssäkerhetsskäl. Annars skulle ju byråkrater mygla och nolltaxera sina kompisar och den som betalar en muta, utan att någon annan kan kontrollera det. Om man ska beskatta inkomst så måste allas inkomst vara offentlig för alla. Eftersom beskattning är brutalt överfallsrån så är det föga förvånande att även andra grundläggande mänskliga rättigheter måste avskaffas på kuppen, allt för att berika de giriga härskarna (som officiellt säger att de inte längre vet vad en demokrati är för någonting).

      Radera
    2. Uppgifterna borde aldrig varit offentliga till att börja med. Två fel ger inte ett rätt som det heter.

      Det är en del av människors frihet slippa behandlas som en skock boskap.

      Radera
    3. Något riktigt uppror mot eländet att outta privatperson ned på kalsongnivå kommer det inte att bli förrän den dag landets kvinnoklinikers journaler läcker ut på något sätt och svenska feminister snart därefter inser att det finns länder i världen som inte kommer att släppa in dem genom tullen därför att de t.ex har genomgått abort...

      Radera
    4. Det står ju var en och fritt att beställa den offentliga "taxeringskalendern" över sitt område om man vill se vad grannarna tjänar, alternativt köpa tjänsten hos lämplig leverantör på nätet. Den har för övrigt varit offentligt tillgänglig sedan urminnes tider. Däremot sjukhusjournaler och valsedlar har inte varit det och kommer förmodligen aldrig att bli det heller.

      Naturligtvis borde alla offentliga uppgifter vara lättillgängliga och sökbara för alla svenskar, som kan identifiera sig som svensk på lämpligt sätt. Det är ju helt efterblivet att göra det svårt i någon slags dubbelmoraletisk hybris och sedan kalla det för offentliga uppgifter.

      Radera
    5. Här beskrivs hur en stat missbrukar uppgifter om sina slavundersåtars inkomster, Eritrea beskattar svenska socialbidrag: http://www.svd.se/opinion/brannpunkt/orimligt-ge-asyl-at-regimens-agenter_4559190.svd

      Radera
  2. Skarpögt! Det skrämmande är att samma slags uselt utbildade epa-ekonomer sitter som byråkrater på storbanker och i andra statliga myndigheter och gör samma slarvfel och ogiltiga kalkyler som underlag för mångmiljardbeslut.

    All inkomst- och skuldinformation på individuell nivå är f.ö. gratis tillgänglig för alla också från staten (Skatteverket och Kronofogden).

    SvaraRadera
  3. Va gott-nu kan man ta sin dator och åka genom grannskapet och se grannarnas ekonomiska status.
    Väntar på att betygen skall kopplas till mobilen så man kan kolla vad den man pratar med har för skolning.
    Gärna även konsumtionsupplysningar-speciellt från Systemet.
    Eller koll på resevanor, biljetter så man kan gå på visit när de inte protesterar!

    SvaraRadera
    Svar
    1. @Oppti, Kina har ett sånt system på gång läste jag nånstans.

      Radera
    2. Mmm, man skulle kunna göra en app som visar hur hög den samlade årsinkomsten är inom 100 meter eller så, och signalera om någon med miljonårsinkomst kommer i närheten. (Fast deklarationer är så klart fyllda med lögner, genom att deklarera för hög inkomst så får man kreditvärdighet som kan vara värt den extra skattekostnaden, om man inte har så hederligt uppsåt att betala tillbaka ett lån)

      Radera
  4. Om grannen har Ferrari och tennisplan på tomten så är det intressant om inkomsten anges som i snitt 50000/m när det är enda fastigheten innanför "ringen".... D v s skattesmitare eller kriminell? Intressant samkörning av register hitta håller på med!

    SvaraRadera
    Svar
    1. Man kan ha väldigt mycket lagliga intäkter som inte är inkomst. Man skulle kunna säga att det är att föredra t.o.m :)

      Radera
    2. Man kan vara pensionär, arbetslös m.m.m.m. eller kanske ha ärvt tillgångar. Hur korkad får man vara när man kallar sig för Besserwisser?

      Radera
    3. Finns väldigt många scenarion där man är rik utan att ha jättehög lön. Lön är inget bra sätt att bygga förmögenhet, så att säga.

      Radera
    4. Stefan, nej det har du rätt i och det är ett av de värre problemen i Sverige.

      Radera
    5. kgb35: Hur menar du att det är ett av våra värre problem? Även med lägre inkomstskatt så skulle lön i sig inte vara särskilt förmögenhetsbyggande jämfört med ägande av pengagenererande tillgångar. Är det ett problem?

      Radera
  5. Aha, nu vet jag varför maxbelåningen är "12 844 587".

    Enligt hitta.se utgår belåningen från _ränteavdragen_ som är gjorda i deklarationen.

    "Snittbelåning: Hur stort är det genomsnittliga lånet i området? Schablonberäknad storlek på skulden utifrån ränteavdrag. "

    Max ränteavdrag till 30% = 100 000 per person, eller normalt 200 000 per hushåll. Man får visserligen 21% skattereduktion på lån >100 000 per person men jag gissar att man inte räknat med detta i sin kalkyl för att göra det enkelt. Alltså: Belåning = [ränteavdrag] / [aktuell upplåningsränta].

    200 000 / 12 844 587 = 1,56% ränta. Det är inom rimlighetens gränser. Förmodligen schablonberäknar hitta.se utifrån någon sorts aktuell upplåningsränta.

    Exempelvis visar Skandiabanken att deras kunders genomsnittliga ränta idag är 1,54%.

    SvaraRadera
    Svar
    1. Om det är baserat på avdragen i deklarationen så borde det vara för inkomståret 2013.

      Var ränta så låg då?

      Radera
    2. Sant. Då var siffran snarare 2,5-3%.

      Det kan faktiskt vara så illa att man tar ränteavdragen inkomståret 2013 och jämför med utlåningsräntan _idag_, vilket då skulle överskatta skulderna ganska mycket.

      Det är väl dags att fråga om hur datan sammanställts.

      Radera
    3. Det betyder också att belåningen kan snedvridas väldigt mycket om uppgifterna är från 2013 och personerna har bundit sina lån på lång tid.

      Säg att man har ett lån på 1.000.000 kr.

      Om de räknar med 1,56% ränta men personen istället har kanske 3% bunden ränta.

      30.000 i ränteavdrag.

      Då antar de att du har 2.000.000 i skuld.

      Radera
    4. Privatliv och kreditkortsskulder kommer ju ge ännu större fel då räntan ofta kan vara tvåsiffrig för dessa.. 15 procent är inte ovanligt för kreditkort, vilket skulle ge ett fel på en tiopotens...

      Radera
  6. Härligt, ett perfekt verktyg för alla inbrottstjuvar som ändå härjar runt här på landet. I våra trakter verkar det vara så lite som ett eller två hushåll statistiken baseras på i de flesta fall.

    SvaraRadera
    Svar
    1. EU-migranter heter det väl?

      Radera
  7. Lönegrafen är rätt intressant och säger en del om vad det är för folk på en gata. I villaområden som relativt nyligt blivit populära. D.v.s. där priserna rusat iväg lite extra kan man se en topp ungefär vid 30k (de som bott där sedan länge) och en vid 50-60k (de som relativt nyligt flyttat dit), och på vissa gräddhyllor finns även en topp på 80k+ (t.ex. små palats med strandtomt)

    SvaraRadera
  8. När en tjänst på nätet är gratis, brukar det ju vara andvändardatan som är handelsvaran. Undrans tro vad någon ska göra med den här informationen. Loda intresset för hitta+ "lär känna dina grannar på nätet"?
    Eller vill man "demokratisera" övervakningssamhället i största allmänhet?

    SvaraRadera
  9. Nästa steg är "rätta din granne" där du kan markera uppgifter om grannen du tycker är fel.
    Du ser i Hitta+ att grannen är sjukskriven men jobbar svart osv. då kan du klicka i och skicka ändring till myndighet X.
    STASI 3.0 (första är DDR-Stasi, andra är "svenska Stasi" = Researchgruppen).

    SvaraRadera

 
Top