isosta tietokannasta valitaan tilat jotka poikkeavat vähiten keskimääräisetä ja näistä valituista kootaan lopullinen aineisto.
Eli miten isosta tietokannasta? Lukuja peliin, kiitos. Montako tilaa?
sanottiin vain että tilastollisesti riittävä. Ja vaikka määrä olisi minulle kerrottu niin tuskinpa aseteeltanne sitä hyväksyisitte. Voin vain kehoittaa teidän korkeuttanne ottamaan yhteyttä ko. tutkimuslaitokseen ja julkituoda epäilyksenne sekä parannusehdotuksenne heidän menetelmiinsä.
Katsos näitä lukuja tuossa alla. Alimpana on kaikki tilat. Mutta noista taulukoista näkyy että lypsykarjan kohdalla on "Tiloja edustettuna" 12.100. Mielestäni se noin suurinpiirtein vastaa tämänhetkisten lypsykarjatilojen määrää. Hiukan ihmetyttää tuo että "Kaikki" on vain 40.800 koska jollakin tavalla luokiteltuja maatiloja on kai sentään vielä enemmän vaikka tilamäärä kovasti laskenut onkin. Mutta etusivulla ilmoittavat että mukana on noin 930 tilaa ja tuossa "kaikki" kohdassa "kirjanpitotiloja" 930 < n < 940. Eli tuota nuo taulukon luvut tarkoittanevat. Tilamäärä tuotantosuunnittain ja sitten tietonsa lähettäneiden tilojen lukumäärä. Tuosta kun katsotaan niin lypsykarjatiloja 12.100 ja "kirjanpitotiloja" 360 < n < 370 koska tilamäärä on noin tuon 12.100 että kirjanpitotiloja lypsykarjapuolella on noin 365? Voinemme olla tästä yhtä mieltä?
No, sikapuoli. "Tiloja edustettuna" on 560 joka sitten mitä ilmeisimmin on sikatilojen lukumäärä tällä hetkellä. On kyllä tippunut kovasti parissakymmenessä vuodessa. Mutta sitten tuo "kirjanpitotiloja" on tuossa sikapuolella 20 < n < 30. Eli aineistonsa lähettäneitä tiloja on siis noin 25? Ilmeisesti voinemme tästäkin olla yhtä mieltä jos nuo taloustohtorin sivut yhtään on loogisesti toimivia. Eikös, ollaanko yhtä mieltä? Mutta mitä tuo tarkoittaa käytännössä? Katso alinta taulukkoa jossa on sikatilat kaikilla alueilla 2007. Niin siitä huomataan kullakin tukialueella on noin 10 tilaa. Siitäkin voinemme olla yhtä mieltä? Mutta että kun tukialueita verrataan niin kummaltakin tukialueelta vertailussa mukana on noin 10 tilaa. Eikös, olemme tästäkin varmaan yhtä mieltä?
Mutta nyt sitten se kysymys josta emme ehkä olekaan yhtä mieltä. Jos sinulle on sanottu että aineisto on tilastollisesti riittävä niin se on varmasti totta, tilastotieteilijät varmasti osaavat työnsä. Mutta tuosta pikaisesti että 25 tilaa ja 560 tilaa niin se on alle 5% tiloista kuitenkin. Minun mielestäni ei voida kovin "laajasta aineistosta" puhua kuten itse esille tuot mutta minä olenkin aikanaan laskenut tilastoja kymmeniintuhansiin havaintoihin perustuen, siinä tämä 25 tilaa jää aika pieneksi. Tilastollinen virhemarginaalikin suuntaan tai toiseen voi olla jo jonkunlainen? Mitäs "raati" eli muut keskustelijat mahtavat olla mieltä? Satunnaiset 25 tilaa jotka ovat ne tilat jotka sattuvat olemaan ja joista lasketaan keskiarvo vai vakioidut tilat joilla sitten verrataan?
____Tuloslaskelma_____ ___2007___
Lypsykarja
Tiloja edustettuna 12 100
Kirjanpitotiloja 360<n<370
____Tuloslaskelma_____ ___2007___
Sikatalous
Tiloja edustettuna 560
Kirjanpitotiloja 20<n<30
____Tuloslaskelma_____ ___2007___
Viljanviljely
Tiloja edustettuna 12 000
Kirjanpitotiloja 140<n<150
____Tuloslaskelma_____ ___2007___
Sekamuotoinen tuotanto Muu kotieläintalous Sikatalous
Muu nautakarja
Lypsykarja
Puutarhatuotanto
Muu kasvinviljely
Viljanviljely
Keskiarvo
Tiloja edustettuna 4 310 820 560 2 330 12 100 2 450 6 230 12 000 40 800
Kirjanpitotiloja 110<n<120 15<n<20 20<n<30 60<n<70 360<n<370 70<n<80 110<n<120 140<n<150 930<n<940
____Tuloslaskelma_____ ___2007___
Sikatalous
C2-alue C1-alue B-alue Keskiarvo
Tiloja edustettuna 140 220 190 560
Kirjanpitotiloja 7<n<14 7<n<14 7<n<14 20<n<30