Scipy Stats ttest_1samp Hypothesentest zum Vergleich der bisherigen Leistung mit der StichprobePython

Python-Programme
Anonymous
 Scipy Stats ttest_1samp Hypothesentest zum Vergleich der bisherigen Leistung mit der Stichprobe

Post by Anonymous »

Mein Problem, das ich zu lösen versuche

Ich habe Leistungsdaten für 11 Monate:

Code: Select all

        Month  Branded  Non-Branded  Shopping  Grand Total
0    2/1/2015     1330          334       161         1825
1    3/1/2015     1344          293       197         1834
2    4/1/2015      899          181       190         1270
3    5/1/2015      939          208       154         1301
4    6/1/2015     1119          238       179         1536
5    7/1/2015      859          238       170         1267
6    8/1/2015      996          340       183         1519
7    9/1/2015     1138          381       172         1691
8   10/1/2015     1093          395       176         1664
9   11/1/2015     1491          426       199         2116
10  12/1/2015     1539          530       156         2225
Nehmen wir an, es ist der 1. Februar 2016 und ich frage: „Unterscheiden sich die Ergebnisse im Januar statistisch von denen der letzten 11 Monate?“

Code: Select all

       Month  Branded  Non-Branded  Shopping  Grand Total
11  1/1/2016     1064          408       106         1578
Ich bin auf einen Blog gestoßen...

Ich bin auf den Blog von iaingallagher gestoßen. Ich werde es hier reproduzieren (falls der Blog nicht mehr funktioniert).


1-Stichproben-T-Test

Der 1-Stichproben-T-Test wird verwendet, wenn wir einen Stichprobenmittelwert mit einem
Populationsmittelwert (den wir bereits kennen) vergleichen möchten. Der durchschnittliche britische Mann ist
175,3 cm groß. Bei einer Umfrage wurde die Körpergröße von 10 britischen Männern erfasst und wir möchten wissen, ob der Mittelwert der Stichprobe vom
Mittelwert der Bevölkerung abweicht.

Code: Select all

# 1-sample t-test
from scipy import stats
one_sample_data = [177.3, 182.7, 169.6, 176.3, 180.3, 179.4, 178.5, 177.2, 181.8, 176.5]

one_sample = stats.ttest_1samp(one_sample_data, 175.3)

print "The t-statistic is %.3f and the p-value is %.3f." % one_sample
Ergebnis:

Code: Select all

The t-statistic is 2.296 and the p-value is 0.047.
Abschließend zu meiner Frage...

In Iaingallaghers Beispiel kennt er den Mittelwert der Grundgesamtheit und vergleicht eine Stichprobe (

Code: Select all

one_sample_data
). In MEINEM Beispiel möchte ich sehen, ob sich der 1.1.2016 statistisch von den letzten 11 Monaten unterscheidet. In meinem Fall sind die letzten 11 Monate also ein Array (anstelle eines einzelnen Bevölkerungsmittelwerts) und meine Stichprobe ist ein Datenpunkt (anstelle eines Arrays) ... also ist es irgendwie rückwärts.

FRAGE

Wenn ich mich auf die Daten der Spalte „Einkaufen“ konzentriert hätte:

Will scipy.stats.ttest_1samp

Code: Select all

([161,197,190,154,179,170,183,172,176,199,156], 106)
erzeugt ein gültiges Ergebnis, obwohl meine Stichprobe (erste Parameter) eine Liste früherer Ergebnisse ist und ich sie mit einem Popmean vergleiche, der nicht der Populationsmittelwert, sondern eine Stichprobe ist.

Wenn dies nicht die richtige Statistikfunktion ist, gibt es eine Empfehlung, was für diese Hypothesentestsituation zu verwenden ist?

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post