Hilfe beim Beweis für die Unverzerrtheit der Stichprobenvarianz

  • Hallo, ich brauch mal eure Hilfe. Ich versuche zu beweisen, dass der Schätzer für die Stichprobenvarianz unverzerrt ist. Das sollte eigentlich nicht so schwer sein, der Ansatz ist in den Folien bei 25.2. Ich komm aber nicht mit den Eigenschaften des Erwartungswertes klar. Bitte korrigiert folgende zeilen:


    E( (1/n-1) * sum((Xi-Xn)²,i,1,n) = (1/n-1) * sum( E(Xi-Xn)² ,i,1,n)


    soweit so klar, linearität -> man kann den erwartungswert der summe durch die summe der erwartungswerte ersetzen


    = (1/n-1) * sum( E(Xi² - 2*Xi*Xn + Xn²) ,i,1,n) = (1/n-1) * sum( E(Xi²) - E(2*Xi*Xn) + E(Xn²) ,i,1,n)


    Hier bin ich mir nicht sicher; darf man jetzt Xn durch EXi ersetzen? Wenn ja und wenn EXn=Xn:


    = (1/n-1) * sum( E(Xi²) - 2*(EXi)² + E((EXi)²) ,i,1,n) = (1/n-1) * sum( E(Xi²) - (EXi)² ,i,1,n) = (1/n-1) * sum( Var(Xi) ,i,1,n)


    Und jetzt hab ich keine Ahnung mehr, was zu tun ist...

  • Hi!


    Ich steige da auch nicht wirklich durch. Ich denke auch, dass man Xn durch EXi ersetzt. Weil das ist ja gerade ein Schätzer dafür. Ich komme auch zum selben Ergebnis wie du. Die Summe der Varianzen kann man ja dann glaube ich noch so anschreiben sum(var(Xi)) = n*var(X)


    Aber warum man dann durch n-1 dividiert und nicht durch n verstehe ich nicht ganz.

  • X[t]n[/t] darfst du nicht so einfach durch EX[t]i[/t] ersetzen, es ist einfach nicht dasselbe. EX[t]n[/t] wäre dasselbe wie EX[t]i[/t], das haben wir hier aber nicht.


    Wie man hier weiterverfahren könnte, wäre, X[t]n[/t] durch 1/n sumX[t]i[/t] zu ersetzen, im mittleren Term bekommt man dann eine Doppelsumme sum[t]i[/t]sum[t]j[/t]X[t]i[/t]X[t]j[/t], die man aufspalten kann in sum[t]i[/t]sum[t]j!=i[/t]X[t]i[/t]X[t]j[/t] + sum[t]i[/t](X[t]i[/t])[h]2[/h], wobei ersteres sich wegen der Unabhängigkeit der einzelnen X[t]i[/t] und X[t]j[/t] vereinfachen lässt und zweiteres sich irgendwie mit den anderen sum[t]i[/t](X[t]i[/t]) zusammenfassen/wegkürzen lassen sollte. Ist aber etwas mühsam - ich wollte das grad schnell vorrechnen, hab mich aber verrechnet und jetzt keine Zeit mehr, den Fehler zu suchen... :shinner:


    Eine andere Möglichkeit, das durchzurechnen, wird auf der englischen Wikipedia schön ausführlich gezeigt.

  • X[t]n[/t] darfst du nicht so einfach durch EX[t]i[/t] ersetzen, es ist einfach nicht dasselbe. EX[t]n[/t] wäre dasselbe wie EX[t]i[/t], das haben wir hier aber nicht.


    Warum sollte man das nicht dürfen? X[t]n[/t] ist doch der Erwartungswert der X[t]i[/t], also EX[t]i[/t], oder nicht?


    Ich versteh bei dem PDF einfach nicht, wie aus der summe auf n * (n-1) / n * VarX kommt.. Und das aus der Wikipedia auf unsere Formel umzumünzen schaff ich auch nicht. Vielleicht steh ich ja auch grad gehörig auf der Leitung :/

  • Warum sollte man das nicht dürfen? X[t]n[/t] ist doch der Erwartungswert der X[t]i[/t], also EX[t]i[/t], oder nicht?


    Das kann man wie gesagt deswegen nicht, weil es völlig verschiedene Dinge sind. X[t]n[/t] ist nicht der Erwartungswert, sondern nur ein Schätzer für den Erwartungswert und damit ultimativ nichts anderes als eine Linearkombination der Stichprobenwerte, also auch eine stochastische Größe. Hier ein paar Hinweise, die helfen können, diesen Unterschied besser zu verstehen.


    - Während wie gesagt X[t]n[/t] eine stochastische Größe ist, ist EX[t]i[/t] eine feste, nicht zufällige Zahl (abhängig von der Verteilung von X, aber unabhängig von den konkreten Werten der X[t]i[/t]) - eine Zahl und eine stochastische Größe verhalten sich beim Versuch, sie zu vergleichen, wie ein Apfel und eine Birne.


    - wenn du zwei Stichproben aus derselben Grundgesamtheit ziehst, bekommst du zwei verschiedene Stichprobenmittel (X[t]n[/t]), die Erwartungswerte (EX[t]i[/t]) aller Stichprobenelemente beider Stichproben sind aber dieselben.


    - Man kann bei stetigen Verteilungen sogar zeigen, dass die Wahrscheinlichkeit, dass EX[t]i[/t] = X[t]n[/t] ist, Null ist: bei stetigen unabhängig verteilten X[t]i[/t] ist auch X[t]n[/t] stetig verteilt, die Punktwahrscheinlichkeiten jedes einzelnen Punktes sind damit alle Null - das gilt auch für den Wert EX[t]i[/t]. Wenn du X[t]n[/t]also durch EX[t]i[/t] ersetzt, ist das mit Wahrscheinlichkeit 1 falsch.



    Vielleicht hilft die Beleuchtung der Fragestellung in diesem Licht, zu sehen, warum eine solche Ersetzung falsch wäre.


    Zitat

    Ich versteh bei dem PDF einfach nicht, wie aus der summe auf n * (n-1) / n * VarX kommt.. Und das aus der Wikipedia auf unsere Formel umzumünzen schaff ich auch nicht. Vielleicht steh ich ja auch grad gehörig auf der Leitung :/

    Meinst du das oben von Synite verlinkte pdf, folie 9? der Sprung in der letzten Zeile von der Summe zu dem Var(X) ist nur das Einsetzen des Zwischenergebnisses vom Punkt "Aus den bisherigen Überlegungen folgt". Der Sprung dort, von E((E(X) − X[t]n[/t] )[h]2[/h]) auf V(X[t]n[/t]) ergibt sich aus der Erwartungstreue des Stichprobenmittels als Schätzer für den Erwartungswert, also E(X[t]n[/t]) = E(X).
    E((E(X) − X[t]n[/t] )[h]2[/h]) = E((E(X[t]n[/t]) − X[t]n[/t] )[h]2[/h]) = V(X[t]n[/t])


    Ferner wird in den Folien verwendet, dass V(X[t]n[/t]) = 1/n V(X), (was sie aber leider nirgends explizit erwähnen (*) ) sowie, dass V(X[t]i[/t] = V(X) für alle i woraus sich dann der letzte Schritt dieser Zwischenrechnung ergibt.


    (*) aus diesem Grund find ich die Rechnung, wie sie dort vorgeführt wird, auch etwas unschön, aber solange ich meine oben vorgeschlagene Rechnung nicht sauber aufgeschrieben hab, reiß ich lieber das Maul nicht zu weit auf ; )