Schätzung der pdf

  • Ich habe eine Frage zur Schätzung der probability density function.
    Aus den Folien wird mir nicht ganz klar, wie man genau auf die Länge Vx und dann auf 1/Vx kommt. Wie soll man die Einheiten verstehen, sind das Zentimeter, oder Millimeter? oder ist das irrelevant?
    Ich werd aus dem Skriptum nicht ganz schlau...
    Könnte da jemand Licht ins Dunkel bringen!? Danke schon mal!

  • Soweit ich das verstehe, macht man das prinzipiell für alle möglichen x-Werte. Angenommen wir haben Samples an x=1, x=2, x=4 und x=9 und wollen die pdf beispielsweise an der Stelle x=3 bestimmen.
    Man fängt dann an von x=3 ausgehend die Region V gleichmäßig in beide Richtungen zu erweitern. Ist die Region beispielsweise um +/- 1 Einheit erweitert, so umfasst sie die Samples x=2 und x=4. Wollen wir nun eine Schätzung mit k=3 machen, so müssen wir die Region auf +/- 2 Einheiten erweitern, erst dann liegen 3 Samples (nämlich x=1, x=2 und x=4) in der Region. Die Region ist dann also 3+/-2, sprich sie geht von 1 bis 5 und die Breite ist daher 4. Die Höhe ergibt sich dann zu 1/4 = 0.25 (laut Duda "Pattern Classification" müsste man korrekterweise k/n * 1/V rechnen, dies entspricht aber "nur" einer Skalierung - vermutlich wegen der Fläche unter pdf = 1 Forderung - wäre hier also 0.1875).
    So stell ich mir das vor, es scheint auch so halbwegs mit der Grafik im Skriptum übereinzustimmen. Die Einheiten sind einfach die Einheiten der x-Achse (also nicht wirklich mm oder cm, sondern die auf der x-Achse aufgetragenen Werte/Einheiten). Klingt das halbwegs sinnvoll?

    p?: o. unqualifizierter sklave

  • Ich habe dazu in den POs folgende Angabe gefunden (Bild-Links) - Wenn ich versuche die nach der Anleitung von oben (#4) zu machen kommt aber etwas anderes raus (rechts). Kann wer bestätigen was davon richtig ist? Bzw. Weiß wer wie man in den POs auf den k/n Wert von 30 kommt? Die gesamt-Wahrscheinlichkeit unterhalb der Kurve darf nicht 1 übersteigen - wenn dann y Skala bis 5.5 geht würde bei einem Integral aber mehr als 1 rauskommen, oder?
    frage-pdf-po.jpg

    ... So I open my door to my enemies
    And I ask could we wipe the slate clean
    But they tell me to please go fuck myself
    You know you just can't win ...

    Edited once, last by SuperStar ().

  • n ist ja bei dir 8 und nicht 5. Der Wert 30 klingt nicht plausibel, den Wert würde man nur erreichen wenn das k größer als die Anzahl der verfügbaren Werte ist.

  • Hi, ja den Fehler mit 5 habe ich schon mitbekommen, der ist irgendwie in der Verwirrung entstanden... und ja 8 ist mMn. auch richtig :)
    Den wert "30" verstehe ich auch nicht. Danke für die Bestätigung :)


    es freut mich auch zu sehen, dass in diesem Geisterforum doch noch weitere Leidensgenossen vorhanden sind... danke

    ... So I open my door to my enemies
    And I ask could we wipe the slate clean
    But they tell me to please go fuck myself
    You know you just can't win ...

  • Ja hab nur noch net so bald slernen begonnen wie du anscheinend ;-)


    Zu deiner Frage ob der y Wert größer als 1 werden kann: Ja kann, aber nur kurz. Also wenn man z.B: im Intervall 0.5 bis 0.6 einen y-Wert von 5.5 hat is das ja beim Integral kleiner als 1. Also noch in Ordnung. (siehe folie 44 in III)

    Edited once, last by davian ().

  • Kannst du das Beispiel erklären?


    k => müssen wir nehmen zwecks der matrikelnummer also entweder 2 oder 3
    n => anzahl der "vorgegebenen Samples"


    1/Vx => ? Vx ist ja nur die Länge der Linie am Punkt, aber wieso kommt dann einmal 1/6, 1/4 usw vor? Versteh das nciht


    Zu deiner Frage: man nimmt (k/n) * 1/Vx => somit ist es genauer

    "Jeder hat das Recht auf Meinungsfreiheit und freie Meinungsäußerung; dieses Recht schließt die Freiheit ein, Meinungen ungehindert anzuhängen sowie über Medien jeder Art und ohne Rücksicht auf Grenzen Informationen und Gedankengut zu suchen, zu empfangen und zu verbreiten."


  • 1/Vx => ? Vx ist ja nur die Länge der Linie am Punkt, aber wieso kommt dann einmal 1/6, 1/4 usw vor? Versteh das nciht


    Die Länge der Linie am Punkt ist ja bei den Punkten jeweils unterschiedlich.
    Bei P(0) muss man auf der x-Achse 3 Positionen nach rechts gehen um das k von 2 zu erfüllen, nachdem man genauso auch nach links geht hat man ein Vx von 6.
    Beim P(1) muss man nur jeweils 2 Schritte nach rechts und links machen -> Vx=4
    ...

  • Quote

    Bei P(0) muss man auf der x-Achse 3 Positionen nach rechts gehen um das k von 2 zu erfüllen, nachdem man genauso auch nach links geht hat man ein Vx von 6.
    Beim P(1) muss man nur jeweils 2 Schritte nach rechts und links machen -> Vx=4


    Wie meinst das? sorry steh wahrscheinlich auf der leitung

    "Jeder hat das Recht auf Meinungsfreiheit und freie Meinungsäußerung; dieses Recht schließt die Freiheit ein, Meinungen ungehindert anzuhängen sowie über Medien jeder Art und ohne Rücksicht auf Grenzen Informationen und Gedankengut zu suchen, zu empfangen und zu verbreiten."

  • Vx ist die Länge des Intervalles das bei einer x-Koordinate benötigt wird um k Punkte zu finden. (hmm sicher ned verständlicher....)


    Man beginnt bei einer x-Koordinate (z.B. x=1) und prüft dort in einem Intervall (erst x-1 bis x+1), wenn dort bereits k Punkte liegen ist man fertig und hat somit ein Vx von der Intervall-Länge 2.
    Wenn nicht muss das Intervall wachsen bis k Punkte darin liegen.
    Im Beispiel ist das bei x=1 mit dem Intervall x-2 bis x+2 der Fall -> von -1 bis 3, die Länge des Intervalls ist 4 und das ist somit auch Vx.



    So hab ich das ganze zumindest verstanden... ich hoff es ist kein Blödsinn...

  • d.h wenn ich bei x= 2 bin (also in dem Intervall) x-1 bis x+1 => weil dort ja bereits k punkte liegen ?


    wenn ich jetzt x = 0 hab warum muss ich aber dann 3 gehen? weil der 2 punkt nach 2 erst liegt ?

    "Jeder hat das Recht auf Meinungsfreiheit und freie Meinungsäußerung; dieses Recht schließt die Freiheit ein, Meinungen ungehindert anzuhängen sowie über Medien jeder Art und ohne Rücksicht auf Grenzen Informationen und Gedankengut zu suchen, zu empfangen und zu verbreiten."

  • k/n * 1/Vx steht anscheinend im Buch von Duda.
    1/Vx steht in den Folien.


    => Es ist sicher beides richtig, bzw lässt sich bei einer Prüfungseinsicht sicher argumentieren. Kann mir nicht vorstellen, dass es an dem scheitern wird.