>

Matheaufgabe (Wahrscheinlichkeitsrechnung)

#
FredSchaub schrieb:
ist das Chemie oder Mathe?  




Zu meiner Zeit endeten solche Aufgaben mit der Frage: "Welche Schuhgröße hat der Busfahrer?"...
#
Riedadler schrieb:
Okay, nächste Runde!

Vorausgesetztes Wissen: Welch's t-Test (Alternative für Student t-Test, falls Varianzen unbekannt)

- Zwei Chemiker experimentieren mit zwei verschiedenen Sorten Wachs herum: 12 Stück Wachs von Sorte A und 8 Stück Wachs von Sorte B.
- Sie vergleichen den durchschnittlichen Schmelzpunkt der beiden Sorten miteinander.
- Sie benutzen Welch's t-Test, um die Nullhypothese zu testen, dass es keinen Unterschied zwischen den durchschnittlichen Schmelzpunkten der beiden Wachssorten gibt.
- Die Temperatur wurde in Fahrenheit gemessen, und Chemiker 1 führt den Test dementsprechend durch.
- Chemiker 2 dagegen konvertiert jeden Schmelzpunkt zunächst von Fahrenheit in Celsius (Fahrenheit minus 32, dann mal 5/9)

-> Ist es wahr oder falsch, dass beide Chemiker die gleiche Signifikanzwahrscheinlichkeit (also p-Wert) herausbekommen? Warum?

Bin gespannt...





Sowas ist ja immer eklig wegen den vielen Teststatistiken, die es da je nach Problem immer gibt...

Ich wusste jetzt auch nicht mehr, was Welsh's t-Verteilung ist, nehme jetzt aber einfach mal diese Wiki-Definition:
http://en.wikipedia.org/wiki/Welch%27s_t_test

Die Teststatistik ist


und dann wohl t-verteilt mit

Freiheitsgraden.
Damit entscheidet man dann nach einem bestimmten Kriterium, ob man die Hypothese annimmt oder verwirft.

Soweit, so gut. Meiner Meinung nach ist das für die Aufgabe aber alles gar nicht wichtig , sondern nur die Frage, ob sich die Prüfstatistik t ändert, wenn man alle Werte von Fahrenheit in Celsius ändert. Bleibt die Prüfgröße t dabei gleich, dann wird man natürlich auch in beiden Fällen die gleiche Signifikanzwahrscheinlichkeit erhalten.

Wenn man die Mittelwerte X_i von Fahreheit in Celsius umrechnet passiert einfach Folgendes:

X_i[Celsius]=5/9*(X_i[Fahrenheit]-32)

und für den Zähler in t insgesamt:

X_1[Celsius]-X_2[Celsius]=5/9*(X_1[Fahrenheit]-X_2[Fahrenheit]).

Berechnet man damit die Varianz s_i^2 in Celsius, erhält man (einfach durch Verwenden der Umrechenregel für Fahrenheit und Celsius in den Messwerten und Mittelwerten)

s_i^2[Celsius]=(5/9)^2*s_i[Fahrenheit],

womit sich für den Nenner von t ergibt:
sqrt[s_1^2[Celsius]/N_1+s_2^2[Celsius]/N_1]=5/9*sqrt[s_1^2[Fahrenheit]/N_1+s_2^2[Fahrenheit]/N_1]

Sowohl der Nenner als auch der Zähler ändern sich also lediglich um einen Faktor 5/9, der sich gerade wieder wegkürzt. t bleibt also gleich, egal ob man die Werte in Celsius oder Fahrenheit angibt. Somit erhält man auch in beiden Fällen die gleiche Signifikanzwahrscheinlichkeit. Es wäre ja auch unsinnig, wenn die Entscheidung von der Wahl der Einheiten abhängen würde.
#
Feigling schrieb:
Riedadler schrieb:
Okay, nächste Runde!

Vorausgesetztes Wissen: Welch's t-Test (Alternative für Student t-Test, falls Varianzen unbekannt)

- Zwei Chemiker experimentieren mit zwei verschiedenen Sorten Wachs herum: 12 Stück Wachs von Sorte A und 8 Stück Wachs von Sorte B.
- Sie vergleichen den durchschnittlichen Schmelzpunkt der beiden Sorten miteinander.
- Sie benutzen Welch's t-Test, um die Nullhypothese zu testen, dass es keinen Unterschied zwischen den durchschnittlichen Schmelzpunkten der beiden Wachssorten gibt.
- Die Temperatur wurde in Fahrenheit gemessen, und Chemiker 1 führt den Test dementsprechend durch.
- Chemiker 2 dagegen konvertiert jeden Schmelzpunkt zunächst von Fahrenheit in Celsius (Fahrenheit minus 32, dann mal 5/9)

-> Ist es wahr oder falsch, dass beide Chemiker die gleiche Signifikanzwahrscheinlichkeit (also p-Wert) herausbekommen? Warum?

Bin gespannt...





Sowas ist ja immer eklig wegen den vielen Teststatistiken, die es da je nach Problem immer gibt...

Ich wusste jetzt auch nicht mehr, was Welsh's t-Verteilung ist, nehme jetzt aber einfach mal diese Wiki-Definition:
http://en.wikipedia.org/wiki/Welch%27s_t_test

Die Teststatistik ist


und dann wohl t-verteilt mit

Freiheitsgraden.
Damit entscheidet man dann nach einem bestimmten Kriterium, ob man die Hypothese annimmt oder verwirft.

Soweit, so gut. Meiner Meinung nach ist das für die Aufgabe aber alles gar nicht wichtig , sondern nur die Frage, ob sich die Prüfstatistik t ändert, wenn man alle Werte von Fahrenheit in Celsius ändert. Bleibt die Prüfgröße t dabei gleich, dann wird man natürlich auch in beiden Fällen die gleiche Signifikanzwahrscheinlichkeit erhalten.

Wenn man die Mittelwerte X_i von Fahreheit in Celsius umrechnet passiert einfach Folgendes:

X_i[Celsius]=5/9*(X_i[Fahrenheit]-32)

und für den Zähler in t insgesamt:

X_1[Celsius]-X_2[Celsius]=5/9*(X_1[Fahrenheit]-X_2[Fahrenheit]).

Berechnet man damit die Varianz s_i^2 in Celsius, erhält man (einfach durch Verwenden der Umrechenregel für Fahrenheit und Celsius in den Messwerten und Mittelwerten)

s_i^2[Celsius]=(5/9)^2*s_i[Fahrenheit],

womit sich für den Nenner von t ergibt:
sqrt[s_1^2[Celsius]/N_1+s_2^2[Celsius]/N_1]=5/9*sqrt[s_1^2[Fahrenheit]/N_1+s_2^2[Fahrenheit]/N_1]

Sowohl der Nenner als auch der Zähler ändern sich also lediglich um einen Faktor 5/9, der sich gerade wieder wegkürzt. t bleibt also gleich, egal ob man die Werte in Celsius oder Fahrenheit angibt. Somit erhält man auch in beiden Fällen die gleiche Signifikanzwahrscheinlichkeit. Es wäre ja auch unsinnig, wenn die Entscheidung von der Wahl der Einheiten abhängen würde.



Und welche Schuhgröße hat jetzt der Busfahrer?
#
@ Feigling: Fantastisch  
#
Was mir noch eingefallen ist:

Man muss natuerlich auch zeigen, dass die Zahl der Freiheitsgrade nue gleich bleibt, sonst haette man ja plotzlich eine andere t-Verteilung. Das geht aber genau gleich, da gibts im Zaehler und Nenner den Fakteor (5/9)^2 von den Varianzen und das hebt sich wieder weg.
#
42
#
Okay, vorerst letzte Frage:

die alten Griechen haben bei ihren Bauten gerne Rechtecke mit der "golden ratio" 1: (1+wurzel5) / 2 = 0,618034 verwendet.
Ich habe jetzt eine Stichprobe von Werten (n=20), die alle so um den Wert herum schwanken:
[1] 0,693 0,662 0,690 0,606 0,570 0,749 0,672 0,628 0,609 0,844 0,654 0,615
[13] 0,668 0,601 0,576 0,670 0,606 0,611 0,553 0,933

Ich soll jetzt berechnen, ob die Werte in signifikanter Weise besagter golden ratio entsprechen, was eigentlich kein großes problem wäre.
Jetzt wird aber zusätzlich noch gesagt, dass man hierzu entweder obige ratios direkt oder deren natürlichen logarithmus verwenden kann, und die Frage ist, bei welcher dieser beiden Möglichkeiten man eher von einer Normalverteilung ausgehen kann. Ich also den log von obigen ratios genommen und bei beiden Gruppen dann geguckt, was eher an einer Normalverteilung dran ist, nimmt sich aber meiner Meinung nach nicht viel.
Hat also jemand eine plausible Antwort auf die Frage, für welche der beiden Möglichkeiten die Annahme einer Normalverteilung sinnvoller ist?
#
Ich glaub es hat was damit zu tun dass es sich bei den Werten um ratios handelt (Höhe zu Weite eines Rechtecks).
#
Ich würde es mit einem Chi-Quadrat-Test probieren.

Das Testen auf eine Normalverteilung ist hier ganz gut beschrieben:
http://de.wikipedia.org/wiki/Chi-Quadrat-Test#Beispiel_zu_Anpassungstest
#
Ja ich hab einige Tests gemacht, beide Verteilungen sind in etwa gleich weit von einer NV entfernt. Ich frage mich nur, ob es eine Antwort auf die Frage gibt, die man auch ohne Rechnen erhält, also ob z.B. durch Logarithmieren der Ratios eine Annäherung an eine NV erfolgen sollte oder nicht.
#
Ohne dass das jetzt ausgereift ist:

Das Verhältnis ist ja irgendwie x/y mit den beiden Seiten x und y.

Wenn man jetzt den log(x/y) bildet, dann ist das nach den Logarithmengesetzen

log(x/y)=logx-logy

Wenn man (aus welchen Gründen auch immer) annimmt, dass logx und logy unabhängig voneinander und normalverteilt sind, dann ist auch log(x/y) normalverteilt, denn die Summe zweier normalverteilter Zufallsvariablen ist auch normalverteilt.

Dahingegen ist x/y nicht normalverteilt, selbst wenn x und y unabhängig normalverteilt wären.

Wenn man also davon ausgeht, dass x und y (und auch logx und logy) unabhängig voneinander und normalverteilt sind, dann würde man die Normalverteilung bei den logarithmierten Daten erwarten und nicht bei den unlogarithmierten.
#
Der Hintergedanke wäre dabei, dass die Abweichungen an den Seitenlängen der Rechtecke unabhängig voneinander passieren, was ja nicht ganz unsinnig erscheint. Das Seitenverhältnis, das man dann letztlich betrachtet, ist ja dann eine Funktion dieser beiden Zufallsvariablen. Ob beim Logarithmus der Seitenlängen bei n=20 schon der zentrale Grenzwertsatz greift, ist so eine Frage, aber falls ja, kann man damit eine Normalverteilung der Seitenverhältnisse vorhersagen.

Wenn Du nur auf die Daten vertrauen möchtest, ist das kleinere chi^2 eben Dein Kriterium.
#
Wie immer sehr hilfreich, tausend Dank hierfür. Hab evtl Ende April/Anfang Mai letztmals was schönes parat
#
Feigling schrieb:
Was mir noch eingefallen ist:

Man muss natuerlich auch zeigen, dass die Zahl der Freiheitsgrade nue gleich bleibt, sonst haette man ja plotzlich eine andere t-Verteilung. Das geht aber genau gleich, da gibts im Zaehler und Nenner den Fakteor (5/9)^2 von den Varianzen und das hebt sich wieder weg.


(5/9)^4 kam bei mir raus, aber egal, kürzt sich ja wech
#
Riedadler schrieb:


(5/9)^4 kam bei mir raus


Oder so...
#
Okay, letzte Runde...

Angenommen, es werden 100 Stichproben von einer Normalverteilung gezogen und mit jeder Stichprobe wird der Student-t-Test durchgeführt, um eine Nullhypothese (Mü = 0) zu testen. Mü ist tatsächlich 0, das weiss aber keiner von denen die die Stichproben ziehen, und das Signifikanzlevel alpha ist 0,05.
Wie hoch ist nun die Wahrscheinlichkeit, dass mindestens zwei Stichproben zum Type I error (verwerfen der Nullhypothese obwohl sie wahr ist) führen?

Sind alle Experten mit 99,38% einverstanden? Ziemlich hoch aber das hab ich raus...
#
mathe3 ist zwar schon ne weile her bei mir,aber muss man die zahlen net einfach in ne gleichung einsetzen und gut ist?
so hab ich das immer gemacht und hat zumindest in der klausur ganz gut geklappt^^
#
Riedadler schrieb:
Okay, letzte Runde...

Angenommen, es werden 100 Stichproben von einer Normalverteilung gezogen und mit jeder Stichprobe wird der Student-t-Test durchgeführt, um eine Nullhypothese (Mü = 0) zu testen. Mü ist tatsächlich 0, das weiss aber keiner von denen die die Stichproben ziehen, und das Signifikanzlevel alpha ist 0,05.
Wie hoch ist nun die Wahrscheinlichkeit, dass mindestens zwei Stichproben zum Type I error (verwerfen der Nullhypothese obwohl sie wahr ist) führen?

Sind alle Experten mit 99,38% einverstanden? Ziemlich hoch aber das hab ich raus...



Meine Erachtens ist whrscheinlichkeit, dass eine studentische normalverteilung außerhalt des Signifikanzbereichs liegt grade 5%. Wie hoch ist also die Wahrscheinlichkeit das mehr als 2 stichproben error I zeigen?

1-(0,95^100+0,95^99)=0,9878
#
marcelninho85 schrieb:
Riedadler schrieb:
Okay, letzte Runde...

Angenommen, es werden 100 Stichproben von einer Normalverteilung gezogen und mit jeder Stichprobe wird der Student-t-Test durchgeführt, um eine Nullhypothese (Mü = 0) zu testen. Mü ist tatsächlich 0, das weiss aber keiner von denen die die Stichproben ziehen, und das Signifikanzlevel alpha ist 0,05.
Wie hoch ist nun die Wahrscheinlichkeit, dass mindestens zwei Stichproben zum Type I error (verwerfen der Nullhypothese obwohl sie wahr ist) führen?

Sind alle Experten mit 99,38% einverstanden? Ziemlich hoch aber das hab ich raus...



Meine Erachtens ist whrscheinlichkeit, dass eine studentische normalverteilung außerhalt des Signifikanzbereichs liegt grade 5%. Wie hoch ist also die Wahrscheinlichkeit das mehr als 2 stichproben error I zeigen?

1-(0,95^100+0,95^99*0,05)=0,9878


Ich hab fast dieselbe Gleichung, mit einem kleinen Unterschied:
1-(0,95^100+0,95^99*0,05)
#
Ich nehm das mal auf.

Habe ein eigentlich eher einfaches Problem, komme aber irgendwie nicht drauf.

Wieviele Möglichkeiten gibt es 3 Kugeln auf 10 Plätzen zu verteilen (in eine Urne kann mehr als ein Kugel)?
Meine Lösung : 10 über 3 = 10c3 = 120

Wie groß ist die Wahrscheinlichkeit, wenn ich nun eine der Urnen blind ziehe, eine Urne mit 0,1,2 bzw 3 Kugeln zu haben?

Spätestens hier völlige Unsicherheit.
Für Beispiel 0 würde ich sagen:
P(0) = (10c0 * 9c3 ) / (10c3) = 0,7

stimmt dies und wenn nein, wieso und wie wäre es richtig.

Danke


Teilen