Themen-Übersicht |
xxxyyy Aktiv Dabei seit: 09.04.2016
Mitteilungen: 68
 | Themenstart: 2020-10-21 20:04
Hallo zusammen,
mal eine Frage an alle die sich mit Statistik besser auskennen als ich (also vermutlich jeder hier 😄).
+++++++++
Problemstellung:
Gegeben sind zwei Stichproben, die miteinander verglichen werden sollen. Ziel ist es zu sagen wie ähnlich die zugrundeliegenden Verteilungen sind und ob die Stichproben eventuell aus derselben Grundgesamtheit stammen. Ideal wäre es einen Kennwert zu haben an dem man festmachen kann wie ähnlich sich die den Stichproben zugrundeliegenden Verteilungen sind (z.B. 0 für komplett verschieden und 1 für identisch).
Die Datenpunkte der Stichprobe können von beliebiger Dimensionalität sein d.h. ein Datenpunkt kann z.B. sein x=(1,1) oder x=(1,1,1,...). Ein Ansatz, den ich mir vorstellen könnte wäre es die Stichproben für jede Koordinate zu vergleichen und dann die Ergebnisse der Koordinaten irgendwie zu mitteln - aber nur so eine Idee meinerseits.
Es ist nicht bekannt welche Verteilungen den Stichproben zugrunde liegt und die zwei Stichproben selbst können auch unterschiedliche Verteilungen besitzen.
+++++++++
Wenn jemand eine Idee hat oder ein Verfahren kennt, das man auf diese Problemstellung anwenden könnte, wäre es toll, wenn er das mal in die Runde werfen könnte. Bei einem statistischen Verfahren reicht auch bereits die Bezeichnung (einarbeiten kann ich mich dann selbst).
Vielen Dank schon mal vorab :)
|
Caban Senior Dabei seit: 06.09.2018
Mitteilungen: 1533
Herkunft: Brennpunkt einer Parabel
 | Beitrag No.1, eingetragen 2020-10-21 20:35
Hallo
Sagt dir der t-test und fer F-test was?
Gruß Caban
|
xxxyyy Aktiv Dabei seit: 09.04.2016
Mitteilungen: 68
 | Beitrag No.2, vom Themenstarter, eingetragen 2020-10-22 09:13
Danke, aber die gehen doch nur bei Normalverteilung bzw. TVerteilung,oder?
|
luis52 Senior Dabei seit: 24.12.2018
Mitteilungen: 429
 | Beitrag No.3, eingetragen 2020-10-22 09:18
Moin allerseits,
ein t-Test ist im Prinzip anwendbar, wenn Annahmen hinsichtlich der Verteilung in den Grundgesamtheiten getroffen werden koennen, insbesondere Normalverteilung. Das ist hier ausdruecklich nicht der Fall, weswegen ich eher einen nichtparametrischen Test vorschlage.
Die Idee der Mittelung der Werte koennte vielleicht zum Ziel fuehren. So entstehen ordinal skalierte Daten, wofuer bspw. der Mann-Whitney-Wilcoxon-Test geeignet ist.
vg Luis
[Die Antwort wurde nach Beitrag No.1 begonnen.]
|
xxxyyy Aktiv Dabei seit: 09.04.2016
Mitteilungen: 68
 | Beitrag No.4, vom Themenstarter, eingetragen 2020-10-22 10:32
Hallo, habe Mal nach den Test recherchiert. Der Test ist in der Lage zu sagen ob ein zufälliger Wert aus einer Population (bei mir wäre das in Näherung Stichprobe 1) im Mittel größer oder kleiner als ein zufälliger aus einer anderen Population (bei mir dann Stichprobe 2) ausgewählter Wert ist.
Deine Idee wäre nun: Wenn die Werte ca. Identisch sind, sind die Stichproben identisch? Dazu müsste ich den Test praktisch für jede Koordinate durchführen und dann aus den erhaltenen Abweichungen den Mittelwert der Beträge bilden.
Kann ich dir folgen?
|
luis52 Senior Dabei seit: 24.12.2018
Mitteilungen: 429
 | Beitrag No.5, eingetragen 2020-10-22 11:08
Ich weiss nicht, ob *ich* dir folgen kann ...
Nehmen wir an, deine Datenssaetze sind
DS 1: $(1,1)$, $(1,1,1)$, $(1,1)$, $(1,1,1,1)$
DS 2: $(1,1,1)$, $(1,1,1)$, $(1,1)$, $(1,1,1,1)$, (1,1,1,1,1)
Durschnittsbildung ist doch nicht hilfreich, denn du erhaeltst jeweils
das arithmetische Mittel $1$. Bildest du hingegen Summen, so ergibt sich
DS 1: $2,3,2,4$
DS 2: $3,3,2,4,5$
Und fuer diese Situation ist der MWW-Test durchaus geeignet. Wichtig ist,
dass die Daten zumindest ein ordinales Messniveau haben.
vg Luis
|
xxxyyy Aktiv Dabei seit: 09.04.2016
Mitteilungen: 68
 | Beitrag No.6, vom Themenstarter, eingetragen 2020-10-22 12:25
Danke für die Rückmeldung.
Ich denke das mit der Dimensionalität würde bei der Problemstellung nicht ganz klar.
Die Daten in den beiden Stichproben habe alle dieselbe Dimensionalität. Nur die Dimensionalität selbst kann abweichen d.h. der Test soll auf Daten beliebiger Dimensionalität angewendet werden können.
Z.B.
Stichprobe 1: (1,1,1), (1,2,3), ...
Stichprobe 2: (2,2,2), (3,2,1), ...
Aber es könnte z.B. auch sein
Stichprobe 1: (1,1,1,1), (1,2,3,4), ...
Stichprobe 2: (2,2,2,2), (4,3,2,1), ...
|
luis52 Senior Dabei seit: 24.12.2018
Mitteilungen: 429
 | Beitrag No.7, eingetragen 2020-10-22 14:00
2020-10-22 12:25 - xxxyyy in Beitrag No. 6 schreibt:
Die Daten in den beiden Stichproben habe alle dieselbe Dimensionalität. Nur die Dimensionalität selbst kann abweichen d.h. der Test soll auf Daten beliebiger Dimensionalität angewendet werden können.
Okay, das aendert aber nichts an meinem Vorschlag ...
vg Luis
|
xxxyyy Aktiv Dabei seit: 09.04.2016
Mitteilungen: 68
 | Beitrag No.8, vom Themenstarter, eingetragen 2020-10-22 16:20
Ja, vielen Dank für deinen Vorschlag, das kann ich Mal ausprobieren :).
Was ich meine ist, wenn man den Test für jede Achse durchführt und dann aus den sich ergebenden U-Werten den Mittelwert bildet.
Denkst du das würde auch gehen?
|
luis52 Senior Dabei seit: 24.12.2018
Mitteilungen: 429
 | Beitrag No.9, eingetragen 2020-10-22 17:20
2020-10-22 16:20 - xxxyyy in Beitrag No. 8 schreibt:
Was ich meine ist, wenn man den Test für jede Achse durchführt und dann aus den sich ergebenden U-Werten den Mittelwert bildet.
Denkst du das würde auch gehen?
So, aus der Ferne laesst sich das nicht sagen. Wie wurde man den gemittelten U-Wert denn interpretieren?
vg Luis
|
xxxyyy Aktiv Dabei seit: 09.04.2016
Mitteilungen: 68
 | Beitrag No.10, vom Themenstarter, eingetragen 2020-10-22 18:16
Ja, stimmt. Vielen Dank schon Mal an dich.
Bin natürlich für weitere Vorschläge offen ;)
|
|