Old Fidelity - HiFi Klassiker Forum

Normale Version: Blindtest und Vorgehensweisen...
Du siehst gerade eine vereinfachte Darstellung unserer Inhalte. Normale Ansicht mit richtiger Formatierung.
Seiten: 1 2 3 4 5

deleted

(11.01.2020, 12:30)scope schrieb: [ -> ]Helmut Schmidt war ein ausgesprochen kluger Mann....Bei dir sieht das offensichtlich nicht ganz so rosig aus. Thumbsup

Naja, man tut was man kann. Solange bei dir alles passt....

deleted

(11.01.2020, 12:32)Pufftrompeter schrieb: [ -> ]... ob Du Deine 0815-Celestion mit einem 0815-AR oder einem 0815-Musical-Fidelity befeuerst, ist FAKTISCH vollkommen Wumpe, solange Du keinen der beiden ausserhalb seiner Maximalleistung betreibst oder sonstwie vergewaltigst.

Danke, das raubt mir nun letztendlich alle Illusionen. Ich geh jetzt mal zum Trost die Wumpe anschalten....  Drinks

Rheydter

Dafür liebe ich dieses Forum!

Nach dem gestrigen Fetisch-Exkurs hatte ich schon Sorge, dass der Thread nicht mehr die Kurve kriegt. Hat er aber...
Und jetzt setzt der schimi hier völlig tiefenenspannt noch einen drauf. Locker aus der Hüfte, als ob es das Normalste der Welt wäre. Drinks

Rheydter

Scope Industries Inc. Lol1 
War ganz sicher eine der Geldquellen des berühmten Industriellen Vincent Ludwig, oder... Floet
(10.01.2020, 16:52)scope schrieb: [ -> ] Es stellen sich zwei wichtige Fragen:

1. ...
2. Wie viele  A-B Vergleiche beinhaltet der Test?

An deutschen Universitäten werden von Statistik-Dozenten Vorlesungen zum Thema Stochastik gehalten. Die Quintessenz daraus lautet kurz zusammengefasst: Um zu einem mit 95% Wahrscheinlichkeit validen Ergebnis zu kommen, braucht man 36 Hördurchgänge. Wegen der sogenannten Laplace-Bedingung dürften es eigentlich nicht weniger sein. Die Ausgangshypothese (in Statistikdeutsch: "Nullhypothese") lautet "Der Proband hört nicht wirklich Unterschiede, er rät vielmehr und hat eine Trefferwahrscheinlichkeit von 50% (p =0.5)". Diese Nullhypothese kann verworfen werden, wenn er bei 36 Versuchen mindestens 24 Treffer erzielt. Schafft also jemand bei 36 Hördurchläufen 24 oder mehr korrekte Zuordnungen, so kann man mit mindestens 95%iger Wahrscheinlichkeit davon ausgehen, dass er nicht einfach nur rät.

Mehr Infos: http://www.mathematik-wissen.de/hypothesentest.htm
Ich meine dass du es warst, der das bereits vor einiger Zeit zur Sprache brachte, und den Abschnitt mit drag & drop übernommen hast? Kann das sein? Die Zusammenhänge wurden schon vor über 10 Jahren in anderen Foren immer und immer wieder nachgerechnet, und schon damals gab es immer ein paar ganz besonders pfiffige Schlaumeier, die auf eine bestimmte Anzahl von Durchgängen "pochten", obwohl die wenigsten von ihnen ein Bein vor das andere setzen konnten. In der Praxis werden solche Versuche auch im professionellen Bereich nicht mit 30, 36 , oder noch mehr Proben durchgeführt. Das funktioniert nicht.

In der Praxis muss man vielmehr einen gesunden Kompromiss aus Mathematik, Mensch, und Zeit eingehen, um wie Wahrscheinlichkeit von zufällig entstandenen (erratenen) Ergebnissen möglichst klein zu halten, und die praktische Umsetzbarkeit beizubehalten.

HVF schrieb weiter oben, dass sie jedes Gerät "nur ein mal" testen werden. Daraus leitete ich ab, dass sie Gerät A 1x für eine Zeit von vielleicht 2 Stunden, und danach Gerät B 1x für 2 Stunden hören.
Damit würde zwar einmalig eine Präferenz festgelegt, es würde aber nicht überprüft werden, ob diese Präferenz stabil bleibt. Genau da liegt das Hauptproblem, wenn die zu vergleichenden Zustände extrem eng beieinanderliegen , wie es in so einem Fall die Regel ist.
Das war aber ein Missverständnis...Er meinte vielmehr einen Durchgang mit 10 Proben.

In der Praxis begnügt man sich entweder (selten) mit einem Durchgang a 20 Hörproben, oder eben zwei  mit je 10 Proben und einer längeren  Pause.
Im Professionellen Bereich wird nicht ohne Grund davon abgeraten, mehr als 25 Hörproben zu verwenden.

https://en.wikipedia.org/wiki/ABX_test


Wenn HVF und Co. es auf lediglich einen Durchgang  mit 10 Proben bringen, da die Proben länger ausfallen sollen, wird das Ergebnis bereits nützliche Schlußfolgerungen zulassen. Selbstverständlich wird das Ergebnis mit steigender  Anzahl der Probem "genauer", die Durchführung aber  praxisfremder.

Das sollte nicht allzu schwer zu erkennen sein.

deleted

...und wenn die Nullhypothese nicht vollständig widerlegt werden kann ist ja immer noch Katharina da....

deleted

(11.01.2020, 12:42)Volker Krings schrieb: [ -> ]Dafür liebe ich dieses Forum!

Nach dem gestrigen Fetisch-Exkurs hatte ich schon Sorge, dass der Thread nicht mehr die Kurve kriegt. Hat er aber...
Und jetzt setzt der schimi hier völlig tiefenenspannt noch einen drauf. Locker aus der Hüfte, als ob es das Normalste der Welt wäre. Drinks


Ach, das haben auch andere immer schon mal wieder angemerkt....

(08.09.2018, 14:28)Armin777 schrieb: [ -> ]Weil Du so viele teure Messgeräte besitzt? Weil kaum jemand in diesem Forum weiß, wer Du bist und was Du treibst?

Nimm dazu doch mal bitte Stellung!

Beste Grüße
Armin


Und auch Armin ist ganz sicher nicht der einzige. Ich meine es ist ja nicht normal sich mit einem derartigen Messpark zu bepflastern ohne ihn vielleicht von der Steuer absetzen zu können. Wink2 Andernfalls wäre die Wahrscheinlichkeit einer Persönlichkeitsstörung doch relativ hoch! LOL
Ach du meine Güte, jetzt geht das wieder los. Da muß ich den scope ausnahmsweise mal in Schutz nehmen. Er tut das, weil er es kann und wahrscheinlich aus Spaß an der Sache. Es gibt wirklich seltsamere Hobbys.  Floet
(11.01.2020, 13:21)scope schrieb: [ -> ]Ich meine dass du es warst, der das bereits vor einiger Zeit zur Sprache brachte, und den Abschnitt mit drag & drop übernommen hast? Kann das sein?

Richtig. Ich wies in diesem Forum früher schon auf die Anforderungen eines statistisch validen Blindtests hin.

(11.01.2020, 13:21)scope schrieb: [ -> ]Die Zusammenhänge wurden schon vor über 10 Jahren in anderen Foren immer und immer wieder nachgerechnet, und schon damals gab es immer ein paar ganz besonders pfiffige Schlaumeier, die auf eine bestimmte Anzahl von Durchgängen "pochten", obwohl die wenigsten von ihnen ein Bein vor das andere setzen konnten. In der Praxis werden solche Versuche auch im professionellen Bereich nicht mit 30, 36 , oder noch mehr Proben durchgeführt. Das funktioniert nicht.

Ähm, bist Du nicht derjenige, der andere Leute nur zu gerne darauf hinweist, dass sie bezüglich ihrer Ansichten über Hifi in einer Welt fern der Realität leben? Diesen Vorwurf musst Du Dir selbst  jetzt in Bezug auf Statistik gefallen lassen.

(11.01.2020, 13:21)scope schrieb: [ -> ]In der Praxis muss man vielmehr einen gesunden Kompromiss aus Mathematik, Mensch, und Zeit eingehen, um wie Wahrscheinlichkeit von zufällig entstandenen (erratenen) Ergebnissen möglichst klein zu halten, und die praktische Umsetzbarkeit beizubehalten.

Wenn HVF und Co. es auf lediglich einen Durchgang  mit 10 Proben bringen, da die Proben länger ausfallen sollen, wird das Ergebnis bereits nützliche Schlußfolgerungen zulassen. Selbstverständlich wird das Ergebnis mit steigender  Anzahl der Probem "genauer", die Durchführung aber  praxisfremder.

Das sollte nicht allzu schwer zu erkennen sein.

Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.

Ein kleiner Tipp noch: Man muss bei dem Test nicht unbedingt 36 Durchgänge tatsächlich durchführen. Man muss nur 36 Durchgänge als Höchstzahl festlegen und kann in der Realität schon abbrechen, wenn der Probant zum 13. Mal eine falsche Zuordnung macht. Denn dann wäre die Nullhypothese "Der Probant rät" statistisch nicht mehr zu widerlegen.

Pufftrompeter

Zitat:Und auch Armin ist ganz sicher nicht der einzige. Ich meine es ist ja nicht normal sich mit einem derartigen Messpark zu bepflastern ohne ihn vielleicht von der Steuer absetzen zu können. [Bild: wink2.gif] Andernfalls wäre die Wahrscheinlichkeit einer Persönlichkeitsstörung doch relativ hoch! [Bild: laugh.gif]


Jetzt wird's wieder mal mehr als unertraeeglich. Du leidest an Otze. Abersowasvon. 

Es sind immer dieselben fiesen Aersche, und die gehoeren alle zur selben Arschloch-Gang, die sich am liebsten selbst liked, die irgendwelche aus der Luft gegriffenen Behauptungen in ein fuer sie unertraegliches Faktenvakuum erbrechen.

Mann mann Schimi ... offensichtlich gibt's doch hier genuegend Mitstreiter, die Scopes Schweisstrafosammlung im WoZi, das Drachenkino und die Messkaverne schon live gesehen haben. Meist Du nicht, dass es reichen wuerde, einfach DENEN blind zu glauben, anstatt hier den Otze zu geben, der auch nie begreift, wann er vollkommen auf dem Holzweg ist?

Rheydter

Läuft hier... LOL 

Bei mir stapeln sich ein paar hochwertige Endstufen. Bin ich deshalb Gewerbetreibender und/oder persönlichkeitsgestört? Denker

deleted

(11.01.2020, 14:37)Dan_Seweri schrieb: [ -> ]Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.

Das ist ja dann mal bitter scope. Deine Beweise, die Arbeit der letzten 20 Jahre, deine Fans...komplett fürn Arsch. Vielleicht doch mal lieber eine Mathematikvorlesung mehr besucht als noch ein Messgerät dazu gekauft.... LOL

Pufftrompeter

Zitat:Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.


Das ist leider nicht korrekt.

Der Test ist nicht erst durch eine statistische Untermauerung valide - nur die STATISTISCHE SIGNIFIKANZ ist eben erst mit einem solchen Test bewiesen. Wertlos ist er ohne noch lange nicht. 

Beispiel: Ich sehe ein altes W123-Taxi und denke mit: Oh - schoenes altes Auto. Ich muss nicht 36x hinschauen und Statistik fuehren, um zu wissen, dass ich mich nicht getaeuscht habe und das nicht tatsaechlich ein Kaefer war. Oder eine Pferdekutsche. 

Und wenn der Kotfluegel von dem 123er vorn links dunkler ist, dann weiss ich, dass der mal gewechselt wurde, ohne dass ich 36x das Erkennen des Farbunterschiedes statistisch verifizieren muss.

Und genau darum gehts. Jeder Aufbau, den Scope bisher praesentiert hat, ist dazu geeignet, schon mit einem Durchgang deutlich zu machen, dass es entweder Unterschiede gibt, oder eben nicht - der Trick liegt naemlich im objektiven VERGLEICH zweier im Rahmen des moeglichen normierter Sinneseindruecke (gleiche Lautstaerke etc). Es geht gar nicht um Nullhypothesen - sondern darum, ob man einen Farbunterschied am nachlackierten Kotfluegel sieht oder nicht. Und dafuer brauche ich erstmal keine Statistik. 

Und das kann Scope's Aufbau ermoeglichen ... und all die Umstoepselheinis koennen das eben nicht in gleicher Weise ermoeglichen und hoeren daher das Gras wachsen, die Floehe husten und sagen die Zukunft schon heute voraus.

deleted

Wenn ich in meinem Wohnzimmer sitze und feststelle das meine Celestion 300 am AR A-07 besser spielen ist das zunächst auch mal ein Fakt wie wenn du ein altes W123 Taxi siehst...von vorne bis hinten geschwubbelt....wie alles hier in diesem Forum.

Kaffee

Pufftrompeter

(11.01.2020, 15:06)schimi schrieb: [ -> ]Wenn ich in meinem Wohnzimmer sitze und feststelle das meine Celestion 300 am AR A-07 besser spielen ist das zunächst auch mal ein Fakt wie wenn du ein altes W123 Taxi siehst...von vorne bis hinten geschwubbelt....

Und schon siehst Du, wo mein herbeigezauberter Vergleich hinkt.

Der nachlackierte Kotfluegel passt besser, das geb ich zu ...

Letztendlich geht es darum, ob ein Versuchsaufbau GEEIGNET ist, eine einzige Variable zuverlaessig genug zu vergleichen, ohne sich durch 357 andere moegliche Fehler einen vorzugaukeln. Und da legst Du Dir schon im 1. Schuss die Karten wegen (a) der nicht normierten Lautstaerke und (b) weil Du weisst, was wann spielt und Deine Erwartungshaltung das Ergebnis beeinflusst. Ist ja kein Zufall, dass Du glaubst, der groessere Amp sei kontrollierter.

Scope eliminiert die allermeisten dieser Randbedingungsfehler - und es bedarf eines boeswilligen Testers, den Test mit einer bewussten Falschaussage zu torpedieren. Genau da greift die Statistik, mit der man das ausschliessen koennte, aber nicht muss, um das Ergebnis erstmal als solches anzunehmen (minus der unbewiesenen bzw. unwiederlegten Annahme, dass die Tester mutwillig behaupten, man hoere keinen Unterschied).
(11.01.2020, 15:05)Pufftrompeter schrieb: [ -> ]Das ist leider nicht korrekt.

Der Test ist nicht erst durch eine statistische Untermauerung valide - nur die STATISTISCHE SIGNIFIKANZ ist eben erst mit einem solchen Test bewiesen. Wertlos ist er ohne noch lange nicht. 

Wo steht in meinen Ausführungen, dass ich den Test für wertlos halte? Du scheinst Dich auf etwas zu beziehen, was ich nicht geschrieben habe.

deleted

Also scope, nicht wertlos aber halt eben auch leider nicht belastbar.... LOL

Kann man aber dann auch mit weniger Aufwand schaffen und ohne sich als Gralshüter der ewigen Wahrheit zu fühlen. Wink2

deleted

(11.01.2020, 15:17)Pufftrompeter schrieb: [ -> ]Letztendlich geht es darum, ob ein Versuchsaufbau GEEIGNET ist, eine einzige Variable zuverlaessig genug zu vergleichen, ohne sich durch 357 andere moegliche Fehler einen vorzugaukeln. Und da legst Du Dir schon im 1. Schuss die Karten wegen (a) der nicht normierten Lautstaerke und (b) weil Du weisst, was wann spielt und Deine Erwartungshaltung das Ergebnis beeinflusst. Ist ja kein Zufall, dass Du glaubt, der groessere Amp sei kontrollierter.

Letztlich geht es darum dass das statistisch betrachtet eben leider nicht genügt. Wie sagt man so schön "Knapp vorbei ist eben leider auch vorbei". Ich gebe aber zu das man das sicherlich verlieren auf hohem Niveau nennen könnte. Ein eindeutiges Ergebnis liefert das genausowenig wie meine Aussage.

Ist mir ja in Prinzip auch wurscht. Ich bohr ja auch nicht so dicke Bretter wir Hr. scope. Ich kann mit anderen Meinungen leben. Wenn einer allerdings seine Meinung als alleinige Wahrheit verkündet, dann sollte auch die dahinter liegende Mathematik stimmen und nicht nur der Messgerätepark. Wink2
Zitat:....wer Du bist und was Du treibst? ... LOL welche Partei du wählst?....welche Socken du trägst. LOL ...?  Leicht verändert, aber passend

Nimm dazu doch mal bitte Stellung!

Ich war schon immer davon überzeugt, dass du dir irgendwann einmal -ganz übel- den Kopf an der Kellertreppe gestoßen haben musst. Thumbsup
Anders ist das nicht zu erklären.

Pufftrompeter

Zitat:Ich gebe aber zu das man das sicherlich verlieren auf hohem Niveau nennen könnte. Ein eindeutiges Ergebnis liefert das genausowenig wie meine Aussage.


Wenn Du den Unterschied in der Qualitaet der Herangehensweise und in der daraus resultierenden Verlaesslichkeit des Ergebnisses zwischen Deinen Stoepseltests und Scopes Blindtest nicht sehen willst und beides als gleichwertig ingenioes ansiehst, dann ist Dir leider nicht zu helfen. 

Selbstueberschaetzung - wie so oft.
Zitat:Ähm, bist Du nicht derjenige, der andere Leute nur zu gerne darauf hinweist, dass sie bezüglich ihrer Ansichten über Hifi in einer Welt fern der Realität leben? Diesen Vorwurf musst Du Dir selbst  jetzt in Bezug auf Statistik gefallen lassen.

Nein, denn die statistische Auswertung steht bei diesen Versuchen nicht im Vordergrund. Ganz im Gegenzeil, und das wurde von Anfang an haarklein erklärt. Es ist nahezu unmöglich, dass du das übersehen hast. Es muss also andere Gründe dafür geben, dass du mit deinem Textblock in regelmäßigen Abständen auftauchst. Ich vermute mal "Solidarität".

Das habe ich dir aber auch vor 2 Jahren bereits erzählt. Anscheinend ohne Erfolg.
Mit "fern der Realität" hat das absolut nichts zu tun. 

Zitat:Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.h

Kurz und schmerzlos : Das ist absoluter Unsinn.

Zitat:Ein kleiner Tipp noch: Man muss bei dem Test nicht unbedingt 36 Durchgänge tatsächlich durchführen. Man muss nur 36 Durchgänge als Höchstzahl festlegen und kann in der Realität schon abbrechen, wenn der Probant zum 13. Mal eine falsche Zuordnung macht. Denn dann wäre die Nullhypothese "Der Probant rät" statistisch nicht mehr zu widerlegen.

Danke für diesen "tollen Tip" Thumbsup Darauf muss man erst mal kommen.
Schimi grübelte:

Zitat:Kann man aber dann auch mit weniger Aufwand schaffen

Aha?....Erzähl´doch mal...


Bitte...bin gespannt was jetzt kommt.
(11.01.2020, 15:34)schimi schrieb: [ -> ]...
Letztlich geht es darum dass das statistisch betrachtet eben leider nicht genügt. Wie sagt man so schön "Knapp vorbei ist eben leider auch vorbei". Ich gebe aber zu das man das sicherlich verlieren auf hohem Niveau nennen könnte. Ein eindeutiges Ergebnis liefert das genausowenig wie meine Aussage.

Ist mir ja in Prinzip auch wurscht. Ich bohr ja auch nicht so dicke Bretter wir Hr. scope. Ich kann mit anderen Meinungen leben. Wenn einer allerdings seine Meinung als alleinige Wahrheit verkündet, dann sollte auch die dahinter liegende Mathematik stimmen und nicht nur der Messgerätepark. Wink2

Im Gegensatz zu deinen (euren) Schwurbeleien, für die der Begriff "Meinung" schon fast einen Euphemismus darstellt, fußen die Äußerungen  scopes auf überprüfbaren physikalischen Gesetzmäßigkeiten und wurden in zahlreichen Blindtests verifiziert. Hierfür ist der Begriff Meinung dann schon zu schwach, so dass "Faktum" die Sache besser trifft.

Es ist aber bezeichnend für die vorhandene geistige Barriere, wenn man hier zwei auf einer Stufe stehende Meinungen erkennen will...

deleted

Von mir kommt nix mehr. Von der Mathematik auch nicht. Es wurde bereits alles gesagt.
Zitat:Ich meine es ist ja nicht normal sich mit einem derartigen Messpark zu bepflastern ohne ihn vielleicht von der Steuer absetzen zu können.


Du kleines Lichtlein.... Thumbsup   Was kann ich dafür, dass du dir nichts "erlauben" kannst ? Wenn du auf dieser Ebene "diskutieren" möchtest, mache ich mal eine Ausnahme.
Seiten: 1 2 3 4 5