Old Fidelity - HiFi Klassiker Forum - Blindtest und Vorgehensweisen...

Seiten: 1 2 3 4 5

(11.01.2020, 12:30)scope schrieb: [ -> ]Helmut Schmidt war ein ausgesprochen kluger Mann....Bei dir sieht das offensichtlich nicht ganz so rosig aus.

Naja, man tut was man kann. Solange bei dir alles passt....

(11.01.2020, 12:32)Pufftrompeter schrieb: [ -> ]... ob Du Deine 0815-Celestion mit einem 0815-AR oder einem 0815-Musical-Fidelity befeuerst, ist FAKTISCH vollkommen Wumpe, solange Du keinen der beiden ausserhalb seiner Maximalleistung betreibst oder sonstwie vergewaltigst.

Danke, das raubt mir nun letztendlich alle Illusionen. Ich geh jetzt mal zum Trost die Wumpe anschalten.... Drinks

Dafür liebe ich dieses Forum!

Nach dem gestrigen Fetisch-Exkurs hatte ich schon Sorge, dass der Thread nicht mehr die Kurve kriegt. Hat er aber...
Und jetzt setzt der schimi hier völlig tiefenenspannt noch einen drauf. Locker aus der Hüfte, als ob es das Normalste der Welt wäre. Drinks

Scope Industries Inc. Lol1

War ganz sicher eine der Geldquellen des berühmten Industriellen Vincent Ludwig, oder... Floet

(10.01.2020, 16:52)scope schrieb: [ -> ] Es stellen sich zwei wichtige Fragen:

1. ...
2. Wie viele A-B Vergleiche beinhaltet der Test?

An deutschen Universitäten werden von Statistik-Dozenten Vorlesungen zum Thema Stochastik gehalten. Die Quintessenz daraus lautet kurz zusammengefasst: Um zu einem mit 95% Wahrscheinlichkeit validen Ergebnis zu kommen, braucht man 36 Hördurchgänge. Wegen der sogenannten Laplace-Bedingung dürften es eigentlich nicht weniger sein. Die Ausgangshypothese (in Statistikdeutsch: "Nullhypothese") lautet "Der Proband hört nicht wirklich Unterschiede, er rät vielmehr und hat eine Trefferwahrscheinlichkeit von 50% (p =0.5)". Diese Nullhypothese kann verworfen werden, wenn er bei 36 Versuchen mindestens 24 Treffer erzielt. Schafft also jemand bei 36 Hördurchläufen 24 oder mehr korrekte Zuordnungen, so kann man mit mindestens 95%iger Wahrscheinlichkeit davon ausgehen, dass er nicht einfach nur rät.

Mehr Infos: http://www.mathematik-wissen.de/hypothesentest.htm

Ich meine dass du es warst, der das bereits vor einiger Zeit zur Sprache brachte, und den Abschnitt mit drag & drop übernommen hast? Kann das sein? Die Zusammenhänge wurden schon vor über 10 Jahren in anderen Foren immer und immer wieder nachgerechnet, und schon damals gab es immer ein paar ganz besonders pfiffige Schlaumeier, die auf eine bestimmte Anzahl von Durchgängen "pochten", obwohl die wenigsten von ihnen ein Bein vor das andere setzen konnten. In der Praxis werden solche Versuche auch im professionellen Bereich nicht mit 30, 36 , oder noch mehr Proben durchgeführt. Das funktioniert nicht.

In der Praxis muss man vielmehr einen gesunden Kompromiss aus Mathematik, Mensch, und Zeit eingehen, um wie Wahrscheinlichkeit von zufällig entstandenen (erratenen) Ergebnissen möglichst klein zu halten, und die praktische Umsetzbarkeit beizubehalten.

HVF schrieb weiter oben, dass sie jedes Gerät "nur ein mal" testen werden. Daraus leitete ich ab, dass sie Gerät A 1x für eine Zeit von vielleicht 2 Stunden, und danach Gerät B 1x für 2 Stunden hören.
Damit würde zwar einmalig eine Präferenz festgelegt, es würde aber nicht überprüft werden, ob diese Präferenz stabil bleibt. Genau da liegt das Hauptproblem, wenn die zu vergleichenden Zustände extrem eng beieinanderliegen , wie es in so einem Fall die Regel ist.
Das war aber ein Missverständnis...Er meinte vielmehr einen Durchgang mit 10 Proben.

In der Praxis begnügt man sich entweder (selten) mit einem Durchgang a 20 Hörproben, oder eben zwei mit je 10 Proben und einer längeren Pause.
Im Professionellen Bereich wird nicht ohne Grund davon abgeraten, mehr als 25 Hörproben zu verwenden.

https://en.wikipedia.org/wiki/ABX_test

Wenn HVF und Co. es auf lediglich einen Durchgang mit 10 Proben bringen, da die Proben länger ausfallen sollen, wird das Ergebnis bereits nützliche Schlußfolgerungen zulassen. Selbstverständlich wird das Ergebnis mit steigender Anzahl der Probem "genauer", die Durchführung aber praxisfremder.

Das sollte nicht allzu schwer zu erkennen sein.

...und wenn die Nullhypothese nicht vollständig widerlegt werden kann ist ja immer noch Katharina da....

(11.01.2020, 12:42)Volker Krings schrieb: [ -> ]Dafür liebe ich dieses Forum!

Nach dem gestrigen Fetisch-Exkurs hatte ich schon Sorge, dass der Thread nicht mehr die Kurve kriegt. Hat er aber...
Und jetzt setzt der schimi hier völlig tiefenenspannt noch einen drauf. Locker aus der Hüfte, als ob es das Normalste der Welt wäre.

Ach, das haben auch andere immer schon mal wieder angemerkt....

(08.09.2018, 14:28)Armin777 schrieb: [ -> ]Weil Du so viele teure Messgeräte besitzt? Weil kaum jemand in diesem Forum weiß, wer Du bist und was Du treibst?

Nimm dazu doch mal bitte Stellung!

Beste Grüße
Armin

Und auch Armin ist ganz sicher nicht der einzige. Ich meine es ist ja nicht normal sich mit einem derartigen Messpark zu bepflastern ohne ihn vielleicht von der Steuer absetzen zu können. Wink2

Andernfalls wäre die Wahrscheinlichkeit einer Persönlichkeitsstörung doch relativ hoch! LOL

Ach du meine Güte, jetzt geht das wieder los. Da muß ich den scope ausnahmsweise mal in Schutz nehmen. Er tut das, weil er es kann und wahrscheinlich aus Spaß an der Sache. Es gibt wirklich seltsamere Hobbys. Floet

(11.01.2020, 13:21)scope schrieb: [ -> ]Ich meine dass du es warst, der das bereits vor einiger Zeit zur Sprache brachte, und den Abschnitt mit drag & drop übernommen hast? Kann das sein?

Richtig. Ich wies in diesem Forum früher schon auf die Anforderungen eines statistisch validen Blindtests hin.

(11.01.2020, 13:21)scope schrieb: [ -> ]Die Zusammenhänge wurden schon vor über 10 Jahren in anderen Foren immer und immer wieder nachgerechnet, und schon damals gab es immer ein paar ganz besonders pfiffige Schlaumeier, die auf eine bestimmte Anzahl von Durchgängen "pochten", obwohl die wenigsten von ihnen ein Bein vor das andere setzen konnten. In der Praxis werden solche Versuche auch im professionellen Bereich nicht mit 30, 36 , oder noch mehr Proben durchgeführt. Das funktioniert nicht.

Ähm, bist Du nicht derjenige, der andere Leute nur zu gerne darauf hinweist, dass sie bezüglich ihrer Ansichten über Hifi in einer Welt fern der Realität leben? Diesen Vorwurf musst Du Dir selbst jetzt in Bezug auf Statistik gefallen lassen.

(11.01.2020, 13:21)scope schrieb: [ -> ]In der Praxis muss man vielmehr einen gesunden Kompromiss aus Mathematik, Mensch, und Zeit eingehen, um wie Wahrscheinlichkeit von zufällig entstandenen (erratenen) Ergebnissen möglichst klein zu halten, und die praktische Umsetzbarkeit beizubehalten.

Wenn HVF und Co. es auf lediglich einen Durchgang mit 10 Proben bringen, da die Proben länger ausfallen sollen, wird das Ergebnis bereits nützliche Schlußfolgerungen zulassen. Selbstverständlich wird das Ergebnis mit steigender Anzahl der Probem "genauer", die Durchführung aber praxisfremder.

Das sollte nicht allzu schwer zu erkennen sein.

Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.

Ein kleiner Tipp noch: Man muss bei dem Test nicht unbedingt 36 Durchgänge tatsächlich durchführen. Man muss nur 36 Durchgänge als Höchstzahl festlegen und kann in der Realität schon abbrechen, wenn der Probant zum 13. Mal eine falsche Zuordnung macht. Denn dann wäre die Nullhypothese "Der Probant rät" statistisch nicht mehr zu widerlegen.

Zitat:Und auch Armin ist ganz sicher nicht der einzige. Ich meine es ist ja nicht normal sich mit einem derartigen Messpark zu bepflastern ohne ihn vielleicht von der Steuer absetzen zu können. Andernfalls wäre die Wahrscheinlichkeit einer Persönlichkeitsstörung doch relativ hoch!

Jetzt wird's wieder mal mehr als unertraeeglich. Du leidest an Otze. Abersowasvon.

Es sind immer dieselben fiesen Aersche, und die gehoeren alle zur selben Arschloch-Gang, die sich am liebsten selbst liked, die irgendwelche aus der Luft gegriffenen Behauptungen in ein fuer sie unertraegliches Faktenvakuum erbrechen.

Mann mann Schimi ... offensichtlich gibt's doch hier genuegend Mitstreiter, die Scopes Schweisstrafosammlung im WoZi, das Drachenkino und die Messkaverne schon live gesehen haben. Meist Du nicht, dass es reichen wuerde, einfach DENEN blind zu glauben, anstatt hier den Otze zu geben, der auch nie begreift, wann er vollkommen auf dem Holzweg ist?

Läuft hier... LOL

Bei mir stapeln sich ein paar hochwertige Endstufen. Bin ich deshalb Gewerbetreibender und/oder persönlichkeitsgestört? Denker

(11.01.2020, 14:37)Dan_Seweri schrieb: [ -> ]Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.

Das ist ja dann mal bitter scope. Deine Beweise, die Arbeit der letzten 20 Jahre, deine Fans...komplett fürn Arsch. Vielleicht doch mal lieber eine Mathematikvorlesung mehr besucht als noch ein Messgerät dazu gekauft.... LOL

Zitat:Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.

Das ist leider nicht korrekt.

Der Test ist nicht erst durch eine statistische Untermauerung valide - nur die STATISTISCHE SIGNIFIKANZ ist eben erst mit einem solchen Test bewiesen. Wertlos ist er ohne noch lange nicht.

Beispiel: Ich sehe ein altes W123-Taxi und denke mit: Oh - schoenes altes Auto. Ich muss nicht 36x hinschauen und Statistik fuehren, um zu wissen, dass ich mich nicht getaeuscht habe und das nicht tatsaechlich ein Kaefer war. Oder eine Pferdekutsche.

Und wenn der Kotfluegel von dem 123er vorn links dunkler ist, dann weiss ich, dass der mal gewechselt wurde, ohne dass ich 36x das Erkennen des Farbunterschiedes statistisch verifizieren muss.

Und genau darum gehts. Jeder Aufbau, den Scope bisher praesentiert hat, ist dazu geeignet, schon mit einem Durchgang deutlich zu machen, dass es entweder Unterschiede gibt, oder eben nicht - der Trick liegt naemlich im objektiven VERGLEICH zweier im Rahmen des moeglichen normierter Sinneseindruecke (gleiche Lautstaerke etc). Es geht gar nicht um Nullhypothesen - sondern darum, ob man einen Farbunterschied am nachlackierten Kotfluegel sieht oder nicht. Und dafuer brauche ich erstmal keine Statistik.

Und das kann Scope's Aufbau ermoeglichen ... und all die Umstoepselheinis koennen das eben nicht in gleicher Weise ermoeglichen und hoeren daher das Gras wachsen, die Floehe husten und sagen die Zukunft schon heute voraus.

Wenn ich in meinem Wohnzimmer sitze und feststelle das meine Celestion 300 am AR A-07 besser spielen ist das zunächst auch mal ein Fakt wie wenn du ein altes W123 Taxi siehst...von vorne bis hinten geschwubbelt....wie alles hier in diesem Forum.

Kaffee

(11.01.2020, 15:06)schimi schrieb: [ -> ]Wenn ich in meinem Wohnzimmer sitze und feststelle das meine Celestion 300 am AR A-07 besser spielen ist das zunächst auch mal ein Fakt wie wenn du ein altes W123 Taxi siehst...von vorne bis hinten geschwubbelt....

Und schon siehst Du, wo mein herbeigezauberter Vergleich hinkt.

Der nachlackierte Kotfluegel passt besser, das geb ich zu ...

Letztendlich geht es darum, ob ein Versuchsaufbau GEEIGNET ist, eine einzige Variable zuverlaessig genug zu vergleichen, ohne sich durch 357 andere moegliche Fehler einen vorzugaukeln. Und da legst Du Dir schon im 1. Schuss die Karten wegen (a) der nicht normierten Lautstaerke und (b) weil Du weisst, was wann spielt und Deine Erwartungshaltung das Ergebnis beeinflusst. Ist ja kein Zufall, dass Du glaubst, der groessere Amp sei kontrollierter.

Scope eliminiert die allermeisten dieser Randbedingungsfehler - und es bedarf eines boeswilligen Testers, den Test mit einer bewussten Falschaussage zu torpedieren. Genau da greift die Statistik, mit der man das ausschliessen koennte, aber nicht muss, um das Ergebnis erstmal als solches anzunehmen (minus der unbewiesenen bzw. unwiederlegten Annahme, dass die Tester mutwillig behaupten, man hoere keinen Unterschied).

(11.01.2020, 15:05)Pufftrompeter schrieb: [ -> ]Das ist leider nicht korrekt.

Der Test ist nicht erst durch eine statistische Untermauerung valide - nur die STATISTISCHE SIGNIFIKANZ ist eben erst mit einem solchen Test bewiesen. Wertlos ist er ohne noch lange nicht.

Wo steht in meinen Ausführungen, dass ich den Test für wertlos halte? Du scheinst Dich auf etwas zu beziehen, was ich nicht geschrieben habe.

Also scope, nicht wertlos aber halt eben auch leider nicht belastbar.... LOL

Kann man aber dann auch mit weniger Aufwand schaffen und ohne sich als Gralshüter der ewigen Wahrheit zu fühlen. Wink2

(11.01.2020, 15:17)Pufftrompeter schrieb: [ -> ]Letztendlich geht es darum, ob ein Versuchsaufbau GEEIGNET ist, eine einzige Variable zuverlaessig genug zu vergleichen, ohne sich durch 357 andere moegliche Fehler einen vorzugaukeln. Und da legst Du Dir schon im 1. Schuss die Karten wegen (a) der nicht normierten Lautstaerke und (b) weil Du weisst, was wann spielt und Deine Erwartungshaltung das Ergebnis beeinflusst. Ist ja kein Zufall, dass Du glaubt, der groessere Amp sei kontrollierter.

Letztlich geht es darum dass das statistisch betrachtet eben leider nicht genügt. Wie sagt man so schön "Knapp vorbei ist eben leider auch vorbei". Ich gebe aber zu das man das sicherlich verlieren auf hohem Niveau nennen könnte. Ein eindeutiges Ergebnis liefert das genausowenig wie meine Aussage.

Ist mir ja in Prinzip auch wurscht. Ich bohr ja auch nicht so dicke Bretter wir Hr. scope. Ich kann mit anderen Meinungen leben. Wenn einer allerdings seine Meinung als alleinige Wahrheit verkündet, dann sollte auch die dahinter liegende Mathematik stimmen und nicht nur der Messgerätepark. Wink2

Zitat:....wer Du bist und was Du treibst? ... welche Partei du wählst?....welche Socken du trägst. ...? Leicht verändert, aber passend

Nimm dazu doch mal bitte Stellung!

Ich war schon immer davon überzeugt, dass du dir irgendwann einmal -ganz übel- den Kopf an der Kellertreppe gestoßen haben musst. Thumbsup

Anders ist das nicht zu erklären.

Zitat:Ich gebe aber zu das man das sicherlich verlieren auf hohem Niveau nennen könnte. Ein eindeutiges Ergebnis liefert das genausowenig wie meine Aussage.

Wenn Du den Unterschied in der Qualitaet der Herangehensweise und in der daraus resultierenden Verlaesslichkeit des Ergebnisses zwischen Deinen Stoepseltests und Scopes Blindtest nicht sehen willst und beides als gleichwertig ingenioes ansiehst, dann ist Dir leider nicht zu helfen.

Selbstueberschaetzung - wie so oft.

Zitat:Ähm, bist Du nicht derjenige, der andere Leute nur zu gerne darauf hinweist, dass sie bezüglich ihrer Ansichten über Hifi in einer Welt fern der Realität leben? Diesen Vorwurf musst Du Dir selbst jetzt in Bezug auf Statistik gefallen lassen.

Nein, denn die statistische Auswertung steht bei diesen Versuchen nicht im Vordergrund. Ganz im Gegenzeil, und das wurde von Anfang an haarklein erklärt. Es ist nahezu unmöglich, dass du das übersehen hast. Es muss also andere Gründe dafür geben, dass du mit deinem Textblock in regelmäßigen Abständen auftauchst. Ich vermute mal "Solidarität".

Das habe ich dir aber auch vor 2 Jahren bereits erzählt. Anscheinend ohne Erfolg.
Mit "fern der Realität" hat das absolut nichts zu tun.

Zitat:Wenn Du einen Blindtest ohne Berücksichtigung der Laplace-Bedingung (und ohne ausreichende Versuche / Stichproben) machst, hat er letztlich nicht mehr Aussagekraft als ein beliebiger Produkttest aus der Hifi-Presse mit geschwurbelten Klangbeschreibungen.h

Kurz und schmerzlos : Das ist absoluter Unsinn.

Zitat:Ein kleiner Tipp noch: Man muss bei dem Test nicht unbedingt 36 Durchgänge tatsächlich durchführen. Man muss nur 36 Durchgänge als Höchstzahl festlegen und kann in der Realität schon abbrechen, wenn der Probant zum 13. Mal eine falsche Zuordnung macht. Denn dann wäre die Nullhypothese "Der Probant rät" statistisch nicht mehr zu widerlegen.

Danke für diesen "tollen Tip" Thumbsup

Darauf muss man erst mal kommen.
Schimi grübelte:

Zitat:Kann man aber dann auch mit weniger Aufwand schaffen

Aha?....Erzähl´doch mal...

Bitte...bin gespannt was jetzt kommt.

(11.01.2020, 15:34)schimi schrieb: [ -> ]...
Letztlich geht es darum dass das statistisch betrachtet eben leider nicht genügt. Wie sagt man so schön "Knapp vorbei ist eben leider auch vorbei". Ich gebe aber zu das man das sicherlich verlieren auf hohem Niveau nennen könnte. Ein eindeutiges Ergebnis liefert das genausowenig wie meine Aussage.

Ist mir ja in Prinzip auch wurscht. Ich bohr ja auch nicht so dicke Bretter wir Hr. scope. Ich kann mit anderen Meinungen leben. Wenn einer allerdings seine Meinung als alleinige Wahrheit verkündet, dann sollte auch die dahinter liegende Mathematik stimmen und nicht nur der Messgerätepark.

Im Gegensatz zu deinen (euren) Schwurbeleien, für die der Begriff "Meinung" schon fast einen Euphemismus darstellt, fußen die Äußerungen scopes auf überprüfbaren physikalischen Gesetzmäßigkeiten und wurden in zahlreichen Blindtests verifiziert. Hierfür ist der Begriff Meinung dann schon zu schwach, so dass "Faktum" die Sache besser trifft.

Es ist aber bezeichnend für die vorhandene geistige Barriere, wenn man hier zwei auf einer Stufe stehende Meinungen erkennen will...

Von mir kommt nix mehr. Von der Mathematik auch nicht. Es wurde bereits alles gesagt.

Zitat:Ich meine es ist ja nicht normal sich mit einem derartigen Messpark zu bepflastern ohne ihn vielleicht von der Steuer absetzen zu können.

Du kleines Lichtlein.... Thumbsup

Was kann ich dafür, dass du dir nichts "erlauben" kannst ? Wenn du auf dieser Ebene "diskutieren" möchtest, mache ich mal eine Ausnahme.

Seiten: 1 2 3 4 5

Old Fidelity - HiFi Klassiker Forum

deleted

deleted

Rheydter

Rheydter

Dan_Seweri

scope

deleted

deleted

Ironside

Dan_Seweri

Pufftrompeter

Rheydter

deleted

Pufftrompeter

deleted

Pufftrompeter

Dan_Seweri

deleted

deleted

scope

Pufftrompeter

scope

Jottka

deleted

scope