Ein Durchgang durch Realitäten aus meiner Sicht - Blog von Ulrich Bauer (Ergänzt ubpage.de)
Samstag, 10. August 2024
Statistik
Schwarz auf Weiß, - kein Fake? Was mich als halbwegs ausgebildeten Statistiker immer wieder stört, ist die Verwendung und „Benutzung“ gewisser Zahlen in einem eindeutig definierten Interesse oder in dem stumpfen Vorsatz, gewisse Vorurteile im eigenen Interesse zu stützen. Berühmt ist ja das Beispiel, dass sich ohne Probleme ein Zusammenhang zwischen der Zahl der Geburten und der Häufigkeit der in einem bestimmten Gebiet auftretenden Störche herstellen ließ und lässt. Aber genauso gibt es Beispiele dafür, wie ein Zusammenhang zwischen Tierliebe und Arbeitnehmerfreundlichkeit hergestellt wurde. Statistische Zusammenhänge herzustellen ist nicht schwer. Es kommt aber darauf an, welcher Art diese Zusammenhänge sind. Entscheidend ist auch, in welcher Situation gewisse Fragen in Umfragen gestellt werden. Wenn ich beispielsweise vor einem Parkplatz frage, dann ist die Wahrscheinlichkeit, dass ich dort Autobesitzer befrage, ziemlich hoch und ich kann meine Ergebnisse nicht unbedingt verallgemeinern.
Dies wird in einem bestimmten Segment des Journalismus aber oft getan, indem reißerische Überschriften produziert werden. Meist wird in einer solchen Journaille ein Beleg aus irgendeiner amerikanischen oder englischen Studie dafür herangezogen. Ein ganz wesentlicher Punkt bei solchen Manövern ist es, ob es einen kausalen (also einen in der Sache begründeten) oder einen rein statistischen Zusammenhang (zwei Phänomene in einen statistischen Zusammenhang zu bringen, den es nicht gibt, ist oft keine große Schwierigkeit) zwischen zwei Phänomenen gibt. Dies sollte auch jeder Laie berücksichtigen, wenn er sich mir reißerischen Schlagzeilen in den Medien konfrontiert sieht. Vielleicht sollte er in seine Erkenntnis auch einfließen lassen, dass viele „Wissenschaftler“ sich durch die Mechanismen des Wissenschaftsbetriebs gezwungen sehen, etwas zu veröffentlichen, egal was. Daraus resultieren oft scheinbare „Beweise“, die aus einem Randphänomen das Wichtigste machen oder Zufallsergebnisse als das Relevanteste „verkaufen“.
Besonders beliebt sind derartige Verbiegungen und „Formungen“ statistischer Ergebnisse in der Politik und im Gesundheitswesen. Das Beispiel der vielfach beeinflussten Arbeitsstatistiken ist ja bekannt, muss aber wegen fehlender Alternativen immer wieder akzeptiert werden.
Eine wichtige Faustregel: es kommt immer darauf an, wie etwas definiert wird, wie es für eine Untersuchung „passend gemacht“ wird. Wie es gefasst wird. Danach richten sich dann auch Ergebnisse, die als „seriös“ verkauft werden können, um nahezu jedem Ergebnis ein wisenschaftliches Mäntelchen umzulegen. Die sogenannte Schere zwischen „Arm und Reich“ ist ein gutes Beispiel dafür. Wähle ich die „richtigen“ Untersuchungsparameter und definiere ich Phänomene in einem bestimmten Interesse, so lässt sich auf diesem Gebiet nahezu alles beweisen, auch gegen die offenkundige Überzeugungskraft des Augenscheins, den die Wissenschaft gerne als „empirisch“ definiert, den sie aber ohne Probleme wegdefinieren kann, weil er auf einer zu geringen „Stichprobe“ resultiert und keinerlei Beweiswert habe. Erst die Menge der so erhobenen Daten schaffe so etwas wie „Beweiskraft“. Weil aber Alltagserfahrung selten darauf aufbaut, dass wissenschaftlich einwandfreie Daten (u.a. auchsauber dokumentiert) erhoben werden, ist sie noch nicht unbedingt wertlos. (in unregelmäßig folgenden Blogs werden weitere Beispiele und Phänomene erwähnt....)
x
x
Black and white, no fake? What always bothers me as a halfway trained statistician is the use and "application" of certain numbers in a clearly defined interest or with the blunt intention of supporting certain prejudices in one's own interest. The famous example is that a connection between the number of births and the frequency of storks in a certain area could and can be established without any problems. But there are also examples of how a connection between love of animals and employee friendliness has been established. Establishing statistical connections is not difficult. But it depends on the type of these connections. The situation in which certain questions are asked in surveys is also crucial. If I ask in front of a parking lot, for example, then the probability that I am asking car owners there is quite high and I cannot necessarily generalize my results.
However, this is often done in a certain segment of journalism by producing sensationalist headlines. In such journalism, evidence from some American or English study is usually used to support this. A very important point in such maneuvers is whether there is a causal (i.e. a factually based) or a purely statistical connection (bringing two phenomena into a statistical connection that does not exist is often not a great difficulty) between two phenomena. Every layperson should also take this into account when confronted with sensational headlines in the media. Perhaps they should also take into account that many "scientists" feel compelled by the mechanisms of the scientific community to publish something, no matter what. This often results in apparent "evidence" that makes a marginal phenomenon the most important thing or "sells" random results as the most relevant.
Such distortions and "shaping" of statistical results are particularly popular in politics and the health care system. The example of labor statistics, which are influenced in many ways, is well known, but has to be accepted again and again because there are no alternatives.
An important rule of thumb: it always depends on how something is defined, how it is "made suitable" for an investigation. How it is framed. This is also the basis for results that can be sold as "serious" in order to give almost every result a scientific veneer. The so-called gap between "rich and poor" is a good example of this. If I choose the "right" parameters for the investigation and define phenomena in a certain interest, almost anything can be proven in this area, even against the obvious persuasiveness of the evidence, which science likes to define as "empirical", but which it can easily define away because it results from too small a "sample" and has no evidential value. Only the amount of data collected in this way creates something like "evidential value". But because everyday experience is rarely based on scientifically flawless data (including clean documentation) being collected, it is not necessarily worthless. (More examples and phenomena are mentioned in irregular blogs.…)
Abonnieren
Kommentare zum Post (Atom)
Keine Kommentare:
Kommentar veröffentlichen