Myślenie krytyczne

Jakub Pruś: KM #24. Jak (nie) korzystać z danych w argumentacji?

Co stanowi o dobrym argumencie? Solidne oparcie w danych oczywiście! Jeśli dane są prawdziwe, jest ich wystarczająca ilość oraz uzasadniają wniosek, to z takim argumentem nie idzie się nie zgodzić, prawda? Rzecz jednak w tym, że przywoływanie informacji w dyskusji jest też okazją do wielu pomyłek i nadużyć – rozważmy jeden z takich błędów: selektywnego przedstawiania danych.

Zacznijmy od przykładu, a jako że w Polsce zbliżają się wybory parlamentarne, to niech to będzie przykład polityczny:

Wedle sondażu CBOS, o którym czytałem na stronie Państwowej Agencji Prasowej 28 sierpnia, na PiS zagłosuje ok. 37% Polaków, na KO 21 %, a na Konfederację zaledwie 6%. Wygląda więc na to, że te wybory znowu wygra partia rządząca. Sondaż był przeprowadzony rzetelnie i wedle najlepszych metod (CATI, CAPI, CAWI) a grupa obszerna i różnorodna – a więc raczej PiS wygra wybory.

Mogłoby się wydawać, że – o ile uznamy, że wyniki sondaży trafnie prognozują wyniki wyborów – argument jest mocny. Wyniki sondaży są trafnie przedstawione, metodologia badań właściwa, czego się tu czepiać? 

Można oczywiście spojrzeć na inne dane – bo przecież tych w ostatnich tygodniach nie brakuje. Weźmy choćby sondaże Instytutu Badań Rynkowych i Społecznych zrobione na zlecenie Polsatu (18 września) czy Onet.pl (13 września) – te pokazują, że rozkład poparcia dla tych samych partii przedstawia się nieco inaczej: PiS – 33%, KO – 27%, Konfederacja – 12%. Na tle innych badań te pierwsze wyniki sondażu wydają się raczej niewiarygodne – większość badań (i to nowszych od tych przywołanych w argumencie) przedstawia znacząco inne liczby zwolenników tych partii. Powołanie się właśnie na takie jedne wyniki badań oraz zignorowanie pozostałych wyników stanowi właśnie błąd selektywnego przedstawiania danych – wybierania wisienek, z języka angielskiego, cherry picking fallacy

Na czym polega błąd?

Wybieranie wisienek” to nie tylko oparcie się na zbyt małej ilości danych – nie chodzi tu o bardzo słabe wnioskowanie indukcyjne w stylu: „Widziałem pięć czarnych kruków, więc wszystkie kruki są czarne”. Taki błąd nazywamy w logice po prostu pośpieszną generalizacją i jest to – obok błędu niereprezentatywnej próby czy też fałszywej powszechności – jeden z błędów wnioskowania indukcyjnego (tzw. „przejścia od szczegółu do ogółu”). W omawianym tutaj błędzie wybierania wisienek konieczny jest jeszcze drugi element – zignorowanie innych danych, które podważają lub ograniczają wniosek. Wówczas mamy do czynienia z cherry picking’iem. Rozważmy jeszcze jeden, tym razem prosty przykład:

Mała Basia wraca ze szkoły z dwóją z matematyki i przekonuje mamę, że sprawdzian był niesamowicie trudny, zdecydowanie za trudny na jej poziom. „Nie tylko ja dostałam dwóję! To samo spotkało Esterę oraz Ignacego! I nawet Józefina nie zdała, a wiesz przecież, że ona jest najlepsza w klasie!”. W rzeczywistości jednak tylko te cztery osoby dostały dwóje, ale poza nimi cała klasa otrzymała lepsze oceny – a wspomniana Józefina, matematyczna prymuska, w dniu klasówki nie czuła się najlepiej.

Mamy więc tutaj przesłankę, że kilku osobom, nie tylko Basi, nie poszło na klasówce oraz wniosek, że klasówka była za trudna. Przesłanka jest prawdziwa, ale… z kontekstu wiemy, że były też inne osoby, które poradziły sobie z klasówką, ale o nich Basia nie wspomina mamie. Można więc stwierdzić, że w tym przypadku mamy do czynienia z selektywnym przedstawieniem danych, które wykorzystuje się w argumentacji. Ten błąd logiczny, jak każdy inny, ma swój schemat i właśnie dzięki schematowi można go trafnie rozpoznać:

P1. Twierdzenie (dana) X wspiera tezę T.

P2. Twierdzenie (dana) Y podważa tezę T.

P3. Twierdzenia (dane) XY są dostępne osobie A.

W. Osoba A twierdzi, że T argumentując, że X.

Warto podkreślić, że ów błąd wyróżnia nie tyle niekonkluzywność przesłanki (to po prostu pośpieszne uogólnienie), lecz raczej pewna nieuczciwość, którą dana osoba popełnia, dysponując danymi, z których wybiera tylko te, które jej pasują. Jest więc to nieformalny błąd logiczny, który gwałci pewną regułę rzetelnego dyskutowania czy też szczerości wobec rozmówcy.

Wybiórcze dane bez argumentów?

Co ciekawe, selektywne przedstawianie danych nie zawsze musi być wprost sformułowane jako przesłanka w argumencie – czasem jakieś informacje są po prostu przedstawiane w wybiórczy sposób, ale argument wcale nie zostaje wyrażony, tj. nie wyciąga się explicite wniosku na podstawie przytoczonych danych. W takich przypadkach możemy mówić o selektywnym przedstawianiu danych, choć zwykle takie akty komunikacyjne dają się zrekonstruować w postaci argumentów – weźmy teraz inny przykład, również z polskiej polityki:

Mamy tu ujęcie z głównego wydania Wiadomości z 14 marca 2023 r., podczas którego prezentowany był wykres oglądalności czterech najchętniej wybieranych stacji telewizyjnych w marcu 2023 r. Na dwóch pierwszych miejscach z wyraźną przewagą znajdują się TVP2TVP1. Wartości przedstawione na wykresie są prawdziwe, ale… coś tu jest nie w porządku. To, co nie zostało przekazane na tym wykresie, a co znacząco może wpłynąć na prawidłowy odbiór informacji to dolna część wykresu – oś pionowa rozpoczyna się tutaj od 7 punktów procentowych, a to sprawia, że różnica między 7,8 % (najwyższy wynik na wykresie) a 7,5% (najniższy wynik) wygląda na znaczącą, podczas gdy jest znikoma. Na czym polega tutaj selektywne przedstawianie danych? Ano na tym, że pomija się całe 7 punktów procentowych na wykresie, a eksponuje się tylko różnicę, która jest nie większa niż połowa punktu procentowego. 

W tym właśnie przypadku mamy do czynienia z samym tylko wybiórczym przedstawieniem danych, które nie jest wykorzystane w argumencie, ale nietrudno sobie wyobrazić jakie wrażenie ma to w odbiorcach wzbudzić czy też do czego ich przekonać: że TVP jest obecnie najchętniej oglądaną telewizją w Polsce. To zaś, nietrudno się domyślić, znacznie ociepla jej wizerunek. 

Widać więc, że wybieranie wisienek jest nadużyciem, które może być również używane poza argumentacją – a przedstawianie danych, np. na wykresie lub w reportażu jest do tego świetną okazją, bo wówczas autor ma pełną kontrolę nad tym, co odbiorca zobaczy a czego nie zobaczy i może dowolnie manipulować danymi.

Przećwiczmy!

Spójrzmy na jeszcze jeden wykres, tym razem podział przedstawiający laureatów programu LIDER Narodowego Centrum Badań i Rozwoju ze względu na płeć:

Tak skonstruowany wykres może sugerować, że laureatami konkursu w ostatnich latach byli w ogromnej większości mężczyźni – jednak po uważniejszej obserwacji słupków i wartości, którymi są opisane, zauważymy, że różnice nie są tak znaczące: np. w 5. edycji konkursu 37% laureatów było kobietami, a w 6. edycji konkursu aż 41%. Słupki wykresu sugerują jednak, że przewaga mężczyzn w tych konkursach była więcej niż dwukrotna. Również więc i tutaj mamy prawdziwą informację, ale przedstawioną w sposób niepełny, a przez to (umyślnie?) mylący.

Dane w dyskusji – jak do nich podchodzić?

To oczywiste, że dane w dyskusji pojawiają się często i bardzo dobrze – dzięki temu opiera się ona na konkretnych informacjach. Warto jednak ostrożnie te dane interpretować oraz zadać kilka standardowych pytań, gdy na takie dane trafimy, np.: jak dane zostały przedstawione?; czy jakichś informacji może brakować?; co warto by wiedzieć, żeby mieć pewność co do danej sprawy?

Chodzi tutaj o próbę zarysowania szerszego obrazu – jeśli dziecko przychodzi do domu ze słabą oceną i narzeka, że klasówka była niesprawiedliwie oceniona, bo „prawie wszyscy” koledzy też nie zdali, to warto zapytać o to, jakie były wszystkie oceny w klasie czy też jaki procent uczniów nie zdał (ewentualnie, czy nie zdali tylko ci co zwykle). Warto by też spróbować potwierdzić tę informację w innym źródle, czy rzeczywiście „prawie wszyscy” nie zdali, ale to już rzecz krytycznej oceny źródeł. Można, rzecz jasna, rozbudować tę listę o pytania dotyczące zdolności poznawczych osoby lub instytucji, która informację przekazuje, jej stronniczości czy też aktualność przedstawianych danych – w przypadku sondaży przedwyborczych kilka tygodni może mieć przecież ogromne znaczenie.

W dobie sprawnie korzystającego z wyszukiwarek internetowych społeczeństwa znalezienie w internecie takich danych, które będą mogły wesprzeć dany punkt widzenia nie jest żadnym problemem. Dlatego tak istotne jest to, by umieć krytycznie takie dane oceniać i prawidłowo interpretować. Szczególnie jednak warto uważać na selektywne przedstawianie danych, wybieranie wisienek – korzysta się tu przecież z rzetelnych (żeby nie powiedzieć „prawdziwych”) informacji, które mogą nas jednak zawieść na manowce.


Jakub Pruś – adiunkt w Instytucie Filozofii Akademii Ignatianum w Krakowie. Redaktor czasopisma „Forum Philosophicum” i autor vloga „Logika Codzienna”. Pisze aktualne odcinki Kursu krytycznego myślenia. Zajmuje się teorią argumentacji i logiką pragmatyczną. Miłośnik szachów, zapasów i śpiewania kołysanek.


Projekt dofinansowany ze środków budżetu państwa, przyznanych przez Ministra Edukacji i Nauki w ramach Programu „Społeczna Odpowiedzialność Nauki”.

Numery drukowane można zamówić online > tutaj. Prenumeratę na rok 2024 można zamówić > tutaj.

Dołącz do Załogi F! Pomóż nam tworzyć jedyne w Polsce czasopismo popularyzujące filozofię. Na temat obszarów współpracy można przeczytać tutaj.

1 komentarz

Kliknij, aby skomentować

Wesprzyj „Filozofuj!” finansowo

Jeśli chcesz wesprzeć tę inicjatywę dowolną kwotą (1 zł, 2 zł lub inną), przejdź do zakładki „WSPARCIE” na naszej stronie, klikając poniższy link. Klik: Chcę wesprzeć „Filozofuj!”

Polecamy