Keď na forme skutočne záleží: percentuálne pravdepodobnosti a prirodzené frekvencie
20.04.2018-20:55:00   |   Jakub Podhorányi
Vyriešiť problém totiž v princípe znamená znázorniť si ho tak, aby bolo riešenie ľahko viditeľné a dosiahnuteľné. Zrejme nikto by napríklad pri počítaní neuprednostnil rímske číslice pred arabskými. Tie by aj pomerne jednoduché výpočty spoľahlivo spravili neprehľadné a znepríjemnili by tak dosiahnutie výsledku. Forma prezentácie informácie teda môže celý proces riešenia buď skomplikovať, alebo uľahčiť (Hoffrage, Gigerenzer, Krauss & Martignon, 2002).


Pravdepodobnosť a medicína

Špecifický typ problémov, pri ktorých sa snažíme vypočítať pravdepodobnosť výskytu určitého javu na základe pozorovaného efektu, označujeme ako problémy bayesovského usudzovania (Hoffrage & Gigerenzer, 1998). Často sa s nimi môžeme stretnúť napríklad v medicínskom prostredí. Keď nám lekár oznámi pravdepodobnosť, s akou trpíme nejakým ochorením, ide práve o výsledok riešenia takéhoto bayesovského problému. Pre lepšiu predstavu však najlepšie poslúži nasledujúci príklad:

„Riziko prítomnosti rakoviny prsníka u žien okolo štyridsiatky, ktoré chodia na preventívne prehliadky, je 1 %. Ak sa rakovina v tele skutočne nachádza, výsledok vyšetrenia mamografom bude s 80 % pravdepodobnosťou pozitívny. Avšak aj v prípade, keď rakovina v tele prítomná nie je, existuje 10 % pravdepodobnosť, že napriek tomu mamograf dosiahne pozitívny výsledok. Predstavte si ženu z danej vekovej skupiny, ktorej mamograf je pozitívny. Aká je pravdepodobnosť, že skutočne trpí rakovinou prsníka?“

Ak si chcete príklad vypočítať sami, smelo do toho! Podrobnejší rozbor a správne riešenie uvádzam ďalej v texte.

Pravdepodobnosť z otázky nazývame pozitívnou prediktívnou hodnotou testu a počítame ju pomocou Bayesovej vety, ktorá vyzerá nasledovne:


-


Aplikujúc ju na náš príklad, v(ochorenie) znamená výskyt rakoviny v populácii (1 %, teda 0,01), v(poz/ochorenie) je zase citlivosť diagnostického testu (podiel pozitívnych výsledkov testu u ľudí, ktorí rakovinou skutočne trpia, v našom príklade je to 80 %, teda 0,8) a nakoniec v(poz/(bez ochorenia)) predstavuje falošne pozitívne výsledky testu (podiel pozitívnych výsledkov testu u ľudí, ktorí však rakovinu reálne nemajú, v našom prípade je to 10 %, teda 0,1). Ak všetky hodnoty dosadíme do vzorca, vyzerá potom takto:


-


Výsledok výpočtu sa po zaokrúhlení rovná hodnote 0,075 a odpoveď na otázku, aká je pravdepodobnosť, že pacientka s pozitívnym mamografom má naozaj rakovinu prsníka, je 7,5 %.

Príklad pôvodne pochádza zo štúdie Davida Eddyho (in Hoffrage & Gigerenzer, 1998). Tá patrí medzi množstvo výskumov, ktoré skúmajú to, ako lekári vyhodnocujú pravdepodobnosť výskytu rôznych ochorení. Výsledky príslušných štúdií však ukazujú, že medicínski profesionáli mávajú problémy vyvodiť z údajov o pravdepodobnosti správne závery. Pokiaľ ide o Eddyho štúdiu, 95 zo 100 zúčastnených lekárov uvádzalo pozitívnu prediktívnu hodnotu testu z príkladu v rozmedzí od 0,7 do 0,8. Pravdepodobnosť, že žena s pozitívnym mamografom skutočne trpí rakovinou prsníka, tak odhadovali na 70 až 80 %. Keďže správnu odpoveď 7,5 % sme už vypočítali vyššie, väčšina participantov sa počas svojich výpočtov zjavne trochu sekla. Čo však spôsobilo takýto výrazný rozdiel medzi ich riešením a hodnotou správnej odpovede?

Pri tomto type problémov máme tendenciu zamieňať si pozitívnu prediktívnu hodnotu s citlivosťou testu, následkom čoho na základe údajov vyvodzujeme nesprávne závery (Garcia-Retamero & Hoffrage, 2013). Obzvlášť v medicínskej oblasti však podobné chyby môžu ľudí zbytočne vystrašiť, takže je na mieste snažiť sa im vyhnúť*. Existuje však aj spôsob, ako dospieť k správnemu výsledku bez toho, aby človek musel nosiť v hlave presný vzorec Bayesovej vety? Odpoveď znie áno a už som ju naznačil na začiatku článku. Kľúčovú úlohu zohráva spôsob prezentácie informácií.


Percentá vs. prirodzené frekvencie

Skutočnosť, že disciplína zvaná matematická pravdepodobnosť je stará len niekoľko storočí (Hoffrage & Gigerenzer, 1998) nabáda k pochybnostiam, či je náš spôsob spracovávania informácií dostatočne vyvinutý na to, aby sme dokázali efektívne „pracovať“ aj s pravdepodobnosťami. Výskumy naznačujú, že naša myseľ sa adaptovala na spracovanie informácií vo forme prirodzených frekvencií (Garcia-Retamero & Hoffrage, 2013).

Prirodzenou frekvenciou je napríklad vyjadrenie, že v určitej populácii žien má rakovinu prsníka len jedna žena zo 100. Túto formu vyjadrenia informácie získame veľmi jednoducho tým, že spočítame jednotlivcov s určitou vlastnosťou (napríklad ženy s rakovinou) a tento údaj vztiahneme k ďalším údajom v rámci riešenej situácie. Príklad z úvodu by teda vo forme prirodzených frekvencií vyzeral nasledovne:

„Na každých 1000 žien vo veku 40 rokov, ktoré sa pravidelne zúčastňujú preventívnych prehliadok, je u 10 z nich prítomná rakovina prsníka (10 z 1000 je 1 %). Spomedzi týchto 10 žien má pozitívny mamograf 8 žien (8 z 10 je 80 %). Hoci zostávajúcich 990 žien rakovinu prsníka nemá, napriek tomu 99 z nich dosiahne pozitívny mamograf (99 z 990 je 10 %). Predstavte si skupinu žien vo veku 40 rokov, ktoré majú pozitívne mamografy. Koľko z nich bude skutočne trpieť rakovinou prsníka?“

Ak ste mali problém dospieť k správnemu výsledku, keď boli informácie v príklade uvedené vo forme percent, teraz by to už malo byť lepšie. Správna odpoveď je takmer očividná. Vidíme, že pozitívny mamograf malo celkovo 107 žien (8 + 99), avšak rakovina bola skutočne prítomná len u 8 z nich (8 zo 107 je po zaokrúhlení 7,5 %). Taktiež aj vzorec na výpočet pozitívnej prediktívnej hodnoty, vyzerá pri použití prirodzených frekvencií omnoho stráviteľnejšie:


-

SP predstavuje počet správne pozitívnych výsledkov testu (8) a FP počet falošne pozitívnych (99).

Keďže forma prirodzených frekvencií robí bayesovské problémy prehľadnejšie, množstvo výskumníkov ju využilo s cieľom zistiť, ako môže dopomôcť k dosahovaniu správnych riešení.


Výskumy

Hoffrage s Gigerenzerom (1998) napríklad požiadali 48 nemeckých lekárov, aby stanovili pozitívnu prediktívnu hodnotu u štyroch diagnostických testov. Lekári mali určiť, s akou pravdepodobnosťou pacient s pozitívnym výsledkom testu skutočne trpí daným ochorením a z poskytnutých informácií mali určiť pravdepodobnosť výskytu rakoviny prsníka pri pozitívnom mamografe**, rakoviny hrubého čreva pri pozitívnom teste na okultné krvácanie***, fenylketonúrie pri pozitívnom Guthrieho teste a ankylozujúcej spondylitízy (Bechterevovej choroby) pri pozitívnom teste na HLA-B27.

Každý lekár dostal dokopy štyri zadania: dve z nich obsahovali informáciu vo forme percentuálnych pravdepodobností a dve vo forme prirodzených frekvencií. Autori účastníkov vyzvali k tvorbe poznámok, výpočtov aj pomocných náčrtkov počas riešenia a systematicky tiež striedali formy aj poradie jednotlivých testov. Keď boli lekári s úlohami hotoví, nasledoval ešte rozhovor o postupoch, ktoré pri riešení zadaní použili. Výsledok riešenia považovali autori štúdie za správny vtedy, keď sa od správneho riešenia cez Bayesovu vetu nelíšil o viac ako 5% a zároveň poznámky, výpočty, náčrty a informácie získané rozhovorom nasvedčovali tomu, že daný lekár odpoveď neuhádol bez počítania.

Nuž a ako to dopadlo? Keď sa údaje prezentovali prostredníctvom percent, ku správnemu výsledku lekári dospeli len v 10 % prípadov. Keď sa však použili prirodzené frekvencie, lekári sa k správnemu výsledku dopracovali až v 46 % prípadov. Ba čo viac, nad riešením zadania s percentami strávili účastníci približne o 25 % viac času, než u zadaní s prirodzenými frekvenciami, pri riešení ktorých tiež vyzerali menej nervózne.

Trochu aktuálnejší výskum Hoffrageho s Garcia-Retamerom (2013) bol o niečo prepracovanejší. Participantov tvorilo 81 lekárov a 81 laikov, ktorí dostali za úlohu odhadnúť pozitívnu prediktívnu hodnotu troch medicínskych testov. Polovica zúčastnených dostala informácie vo forme percentuálnych pravdepodobností, druhá vo forme prirodzených frekvencií. Polovica participantov však dostala okrem číselnej informácie tiež vizuálnu pomôcku, ktorá dané informácie znázorňovala. Ďalšie rozšírenie výskumu predstavoval test, pomocou ktorého autori zisťovali úroveň matematických schopností účastníkov. K akým výsledkom teda dospeli?

Za zdôraznenie stoja tri hlavné zistenia:

• Výsledky lekárov aj laikov boli presnejšie, keď sa im informácie prezentovali formou prirodzených frekvencií (51 % správnych výsledkov), oproti percentuálnym pravdepodobnostiam (38 % správnych výsledkov). Pri zadaniach s prirodzenými frekvenciami boli výsledky lepšie nielen u účastníkov s nízkou, ale aj vysokou úrovňou matematických schopností.

• Participanti s vizuálnou pomôckou dosahovali lepší výkon (62 % správnych výsledkov) ako tí, ktorí mali k dispozícii len číselné informácie (26 % správnych výsledkov). Prítomnosť vizuálnej pomôcky viedla k presnejším záverom aj v prípade, že informácie sa prezentovali formou prirodzených frekvencií. Pomôcka taktiež pomohla zvýšiť v očiach účastníkov vnímanú užitočnosť uvedených informácií, ako aj znížiť vnímanú náročnosť úlohy.

• Diagnostické závery lekárov (53 % správnych výsledkov) boli presnejšie než tie, ktoré robili pacienti (35 % správnych výsledkov). Keď však autori zohľadnili vplyv matematických schopností, tieto rozdiely zmizli.

Za zmienku stojí tiež skutočnosť, že priaznivé účinky využitia prirodzených frekvencií sa v mnohých štúdiách prejavili bez toho, aby boli účastníci akokoľvek trénovaní a inštruovaní v riešení tohto typu problémov (Hoffrage, Lindsey, Hertwig & Gigerenzer, 2000). Pokiaľ ide o špecifický tréning, ten môže pomôcť aj pri zvládaní operácií s percentuálnou pravdepodobnosťou. Pozornosť je však vhodné zameriavať skôr na formu reprezentácie, než na rôzne vzorce a pravidlá. Upraviť si informácie do formy prirodzených frekvencií je predsa len jednoduchšie, než nosiť v hlave Bayesovu vetu. Ale čo je najdôležitejšie, tréningové programy zamerané na aktívny preklad údajov do prirodzených frekvencií, majú podľa záverov viacerých výskumov dlhodobý efekt (Hoffrage, Gigerenzer, Krauss & Martignon, 2002).


Záver

Ako naznačujú výsledky týchto štúdií, prirodzené frekvencie uľahčujú vyvodzovanie správnych záverov pri bayesovských problémoch. Korešpondujú totiž so spôsobom, akým ľudská myseľ spracovávala štatistické informácie po väčšinu svojej evolučnej histórie (Hoffrage, Lindsey, Hertwig & Gigerenzer, 2000). S prirodzenými frekvenciami preto dokážeme pracovať efektívnejšie než s percentuálnymi pravdepodobnosťami, v ktorých nie je priamo vyjadrená informácia o veľkosti základného súboru.

Ak teda zápasíte s nejakým bayesovským problémom, skúste si ho uľahčiť výberom stráviteľnejšej formy reprezentácie informácií. Na vyriešenie podobných problémov pomocou prirodzených frekvencií stačí dodržať nasledujúci postup (Hoffrage, Lindsey, Hertwig & Gigerenzer, 2000):

1) Najskôr si zistíme informáciu, koľko ľudí v príslušnej populácii trpí daným ochorením.
2) Prostredníctvom informácií o citlivosti (senzitivite) testu určíme, koľko ľudí ochorením skutočne trpí a zároveň dosiahne aj pozitívny výsledok diagnostického testu.
3) Prostredníctvom informácií o počte falošne pozitívnych výsledkov určíme, koľko zo zvyšných zdravých ľudí v populácii tiež dosiahlo pozitívny výsledok diagnostického testu napriek neprítomnosti ochorenia.
4) Údaje získané v krokoch 2) a 3) dáme do pomeru, na základe čoho zistíme, koľko ľudí s pozitívnym výsledkom diagnostického testu skutočne daným ochorením trpí. Tým sme sa úspešne dopracovali k správnemu výsledku celého príkladu.

Taktiež môže byť užitočné spraviť si vizuálnu pomôcku, kde všetko podstatné lepšie uvidíme (Garcia-Retamero & Hoffrage, 2013). Pre náš príklad by mohla vyzerať takto:


-

Ak ste teda nikdy nemali v láske percentá a pravdepodobnosti, vďaka prirodzeným frekvenciám už pre vás možno budú o niečo znesiteľnejšie.

* Samostatným fenoménom je myslenie každého človeka - pacienta, ktorý si môže zle vysvetliť a vyhodnotiť význam nálezov. Lekári tomuto problému venujú pomerne málo pozornosti a často nevysvetlia význam a dôležitosť diagnostických postupov. Obavy a strach však u pacienta spúšťajú stres a ten priamo oslabuje funkciu imunitného systému. Nedostatočne a nesprávne podané a vysvetlené informácie predstavujú problém, ktorý celú zdravotnú situáciu iba komplikuje. Ak si teda lekár či pacient nesprávne interpretujú pravdepodobnosť súvisiacu s výsledkami diagnostických testov, môže to viesť ku zbytočnému stresu, ktorému sa dalo predísť.

** Mamografia sa robí ako skríningové vyšetrenie, čo znamená, že cieľom vyšetrenia je zachytiť čo najviac žien s rakovinou (aj za cenu toho, že časť žien s pozitívnym výsledkom rakovinu nemá). Pozitívny test je dôvodom odobratia vzorky na histológiu (biopsia) a až jej výsledky stanovia, či ide alebo nejde o rakovinu a lekár na základe toho rozhodne o cielenej adekvátnej liečbe. Skutočným problémom však môže byť negatívny nález mamografu pri prítomnej rakovine, čiže situácia, že mamograf je negatívny, ale žena v skutočnosti rakovinu má (falošne negatívne vyšetrenie). Bayesova veta sa však dá využiť aj na vypočítanie pravdepodobnosti, s akou negatívny výsledok testu skutočne znamená neprítomnosť ochorenia.

*** Pozitívny test na okultné krvácanie (okom neviditeľná prítomnosť krvi v stolici) je dôvodom na kolonoskopické vyšetrenie, kedy sa celé hrubé črevo opticky prezrie pomocou kolonoskopu a odoberú sa vzorky tkaniva, ktoré sa posielajú na histologické vyšetrenie. Až toto vyšetrenie určí, či ide o rakovinu a prípadne o aký typ, na základe čoho je možné správne zvoliť účinnú liečbu.

Tento článok sme Vám mohli priniesť vďaka podpore na Patreone. Aj symbolický príspevok nám pomôže zverejňovať viac kvalitných článkov.


Zdroje

Garcia-Retamero, R., & Hoffrage, U. (2013). Visual representation of statistical information improves diagnostic inferences in doctors and their patients. Social Science & Medicine, 83, 27-33.

Hoffrage, U., & Gigerenzer, G. (1998). Using natural frequencies to improve diagnostic inferences. Academic medicine, 73(5), 538-540.

Hoffrage, U., Gigerenzer, G., Krauss, S., & Martignon, L. (2002). Representation facilitates reasoning: What natural frequencies are and what they are not. Cognition, 84(3), 343-352.

Hoffrage, U., Lindsey, S., Hertwig, R., & Gigerenzer, G. (2000). Communicating statistical information.

perexový obrázok: pixabay.com

Loading...
Páčia sa Vám naše články? Podporte nás

Zdieľajte článok






Za podporu ďakujeme

Pridať e-mail