Statystyka jako szczepionka na koronawirusa.

To jest pierwsza część nieplanowanego minicyklu. Część drugą – zawierającą link do vloga „Uwaga! Naukowy Bełkot” oraz moją na niego odpowiedź – można znaleźć tutaj. Komentarze do filmu DM usunąłem – odnoszę się do niego w drugiej części wpisu.

– Dlaczego mamy kwarantannę i wyłączoną gospodarkę? – Wiadomo, koronawirus. – Koronawirus co? – Jak to co? Większa zaraźliwość, większa śmiertelność. – A skąd to wiemy? – Z danych. – Ale z jakich danych?

I w tym momencie zaczyna robić się nieprzyjemnie.

W dobie masowej walki z fake newsami, promowaniem nauki, gdzie się tylko da, i opieraniu się wszem i wobec na twardych danych naukowych, w walce z zarazą mamy do czynienia ze zdumiewającą ignorancją na najwyższych szczeblach i z decyzjami podejmowanymi praktycznie bez jakichkolwiek rzetelnych danych.

Nie jestem lekarzem, nie będę wypowiadał się na temat biologii wirusa i mechanizmów jego rozprzestrzeniania się, bo się nie znam. Nie śledzę filmów na YT, demaskujących nienaturalne pochodzenie SARS-CoV-2 i chwilowo nie zastanawiam się, czy zmutował on samoistnie, czy może Chińczycy podrzucili go Amerykanom, czy jednak odwrotnie, a może to WHO nie gra jednak fair; nie umiałbym zresztą takich doniesień ocenić merytorycznie. Od paru tygodni jednak tułam się po przeróżnych forach z dwoma prostymi pytaniami, na które nikt nie chce albo nie potrafi udzielić mi odpowiedzi.

Zacznijmy od absolutnych podstaw. Współczynnik zgonów, stanowiący praktyczną podstawę do jakichkolwiek dyskusji o śmiertelności czy niebezpieczeństwie koronawirusa, a w konsekwencji mający stanowić podstawę do jakichkolwiek decyzji, to ułamek. Licznikiem w tym ułamku jest liczba zgonów, mianownikiem – liczba stwierdzonych zakażeń.

I ani licznik, ani mianownik nie są liczone w sposób, nie budzący wątpliwości. Nie wiemy, ile osób zmarło, nie wiemy, ile osób jest zakażonych. A na podstawie tego braku wiedzy zatrzymujemy całą światową gospodarkę.

Licznik

Czas na pierwsze pytanie, dotyczące licznika ułamka – osób „zmarłych na COVID-19”:

Dlaczego wciąż – pomimo ogłoszenia stanu pandemii przez WHO – brak jednolitych, globalnych miar „umieralności na koronawirusa”, przez co kryteria te są dowolnie stosowane przez poszczególne kraje, co w konsekwencji stanowi o całkowitej nieporównywalności statystyk w poszczególnych krajach i przyczynia się do zwiększania paniki?

Wtrącenie w poprzednim pytaniu zrobiłem nieco na wyrost, bo przejście od epidemii do pandemii nie jest oparte na żadnych liczbach. WHO zmieniło w ostatnich latach definicję pandemii, charakteryzując ją jako rozprzestrzenianie się nowej choroby na całym świecie, przez co – póki co teoretycznie – grozić nam może nawet pandemia kataru. Ale nazwa „pandemia” budzi przecież większy respekt.

Nie kłóćmy się jednak o definicję. Znacznie większe znaczenie ma uznanie, kto właściwie zmarł na koronawirusa. Pomijając szum informacyjny, w świecie daje się zauważyć podział na reguły, które na użytek tego artykułu nazwałem roboczo „szkołą włoską” i „szkołą niemiecką”. Szkoła włoska każe za „zgon na covid” uznać osobę, u której stwierdzono obecność koronawirusa. Szkoła niemiecka – osobę, u której choroby „odwirusowe” stały się główną przyczyną śmierci.

Najbardziej znanym przypadkiem jest jedna z pierwszych ofiar wirusa w Polsce, mieszkanka Łańcuta, u której stwierdzono wirusa, a która zmarła na sepsę po urodzeniu dziecka. W Polsce przypadków takich nie wlicza się do ogólnej liczby ofiar koronawirusa. We Włoszech zostałaby prawdopodobnie do nich zaliczona.

Na ile istotna jest ta różnica? Cóż, mając pełną świadomość potencjalnej niereprezentatywności danych, posłużę się przykładem z Małopolski. W momencie pisania tego tekstu zmarłych „na covid” odnotowano 14 osób, zmarłych „z covidem” – 18. Przyjmę więc nie do końca karkołomne założenie, że zgrubną wielkością „odchyłki” może być około 20%. I to w warunkach społeczeństwa polskiego, odchylonego raczej zdrowotnie „in plus” od np. Włoch.

Pamiętajmy cały czas, że te wartości, wyliczone tak czy inaczej, stanowią podstawę doniesień medialnych, kształtując zarówno naszą percepcję sytuacji, jak i rządowe decyzje. W interesie więc wszystkich winno być jak najbardziej precyzyjne określenie tych wielkości.

Żeby dać ostateczne pojęcie, z jakim niedbalstwem / brakiem kompetencji podchodzi się do liczby zgonów – cytat z onetu: „We Francji liczenie zmieniono na początku kwietnia, aby dodać liczbę zgonów w domach opieki, co spowodowało wzrost liczby ofiar o ponad 3 tys. W Nowym Jorku oficjalna liczba ofiar śmiertelnych koronawirusa gwałtownie wzrosła do ponad 10 tys., kiedy władze zaczęły obejmować osoby, które nie wykazały pozytywnego wyniku testów na COVID-19, ale przypuszczano, że umarły z tego powodu.” A w Hiszpanii opozycja zarzuca rządowi wręcz zaniżanie liczby ofiar.

Mianownik

Na banalnie proste pytanie „Ile osób w Polsce jest zarażonych koronawirusem?” częsta odpowiedź brzmi: „Nie wiemy, ilu, nie mamy tylu testów, żeby przebadać wszystkich”. Bzdura, bzdura, kłamstwo i manipulacja.

Drugie pytanie brzmi więc tak:

Dlaczego – poza kilkoma przypadkami w skali całego świata – nikt nie analizuje wirusa na populacji generalnej?

Do znajomości liczby zarażonych nie potrzebujemy badać wszystkich Polaków. Wystarczy przebadać odpowiednio dobraną losową próbkę Polaków podobnie, jak bada się preferencje polityczne, szacując na jej podstawie odsetek zarażonych w całej Polsce. Kilka takich próbek co kilka dni – i możemy szacować tempo przyrostu zarażonych, uodpornionych i w krótkim czasie opracować realne prognozy przebiegu epidemii oraz – w oparciu o rzetelne dane, nie estymaty – liczyć słynny współczynnik R. Dlaczego nikt nie wykonuje w Polsce takich badań, a zamiast tego jesteśmy z samej góry bombardowani informacjami, że „nie mamy pojęcia, kiedy to się skończy”?

Obliczenie wielkości próbki [czyli ilości testów do przeprowadzenia], dającej miarodajne wyniki, nie jest niczym trudnym dla studenta po pierwszym półroczu statystyki [edit 2020-04-25: …i pamiętającego ze studiów wszystkie zmienne we wzorze 🙂 O skreślony akapit rozsierdził się właśnie słusznie DM. Poprawione wyliczenia znajdziecie w drugiej części wpisu – tutaj wspomnę tylko, że pierwsza próba to ok. 16 tys. osób, potem prawdopodobnie znacznie mniej]. Przykładowy kalkulator ze strony statystyka.az.pl daje nam próbkę 239 osób [N=38m, α=1%, e=5%]. Mówiąc po polsku – tyle losowo wybranych osób należy przebadać w Polsce, żeby z 99% prawdopodobieństwem oszacować liczbę zarażonych na SARS-CoV-2 z maksymalnym błędem w granicach 5%. Metoda ta jest cudowna również dlatego, że pozwala na elastyczną manipulację budżetem – dysponując większym budżetem możemy zrobić więcej testów, co pozwoli nam na osiągnięcie mniejszego marginesu błędu lub większego prawdopodobieństwa osiągniętego wyniku. A nie mając dużych pieniędzy czy wielu testów – możemy skupić się na wersji budżetowej, czyli przeprowadzić badania mniej dokładnie, ale za to taniej. Ale nawet tak uzyskane rezultaty będą o rząd wielkości lepsze i dokładniejsze, niż rządowo-medialne „nie wiemy, kiedy się to skończy”.

„Ale nie ma na to pieniędzy!”

A pieniądze na zamknięcie połowy kraju bez jakichkolwiek danych są?

PKB Polski w 2019 r. to 593 mld USD. Królowa algebra podpowiada proste dzielenie, ale będę łaskawy i zamiast 0.3% dziennie przyjmę 0.2%, czyli na okrągło 1,2 mld USD. Tyle tracimy [znów teoretycznie – nie wszystko przecież jest zamknięte] z racji dziennego lockdownu gospodarki. Zakładając 10 takich badań cyklicznych co kilka lub kilkanaście dni – co pozwoli nam na monitoring tempa pandemii, szybkości zarażania, w miarę dokładnej daty jej szczytu i czego tylko dusza zapragnie – dostajemy 120 mln dolarów na pojedyncze badanie. A dzieląc to na 239 [liczba testów w badaniu] – wychodzi na to, że jeden test na SARS-CoV-2 [z opłaceniem ankieterów, badania, kosztami administracyjnymi, etc.] musiałby kosztować ponad pół miliona dolarów, żeby zamiast ich zrobienia warto było przetrzymać Polskę w śpiączce jeden dzień dłużej, niż jest to absolutnie konieczne. Nawet jeśli okaże się [a pewnie się okaże], że w wyniku dociekliwości bieglejszych w statystyce, testów trzeba jednak wykonać więcej lub dużo więcej, skala i proporcje końcowego rachunku nie zmienią się tak czy inaczej.

Aktualnie jeden test nie kosztuje oczywiście pół miliona dolarów. Kosztuje maksymalnie 500 zł.

Można spierać się, że 1,2 mld dolarów to bzdura, bo przecież nie staje cała gospodarka. Można kwestionować wielkość próby losowej – nie znam się, prawdopodobnie epidemiolodzy mają własną metodologię, wynikającą chociażby z faktu istnienia ognisk zarazy. Nie zmieni to jednak prostej konstatacji – zastosowanie miar i metod statystycznych zaczęłoby zwracać się już wtedy, jeśli dzięki nim lockdown możnaby skrócić choćby o jeden dzień.

Można argumentować, że barierę stanowi liczba wykwalifikowanego personelu do obsługi testów na COVID-19. Można się z tym zgodzić tylko wtedy, kiedy założymy, że w obecnej sytuacji procedury testowe przeprowadzane są zgodnie z regułami sztuki. Tak jednak się nie dzieje – mamy więc sytuację „krótkiej kołdry”, kiedy to możliwości testowe i tak nie wystarczają na pokrycie zapotrzebowania. Rozpoczęcie testów na populacji miałoby natomiast jedną zasadniczą zaletę – zapobiegłoby wstrzymywaniu gospodarki ponad miarę.

IHME szacuje, że „w najgorszych dniach zarazy będzie potrzebnych w Polsce ponad 700 łóżek na oddziałach intensywnej terapii i ponad 600 respiratorów. To grubo poniżej „mocy przerobowych” polskich szpitali, które tych łóżek mają co najmniej 5.000. Nawet gdyby sprawdziła się najbardziej negatywnie „odchylona” prognoza, zakładająca, że w najgorszym dniu będzie potrzebnych aż 1.800 łóżek na intensywnej terapii – szpitale powinny wytrzymać napór chorych na Covid-19.” – pisze Maciej Samcik. A wobec 600 potrzebnych respiratorów Polska ma do dyspozycji 10,000.

Wygląda więc na to, że przez brak powyższych badań spłaszczyliśmy krzywą mocno za mocno, czyli lockdown – w takiej czy innej formie – będzie trwał [co najmniej] kilkanaście dni za dużo. Jak przełoży się to na nasze portfele, inflację i bezrobocie – pozostawię bez komentarza.

„Ale nie ma testów!”

Kolejna bzdura. W zależności od mainstreamowego kanału, w Polsce wykonywanych jest między kilka a kilkanaście tysięcy testów dziennie.

„Naprawdę nikt nie robi testów na populacji generalnej?”

W Polsce – nie słyszałem. Na całym świecie zrobiono półtora testu.

Żartowałem, dwa. Warunki testowania na populacji generalnej spełnia z grubsza test, przeprowadzony w mieście Gangelt w Westfalii, zwanym „niemieckim Wuhan„, gdzie pospołu z zakażonymi bawiono się na festynie. Fakty: śmiertelność w populacji Gangelt wynosi 0.37%. Styczność z COVID-19 miało ok. 15% badanych.

Brakująca „połowa testu” to badania pasażerów i załogi statku wycieczkowego  „Diamond Princess”. 18 marca, półtora miesiąca po stwierdzeniu zarażenia u pierwszego pasażera, zarażenie stwierdzono u 712 osób na 3711 [19,18%], zmarło 10 osób [1,4% zakażonych]. Z racji kwarantanny załogi i pasażerów wycieczkowca dane te mogą posłużyć jako pewien punkt odniesienia – nie udało mi się niestety znaleźć informacji o liczbie osób z wykształconą odpornością, ale fakt, że nawet przy dwudziestoprocentowej zaraźliwości śmiertelność nie szybuje, powinien dać do myślenia. Tym bardziej, że wyniki zarażalności na wycieczkowcu zbliżone są do wyników z Gangelt i dają podstawy do ostrożnego wyciągania ogólniejszych wniosków… Na przykład takich, że słynne już twierdzenie kanclerz Merkel o 60-70% Niemców, którzy zostaną zarażeni koronawirusem może dość mocno mijać się z prawdą.

Pozwoliłem sobie na mały, nieuprawniony eksperyment myślowy. Na moment pisania tych słów – połowa kwietnia – w Polsce zmarły 292 osoby. Covid-19 jest z nami z grubsza od półtora miesiąca. W tym czasie w Gangelt i na „Diamond Princess” zachorowało ok. 20% próby, więc również całkiem arbitralnie przyjąłem, że z racji procedur kwarantanny choruje u nas połowa z tego – 10% ludności, czyli powiedzmy 3,8 miliona osób. Jaki to odsetek zarażonej ludności [o odniesieniu tego do całości populacji nie mówiąc], zostawiam do samodzielnego przeliczenia. Podpowiem tylko, że mniej, niż 0,01%…

Instytut Roberta Kocha zamierza po Wielkanocy uruchomić testy próbek krwi w całych Niemczech, po 5 tysięcy próbek co dwa tygodnie. Pierwsze wyniki mają być znane na początku maja – podaje cytowana wcześniej „Wyborcza”.

Po kilku miesiącach lockdownu…

I jeszcze jedno: podawanie w mianowniku wskaźnika śmiertelności liczby wykonanych, pozytywnych testów na SARS-CoV-2 – poza oczywistym fałszowaniem rzeczywistości – stwarza jeszcze jedną okazję do zaciemniania wyniku. Chodzi mianowicie o sposób testowania. Wielu badaczy zastanawia się, skąd tak duże różnice w śmiertelności pomiędzy Włochami a Niemcami. Jednym z wyjaśnień jest metodologia testowania. Niemcy i Włochy pod tym względem różni praktycznie wszystko, od ilości przeprowadzonych testów i średniego wieku testowanej osoby poczynając. Im starsza osoba, tym większe prawdopodobieństwo zgonu. I na odwrót – im młodszą osobę testujemy, tym mniejsze prawdopodobieństwo, że wraz z mianownikiem zwiększy się licznik, czyli że testowana osoba umrze.

Podsumowując – wszelkie wskaźniki statystyczne koronawirusa w obecnej formie to policzek dla nauki i obraza dla zdrowego rozsądku. A jednak na ich podstawie podejmuje się decyzje, wiążące dla całych państw.

Kreska ułamkowa

Podchodząc do zagadnienia czysto technicznie, bez uprzedzeń i założonych tez, wyjaśnienia tak zdumiewającej ignorancji w tak podstawowych sprawach [nie mam na myśli pandemii per se, tylko reakcje „czynników oficjalnych”] mogą być dwa: głupota lub premedytacja. Z góry oświadczam, że pierwsze jest praktycznie nie do obrony – technicznie nie jest po prostu możliwe, żeby niemal żaden rząd na świecie nie miał w swoich szeregach osoby, która choćby otarła się o zagadnienia statystyczne na poziomie kursu podstawowego.

Jak mawiał Arthur Conan Doyle, „Gdy odrzucisz to, co niemożliwe, wszystko pozostałe, choćby najbardziej nieprawdopodobne, musi być prawdą.” A ciekawym zajęciem może w tych czasach być odstawienie „przekazu dnia” i rzut oka na „wydarzenia towarzyszące”.

W świecie bez stabilnego systemu monetarnego [a takie oparcie dawał tylko system oparty na złocie] kryzysy zdarzają się średnio raz na 8-9 lat. Od 2008 roku upłynęło nieco więcej czasu, a stan pandemii jest wprost idealną okazją do wyciśnięcia z kryzysu, ile się da, i to bez „skutków ubocznych” – szczególnie mocno polecam ten materiał. Z czystym sumieniem można teraz rozłożyć ręce i powiedzieć: „To nie my, to zaraza…”. Dla każdego coś „miłego”:

  • dla strażników wolności obywatelskich – aktualne uprawnienia dla Policji, straży miejskiej czy ograniczenia swobód nie tyle ograniczają nasze prawa w oparciu o „siłę wyższą”, ile są zwyczajnie bezprawne,
  • dla aktywistów – manewry dokoła terminu wyborów,
  • dla osób z zainteresowaniami ekonomicznymi – stosowane „tarcze” powodują pogłębianie odmętu dalszego zadłużania społeczeństw na rzecz najbogatszych. Senat USA na przykład wyłączył do końca roku posiedzenia FED spod zakresu działania tzw. Sunshine Act, czyli – mówiąc ogólnie – prawa o informacji publicznej,
  • dla krytyków systemu bankowego – za oceanem opad rąk budzi relacja wielkości wsparcia dla np. biznesu lotniczego [4 mld USD] do [kolejnego] praktycznego bailoutu banków [454 mld USD]. Linie lotnicze z dnia na dzień potraciły większość swoich przychodów, niemal całkowicie zamarł ruch pasażerski – a jednak okazuje się, że sto razy więcej od nich straciły… banki!,
  • na polskim podwórku – kontrast pomiędzy szybkością decyzji NBP o stopach procentowych, w efekcie czego jesteśmy krajem, w którym najbardziej na świecie nie opłaca się oszczędzać, a utrzymującą się niepewnością choćby co do decyzji ZUS o zniesieniu składek za 3 miesiące dla przedsiębiorstw poniżej 9 osób,
  • dla łowców fake newsów – bezzasadne sianie paniki i kłamliwe przedstawianie ofiar katastrofy łodzi z 2013 r. jako rzekomych ofiar koronawirusa,
  • dla etyków – powrót metody triażu i jego nowej odmiany hiszpańskiej, selekcji najbardziej wartościowych społecznie,
  • dla wierzących – wymuszone pustki w kościołach, wracające spory doktrynalne i dalsze pogłębianie podziałów,
  • dla psychologów – alienacje, uzależnienie dzieci od internetu, wzrost przemocy domowej i pogłębianie uzależnień.

I tak dalej, i tym podobne; przykłady można mnożyć w nieskończoność.

Powtórzę: to NIE SĄ „obiektywne skutki pandemii”, nad którymi należałoby rozłożyć bezradnie ręce i przejść do porządku dziennego. Tak mówią decydenci. To są konsekwencje działań, podjętych w sytuacji braku rzetelnych danych. Wszystko to, co powyżej, obciąża osoby, które – z głupoty lub z premedytacji – popełniają grzech zaniedbania zebrania podstawowych danych.

Tak wygląda świat bez nauki, o którą przed wybuchem pandemii biło się pół internetu.

Nawiasem mówiąc, Daniel Kahneman – laureat Nagrody Nobla z ekonomii – w swojej rewelacyjnej książce „Pułapki myślenia” dokonuje ciekawego spostrzeżenia: komunikaty o wielkościach, mające uwrażliwić nas na zagadnienie, eksponują wartości bezwzględne [czyli liczby]. Jeśli chcemy, żeby komunikowana wielkość miała mniejsze znaczenie dla odbiorcy, należy użyć wartości procentowych. Dużo mniejsze wrażenie robi na przykład informacja, że samobójstwa stanowią 1.40% ogółu przyczyn śmierci na świecie [do czego jeszcze wrócę], niż że od początku roku samobójstwo popełniło ok. 250 tysięcy osób, prawda? W jaki sposób media przekazują nam w większości informacje o koronawirusie – procentowo czy w wartościach bezwzględnych – pozostawiam ocenie Czytelników.

„To co mamy robić?”

Zdecydowanie naciskać na zbieranie rzetelnych danych jako podstaw do podejmowania racjonalnych decyzji – jak najszybciej! Domagać się od mediów, rządu, decydentów statystycznych podstaw każdej decyzji – szczególnie tych, godzących bezpośrednio w nasze portfele. Bez takich danych sens wydaje się mieć jedynie zakaz większych zgromadzeń, social distancing i nakaz maseczek. Każda inna decyzja świadczy o braku odpowiedzialności i szerszego spojrzenia na świat. Na szczęście problem zaczyna być dostrzegany przez zawodowców od analizy danych, choć powoli i z dużym opóźnieniem – ale czy nie jest już na to za późno?

Bez wiarygodnych statystycznie, realnie szacujących ryzyko badań, wprowadzanie czy przedłużanie dalszych ograniczeń osobistych czy gospodarczych staje się działaniem z pogranicza sabotażu i krańcowego idiotyzmu. Czy naprawdę stać nas na to, żeby z powodu choroby o hipotetycznej śmiertelności rzędu np. 0.5% wstrzymywać całą gospodarkę światową na dalszy rok? W imię mantry „nie wiadomo przecież, ile to jeszcze potrwa”?

„A Włochy?”

Na najgorsze, włoskie statystyki ma wpływ kumulacja kilku czynników, właśnie niekoniecznie powiązanych ściśle z samą pandemią:

  • „duży licznik”, czyli zaliczanie do ofiar COVID-19 również zmarłych z innych przyczyn, w których organizmach po prostu stwierdzono obecność koronawirusa,
  • „mały mianownik”, czyli niewielka liczba testów, która zawyża współczynniki śmiertelności, przeprowadzanych dodatkowo głównie w grupach wysokiego ryzyka,
  • relatywnie wiekowe społeczeństwo włoskie,
  • brak zachowania nawet podstawowych środków ostrożności osobistej – z największym zaniedbaniem, jakim było dopuszczenie do meczu LM Atalanta – Valencia [co nawiasem mówiąc przyczynić się również mogło do „statystyk” hiszpańskich – tuż obok idiotycznej decyzji o dopuszczeniu do marszu 100 tysięcy feministek].

Włochy potwierdzają tylko moją smutną tezę – wysokie współczynniki śmiertelności wyglądają dramatycznie, ale nie ma żadnych podstaw do wyciągania na ich podstawie wniosków na np. populację innych krajów europejskich. Ciekawym kontrprzykładem może być Szwecja, gdzie na przekór kasandrycznym prognozom nie dzieje się nic albo prawie nic. Co polecam pod rozwagę tym, którzy jak ognia piekielnego boją się „niewielerobienia”.

„Nie zamierzasz ratować swojej rodziny?”

I takie pytanie pada zawsze, prędzej czy później.

Owszem, zamierzam – co do izolacji grupy szczególnego ryzyka, którą są osoby starsze, zgadzają się wszyscy. Z zachowaniem rozsądku, rozglądając się dokoła. A każdego, stawiającego sprawę w ten sposób, proszę o odpowiedź na poniższe:

  • jaka jest różnica dla zdrowia pomiędzy izolowaniem starszych i rozsądnym „distancingiem” całej reszty, a izolowaniem starszych i zamykaniem połowy kraju?
  • jaki sens będzie mieć ratowanie starszych przez zamykanie całej Polski, jeśli za pół roku braknie pieniędzy i pracy na zakup lekarstw dla uratowanych pół roku wcześniej?
  • czy wołał(a)byś tak samo za drakońskimi środkami ostrożności, gdyby okazało się, że po wprowadzeniu jednolitych statystyk media nie mogą straszyć cię już dłużej 15% śmiertelnością wśród seniorów, tylko wskaźnikiem na poziomie zbliżonym lub niewiele większym od zwykłej grypy, powiedzmy 2-3%? Czy z powodu dwu- lub trzyprocentowej śmiertelności – i to tylko w najbardziej narażonej grupie! – też zamykasz centra handlowe, zakazujesz zakupów w galeriach i ograniczasz udział we Mszach do pięciu osób?
  • czy aby na pewno walka o te kilka punktów procentowych prawdopodobieństwa warta jest wielomiesięcznego braku kontaktu z żywym człowiekiem?

Last but not least – aktualnie ofiarą koronawirusa padło na świecie ok. 146 tys. osób [oczywiście z wszystkimi zastrzeżeniami jak powyżej, z kwalifikacją ciał zmarłych „z koronawirusem” jako zmarłych „na koronawirusa”, realna liczba zgonów jest więc prawdopodobnie dużo niższa]. W tym samym czasie dwudziestkę najczęstszych przyczyn zgonów na świecie otwierają zgony przy porodzie, stanowiące YTD przyczynę ok. 220 tysięcy zgonów, czyli ok. 1.23% całości. Niechlubne pierwsze miejsce przypada chorobie wieńcowej, odpowiedzialnej za 2.7 mln zgonów od początku roku, tj. ponad 15%.

Przy całej świadomości nieszczęścia indywidualnych przypadków – czy ktokolwiek słyszał o zamknięciu choćby jednego sklepu czy kawiarenki dla zmniejszenia liczby wypadków samochodowych [425 tys. ofiar od początku roku], samobójstw [250 tys.] czy chorób nerek [360 tys.]?

Coda

Nie wolno się bać, strach zabija duszę.
Strach to mała śmierć, a wielkie unicestwienie.
Stawię mu czoło.
Niech przejdzie po mnie i przeze mnie.
A kiedy przejdzie, odwrócę oko swej jaźni na jego drogę.
Którędy przeszedł strach, tam nie ma nic.
Jestem tylko ja.

[FH, „Diuna”]

Na koniec zostawiłem trzy chyba najciekawsze linki:

Do czego może doprowadzić nadmierny strach i brak obserwacji tego, co dzieje się za kulisami, można przeczytać w eseju „Kto zyska na zniszczeniu gospodarki?”.

Wątpliwości – w eseju Johna Ioannidisa z Uniwersytetu Stanford o podejmowaniu decyzji bez danych.

A jak zwalczać zarazę, opierając się na danych, które mamy, w szczególności o efektach różnych podejść do budowania odporności stadnej – w artykule „No, epidemics do not stop by Magic”.

Patrzmy rządom na ręce, ufajmy nauce i Opatrzności.

10 myśli w temacie “Statystyka jako szczepionka na koronawirusa.

  1. > Przykładowy kalkulator ze strony statystyka.az.pl daje nam próbkę 239 osób [N=38m, α=1%, e=5%]. Mówiąc po polsku – tyle losowo wybranych osób należy przebadać w Polsce, żeby z 99% prawdopodobieństwem oszacować liczbę zarażonych na SARS-CoV-2 z maksymalnym błędem w granicach 5%.

    Bynajmniej. Po pierwsze, nie wybranych losowo, tylko z reprezentatywnej próbki – a takiej nie da się dobrać, bo nie znamy wystarczająco dobrze prawidłowości zachorowań; poza tym epidemia to nie preferencje partyjne, które rozkładają się względnie stabilnie i przewidywalnie, tylko proces mocno chaotyczny i podatny na efekt motyla, więc „sondażowe” badanie nawet przy wzorowo dobranej próbce może dać mocno zafałszowane wyniki. Po drugie, te 5% błędu to nie procenty, tylko punkty procentowe, więc dopóki nie mamy parunastu procent zakażonych, dopóty badanie z błędem takiego rzędu będzie wróżeniem z fusów – a jak już będziemy mieć, to i bez badań będziemy wiedzieć, że coś się dzieje.

    > Pozwoliłem sobie na mały, nieuprawniony eksperyment myślowy. Na moment pisania tych słów – połowa kwietnia – w Polsce zmarły 292 osoby. Covid-19 jest z nami z grubsza od półtora miesiąca. W tym czasie w Gangelt i na „Diamond Princess” zachorowało ok. 20% próby, więc również całkiem arbitralnie przyjąłem, że z racji procedur kwarantanny choruje u nas połowa z tego – 10% ludności

    Masz rację – ten eksperyment myślowy jest bardzo nieuprawniony. Państwo to nie wioska ani statek, gdzie przez parę tygodni mogli się zetknąć dosłownie wszyscy ze wszystkimi, więc procent zakażonych po tym samym czasie nie ma prawa być tego samego rzędu – zwłaszcza że izolację (nie od razu całkowitą, ale jednak) zaczęliśmy stosować na bardzo wczesnym etapie epidemii. No i jeśli przyjąć aż tak gigantyczne niedoszacowanie liczby zakażonych, to czemu nie bierzesz pod uwagę niedoszacowania liczby zmarłych? Nie widzę powodu, dla którego Polacy mieliby być o kilka rzędów wielkości odporniejsi niż pasażerowie DP czy mieszkańcy Gangelt, a
    nawet ten 1% z 10% powinien się przełożyć na prawie 40k zgonów – wystarczająco dużo, żeby było to wyraźnie widać w statystykach. O ile wiem, niczego podobnego na razie nie obserwujemy.

    > Ciekawym kontrprzykładem może być Szwecja, gdzie na przekór kasandrycznym prognozom nie dzieje się nic albo prawie nic.

    „Prawie” może robić dużą różnicę. Szwecja na razie ma „tylko” jedne z gorszych statystyk w Europie, ale dzienna liczba zakażeń ciągle wykazuje tam tendencję wzrostową, w najlepszym razie zbliżając się do szczytu, podczas gdy sąsiednie państwa generalnie mają już z górki. Niewykluczone, że sobie poradzą i wyjdzie im to na zdrowie, ale na razie jeszcze za wcześnie, żeby cokolwiek wyrokować. No i weźmy pod uwagę, że Szwedzi i bez pandemii prowadzili tryb życia podpadający według naszych norm pod social distancing, a obecne skromne ograniczenia przynajmniej po części kompensują paranoicznym dezynfekowaniem wszystkiego, więc uważałbym z przenoszeniem ich doświadczeń na nasze warunki.

    > Przy całej świadomości nieszczęścia indywidualnych przypadków – czy ktokolwiek słyszał o choćby lekko podobnych środkach ostrożności czy prewencji w przypadku wypadków samochodowych [425 tys. ofiar od początku roku], samobójstw [250 tys.] czy chorób nerek [360 tys.]?

    Wypadki, samobójstwa i choroby nerek nie są zaraźliwe, więc nie istnieje ryzyko, że ich liczba nagle skoczy pod sufit, wywracając wszystko do góry nogami. Poza tym umyka Ci jeszcze ten szczegół, że na każdy zgon przypada co najmniej kilkunastu chorych wymagających hospitalizacji, więc bez środków bezpieczeństwa możemy łatwo rozwalić służbę zdrowia całkowicie – np. wspomniane w notce 10k respiratorów wystarczyłoby ledwie dla ćwierci promila Polaków, ktoś te respiratory musi obsługiwać i tak dalej, a leczenie trwa tygodniami – już obecnie są obawy, że z powodu niedostatecznej opieki medycznej może umrzeć więcej chorych na inne choroby niż na samego koronawirusa.

    Co do reszty – w kwestii karygodnego braku standaryzacji całkowicie się zgadzam, rozbieżności liczb i proporcji między państwami bywają z tego powodu absurdalne i pewnie wiele miesięcy minie, zanim ktoś na serio ogarnie to wszystko i wyciągnie sensowne wnioski. Jak zwykle mawiam w podobnych sytuacjach: standardy są po to, żeby każdy miał własny.

    Natomiast co do ogólnego przesłania notki – nie wykluczam, że faktycznie szwedzkie podejście okaże się w dłuższej perspektywie lepsze, ale cały Twój wywód opiera się wyłącznie na optymistycznych założeniach (z wyjątkiem gospodarki, gdzie założenia przyjmujesz pesymistyczne) i tylko przy takich daje się obronić. Wobec największej pandemii w historii bezpieczniej być jednak pesymistą. Jeśli przesadzimy z izolacją, to dodatkowe promile czy procenty straconego PKB da się odrobić w niedługim czasie, natomiast w przeciwnym wypadku, jeśli zawali się służba zdrowia (a personel medyczny już i tak jest masowo pozarażany koronawirusem) i stracimy kontrolę nad sytuacją, to konsekwencji lepiej sobie nawet nie wyobrażać…

    Polubienie

    1. 1. Dobór odpowiedniej próby, spełniającej kryteria, o których piszesz, to kwestia techniczna. Zwiększasz poziom ufności, zmniejszasz błąd… do wyboru, do koloru. A – jak pisałem – nawet najbardziej „orientacyjne” wyniki lepsze są od błądzenia we mgle: po prostu TRAGICZNE jest to, że w 38m państwie nikt nie jest w stanie wypowiedzieć się, czy nosicieli jest 500k, 2 miliony czy może 10 milionów!

      2. Szwecja – naprawdę polecam ang. link z końca notki. Facet wziął dostępne dane z jeszcze większym zacięciem i generalnie ichniejsza strategia dobra jest.

      3. Respiratory i inne – no właśnie chodzi o to, że te dramaty z niedoborami są pochodną paniki. Bardzo upraszczając: jeśli wszystkie środki kierujesz na izolację grup ryzyka, to zamiast np. 3/4 szpitala wysyłać na kwarantannę pozwalasz im pracować w sterylnych warunkach, w kombinezonach, etc., mniejszy nacisk kładąc na zapobieganie wzajemnej zarażalności. Odciążasz choćby służby, oddelegowane aktualnie do kontroli osób na kwarantannie.

      4. Inne przyczyny śmierci mają „tylko” inną specyfikę. Samobójstwem się faktycznie nie zarazisz – ale za to koronawirus nie pojawi się z niczego na niezainfekowanym dotychczas terenie. A odsetek np. śmierci wskutek chorób nerek nie zmniejszy się za to w ciągu parunastu tygodni.

      5. https://wiadomosci.gazeta.pl/wiadomosci/7,127561,25881116,chorych-na-koronawirusa-moze-byc-50-razy-wiecej-niz-myslimy.html Mianownik znów 50x większy…

      Polubienie

  2. 1. Oficjalny odsetek zakażonych mamy na poziomie ćwierć promila ludności. Rzeczywisty niewątpliwie dużo większy, ale raczej nie o parę rzędów wielkości, bo wtedy byłoby to już widać po liczbie chorych. Żeby więc uzyskać wynik choćby aspirujący do miarodajności, trzeba by robić tysiące testów, a my i tak ledwo wyrabiamy z testowaniem potrzebujących. Nie tędy droga.

    2. Jak słusznie stwierdza sam autor: „We need a good model of the situation to be able to make good decisions” – ale dobrego modelu jeszcze nie mamy i nie zbudujemy go inaczej niż na doświadczeniach kolejnych miesięcy. Poza tym nasza służba zdrowia już od jakiegoś czasu robi bokami i ja bym granic jej możliwości raczej nie chciał sprawdzać.

    3. Akurat respiratory nie mają nic wspólnego z paniką – nikt nie podłącza do nich pacjentów na wszelki wypadek, tylko w razie konieczności.

    4. https://iheartintelligence.com/wp-content/uploads/2020/04/all-those-coronavirus-memes-we-feel-bad-laughing-at.jpg

    5. Ochotnicy to nie próbka losowa – do testów zapewne chętniej zgłaszały się osoby, które miały jakiś kontakt z zakażonymi, a przy niskim odsetku nawet niewielkie zaburzenie może wypaczyć wyniki.

    Polubienie

  3. 1. No właśnie nikt nie wie, czy dużo wyższy odsetek byłoby widać po liczbie chorych! Może mają przeciwciała, może już przechorowali, może R jest przereklamowane? Zauważ zresztą, że testy też przeprowadza się w grupach nadmiernie narażonych na infekcję.

    A jeśli nie przekonuje Cię, że na badania na populacji nas nie stać, PONIEWAŻ inni potrzebują tych testów – poczytaj jeszcze raz o argumentach ekonomicznych. Poranny Samcik atakuje mnie np. informacją, że w tym roku możemy pożegnać się z urlopami za granicą. Pada choćby cały przemysł turystyczny i połowę rozrywkowego, tak na szybko – w tym kontekście argumentacja, że turystyka stoi i stać będzie, bo nie ma testów na p.g., jest z gatunku wiadomego.

    Szumowski na swoim stołku wydaje się być kompetentny – nie wiem, nie znam się. Ale krajem nie ma rządzić minister zdrowia, tylko mąż stanu, który ogarnie sytuację CAŁOŚCIOWO. Fakt, że w skali całego świata można policzyć takich na palcach jednej ręki, to raczej słabe pocieszenie… już lepsze jest to, że jak padną wszystkie kina, to razem z nimi Helios, a jak padnie Helios, to się michnikówka wyprokreuje również 😀

    2. Służba zdrowia w Szwecji również uskarża się na brak personelu, więc też nie ma kolorowo. Poza tym powtarzam do znudzenia – na razie nie dzieje się tam nic poważnego.

    Na marginesie – nie zastanawia Cię lekko dostrzegalna zmiana narracji? Jeszcze jakiś czas temu było dużo hałasu o odporność stadną, teraz coraz oficjalniej mówi się o różnych lockdownach „do czasu wynalezienia szczepionki”. Potrafisz to jakoś uzasadnić poza tym, że w przeciwieństwie do odporności stadnej, „czasem wytworzenia szczepionki” łatwiej zarządzać?

    3. Z respiratorami masz oczywiście rację, poniosło mnie. Ale chodziło mi o „… i inne”.

    4. Wrzuciłeś nieaktualną wersję obrazka, służę nowszą – nawet też wpasowuje się w kontekst:
    https://mistrzowie.org/753061/Godzilla

    5. Tak krawiec kraje, jak mu sukna staje. Właśnie próbuję przekazać, że jesteśmy skazani na wnioskowanie ze strzępków i że podejmowanie zbyt ważkich decyzji w sytuacji braku danych jest co najmniej kuriozalne.

    btw. Starałem się mocno podlinkować teksty, żeby nikt mi nie zarzucił wysysania z palca, ale teraz widzę, że najwartościowsze linki giną w nadmiarze. Poza dwoma z samego dołu do kompletu warto chyba przeczytać jeszcze https://www.statnews.com/2020/03/17/a-fiasco-in-the-making-as-the-coronavirus-pandemic-takes-hold-we-are-making-decisions-without-reliable-data/

    Polubienie

  4. 1. Biorąc pod uwagę statystyki z Diamond Princess, stosunek chorych do zakażonych jest wystarczająco duży, żeby było widać – chyba że zakładamy jakąś uberodporność Polaków. A turystyka i parę innych branż będzie leżeć i kwiczeć niezależnie od wszystkiego – nawet bez zakazów ludzie nie rzucą się w najbliższym czasie na wycieczki do Włoch i inne tego typu atrakcje.

    2. Jeśli w bogatym państwie, które w przeciwieństwie do nas nigdy nie oszczędzało na służbie zdrowia, zaczyna brakować personelu, to śmiem twierdzić, że jednak coś poważnego się dzieje. A dzienna liczba zakażeń ciągle rośnie i dopóki nie zobaczę zmiany trendu, entuzjazmu wobec szwedzkiego podejścia nie okażę.

    5. Decyzja o braku lockdownu jest równie ważka, jak decyzja o jego wprowadzeniu, więc argument jest obosieczny. Które rozwiązanie jest lepsze, będziemy mogli z pewnością stwierdzić najwcześniej za parę miesięcy – na razie ze statystyk można przy odrobinie wysiłku wyspekulować prawie wszystko.

    Polubienie

  5. szanowny Torero zachęcam do polemiki z Dawidem, przeglądałem artykuł i film. Łatwo pokazać na danych z filmiku, że z wzorem i liczbami jest wszytko ok. Moim zdaniem badanie kilkuset osób ma sens, nawet dla następujących parametrów Szacowana wielkość frakcji (P) =50 (max), poziomu istotności 1% Dopuszczalny błąd = 5 punktów % wychodzi 664 dla 38 mln, wydaje mi się że takie badania były już robione na świecie próby ok 1 tyś. (dla Polski to 50 frakcja, 1%istot, 4% błąd, 38 mln pop) Nie zgadzam się ze sposobem interpretowania wzoru przez Dawida bo zapomniał on o błędzie, który sam założył we wzorze, co innego błąd 5% przy badaniu choroby, o której nie wiemy dokładnie ile ma% a co innego 5% błędu przy 1,3% znanych w populacji wtedy uzyskany wynik 0% mieści się wg wzoru w błędzie i przeliczanie wartości względnej na jedną liczbę to słaby pomysł.
    Proszę się nie poddawać i walczyć w imię nauki!

    Polubienie

  6. Robisz niskiej jakości artykuły, zostałeś publicznie zaorany zarówno Ty jak i Twoja ograniczona wiedza w temacie.

    Przeczytanie paru wpisów na Twoim blogu i opisu Twojego profilu na Joemonster wskazuje na to że jesteś dość zadufanym w sobie i przekonanym o swojej wiedzy osobnikiem. To Twój wybór.

    Bardzo Cię proszę, nie szerz fałszywych informacji, a przed wypowiedzią na jakikolwiek temat dowiedz się czegoś o nim i bazuj na sprawdzonych informacjach. Szerzysz niewiedzę, powodujesz panikę, piszesz teksty bardzo nacechowane. To wszystko jest zwyczajnie szkodliwe.

    Polubienie

Dodaj komentarz