Benačić: Matematičari koji manipuliraju popisom žrtava Jasenovca

Neven Elezović i Nikola Banić s FER-a tvrde da su dokazali da je popis žrtava ustaškog logora Jasenovac fabriciran. To nije točno.

Autor udžbenika iz matematike za djecu, profesor Neven Elezović i programer doktor Nikola Banić, obojica s Fakulteta elektrotehnike i računarstva (FER), ove su godine opetovano u javnosti širili netočnu tvrdnju da su matematičkim putem dokazali kako je lista stradalih u ustaškom logoru smrti u Jasenovcu fabrikacija.

Prema njihovom tumačenju, na listi žrtava Jasenovca objavljenoj na stranicama Američkog memorijalnog muzeja Holokausta (USHMM) ima previše ljudi čija godina rođenja završava nulom ili dvojkom.

Ovu navodnu diskrepanciju ilustriraju usporedbom s godištima rođenja žrtava koncentracijskog logora Auschwitz. Distribucija godina rođenja ljudi pogubljenih u Auschwitzu je “glatka”, za razliku od one s popisa žrtava Jasenovca.

S druge je strane vizualizacija koju Elezović i Banić nazivaju “jasenovačkim ježom”.

Ova jednostavno objašnjiva anomalija koju Elezović i Banić u javnosti prezentiraju kao dokaz da je spisak jasenovačkih žrtava “potpuno lažan i neupotrebljiv” objavljena je u sklopu rada “TVOR: Pronalaženje izdvojenica među histogramima na temelju diskretne totalne varijacije“, u IEEE Accessu. Radi se o međunarodnom znanstvenom časopisu otvorenog tipa u vlasništvu Međunarodnog udruženja elektronike, računarstva i informacijskih tehnologija.

O matematičkoj istini i nepostojanju diskusije

Od brojnih nastupa doktorskog dvojca i odjeka članka o TVOR-u [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] izdvojit ćemo Elezovićevo gostovanje u emisiji Budnica u koju se uključio i Banić. Profesor Elezović u 6. minuti nastupa pokušava termin (historijski) revizionizam rasteretiti negativne konotacije. Revizionizam je, navodi, “imanentan znanosti” i bez njega nema napretka. Kao analogiju koristi priču o znanstvenim revolucionarima Galileu Galileiju te Isaacu Newtonu, revizionistima prijašnjih tumačenja prirodnih zakona. U 31. minuti objašnjava otkriće, uspoređujući Auschwitz i Jasenovac.

U Auschwitzu vidimo zakonitost i pravilnost u ponašanju, gdje se susjedni podaci ne razlikuju puno… To znači da su ti podaci poprilično vjerodostojni. Ne možete na prvi pogled vidjeti odstupanja. I onda kad je meni Nikola (Banić) pokazao ovaj dijagram… Ovo je jasenovački jež. Ja sam ga tako nazvao zbog ovih bodlji na dijagramu. Dakle, to je jedan potpuno neprirodan niz podataka po kojemu je u jednoj godini, 1900. imate 150% više podataka nego u susjednom godištu.

Kada govorimo o netočnostima iz ovog nastupa, važno je napomenuti da već u 9. minuti videa, Elezović poriče da je moguće uopće diskutirati s “matematičkim istinama“, a samu znanost povijesti reducira na iznošenje mišljenja.

Interesantno je da nije bilo nikakvih suprotstavljanja druge strane. Za razliku od povjesničarskih radova gdje čovjek iznosi neku svoju hipotezu, interpretaciju, neko svoje mišljenje – o mišljenju se uvijek da raspravljati, diskutirati… Za razliku od toga, matematička je istina druge vrste, druge naravi. O njoj nema diskusije. Ona ako je jednom izvedena i ako se pokaže da je istinita, ako prođe provjeru stručnjaka koji kaže – jest, to je u redu, o tome nema diskusije.

Diskusije ipak ima

Ova Elezovićeva tvrdnja ne može biti dalje od zbilje. Diskusija još traje, i to na inicijativu Elezovića i Banića. Njihov članak u IEEE Accessu je još proljetos dobio uredničku napomenu, koja upućuje na komentar Melkiora Ornika iz Laboratorija za koordiniranu znanost Sveučilištu u Illinoisu, Urbana-Champaign.

Pored poduljeg objašnjenja, na kraju tog rada postoje pitanja i odgovori u kojima Ornik vrlo plastično objašnjava zašto je TVOR neprikladan za analizu podataka iz Jasenovca. Drugim riječima, pojašnjava zbog čega je Elezovićeva i Banićeva navodna “matematička istina” najobičnija revizionistička fabrikacija.

Krajem studenog 2021. sami Elezović i Banić su u obliku predobjave na portalu arXiv objavili svoj odgovor na Ornikov komentar (ušavši time upravo u onakvu diskusiju za koju Elezović kaže da se o “matematičkim istinama” ne može voditi). Sudeći po naslovu, “Odgovor na komentar” napisan je da bi bio objavljen u IEEE Accessu. No, pitanje je hoće li se to dogoditi.

Uredništvo IEEE Accessa je, naime, poručilo da je zgroženo javnim istupima Elezovića i Banića tijekom kojih su relativizirali genocid u Jasenovcu.

Jednostavno objašnjenje bodlji

Za medijsku manipulaciju člankom objavljenim u IEEE Accessu, uredništvo tog časopisa je saznalo zahvaljujući pismu dvadesetak istraživača iz područja humanističkih znanosti, primarno povjesničara s ovih prostora. Među potpisnicima su i Ognjen Kraus, koordinator Židovskih općina u Hrvatskoj te Ivo Pejaković, ravnatelj Spomen-područja Jasenovac.

Potpisnici su IEEE Access upozorili i na napore koje Elezović i Banić već neko vrijeme poduzimaju na terenu povijesti, sukobljavajući se s mainstream historiografijom kada je u pitanju Jasenovac. Tri godine prije objave rada u IEEE Accessu, Nikola Banić je popis žrtava logora Jasenovac nazvao “masovnom prevarom“.

U samom članku o TVOR metodi Elezovića i Banića, govori se o “zatvorenicima” ovog konc logora, a ne o njegovim žrtvama, ističu povjesničari. Nadalje, autori TVOR-a potpuno ignoriraju povijesni kontekst nastanka spiska, pogotovo činjenicu da su ustaške vlasti uništavale arhive vezane za Jasenovac.

Elezović i Banić, primjerice, za “zlatni standard” distribucije godina rođenja uzimaju popis stanovništva u Njemačkoj iz 1939. godine. Logistiku koju je ta država imala popisujući stanovništvo i preciznost koju je time postigla, nemoguće je primijeniti ili očekivati u slučaju Jasenovca.

“Popis žrtava Jasenovca prikupljen je u rasponu od 72 godine, a godine rođenja žrtava često je bilo teško rekonstruirati, jer su cijele obitelji i sela stradala”, pojašnjavaju potpisnici pisma, zaključujući da bi ova činjenica mogla “objasniti veći broj okruglih godina rođenja koje završavaju s nulom, budući da su vjerojatno zaokruženi zbog nedostatka preciznih informacija”.

Ornikov komentar

Paralelno i bez ikakvog kontakta s potpisnicima ovoga pisma, na drugom je kraju svijeta nastajao Ornikov komentar. Urednik časopisa IEEE Access Derek Abbott će upravo Ornikovu reakciju uvrstiti u napomenu koja ide uz članak Elezovića i Banića.

Napomena urednika: Čitatelji su izrazili zabrinutost zbog ovog članka i konteksta u kojem se o njemu javno raspravlja. Ne dijelimo niti podržavamo stavove autora. Članak treba čitati zajedno s ovim objavljenim komentarom: “Komentar na ‘TVOR: Finding Discrete Total Variation Outliers Among Histograms'” Melkiora Ornika.

Orniku, naime, gomilanje godina oko dvojke i nule nije nikakav znak za alarm.

“Ljudi naravno nisu znali točne godine rođenja žrtava”, kaže nam Ornik, “pa bi je ili zaokružili na najbliže desetljeće (čime je objašnjena 0) ili zaokružili dob smrti na najbliže desetljeće. Kako je najveći broj zarobljenika umro upravo 1942. godine u usporedbi s drugim godinama, to objašnjava zašto godine rođenja završavaju na 2”.

To ilustrira i poljskim primjerom iz Memorijalnog muzeja Holokausta, konkretnije nacističkog geta za Židove i Rome otvorenog nakon okupacije. Može ga se pronaći pod nazivom “USHMM ID 40168, blok A 32 Hohensteiner Str. br. 42, Łódź geto“. Ovako izgleda distribucija godina stradalih ondje:

“Taj spisak ima više od polovice ljudi koji su rođeni 1900. godine. Naravno, autori TVOR-a ne spominju taj popis kada su u pitanju šiljci”, zaključuje Ornik, dodajući da ne smatra ni da je ovaj spisak maliciozno falsificiran, već se naprosto radi o različitim postupcima prikupljanja podataka. I to je ono što su Elezović i Banić trebali uvažavati, a ne ponašati se kao da su tisuće različitih spiskova došli iz istog izvora i da imaju istu distribuciju.

Povjesničari

Elezović i Banić poriču u svom odgovoru na arXivu da nisu konzultirali povjesničare. Obratili su se, navode na arXivu, povjesničarki Esther Gitman, inače autorici knjige “Stepinac – stup ljudskih prava” te povjesničaru Vladimiru Geigeru. Kako proizlazi iz tog poglavlja, s Gitman i Geigerom su uglavnom bistrili poklapanja pojedinih imena s drugim spiskovima, ali nisu potražili objašnjenje gomilanja godina oko nule i dvojke, niti im je ponuđeno ovo jednostavno i plauzibilno objašnjenje “bodlji”.

Spomenimo i da među zahvalama na dnu “Odgovora na komentar” također možemo vidjeti i notornog falsifikatora povijesti Romana Leljaka, kojega je i sâm Geiger svojevremeno ismijavao jer je početkom rujna 2018. godine tvrdio: „U logoru Jasenovac od 1941. do 1945. ukupno je bilo 18.600 zarobljenika… [a] umrlo 1.654 logoraša.”

Iako su “bodlje jasenovačkog ježa” najatraktivnije “otkriće” Elezovića i Banića kojim mašu pred kamerama, Ornik napominje da se one uopće ne mogu pripisati TVOR modelu.

“Bodlje se lako mogu identificirati korištenjem drugih metoda”, piše Ornik u odgovoru na upit Faktografa. Na TVOR otpada prva polovica rada Elezovića i Banića u IEEE Accessu i on je po Ornikovom sudu “prilično razuman”.

“Problem nastaje kada model silom pokušate natjerati da radi s podacima s kojima nije sposoban raditi, kao što je učinjeno u drugoj polovici rada sa skupom podataka Jasenovac. U tom trenutku, pretpostavke modela su narušene i stoga su rezultirajući zaključci besmisleni (da ne spominjemo druge probleme sa skupom podataka)”, navodi Ornik, a tome pripisuje i činjenicu da IEEE Access nije povukao članak, nego je objavio uredničku napomenu.

Problemi s radom

Obratili smo se uredništvu IEEE Accessa i upitali ih što je potrebno za povlačenje takvog jednog članka, kojemu su “nalijepili” Ornikov komentar koji Elezovića i Banića pobija u toliko detalja. Naime, Ornik navodi i da metoda TVOR može biti pristrana ovisno o podacima kojima barata te da “ne može dati nikakve važne rezultate” čak i ako bi se pokušala nositi s “brojnim problemima koje imaju njegovi podaci”. Među tim problemima navodi korištenje “neusporedivih uzoraka” pritom “kontaminiranih dupliciranim podacima”.

Ornik je pokazao da će za model prije biti problematična dulja nego kraća lista, a Jasenovački je popis među duljima. Navodi da ni “16 popisa koji su po veličini najbliži jasenovačkom popisu ne dijele ista svojstva glatkoće”. Što se tiče duplikacije podataka, primijetio je da su Elezović i Banić koristili dva potpuno ista spiska, samo što je jedan bio na ćirilici, a drugi na latinici. Ipak, tretirali su ih zasebno.

Što se tiče čišćenja podataka koji se tiču individualnih žrtava rata, smatra Ornik, “gotovo je nemoguće ukloniti sve duplicirane i netočne podatke, jer bi to zahtijevalo pristup povijesnim izvorima koji možda više ne postoje”.

Urednik časopisa ono što Elezović i Banić pričaju nazvao odvratnim

Nakon poduljeg čekanja, IEEE Access nam nije odgovorio na upit, već su nam proslijedili pismo kojim je urednik Abbott predstavniku izdavača Lawrenceu Hallu objasnio zašto nisu povukli sporni rad o TVOR-u. Ono što Elezović i Banić pričaju po medijima “nije izričito uključeno u sam članak i nije bilo dio tehničkog materijala pregledanog i prihvaćenog za objavljivanje”, piše Abbott.

Iako ja i urednici IEEE Accessa smatramo da su naknadne komunikacije autora odvratne, nije bilo tehničkog obrazloženja za službeno povlačenje, prema smjernicama COPE. Komentar Melkiora Ornika rasvijetlio je potencijalne netočnosti metode predložene u izvornom članku i, kada se čita zajedno s izvornim člankom, daje potpuniju sliku statističke analize potrebne za takve skupove podataka.

Objavili smo Uredničku bilješku uz izvorni članak kako bismo naglasili našu zabrinutost za postupke autora u medijima. Činjenica da nismo preporučili povlačenje ovog članka ne bi smjela implicirati prihvaćanje namjere ili ponašanja autora, a prihvaćanje ovog rada nije potvrđivanje zaključaka koji nisu sadržani u radu.

Kako prepoznati nematematičku priču ispričanu matematikom

Za razumijevanje ovih matematičkih tekstova obratili smo se nekolicini matematičara. Damir Bakić sa Zavoda za matematičku analizu Prirodoslovno-matematičkog fakulteta (i zastupnik Možemo u Hrvatskom saboru) kazao nam je kako se u potpunosti slaže s Ornikom.

“Smatram da je neetično ikoju statističku metodu promovirati ili testirati na skupu podataka čija pouzdanost je upitna do mjere koja taj skup podataka može učiniti neprikladnim za primjenu dane metode. Pogotovo u slučajevima kakav je ovaj, kad se zaključci izvode na tako osjetljivim pitanjima kakva su ratna stradanja i osobito ljudske ratne žrtve”, navodi Bakić.

Docent Katedre za matematiku i statistiku Učiteljskog fakulteta Tin Perkov podsjeća da je uredništvo prihvatilo komentar M. Ornika kao ispravan i istaknulo to uz sam izvorni članak, čime “postaje neutemeljena svaka njihova daljnja ‘popularizacija’ rezultata članka što se tiče primjene na Jasenovac”.

Naš sljedeći sugovornik, inženjer i docent na Trinity Collegeu u Dublinu Harun Šiljak osvrnuo se na argumentaciju Elezovića i Banića oko izbora časopisa u kojemu su objavili rad. Smatra da je nužno pojasniti i priču oko utjecaja IEEE Accessa, koju neprestano apostrofiraju Elezović i Banić. IEEE Access je inženjerski, a ne matematički časopis i ima ogroman impact factor upravo zbog toga što se bavi objavljivanjem radova o mašinskom učenju, energetici, telekomunikacijama i drugim, krajnje popularnim granama znanosti s visokim stupnjem citiranosti.

Što se tiče rigoroznosti postupka recenzije, Šiljak navodi da Access ima i najbrži postupak revizije u odnosu na ostale časopise iz IEEE porodice. Kada ovakav rad pošaljete u IEEE Access, smatra on, netko tko zna matematiku će u najboljem slučaju pročitati metodologiju.

“U tom postupku revizije članka, rezultat rada nije broj žrtava Jasenovca, već nova metoda. I tako ću, na primjer, ja kao recenzent provesti 90 posto vremena proučavajući metodu, a 10 posto rezultate na stvarnim podacima”, pojašnjava Šiljak, koji smatra da je ovu metodu trebalo ipak predstaviti u  matematičkom časopisu.

TVOR

Isto tako, zamjera autorima što tvrde da su IEEE Access izabrali zbog otvorenog pristupa, odnosno želje da bude dostupan javnosti. Njihov rad može biti besplatno dostupan na brojnim drugim servisima, baš kao što je trenutno na arXivu dostupan njihov odgovor na Ornikov komentar.

Prema Šiljku, časopis IEEE Access je iskorišten. On poput Bakića sumnja da rad nije pisan da se predstavi tehnika, već da se diskreditira Jasenovac. Da je cilj bilo predstavljanje metode, po njemu bi se ona koristila za dokazivanje na neutralnim skupovima podataka.

“Uostalom, metoda se ne bi zvala TVOR”, primjećuje Šiljak. Zanimljivo, i voditelj “Budnice” se u 27. minuti emisije smije upravo tom sugestivnom naslovu.