Ellenőrzés és járvány

bigA világ a szemünk előtt változik, méghozzá rohamosan. Nem egészen három hónappal azután, hogy a vuhani hatóságok értesítették az Egészségügyi Világszervezetet (WHO) egy újfajta koronavírus megjelenéséről, több mint hárommilliárd ember kell hogy a mozgásszabadságának, előreláthatóan még hetekig tartó, súlyos korlátozásával szembenézzen.

A kényszerű immobilitás csak a legfeltűnőbb eleme a politikai átalakulásoknak, miközben olyan intézkedések lépnek életbe, amelyek nemrég még elképzelhetetlenek voltak. Ezzel egy időben radikalizálódnak egyes már korábban beindult folyamatok. A vírus terjedésének megfékezése érdekében vívott digitális harc terén ez a két dolog rendkívül kényes módon folyik össze.

 

A koronaválság szükségessé tette a digitális adatok felhasználását

Érthető, ha a mobilszolgáltató cégek fel akarják használni a közösségi média adatait a vírus megfékezésére. Ezek a cégek soha sem titkolták, mennyire jól ismernek bennünket, milyen pontosan tudják szokásainkat, vágyainkat és gondjainkat, valamint jövőbeli viselkedésünket is, amelyet a múltbeliből vezetnek le.

Mi több, a digitális hálózat, mint például a Facebook kapcsolati hálója (amely a platform összes felhasználója közti kapcsolatot mutatja), és az epidemiológia alapjaikban nagyon hasonlóak. Mindkettő azt kutatja, hogy emberek milyen módon vannak egymással kapcsolatban, és hogyan terjednek bizonyos dolgok – információk, tettek, betegségek – ezeken a kapcsolatokon keresztül.

Úgy tűnik tehát, hogy amit az adatok elemzése ígér, tökéletesen egybeesik azzal, amire az egészségügy-politikának is szüksége van. A gond csak az, hogy az adatok nem egyszerűen adatok. A különböző adattípusokból nyert ismeretek nagyon különbözőek. Arról nem is szólva, hogy a jelenlegi nyomás alatt adatvédelmi alapjogok hígulnak fel anélkül, hogy eszközök jönnének létre az adatkezelés demokratikus módozataira.

A Motionlogic, a Telekom egyik leányvállalata, az első cégek között volt Európában, amely március 17-én anonimizált adatokat adott át elemzésre a Robert Koch Intézetnek (RKI). Tíz nappal később az Európai Bizottság bejelentette: tárgyalásokat folytat a mobilszolgáltatókkal, hogy azok Európa-szerte biztosítsanak hozzáférést az adatokhoz. Konkrétan olyan antennák adócelláinak aggregált adatairól van szó, amelyekkel a mobiltelefonoknak folyamatosan kapcsolatban kell lenniük ahhoz, hogy hálózati kapcsolatot tudjanak létesíteni.

Egy ilyen adócella rádiusza ritkán lakott vidéki térségekben több kilométer is lehet, nagyvárosokban viszont csak néhány száz métert tesz ki. Az utóbbiakban, több adócella adatainak kombinálásával, harminc méter pontossággal meg lehet határozni egy készülék pozícióját. Ezekből az adatokból természetesen nem lehet személyes kapcsolatokat kiolvasni, és csoportosulásokat is csak nehezen lehet feltételezni.

Az, hogy ötven mobiltelefon egyazon adócella hatósugarában található, még nem jelenti azt, hogy ennek epidemiológiai jelentősége van. A mozgásra vonatkozóan viszont nagyon is érdemes az adatokat elemezni például annak ellenőrzésére, hogy betartják-e a kijárási korlátozásokat, vagy hogy szigorítani kell-e rajtuk. Valószínűleg Angela Merkel is ilyen adatok ismeretében köszönte meg a lakosságnak március 28-án, hogy betartják a szabályokat.

Az általános mozgásérzékelésénél azonban fontosabb az individuális kapcsolatok nyomon követése. Ehhez az adatoknak sokkal pontosabbnak kell lenniük, az egyes személyek beazonosítását is beleértve. Két különböző adatfajta jöhet itt szóba. Egyszer a helyadatok, amelyek a GPS-szatellitrendszerre épülnek. A GPS-adatokon alapuló helymeghatározás néhány méter pontosságú. Ez elegendő ahhoz, hogy gyülekezési pontokat azonosítsunk, például egy lokált, amelyben egy vírusfertőzött személy tartózkodott. Továbbá arra is alkalmas, hogy csoportosulásokat azonosítsunk. A Google már régóta használja ezeket az adatokat annak előrejelzésére, hogy egy nyilvános helyen, egy adott időben mekkora tömeg lesz. A valós idejű közlekedési dugókat is így állapítja meg.

A Bluetooth-jelek használata a másik lehetőség. Az abszolút helymeghatározással ellentétben itt az egyes személyek közötti relatív távolság is mérhető. A Bluetooth-t eredetileg arra fejlesztették ki, hogy rövidtávú, kábelmentes kapcsolatot lehessen létesíteni, mondjuk, egy fülhallgatóval. Arra is használható viszont, hogy listázzuk a közelben található készülékeket. A készülékek használóit így értesíteni lehet egy megbetegedésről, illetve a megemelkedett fertőzési kockázatról. Azt, hogy ez a kapcsolat hol jött létre és kivel, nem feltétlenül szükséges megállapítani.

Az említett adattípusok egyike sem teszi lehetővé a vírus automatikus követését, és nem csak azért, mert pontatlanságokkal is számolni kell. Sokkal fontosabb, hogy a rendelkezésre álló matematikai modellek ugyan hasonlítanak, de nagyobb pontosságot tételeznek fel a digitális adatokról, mint amilyet azok valójában nyújtani tudnak. Epidemiológiai szempontból ugyanis a vírusátadás lehetőségének megállapításához több kell, mint az, hogy két készülék egymás közelében van-e.

Nem derül ki például, hogy a két személy betartotta-e a biztonsági távolságot, vagy kezet fogott-e, az pedig biztosan nem, hogy történt-e vírusátadás. Legjobb esetben is csak egy meglehetősen szórványos, elővigyázatosságból létrehozott karanténhálózatot lehetne létrehozni, ami azonban még mindig gondosabb megoldás lenne, mint az egész lakosság karanténba küldése.

 

Big data a vírus ellen?

Ez azonban lehetetlen, ha az ember nem tudja, ki betegedett meg, és kinek a személyes kapcsolatait kell visszakövetni. Egy olyan jól kiépített egészségügyi rendszer hiányában, amely gyorsan és tömegesen képes teszteket végezni, az intézkedések értelmetlenek lennének akkor is, ha – elvileg – részletes mozgási és kapcsolati adatok állnának rendelkezésre.

Az ilyen adatok azonban a gyakorlatban nem könnyen hozzáférhetőek, először meg kell szerezni őket. Itt is két lehetőség van, amelyek kombinálhatók egymással. Az egyik egy alkalmazás telepítése okostelefonra. Segítségével adatok válnak elérhetővé. E megoldáshoz elengedhetetlenül szükséges a felhasználó együttműködése.

A másik lehetőség a közösségi médiaplatformokon és az azok árnyékában működő adatkereskedők adatbázisaiban már létező adatok kiértékelése. Ezekkel lehetőség nyílik arra, hogy részletes mozgási profilokat és ismerősi láncokat rekonstruáljanak, bár kívülről elég nehéz ezek minőségét megállapítani.

Minél jobban érződnek a krízis következményei, annál jobban növekszik a nyomás az effajta adatok begyűjtésére. Egyes tudósok is ezen az állásponton vannak, mert hatékonyságnövekedést várnak az intézkedéstől. Az ilyen adatokon alapuló kapcsolatelemzések ugyanis lehetővé teszik az emberek gyorsabb értesítését és karanténba küldését, ezáltal a társadalmi izolálás és távolságtartás hatékonyabb megvalósítását. Nem utolsósorban pedig lehetővé teszik az intézkedések költségeinek viszonylagos minimalizálását is.

Egészségügy-politikai szempontból lényeges, hogy az ilyen intézkedések gyorsan, átfogóan és hatékonyan történjenek azért is, hogy hatásukat ellenőrizni lehessen a kijárási korlátozások feloldása után. Társadalompolitikai szempontból azonban legalább annyira fontos az, hogy milyen formában valósulnak meg az intézkedések, mivel az ebben az időben született technológiai-adminisztratív rendszerek valószínűleg túlélik majd a válságot.

A válság nyomása, amely gyors cselekvést igényel, lehetővé teszi befolyásos szereplőknek, hogy adatbankjaikat gyarapítsák, és tovább építsék a már meglévő tudás- és hatalommonopóliumukat. Ezt a folyamatot Kínában lehet a legnyilvánvalóbban megfigyelni, ahol az állam új és új megfigyelési eszközöket vezetett be a kollektív korlátozások leépítése során, és a személyi mozgásszabadságot egy algoritmusokkal kielemzett érték korlátozza.

Az ebben a rendszerben való részvétel nem önkéntes, és az sem látható át, hogy miként használják az így nyert adatokat. De a demokratikus államokban is aggasztó verseny zajlik az adatforrásokért. Izraelben például magát a Schin Betet, a belbiztonsági titkosszolgálatot bízták meg a fertőzöttek nyomon követésével azzal érvelve, hogy ott már rendelkezésre állnak a szükséges erőforrások, illetve megvan a technológiai tudás. Az izraeli, a megfigyelésben szakértő NSO Group Technologies cég, amely többek között újságírók és emberjogi aktivisták után kémkedik az Öböl-országokban, már piacra is dobott egy követőalkalmazást, amely lehetőséget ad államoknak a felhasználók nyomon követésére. Ilyen és hasonló kereskedelmi ajánlatból egyre több van, részben azzal a kétes ígérettel párosítva, hogy a termék mesterséges intelligenciát is használ.

 

Ne elemezzenek csak azért, mert az adatok rendelkezésre állnak

De nemcsak a személyes, hanem a közigazgatási adatok is célkeresztben vannak. Ezen a téren különösen kapósak az egészségügyi rendszerek adatai. Ezeket a rendszereket az összes nagyobb cég már évek óta a hatékonyságnövelés érdekében környékezi meg. Úgy tűnik, eljött az idő, amikor a gátak átszakadnak. Így az Egyesült Királyságban, ahol a régóta gyengélkedő egészségügy (NHS) adatait most egy, az Amazonból, a Microsofból, a Palantirból és a Faculty AI-ból álló konzorciummal osztják meg.[1] Az adatértékelésüktől az is függhet, hogy mire fordítják a szűkös erőforrásokat. Ez által függőségek keletkeznek, amelyek aláássák az állami beavatkozási lehetőségeket. Dél-Korea ezzel ellentétben az önkéntes kapcsolatkövetésre épít, meglehetős sikerrel. Itt a Belügyminisztérium fejlesztett ki egy alkalmazást, amely GPS-adatok segítségével állít fel mozgásprofilokat.

Az alkalmazás figyelmezteti a felhasználót, ha az kétméteres közelségbe kerül egy vírusbeteghez, olyan helyiségben tartózkodik maszk nélkül, ahol egy beteg köhögött. Ezeket a részleteket természetesen nem lehet automatikusan begyűjteni, hanem azok a megbetegedettek kikérdezéséből származnak. Amennyiben egy alkalmazás közelséget észlel egy beteghez, a felhasználónak is karanténba kell vonulnia. Ehhez jön az adatok nyilvánossá tétele, valamint egy vizuális, személyes kártya elkészítése és folyamatos aktualizálása.

Európai szemszögből ez a személyi szabadság súlyos korlátozása. A Pan-European Privacy-Preserving Proximity Tracing [Páneurópai személyiségvédő közelségkövetés] nevű projekt alternatívát kínál. A rendszer Bluetooth-adatok segítségével ellenőrzi a személyi távolságtartást, és figyelmezteti a meghatározott csoportot anélkül, hogy személyes adatokat közölne. Európában azonban mostanáig sehol nem működnek ilyen adatspóroló alkalmazások.

De a magánszféra védelme magában nem elég. Az adatok csak alapanyagok számos elemzéshez és modellhez. Ezért elengedhetetlen, hogy kifejlődjön a big data-rendszerek alkalmazásának a demokratikus rendszerekkel összeegyeztethető formája. Ehhez nemcsak technológiai fejlődésre van szükség, hanem állami, szabályozó újításokra is.

Először is, korlátozni kell az adatok felhasználhatóságát. Annak érdekében, hogy ez megvalósítható legyen, egy külső hivatalnak kell meghatároznia a vizsgálandó problémákat, illetve a lehetséges kérdésfelvetéseket. Nem engedhető meg további elemzések elvégzése csak azért, mert az adatok rendelkezésre állnak.

Másodszor, lehetővé kell tenni az elemzések adatainak összehasonlítását. Az adatelemzést nem szabad egyetlen szolgáltató kezébe adni. Az adatok önmagukban nem mutatnak semmit, hanem olyan különböző modelleket táplálnak, amelyek feltevések egész sorára hagyatkoznak. Az, hogy ezek a modellek működnek-e, valamint, hogy melyik a megfelelő egy adott probléma kezelésére, csak az eredmények utólagos egyeztetésével jelenthető ki.

Harmadszor, az adatok kiértékelése után nyilvánossá kell tenni a modelleket, hogy meg lehessen ítélni a hasznosságukat/haszontalanságukat, és lehetővé kell tenni a kényes adatok kezelésének etikai vizsgálatát. Így valósulhat meg egy kollektív tanulási folyamat. Negyedszer pedig, az adatokat a kiértékelés után törölni kell.

A jelenlegi válság nyomása alatt meglehetősen nehéz egy ilyen rendszert kialakítani, de itt az ideje, hogy belekezdjünk. Az igény ugyanis, hogy érzékeny és összetett adatmodelleket használjunk fel a jövőben ahhoz, hogy közösségi kérdésekre kapjunk választ, nem fog csökkenni.

 

Felix Stalder a Zürichi Művészeti Főiskola, digitális kultúra professzora.

Németből Fordította: Hujber András

 

[1] The power of data in a pandemic [Az adatok ereje egy pandémiában], Department of Health and Social Care [Egészségügyi és Szociális Gondozási Osztály], 2020. március 28, www.healthtech.blog.gov.uk