© Tomasz Klimanek, Tomasz Józefowski, Andrzej Młodak, Amelia Wardzińska-Sharif Artykuł udostępniony na licencji CC BY-SA 4.0
Udostępnianie podstawowych danych pochodzących z Narodowego Spisu Po-wszechnego Ludności i Mieszkań (NSP) w przekroju siatki kilometrowej należy uznać za jeden z najważniejszych kierunków upowszechniania wyników spisowych, a zarazem spełnienie krajo-wych i międzynarodowych wymogów w tym zakresie. Z uwagi na to, że komórki siatki są rela-tywnie małe (kwadraty 1 km×1 km), a ryzyko identyfikacji konkretnej osoby i ujawnienia jej da-nych wrażliwych jest znaczne, niezbędne staje się podjęcie stosownych działań ochronnych. Ce-lem artykułu jest omówienie najważniejszych działań z zakresu kontroli ujawniania danych na przykładzie danych zebranych podczas NSP 2021 oraz zaproponowanie możliwych do zastoso-wania w tym przypadku metod i narzędzi kontroli. W szczególności dotyczy to podejść niezakłó-ceniowych, czyli takich, które prowadzą do ukrywania danych wrażliwych. Ponadto w artykule wskazano najistotniejsze problemy i wyzwania związane z podjęciem tego rodzaju działań ochronnych w zależności od zakresu udostępnianych informacji, ponieważ liczba i rodzaj zmien-nych mają kluczowe znaczenie dla ryzyka identyfikacji jednostki i doboru narzędzi ochronnych. Przedstawiono także propozycje rozwiązań metodologicznych i technicznych. Analizy wykazały, że ochrona danych stanowi ważne wyzwanie w rozpatrywanym przypadku, zwłaszcza gdy należy kontrolować ujawnianie danych z kilku powiązanych ze sobą baz danych – wówczas konieczne jest uwzględnienie logicznych i matematycznych powiązań między zbiorami. Dodatkowym czynnikiem ryzyka może się okazać gęstość lub hierarchiczność siatki.
siatka kilometrowa, kontrola ujawniania danych, metody niezakłóceniowe, spis powszechny
C54, C63, C83
Branchu, M., Costemalle, V., & Fontaine, M. (2018). Données carroyées et confidentialité. Journées de Méthodologie Statistiques de l’Insee, 13, 1–23. http://www.jms-insee.fr/2018/S23_3_ACTE_BRANCHU_JMS2018.pdf.
Dygaszewicz, J. (2012). Spisy powszechne jako źrodło danych do analiz geoprzestrzennych. Archi-wum Fotogrametrii, Kartografii i Teledetekcji, 23, 91–100. https://ptfit.sgp.geodezja.org.pl/wydawnictwa/archiwum_vol_23/Dygaszewicz.pdf.
Eurostat. (2019). EU legislation on the 2021 population and housing censuses. Explanatory notes. Pub-lications Office of the European Union. https://ec.europa.eu/eurostat/docments/3859598/9670557/KS-GQ-18-010-EN-N.pdf/c3df7fcb-f134-4398-94c8-4be0b7ec0494?t=1552653277000.
Gussenbauer, J. (2023, 30 sierpnia). Target Record Swapping. https://cran.r-project.org/web/pack-ages/sdcMicro/vignettes/recordSwapping.html.
Hundepool, A., Domingo-Ferrer, J., Franconi, L., Giessing, S., Nordholt, E. S., Spicer, K., & de Wolf, P.-P. (2012). Statistical Disclosure Control. John Wiley & Sons. https://doi.org/10.1002/9781118348239.
Młodak, A., Pietrzak, M., & Józefowski, T. (2022). The trade-off between the risk of disclosure and data utility in SDC: A case of data from a survey of accidents at work. Statistical Journal of the IAOS, 38(4), 1503–1511. https://doi.org/10.3233/SJI-220936.
Młodak, A., Pietrzak, M., Klimanek, T., Józefowski, T., & Lańduch, P. (2023). Poufność a użyteczność informacji statystycznych. Dylematy ochrony udostępnianych danych. Wydawnictwo Uniwersytetu Ekonomicznego w Poznaniu. https://doi.org/10.18559/978-83-8211-168-2.
Pietrzak, M., Józefowski, T., Klimanek, T., & Młodak, A. (2022). An Optimized Selection of Statisti-cal Disclosure Control Methods – A Case Study Involving Microdata from the Polish Survey of Accidents at Work. W: K. Jajuga, G. Dehnel, M. Walesiak (Eds.), Modern Classification and Data Analysis: Methodology and Applications to Micro- and Macroeconomic Problems (pp. 63–78). Springer. https://doi.org/10.1007/978-3-031-10190-8_6.
Rozporządzenie Rady Ministrów z dnia 15 października 2012 r. w sprawie państwowego systemu odniesień przestrzennych (Dz.U. 2012 poz. 1247 ze zm.).
Rozporządzenie (WE) nr 1059/2003 Parlamentu Europejskiego i Rady z dnia 26 maja 2003 r. w sprawie ustalenia wspólnej klasyfikacji Jednostek Terytorialnych do Celów Statystycznych (NUTS) (Dz.U. UE L 154/1).
Rozporządzenie wykonawcze Komisji (UE) 2018/1799 z dnia 21 listopada 2018 r. w sprawie ustano-wienia tymczasowego bezpośredniego działania w dziedzinie statystyki dotyczącego rozpo-wszechniania wybranych tematów spisu ludności i mieszkań w 2021 r. i geokodowanych w siatce kilometrowej (Dz.U. L 296 z 22.11.2018).
System informacji przestrzennej. (n.d.). W: Internetowy leksykon geomatyczny. https://www.ptip.info/LMB/system-informacji-przestrzennej.
United Nations. (2017). Principles and Recommendations for Population and Housing Censuses: the 2020 Round (Revision 3). https://unstats.un.org/unsd/demographic-social/Standards-and-Methods/files/Principles_and_Recommendations/Population-and-Housing-Censuses/Series_M67rev3-E.pdf.