1. Ang konsepto sa Data Masking
Ang data masking nailhan usab nga data masking. Kini usa ka teknikal nga pamaagi sa pag-convert, pagbag-o o pagtabon sa sensitibo nga datos sama sa numero sa mobile phone, numero sa bank card ug uban pang impormasyon kung naghatag kami mga lagda ug palisiya sa pag-mask. Kini nga teknik sa panguna gigamit aron mapugngan ang sensitibo nga datos nga gamiton direkta sa dili kasaligan nga mga palibot.
Prinsipyo sa Pag-masking sa Data: Ang pag-mask sa datos kinahanglan nga magpadayon sa orihinal nga mga kinaiya sa datos, mga lagda sa negosyo, ug kalabutan sa datos aron masiguro nga ang sunod nga pag-uswag, pagsulay, ug pagtuki sa datos dili maapektuhan sa pag-mask. Siguruha ang pagkamakanunayon ug pagkabalido sa datos sa wala pa ug pagkahuman sa pag-mask.
2. Klasipikasyon sa Data Masking
Ang data masking mahimong bahinon sa static data masking (SDM) ug dynamic data masking (DDM).
Static data masking (SDM): Static data masking nagkinahanglan sa pagtukod sa usa ka bag-o nga non-produksyon palibot database alang sa paglain gikan sa produksyon palibot. Ang sensitibo nga datos gikuha gikan sa database sa produksiyon ug dayon gitipigan sa database nga dili produksiyon. Niining paagiha, ang desensitized nga datos nahimulag gikan sa palibot sa produksiyon, nga nagtagbo sa mga panginahanglanon sa negosyo ug nagsiguro sa seguridad sa datos sa produksiyon.
Dynamic Data masking (DDM): Kasagaran kini gigamit sa palibot sa produksiyon aron ma-desensitize ang sensitibo nga datos sa tinuud nga oras. Usahay, lain-laing lebel sa masking gikinahanglan sa pagbasa sa sama nga sensitibo nga data sa lain-laing mga sitwasyon. Pananglitan, ang lain-laing mga tahas ug pagtugot mahimong mag-implementar og lain-laing mga masking scheme.
Pagreport sa datos ug aplikasyon sa masking sa mga produkto sa datos
Ang maong mga senaryo kasagaran naglakip sa internal nga data monitoring nga mga produkto o billboard, external service data products, ug mga report base sa data analysis, sama sa business reports ug project review.
3. Data Masking Solution
Ang kasagarang mga pamaagi sa pag-mask sa datos naglakip sa: invalidation, random value, data replacement, symmetric encryption, average value, offset ug rounding, etc.
Pagkadili balido: Ang invalidation nagtumong sa pag-encrypt, pagputol, o pagtago sa sensitibo nga datos. Kini nga laraw kasagarang mopuli sa tinuod nga datos sa mga espesyal nga simbolo (sama sa *). Ang operasyon yano ra, apan ang mga tiggamit dili mahibal-an ang pormat sa orihinal nga datos, nga mahimong makaapekto sa sunod nga mga aplikasyon sa datos.
Random nga Bili: Ang random nga bili nagtumong sa random nga pag-ilis sa sensitibo nga datos (mga numero mopuli sa mga digit, letra mopuli sa mga letra, ug karakter mopuli sa mga karakter). Kini nga pamaagi sa masking magsiguro sa pormat sa sensitibo nga datos sa usa ka sukod ug mapadali ang sunod nga aplikasyon sa datos. Ang pagtago sa mga diksyonaryo mahimong gikinahanglan alang sa pipila ka makahuluganon nga mga pulong, sama sa mga ngalan sa mga tawo ug mga lugar.
Pagpuli sa Data: Ang pag-ilis sa datos susama sa masking sa null ug random values, gawas nga imbes mogamit ug espesyal nga mga karakter o random values, ang masking data gipulihan sa usa ka piho nga bili.
Symmetric Encryption: Symmetric encryption maoy usa ka espesyal nga mabalikbalik nga pamaagi sa masking. Gi-encrypt niini ang sensitibo nga datos pinaagi sa mga yawe sa pag-encrypt ug mga algorithm. Ang format sa ciphertext nahiuyon sa orihinal nga datos sa lohikal nga mga lagda.
Average: Ang kasagarang laraw kasagarang gigamit sa mga estadistika nga sitwasyon. Para sa numerical data, una namong kuwentahon ang ilang mean, ug dayon random nga ipang-apod-apod ang mga desensitized values palibot sa mean, sa ingon magpabilin ang sum sa data nga makanunayon.
Offset ug Rounding: Kini nga pamaagi nag-usab sa digital data pinaagi sa random shift. Ang offset rounding nagsiguro sa gibana-bana nga pagkatinuod sa range samtang nagmintinar sa seguridad sa data, nga mas duol sa tinuod nga data kay sa miaging mga laraw, ug adunay dako nga kahulogan sa scenario sa dako nga data analysis.
Ang Rekomend nga Modelo "ML-NPB-5660" alang sa Data Masking
4. Kasagarang gigamit nga Data Masking Techniques
(1). Estadistika nga mga Teknik
Data sampling ug data aggregation
- Data sampling: Ang pag-analisa ug pagtimbang-timbang sa orihinal nga set sa datos pinaagi sa pagpili sa usa ka representante nga subset sa set sa datos usa ka importante nga pamaagi aron mapalambo ang pagka-epektibo sa mga pamaagi sa de-identification.
- Paghiusa sa datos: Ingon usa ka koleksyon sa mga pamaagi sa estadistika (sama sa pagsuma, pag-ihap, pag-aberids, maximum ug minimum) nga gigamit sa mga kinaiya sa microdata, ang resulta nagrepresentar sa tanan nga mga rekord sa orihinal nga set sa datos.
(2). Kriptograpiya
Ang kriptograpiya usa ka sagad nga pamaagi aron ma-desensitize o mapalambo ang pagka-epektibo sa desensitization. Ang lain-laing mga matang sa encryption algorithms makab-ot sa lain-laing mga desensitization epekto.
- Deterministic encryption: Usa ka non-random symmetric encryption. Kini kasagarang nagproseso sa datos sa ID ug maka-decrypt ug makapabalik sa ciphertext sa orihinal nga ID kon gikinahanglan, apan ang yawe kinahanglang protektahan sa husto.
- Dili mabalik nga encryption: Ang hash function gigamit sa pagproseso sa datos, nga kasagaran gigamit alang sa ID data. Dili kini direkta nga ma-decrypt ug ang relasyon sa pagmapa kinahanglan nga maluwas. Dugang pa, tungod sa feature sa hash function, ang data collision mahimong mahitabo.
- Homomorphic encryption: Ang ciphertext homomorphic algorithm gigamit. Ang kinaiya niini mao nga ang resulta sa operasyon sa ciphertext parehas sa operasyon sa plaintext pagkahuman sa decryption. Busa, kini sagad nga gigamit sa pagproseso sa numerical fields, apan kini dili kaylap nga gigamit alang sa performance rason.
(3). Teknolohiya sa Sistema
Ang teknolohiya sa pagsumpo nagtangtang o nagtago sa mga butang sa datos nga wala makab-ot ang proteksyon sa pagkapribado, apan wala kini gimantala.
- Pag-masking: kini nagtumong sa labing komon nga pamaagi sa desensitization aron sa pag-mask sa hiyas nga bili, sama sa numero sa kontra, ID card gimarkahan og asterisk, o ang adres giputol.
- Lokal nga pagpanumpo: nagtumong sa proseso sa pagtangtang sa piho nga mga hiyas sa hiyas (kolum), pagtangtang sa dili kinahanglanon nga mga natad sa datos;
- Pagpugong sa rekord: nagtumong sa proseso sa pagtangtang sa piho nga mga rekord (mga linya), pagtangtang sa dili kinahanglanon nga mga rekord sa datos.
(4). Pseudonym Teknolohiya
Ang Pseudomanning kay usa ka teknik sa de-identification nga naggamit ug pseudonym para ilisan ang direktang identifier (o uban pang sensitibong identifier). Ang mga teknik sa pseudonym nagmugna og talagsaon nga mga identifier alang sa matag indibidwal nga hilisgutan sa impormasyon, imbes nga direkta o sensitibo nga mga identifier.
- Makahimo kini og random nga mga bili nga independente nga katumbas sa orihinal nga ID, i-save ang mapping table, ug higpit nga kontrolon ang access sa mapping table.
- Mahimo usab nimo gamiton ang encryption aron makagama og mga pseudonym, apan kinahanglan nga huptan nga husto ang yawe sa decryption;
Kini nga teknolohiya kaylap nga gigamit sa kaso sa usa ka dako nga gidaghanon sa mga independente nga tiggamit sa datos, sama sa OpenID sa open platform nga senaryo, diin ang lain-laing mga developers makakuha og lain-laing mga Openids alang sa sama nga user.
(5). Mga Pamaagi sa Generalization
Ang teknik sa generalization nagtumong sa usa ka teknik sa de-identification nga nagpamenos sa granularity sa pinili nga mga attribute sa usa ka set sa datos ug naghatag og mas kinatibuk-an ug abstract nga paghulagway sa datos. Ang teknolohiya sa generalization sayon nga ipatuman ug makapanalipod sa pagkatinuod sa record-level data. Kasagaran kini gigamit sa mga produkto sa datos o mga taho sa datos.
- Rounding: naglakip sa pagpili sa usa ka rounding base alang sa pinili nga hiyas, sama sa pataas o paubos nga forensics, hatag resulta 100, 500, 1K, ug 10K
- Ibabaw ug ubos nga mga teknik sa coding: Ilisan ang mga bili sa ibabaw (o sa ubos) sa threshold sa usa ka threshold nga nagrepresentar sa ibabaw (o ubos) nga lebel, nga mohatag og resulta sa "ibabaw sa X" o "ubos sa X"
(6). Randomization nga mga Teknik
Isip usa ka matang sa de-identification technique, ang randomization technology nagtumong sa pag-usab sa bili sa usa ka attribute pinaagi sa randomization, aron ang value human sa randomization lahi sa orihinal nga tinuod nga bili. Kini nga proseso nagpamenos sa abilidad sa usa ka tig-atake sa pagkuha sa usa ka hiyas nga bili gikan sa uban nga mga hiyas sa hiyas sa sama nga data rekord, apan makaapekto sa pagkatinuod sa resulta data, nga mao ang komon sa produksyon pagsulay data.
Oras sa pag-post: Sep-27-2022