1. Ang konsepto sa Data Masking
Ang data masking nailhan usab nga data masking. Kini usa ka teknikal nga pamaagi sa pag-convert, pag-usab o pagtabon sa sensitibo nga datos sama sa numero sa mobile phone, numero sa bank card ug uban pang impormasyon kung kita naghatag og mga lagda ug palisiya sa masking. Kini nga teknik panguna nga gigamit aron mapugngan ang sensitibo nga datos nga magamit direkta sa dili kasaligan nga mga palibot.
Prinsipyo sa Data Masking: Ang data masking kinahanglan nga magmintinar sa orihinal nga mga kinaiya sa datos, mga lagda sa negosyo, ug kalabutan sa datos aron masiguro nga ang sunod nga pag-uswag, pagsulay, ug pag-analisar sa datos dili maapektuhan sa masking. Siguruha ang pagkamakanunayon ug pagkabalido sa datos sa dili pa ug pagkahuman sa masking.
2. Klasipikasyon sa Pagtago sa Datos
Ang data masking mahimong bahinon sa static data masking (SDM) ug dynamic data masking (DDM).
Pagtago sa estatikong datos (SDM)Ang static data masking nagkinahanglan og pagtukod og bag-ong database sa non-production environment para i-isolate gikan sa production environment. Ang sensitibo nga data gikuha gikan sa production database ug dayon gitipigan sa non-production database. Niining paagiha, ang desensitized data i-isolate gikan sa production environment, nga makatubag sa mga panginahanglanon sa negosyo ug makasiguro sa seguridad sa production data.
Dinamikong Pagtago sa Datos (DDM)Kasagaran kini gigamit sa palibot sa produksiyon aron maminusan ang pagkasensitibo sa sensitibo nga datos sa tinuod nga oras. Usahay, gikinahanglan ang lainlaing lebel sa masking aron mabasa ang parehas nga sensitibo nga datos sa lainlaing mga sitwasyon. Pananglitan, ang lainlaing mga tahas ug permiso mahimong magpatuman sa lainlaing mga pamaagi sa masking.
Pagreport sa datos ug aplikasyon sa pagtago sa mga produkto sa datos
Ang maong mga senaryo naglakip sa mga produkto o billboard sa internal data monitoring, mga produkto sa external service data, ug mga report nga gibase sa data analysis, sama sa mga business report ug project review.
3. Solusyon sa Pagtago sa Datos
Ang kasagarang mga pamaagi sa pagtago sa datos naglakip sa: invalidation, random value, data replacement, symmetric encryption, average value, offset ug rounding, ug uban pa.
Pag-invalidateAng invalidation nagtumong sa encryption, truncation, o pagtago sa sensitibo nga datos. Kini nga pamaagi kasagarang mopuli sa tinuod nga datos gamit ang mga espesyal nga simbolo (sama sa *). Sayon ra ang operasyon, apan ang mga tiggamit dili mahibalo sa pormat sa orihinal nga datos, nga mahimong makaapekto sa sunod nga mga aplikasyon sa datos.
Random nga BiliAng random nga bili nagtumong sa random nga pag-ilis sa sensitibo nga datos (ang mga numero mopuli sa mga numero, ang mga letra mopuli sa mga letra, ug ang mga karakter mopuli sa mga karakter). Kini nga pamaagi sa pagtago sa datos mosiguro sa pormat sa sensitibo nga datos sa usa ka piho nga sukod ug mopadali sa sunod nga aplikasyon sa datos. Ang pagtago sa mga diksyonaryo mahimong gikinahanglan alang sa pipila ka makahuluganon nga mga pulong, sama sa mga ngalan sa mga tawo ug mga lugar.
Pag-ilis sa DatosAng pag-ilis sa datos susama sa pag-mask sa null ug random nga mga kantidad, gawas lang nga imbes nga mogamit og mga espesyal nga karakter o random nga mga kantidad, ang pag-mask sa datos gipulihan sa usa ka piho nga kantidad.
Simetrikong EnkripsiyonAng symmetric encryption usa ka espesyal nga mabaliktad nga pamaagi sa pagtago sa impormasyon. Gi-encrypt niini ang sensitibo nga datos pinaagi sa mga yawe ug algorithm sa pag-encrypt. Ang pormat sa ciphertext nahiuyon sa orihinal nga datos sa mga lagda sa lohika.
KasagaranAng average scheme kanunay gigamit sa mga senaryo sa estadistika. Para sa numerical data, una natong gikalkulo ang ilang mean, ug dayon random nga giapod-apod ang mga desensitized nga kantidad palibot sa mean, sa ingon nagpabilin nga makanunayon ang kinatibuk-ang datos.
Offset ug RoundingKini nga pamaagi nag-usab sa digital data pinaagi sa random shift. Ang offset rounding nagsiguro sa gibanabana nga pagkatinuod sa range samtang gipadayon ang seguridad sa data, nga mas duol sa tinuod nga data kaysa sa nangaging mga scheme, ug adunay dakong importansya sa senaryo sa big data analysis.
Ang Modelo sa Rekomendasyon "ML-NPB-5660"para sa Pagtago sa Datos
4. Kasagarang Gigamit nga mga Teknik sa Pagtago sa Datos
(1). Mga Teknik sa Estadistika
Pagkuha og mga sample sa datos ug pag-ipon sa datos
- Pagkuha og mga sample sa datos: Ang pag-analisar ug pagtimbang-timbang sa orihinal nga set sa datos pinaagi sa pagpili og representante nga subset sa set sa datos usa ka importante nga pamaagi aron mapauswag ang kaepektibo sa mga teknik sa pag-de-identification.
- Pag-ipon sa datos: Isip usa ka koleksyon sa mga teknik sa estadistika (sama sa pagsumada, pag-ihap, pag-average, maximum ug minimum) nga gigamit sa mga hiyas sa microdata, ang resulta nagrepresentar sa tanang rekord sa orihinal nga set sa datos.
(2). Kriptograpiya
Ang cryptography usa ka komon nga pamaagi aron maminusan o mapalambo ang kaepektibo sa desensitization. Ang lainlaing mga klase sa encryption algorithm mahimong makab-ot ang lainlaing mga epekto sa desensitization.
- Deterministic encryption: Usa ka dili-random nga simetriko nga encryption. Kasagaran kini moproseso sa datos sa ID ug mahimong i-decrypt ug ibalik ang ciphertext sa orihinal nga ID kung gikinahanglan, apan ang yawe kinahanglan nga mapanalipdan sa husto.
- Dili mabalik nga pag-encrypt: Ang hash function gigamit sa pagproseso sa datos, nga kasagaran gigamit alang sa datos sa ID. Dili kini direktang ma-decrypt ug ang mapping relationship kinahanglan nga i-save. Dugang pa, tungod sa bahin sa hash function, mahimong mahitabo ang pagbangga sa datos.
- Homomorphic encryption: Gigamit ang ciphertext homomorphic algorithm. Ang kinaiya niini mao nga ang resulta sa operasyon sa ciphertext parehas sa operasyon sa plaintext pagkahuman sa decryption. Busa, kini kasagarang gigamit sa pagproseso sa mga numerical field, apan dili kini kaylap nga gigamit tungod sa mga hinungdan sa performance.
(3). Teknolohiya sa Sistema
Ang teknolohiya sa pagpugong nagtangtang o nanalipod sa mga aytem sa datos nga wala makatuman sa proteksyon sa pribasiya, apan dili kini imantala.
- Pagmasking: kini nagtumong sa labing komon nga pamaagi sa desensitization aron itago ang bili sa attribute, sama sa numero sa kontra, ang ID card gimarkahan og asterisk, o ang address giputol.
- Lokal nga pagpugong: nagtumong sa proseso sa pagtangtang sa piho nga mga kantidad sa hiyas (mga kolum), pagtangtang sa dili hinungdanon nga mga natad sa datos;
- Pagpugong sa rekord: nagtumong sa proseso sa pagtangtang sa piho nga mga rekord (mga laray), pagtangtang sa dili hinungdanon nga mga rekord sa datos.
(4). Teknolohiya sa Alyas
Ang pseudomanning usa ka teknik sa pagtangtang sa identipikasyon nga naggamit og alyas aron ilisan ang usa ka direktang identifier (o uban pang sensitibo nga identifier). Ang mga teknik sa alyas makamugna og talagsaon nga mga identifier alang sa matag indibidwal nga hilisgutan sa impormasyon, imbes nga direkta o sensitibo nga mga identifier.
- Mahimo kini nga makamugna og mga random nga kantidad nga independente aron motakdo sa orihinal nga ID, i-save ang mapping table, ug hugot nga makontrol ang pag-access sa mapping table.
- Mahimo usab nimo gamiton ang encryption aron makahimo og mga alyas, apan kinahanglan nga tipigan sa husto ang decryption key;
Kini nga teknolohiya kay kaylap nga gigamit sa kaso sa daghang mga independente nga tiggamit sa datos, sama sa OpenID sa open platform scenario, diin ang lainlaing mga developer makakuha og lainlaing mga Openid para sa parehas nga tiggamit.
(5). Mga Teknik sa Pag-generalize
Ang teknik sa pag-generalize nagtumong sa usa ka teknik sa pag-de-identification nga nagpamenos sa granularity sa pinili nga mga attribute sa usa ka data set ug naghatag og mas heneral ug abstract nga paghulagway sa datos. Ang teknolohiya sa pag-generalize dali ra ipatuman ug makaprotekta sa pagkatinuod sa record-level data. Kasagaran kini gigamit sa mga data product o data report.
- Pagpalibot: naglambigit sa pagpili og rounding base para sa napiling hiyas, sama sa pataas o paubos nga forensics, nga mohatag og mga resulta nga 100, 500, 1K, ug 10K
- Mga teknik sa pag-coding sa ibabaw ug ubos: Ilisi ang mga kantidad nga labaw (o ubos) sa threshold og usa ka threshold nga nagrepresentar sa ibabaw (o ubos) nga lebel, nga moresulta sa resulta nga "labaw sa X" o "ubos sa X"
(6). Mga Teknik sa Pag-randomize
Isip usa ka matang sa teknik sa de-identification, ang teknolohiya sa randomization nagtumong sa pag-usab sa bili sa usa ka hiyas pinaagi sa randomization, aron ang bili human sa randomization lahi gikan sa orihinal nga tinuod nga bili. Kini nga proseso makapakunhod sa abilidad sa usa ka tig-atake sa pagkuha sa bili sa hiyas gikan sa ubang mga bili sa hiyas sa parehas nga rekord sa datos, apan makaapekto sa pagkatinuod sa resulta nga datos, nga komon sa datos sa pagsulay sa produksiyon.
Oras sa pag-post: Sep-27-2022



