차례:
정의-데이터 섭동이란 무엇입니까?
데이터 교란은 전자 건강 기록 (EHR)을위한 개인 정보 보호 데이터 마이닝의 한 형태입니다. EHR 데이터 보호에 적합한 두 가지 주요 유형의 데이터 섭동이 있습니다. 첫 번째 유형은 확률 분포 방식으로 알려져 있고 두 번째 유형은 값 왜곡 방식으로 불립니다. 데이터 삽관은 민감한 전자 데이터를 무단 사용으로부터 보호하기위한 비교적 쉽고 효과적인 기술로 간주됩니다.
Techopedia는 데이터 섭동을 설명합니다
데이터 삽관은 공개 데이터 세트를 원래의 식별자 또는 주체와 연결하는 공격이 발생할 가능성이 높기 때문에 비 식별 / 재 식별보다 건강 관리에서 데이터 보호를보다 효과적으로 적용하는 것으로 호평을 받고 있습니다. 이러한 이유로 EHR 보안과 관련하여 데이터 삽관은보다 견고한 응용 프로그램으로 호평을 받고 있습니다.
확률 분포 방식은 데이터를 가져와 동일한 분포 표본 또는 분포 자체에서 대체합니다. 가치 왜곡 접근법은 곱셈 또는 가산 성 노이즈 또는 기타 무작위 프로세스에 의해 데이터를 교란시킵니다. 이전 유형의 섭동보다 더 효과적인 것으로 간주됩니다. 이 접근법은 예를 들어 각 요소에 가우시안 분포에서 랜덤 노이즈가 할당되는 의사 결정 트리 분류기를 작성합니다. 데이터 마이닝을 통해 원본 데이터 배포가 교란 된 버전에서 다시 작성됩니다. 그러나 비평가들은 랜덤 추가 노이즈가 필터링 될 수 있으며 EHR 프라이버시가 손상 될 수 있다는 사실을 지적합니다.