데이터베이스 더티 데이터 란 무엇입니까? -techopedia에서 정의

더티 데이터 란 무엇입니까? -techopedia에서 정의

차례:

Anonim

정의-더티 데이터 란 무엇입니까?

더티 데이터는 잘못된 정보가 포함 된 데이터를 말합니다. 메모리에 있지만 아직 데이터베이스에로드되지 않은 데이터를 참조 할 때도 사용할 수 있습니다. 소스에서 더티 데이터를 완전히 제거하는 것은 비현실적이거나 사실상 불가능합니다.

다음 데이터는 더티 데이터로 간주 될 수 있습니다.

  • 잘못된 데이터
  • 중복 데이터
  • 잘못된 데이터
  • 부정확 한 데이터
  • 비 통합 데이터
  • 비즈니스 규칙을 위반하는 데이터
  • 일반 형식이없는 데이터
  • 구두점 또는 철자가 잘못된 데이터

더티 데이터 설명 Techopedia

잘못된 데이터 입력 외에도 데이터 관리 및 데이터 스토리지의 부적절한 방법으로 인해 더티 데이터가 생성 될 수 있습니다. 일부 더티 데이터 유형은 다음과 같습니다.

  • 잘못된 데이터-데이터가 유효하거나 정확한지 확인하려면 입력 한 값이 필드의 유효한 값을 준수해야합니다. 예를 들어, 월 필드에 입력 한 값의 범위는 1-12이거나 개인의 나이는 130보다 작아야합니다. 데이터 값 정확성은 조회 테이블 또는 편집 확인을 통해 프로그래밍 방식으로 시행 될 수 있습니다.
  • 부정확 한 데이터-데이터 값은 정확하지만 정확하지 않을 수 있습니다. 때로는 다른 파일이나 필드를 검사하여 사용 된 컨텍스트에 따라 데이터 값이 정확한지 확인하는 것이 실용적입니다. 그러나 정확성은 종종 수동 검증에 의해서만 검증 될 수 있습니다.
  • 비즈니스 규칙 위반-비즈니스 규칙을 위반하는 데이터는 다른 유형의 더티 데이터입니다. 예를 들어, 유효 날짜는 항상 만료 날짜 이전이어야합니다. 다른 비즈니스 규칙 위반의 예는 환자가 여전히 퇴직 연령 미만일 수 있으며 Medicare 자격이없는 환자의 Medicare 보험 청구일 수 있습니다.
  • 불일치 데이터-확인되지 않은 데이터 중복성은 데이터 불일치를 초래합니다. 각 조직은 일관성이없고 반복적 인 데이터에 영향을받습니다. 이것은 고객 데이터에서 특히 일반적입니다.
  • 불완전한 데이터-결 측값이있는 데이터는 불완전한 데이터의 주요 유형입니다.
  • 중복 데이터-반복 된 제출, 부적절한 데이터 조인 또는 사용자 오류로 인해 중복 데이터가 발생할 수 있습니다.

데이터 품질을 높이고 더티 데이터를 방지하기 위해 조직은 데이터의 완전성, 유효성, 일관성 및 정확성을 보장하는 방법론을 통합해야합니다.

더티 데이터 란 무엇입니까? -techopedia에서 정의