차례:
정의-추출이란 무엇입니까?
추출은 데이터웨어 하우징 환경에서 사용하기 위해 특정 패턴으로 데이터 소스에서 관련 정보를 도출하는 프로세스입니다. 추출은 데이터에 의미를 부여하며 데이터 변환 프로세스의 첫 번째 단계입니다. 추출은 다양한 소스에서 오는 방대한 데이터 모음에서 조건 또는 범주에 맞는 특정 데이터 만 선택합니다.
Techopedia는 추출을 설명합니다
데이터웨어 하우징 환경에서, 다양한 구조 및 구조화되지 않은 소스에서 가져온 거대한 데이터 콜렉션을 처리, 변환 및 저장하여 의미있는 결론 및 예측을 도출해야합니다. 기본 소스에서 오는 데이터는 데이터에 대한 다양한 작업을 쉽게 수행 할 수있는 체계적인 방식으로 데이터웨어 하우징 시스템으로 가져와야합니다. 이 과정을 추출이라고합니다. 추출은 특정 규칙에 따라 구조화되지 않은 데이터에 구조를 추가합니다. 다음은 데이터 추출에 사용되는 기술 중 일부입니다.
- 패턴 매칭
- 테이블 기반 접근법
- 텍스트 분석
