차례:
정의-비정형 데이터 란 무엇입니까?
구조화되지 않은 데이터는 인식 가능한 구조가없는 데이터를 나타냅니다. 그것은 조직적이지 않고 날 것이며 텍스트가 아니거나 텍스트가 될 수 있습니다. 예를 들어 전자 메일은 구조화되지 않은 텍스트 데이터를 잘 보여줍니다. 시간, 날짜, 수신자 및 발신자 세부 정보 및 제목 등이 포함되지만 전자 메일 본문은 구조화되지 않은 상태로 남아 있습니다. 비정형 데이터는 느슨하게 구조화 된 데이터로 식별 될 수 있으며, 여기서 데이터 소스는 구조를 포함하지만 데이터 세트의 모든 데이터가 동일한 구조를 따르는 것은 아닙니다.
고객 중심 비즈니스에서 비정형 형태로 발견 된 데이터를 조사하여 관계 마케팅 및 CRM (고객 관계 관리)을 향상시킬 수 있습니다. Facebook 및 Twitter와 같은 소셜 미디어 앱이 주류를 차지함에 따라 비정형 데이터 개발로 인해 구조화 된 데이터의 진행 상황이 앞서고 있습니다.
Techopedia는 비정형 데이터를 설명합니다
구조화되지 않은 데이터는 스프레드 시트 페이지, 데이터베이스 테이블 또는 기타 선형 또는 정렬 된 데이터 세트와 같은 항목보다 정렬되지 않은 양식을 따르는 데이터를 말합니다. 실제로 "데이터 세트"라는 용어는 추가 내용없이 깔끔하고 액세스 가능한 배열에 있고 특정 구조로 링크되거나 태그 된 데이터와 관련되어 있기 때문에 유용합니다.
구조화되지 않은 텍스트 데이터의 다른 예에는 Word 문서, PowerPoint 프레젠테이션, 인스턴트 메시지, 공동 작업 소프트웨어, 문서, 서적, 소셜 미디어 게시물 및 의료 기록이 포함됩니다. 텍스트가 아닌 구조화되지 않은 데이터는 일반적으로 MP3 오디오 파일, JPEG 이미지 및 Flash 비디오 파일 등과 같은 미디어에서 생성됩니다.
비정형 데이터는 일반적으로 사전 정의 된 데이터 모델을 포함하지 않으며 관계형 테이블과 잘 맞지 않을 수 있습니다. 구조화되지 않은 데이터는 일반적으로 텍스트가 무겁습니다. 그러나 숫자와 날짜 및 사실을 포함 할 수 있습니다. 이로 인해 기존 소프트웨어 프로그램을 사용하여 식별하기 어려운 모호성이 생깁니다.
기업 내에서 생성 된 방대한 양의 비정형 데이터를 제대로 관리하지 않으면 비용이 증가 할 수 있습니다. 검색 응용 프로그램이 특정 상황에서 사용되는 단어에 따라 아이디어를 파싱하려면 하드 카피 문서 또는 전자 형식의 데이터를 스캔해야합니다. 이것을 엔터프라이즈 또는 시맨틱 검색이라고합니다.
