큐:
일부 기계 학습 프로젝트에서 데이터 주석이 중요한 이유는 무엇입니까?
ㅏ:많은 경우 머신 러닝 프로그램의 작업이 훨씬 쉬워 지므로 데이터 주석은 머신 러닝에서 중요합니다.
이것은 감독과 비지도 머신 러닝의 차이와 관련이 있습니다. 기계 학습을 감독하면 교육 데이터에 이미 레이블이 지정되어 있으므로 기계가 원하는 결과에 대해 더 많이 이해할 수 있습니다. 예를 들어, 프로그램의 목적이 이미지에서 고양이를 식별하는 것이라면, 시스템에는 이미 고양이로 태그 된 많은 사진이 있습니다. 그런 다음 이러한 예를 사용하여 새 데이터를 대조하여 결과를 만듭니다.
무료 다운로드 : 기계 학습 및 중요한 이유 |
감독되지 않은 기계 학습에는 레이블이 없으므로 시스템은 고양이를 식별하기 위해 속성 및 기타 기술을 사용해야합니다. 엔지니어는 수염이나 꼬리와 같은 고양이의 시각적 특징을 인식하도록 프로그램을 교육 할 수 있지만, 라벨이 매우 중요한 역할을하는 감독 된 머신 러닝 에서처럼 프로세스가 간단하지 않습니다.
데이터 주석은 교육 데이터 세트에 레이블을 첨부하는 프로세스입니다. 이것들은 여러 가지 방법으로 적용 할 수 있습니다. 위에서 이진 데이터 주석 (고양이 또는 고양이가 아닌)에 대해 이야기했지만 다른 종류의 데이터 주석도 중요합니다. 예를 들어, 의료 분야에서, 데이터 주석은 다른 생물학적 특성에 대한 병리 또는 질병 마커를 식별하는 태그로 특정 생물학적 이미지에 태그를 부착하는 것을 포함 할 수있다.
데이터 주석은 작업을 수행하고 종종 팀이 수행하지만 많은 머신 러닝 프로젝트가 정확하게 기능하도록하는 데있어 중요한 부분입니다. 이 프로그램은 학습해야 할 내용과 다양한 입력을 구별하여 정확한 출력을 도출하는 방법을 프로그램에 가르치기위한 초기 설정을 제공합니다.