오디오 max pooling은 alexnet을 이미지 처리를위한 훌륭한 기술로 만드는 데 어떻게 도움이됩니까?

max pooling은 alexnet을 이미지 처리를위한 훌륭한 기술로 만드는 데 어떻게 도움이됩니까?

Anonim

큐:

최대 풀링은 AlexNet을 이미지 처리를위한 훌륭한 기술로 만드는 데 어떻게 도움이됩니까?

ㅏ:

혁신적인 컨볼 루션 신경망 인 AlexNet에서 max pooling의 개념은 부분적으로 여러 컨볼 루션 레이어가있는 복잡한 모델에 삽입되어 전문가들이 부르는 이미지를 사용하여 신경망이 수행하는 작업을 능률화하고 능률화하기 위해 "비선형 다운 샘플링 전략"

AlexNet은 기계 학습 및 신경망 진행을위한 유역 행사로 여겨지는 2012 ILSVRC (ImageNet Large-Scale Visual Recognition Challenge)를 수상한 매우 훌륭한 CNN으로 널리 알려져 있습니다 (컴퓨터 비전의 "올림픽"이라고도 함) ).

훈련이 2 개의 GPU로 분할되는 네트워크의 프레임 워크에는 5 개의 회선 레이어, 3 개의 완전히 연결된 레이어 및 최대 풀링 구현이 있습니다.

기본적으로 max pooling은 뉴런 컬렉션에서 출력의 "풀"을 가져와 후속 레이어 값에 적용합니다. 이를 이해하는 또 다른 방법은 최대 풀링 접근 방식이 모델을보다 적합하게 맞추기 위해 값을 통합하고 단순화 할 수 있다는 것입니다.

최대 풀링은 그래디언트 계산에 도움이 될 수 있습니다. 다운 샘플링을 통해 "계산 부담을 줄입니다"또는 "수축 초과 축소"라고 말할 수 있습니다. 최대 풀링은 "차원 감소"라고합니다.

차원 축소는 신경망을 통해 실행하기 어려운 복잡한 모델의 문제를 해결합니다. 작은 들쭉날쭉 한 윤곽이 많고이 선의 모든 작은 부분이 데이터 점으로 표시되는 복잡한 모양을 상상해보십시오. 차원 축소를 통해 엔지니어는 기계 학습 프로그램이 데이터 포인트를 "축소"하거나 더 적은 수의 데이터 포인트를 샘플링하여 모델을보다 간단하게 만들 수 있도록 도와줍니다. 그렇기 때문에 최대 풀링 레이어와 출력을 보면 차원 축소 전략에 해당하는 더 간단한 픽셀 화를 볼 수 있습니다.

AlexNet은 또한 정류 선형 단위 (ReLU)라고하는 기능을 사용하며 CNN을 통해 이미지를 처리 ​​할 때 최대 풀링이이 기술을 보완 할 수 있습니다.

전문가와 프로젝트에 참여한 사람들은 AlexNet의 특정 빌드를 보여주기 위해 풍부한 시각적 모델, 방정식 및 기타 세부 사항을 제공했지만 일반적으로 최대 풀링을 여러 인공 뉴런의 출력을 통합하거나 통합하는 것으로 생각할 수 있습니다. 이 전략은 CNN의 전체 빌드의 일부이며 최첨단 머신 비전 및 이미지 분류와 동의어가되었습니다.

max pooling은 alexnet을 이미지 처리를위한 훌륭한 기술로 만드는 데 어떻게 도움이됩니까?