전체 글 (19) 썸네일형 리스트형 SPP-net Spatial Pyramid Pooling SPP-net이라고 불리는 논문에 대하여 리뷰해 보겠습니다 해당 논문은 이전 이미지 분석을 위해 이미지를 convolution layer에 넣고 feature map을 만든뒤 FC-Layer로 통한 분석을 진행하는 과정에서 특정 수의 FC-Layer의 node 수를 위해 입력 이미지의 크기를 고정시키지만 이미지를 고정시키지 않기 위해 고안된 기법입니다 고정 이미지의 이유로는 FC-Layer에서 고정된 크기가 필요하며 이를 해결하기 위하여 다양한 convolution layer에서 feature map을 뽑아내고 해당 feature map을 FC-Layer 직전 고정 크기로 변환시키는데 목적을 둔 기법입니다 | 다양한 크기의 이미지를 입력으로 받아 convolut.. DSSD:Deconvolutional Single Shot Detector 이번에 리뷰할 논문은 DSSD 이라는 이름의 논문입니다 해당 논문은 기존 YOLO 대비 정확도를 개선한 모델인 SSD의 주 문제점인 작은 물체의 탐지가 어렵다 라는 단점을 보완한 논문입니다. 해당 논문의 주 변경점은 Base model 을 SSD VGG-16 model에서 ResNet-101 모델로 변경 기존 SSD(single shot detector )에 deconvolution network 추가 Prediction module 사용 이 있습니다 정확도 향상 및 작은 물체 탐지를 위하여 당시 최고의 성능을 보이던 ResNet 모델을 SSD Network와 결합시켜 모델을 생성하였으며 Deconvolution network를 사용시 작은 물체와 정확도 개선에 영향을 끼칠 것이라 판단하여 기존 SSD .. Mobilenet 논문리뷰 이번에 리뷰할 논문은 Mobilnet이라는 논문입니다 이전 읽어 보았던 논문들이 속도와 정확도 향상에 중점을 둔 모델이었다면 해당 모델은 기존보다 정확도가 약간 떨어지더라도 robotics , self-driving 등에 사용되는 소형 임베디드 기기에서도 사용이 가능하도록 최대한 연산량을 줄여 효율적으로 만든 모델입니다 해당 논문의 주요 기술로는 depth-wise separable convolution 이 주요하며 채널수와 해상도를 조정하기 위하여 width multiplier와 rewolution multiplier이라는 하이퍼 파라미터를 사용합니다 해당 논문의 거의 대부분의 내용이 이 depth-wise separable convolution입니다 (이후 설명 중 입 출력의 size를 같게 하기 위.. jetson board 환경설정 및 saved_model ,frozen_graph 생성 이전의 과정들로 생성했던 annotation data 들로 모델의 학습을 완료했을 것이며 검증 또한 완료하였을 것이다 해당 결과는 tensorboard로 확인할 수 있을 것이며 이번에는 이 학습된 모델을 활용할 수 있는 방안에 대하여 알아 볼 것이다 우선 saved_model.pb파일이나 frozen_graph.pb파일에 대하여 알아 두어야 하는데 간단히 말하면 pb파일은 우리가 학습한 모델을 사용하기 위하여 해당 가중치들의 값과 모델의 모양을 저장한 파일이라 생각하면 이해가 빠를듯 하다 활용방안으로는 해당 pb파일을 이용해 소형 컴퓨터인 jetson board에서 모델을 이용하여 detection을 진행 해 볼 것이다 jetson board역시 tensorflow 및 가상환경을 사용하여야 하기에 우선 .. SSD: Single Shot MultiBox Detector 논문리뷰 이번에 읽어볼 논문은 Single Shot Multibox Detector 이라는 이름의 SSD논문입니다 해당 논문은 이전 yolo와 동일하게 1 stage model이며 1stage model이지만 기존 2stage model이던 Faster RCNN보다 높은 정확도를 자랑하며 이전 yolo보다 더 빠른 속도를 보여줍니다 정확도를 높이기 위해서는 yolo의 경우 마지막 단의 feature map만 추론에 사용하지만 SSD같은 경우는 논문의 경우 총 6개의 layer에서 feature map을 생성하여 추론에 사용하며 여러 크기와 비율의 default boxes들을 사용하여 정확도를 높였습니다 속도같은 경우 yolo와 동일하게 region proposal 단을 제거하고 각 layer마다 grid cell.. GoogLeNet (inceptionet) 논문리뷰 이번 논문은 googlenet입니다 googlenet은 2014년도 논문으로써 최근 읽어보던 논문들에 비하면 예전 논문이지만 inception module 관련해서 알아두면 좋을 것 같아 공부를 진행하였습니다 우선 googlenet은 2014년도 VGGnet과 같은 시기에 나온 논문으로써 해당 논문 또한 네트워크의 깊이가 정확도에 큰 영향을 주며 추가적은 연산을 늘리지 않으며 깊이(layer)와 너비(채널 개수)를 늘려가는 것에 중점을 두었으며 총 22개 layer로 구성되었습니다 해당 논문에서 최근 3년간 딥러닝이 많이 개선되었으며 개선은 새로운 아이디어와 알고리즘, 신경망이 큰 비중을 차지했다 말하고 있습니다 기존 alexnet과 비교하면 parameter은 약 12배 가량 감소하였으며 해당 논문에서.. You Only Look Once(YOLO) v1 논문 리뷰 이번에 진행할 논문은 yolo라고 잘 알려진 모델의 첫번째 논문입니다 해당 리뷰는 실제 논문의 순서가 아닌 필자가 이해하기 쉬운 순서로 정리하였습니다 간단히 설명하면 이전 faster rcnn또한 초당 5 frames로 높은 속도를 보여 주나 real time 으로 구동하기 위해서는 초당 40 frames정도의 속도를 내야 되기 때문에 많이 모자란 속도를 보여줍니다 속도 측면을 해결하기 위해서 이전 region proposal 과 detection 총 2개의 network로 구성되던 과정을 하나의 network에서 처리하는 방법을 채택합니다 이를 1-satge기법이라 부르며 사용 결과 기본 yolo 45frames/second fast yolo 155frames/second를 기록하며 real time으.. Resnet 논문리뷰 이번에 리뷰해볼 논문은 resnet 논문입니다 ResNet 논문은 이전 VGGnet의 결과인 깊이가 깊어질시 정확도가 상승한다 라는 결론에 대해 실제로 해당하는지 테스트 후 수정한 논문입니다 이전 VGGnet이 16/19개 layer을 사용하였다면 ResNet은 1202 layer까지 깊이를 상승시키며 테스트를 진행하였습니다 우선 해당 결과에 대해 주목해 볼 필요가 있습니다 해당 결과는 CIFAR-10 dataset을 가지고 VGGnet 20/56 layer에 대하여 테스트를 진행 해 본 결과표 인데 해당 결과를 보면 이전의 결론인 깊이가 깊어질수록 error rate는 낮아진다 가 아닌 오히려 더 증가하는 결과를 보여주고 있습니다 정확도가 일정 수준 포화되면 급격히 감소하는 추세를 보이며 깊은 모델에서.. 이전 1 2 3 다음