전체 글54 [논문정리] GhostNet: More Features from Cheap Operations *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. GhostNet의 기초가 되는 MobileNet에 대한 설명은 이전 게시물을 참조해주세요. https://stevenkim1217.tistory.com/entry/%EB%85%BC%EB%AC%B8%EC%A0%95%EB%A6%AC-MobileNets-Convolutional-Neural-Networks-for-Mobile-Vision-Applications [논문정리] MobileNets: Convolutional Neural Networks for Mobile Vision Applications *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. Introduction MobileNet의 핵심 아이디어는 Depthwise.. 2023. 9. 1. [논문정리] MobileNets: Convolutional Neural Networks for Mobile Vision Applications *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. Introduction MobileNet의 핵심 아이디어는 Depthwise Separable Convolution입니다. 이 개념은 Depthwise Convolution과 Pointwise Convolution을 조합하는 방법으로 이루어집니다. Background 1. Standard Convolution 일반적인 Convolution 먼저 설명하겠습니다. 일반적인 Convolution에서는 Input 채널 개수 만큼 Filter의 채널도 3개가 있어서, Convolution 연산을 하면 하나의 채널의 output을 가집니다. 2. Depthwise Convolution 그런데 Standard와는 다르게, Depthwise Convo.. 2023. 9. 1. [논문 정리] Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction w *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. Introduction FPN이라고 부르는 Feature Pyramid Network 등 이전의 많은 논문에서 이 Pyramid 구조에 대해서 다뤘는데요. 이 Pyramid 구조는 여기 그림에서 보이는 것처럼 서로 다른 해상도의 feature map을 쌓아 올린 형태를 말합니다. 이 다양한 scale의 feature map을 모두 이용하여 segmentation을 수행합니다. Receptive field는 기존 이미지에서 한 픽셀이 담당하는 범위를 말하는데요. 이렇게 pyramid 구조를 가지면, 깊이가 더 깊어질수록, feature map에서 한 픽셀이 담당하는 범위가 늘어나게 됩니다. 즉, 깊이가 깊어질수록 receptive fiel.. 2023. 9. 1. [논문정리] ECA-Net:Efficient Channel Attention for Deep Convolutinoal Neural Networ *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. Introduction ECA Net은 SENet을 개선한 모델입니다. https://stevenkim1217.tistory.com/entry/%EB%85%BC%EB%AC%B8%EC%A0%95%EB%A6%AC-SENet-Squeeze-and-Excitation-Networks [논문정리] SENet: Squeeze and Excitation Networks *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. Method SENet은 크게 Squeeze와 Excitation 과정으로 나누어집니다. Squeeze: 쥐어짜고, Excitation: 활성화하는 네트워크입니다. 대략적인 stevenkim1217.tistory.co.. 2023. 9. 1. [논문정리] SENet:Squeeze and Excitation Networks *본 내용은 논문의 상세한 분석이 아닌, 간단한 복기용 정리입니다. Method SENet은 크게 Squeeze와 Excitation 과정으로 나누어집니다. Squeeze: 쥐어짜고, Excitation: 활성화하는 네트워크입니다. 대략적인 과정은 맨처음 input 이미지에서 conv 연산을 통해 feature map을 생성하고, 그 다음 squeeze작업을 통해 쥐어짜서, 여기서 활성화해서 마지막에 곱해주는 과정입니다. 첫번째 squeeze 과정에서는, 저번 시간에 설명한 Global Average Pooling을 진행합니다. 여러 채널로 되어있는 여기 feature map에서 각 한 채널당 평균을 내서 하나의 값으로 이루어진 채널을 구성합니다. 여기 보이시는 것처럼 채널만 여러개로 남겨둔 채 1x1x.. 2023. 9. 1. 이전 1 2 3 4 5 6 7 8 ··· 11 다음