본문 바로가기
[Paper Review] ConvNeXt - A ConvNet for the 2020s (2/n) ConvNet : a Roadmap Starting Point is a ResNet-50 model을 Vision transformer가 학습하는 방식으로 학습시켰더니 performance가 더 좋았다. Deisign Decision (network modernization : CNN의 현대화) 1. Macro design 2. ResNeXt 3. Inverted bottleneck 4. Large kernel size 5. various layer-wise micro design Training Techniques 0. train a baseline model(resnet 50/200) with the vision transformer training procedure ~ DeiT와 Swin Trnasfomer에서 소개된 것들과 유사한 .. 2023. 11. 27.
[Paper Review] ConvNeXt - A ConvNet for the 2020s (1/n) Introduction In this work, we reexamine the design spaces and test the limits of what a pure ConvNet can achieve. We gradually “modernize” a standard ResNet toward the design of a vision Transformer, and discover several key components that contribute to the performance difference along the way. 대표적인 inductive bias 1. sliding-window manner = is intrinsic to visual processing, particularly when working with h.. 2023. 11. 27.
[FastVit] Vision Transformer from APPLE https://github.com/apple/ml-fastvit?s=09 https://arxiv.org/pdf/2303.14189.pdf In this work, we introduce FastViT, a hybrid vision transformer architecture that obtains the state-of-the-art latency-accuracy trade-off. To this end, we introduce a novel token mixing operator, RepMixer, a building block of FastViT, that uses structural reparameterization to lower the memory access cost by removing s.. 2023. 8. 18.
[Computer Vision] Super Resolution https://www.youtube.com/watch?v=vMlLgA-nhuY&t=205s https://github.com/kairess/BSRGAN GitHub - kairess/BSRGAN: 4배 고해상도 복원 BSRGAN (옛날 사진, 인물 사진, 옛날 만화책) 4배 고해상도 복원 BSRGAN (옛날 사진, 인물 사진, 옛날 만화책). Contribute to kairess/BSRGAN development by creating an account on GitHub. github.com 빵형의 개발도상국채널에서 본것 중 오늘은 Super Resolution (화질 개선, 화질 향상) + Colorization (흑백사진의 컬러복원)이 매우 흥미로워 보여서 천천히 따라해보며 이해하도록 하겠습니다. .. 2022. 4. 11.
[Computer Vision] Face detector https://github.com/kairess/face_detector GitHub - kairess/face_detector Contribute to kairess/face_detector development by creating an account on GitHub. github.com https://www.youtube.com/watch?v=tpWVyJqehG4 오늘 해볼것은 FACE DETECT한뒤 다른 이미지로 대체하는 project입니다. 우선 유튜브와 github 동시에 공유 해드리겠습니다. 직접 확인해보시는것도 좋겠죠? terminal 에서 git clone https://github.com/kairess/face_detector.git 입력해주시면 됩니다 그러면 이런 폴더가 생성되는데.. 2022. 3. 16.
[Computer Vision] 나의 관심 분야 빵형의 개발도상국이라는 유튜버가 계십니다. 여러 가지 재밌는 주제를 다루시는 것 같아서 그중에 제가 재밌어하는 분야들을 따라 쳐보면서 좀 더 뻗어나가보려 합니다. RESPECT! https://www.youtube.com/c/%EB%B9%B5%ED%98%95%EC%9D%98%EA%B0%9C%EB%B0%9C%EB%8F%84%EC%83%81%EA%B5%AD/videos 빵형의 개발도상국 신기하고 재밌는 인공지능을 쉽게, 짧게, 내손으로 만들어 봅니다! 📮사업 및 개발문의 kairess87@gmail.com 😘빵형의 개발도상국 후원 카카오페이 : https://qr.kakaopay.com/Ej86nqvdu 투네이션 : https://toon.at www.youtube.com https://github.com/.. 2022. 3. 15.