'On Going' 카테고리의 글 목록

본문 바로가기

[pcd] LiDAR 데이터의 noise 제거 방법론 라이더 데이터(PCD, LAS 등)에서 노이즈를 효과적으로 제거하는 방법은 데이터 품질 향상과 정확한 3D 모델링을 위해 필수적입니다. 다양한 기법과 도구를 활용해 환경 간섭, 센서 오류 등으로 발생하는 이상치를 제거할 수 있으며, 본 글에서는 실무에서 적용 가능한 핵심 기법들을 체계적으로 정리합니다. 1. 통계적 이상치 제거(Statistical Outlier Removal) 수학적 원리- 평균 거리 계산 : 각 포인트 \(p_i\)에 대해, 주변의 k-최근접 이웃과의 평균거리 \(\bar{d}_i\)를 계산합니다.- 전체 평균 및 표준편차 : 모든 포인트의 평균거리 \(\mu\)와 표준편차 \(\sigma\)를 계산합니다.- 이상치 판단 : 포인트 \(p_i\)가 \(\bar{d}_i>\mu+\alp.. 2025. 4. 15.

[pcd] 도로 포인트클라우드를 평면으로 정렬하는 4가지 방법: 딥러닝 전처리를 위한 접근(4. PCA기반 평면정렬) 포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬하거나 2D 이미지처럼 표현하는 전처리 과정이 필요합니다. 이 글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 네 번째를 소개합니다. 4. PCA(Principal Component Analysis)PCA는 데이터의 분산이 가장 큰 방향을 찾아내는 고전적인 통계 기법입니다. 주로 고차원 데이터를 저 차원으로 투영할 때 사용되지만, 3D 포인트 클라우드에서는 다음과 같은 목적에 활용됩니다. 입력: 3D 포인트 집합\( X = \{ \mathbf{x}_1, \mathbf {.. 2025. 4. 14.

[pcd] 도로 포인트클라우드를 평면으로 정렬하는 4가지 방법: 딥러닝 전처리를 위한 접근(3. DTM기반 CSF) 포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬하거나 2D 이미지처럼 표현하는 전처리 과정이 필요합니다. 이 글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 세 번째를 소개합니다. 3. DTM(DIgital Terrain Model)DTM은 지표면의 형상을 3D로 표현한 모델입니다.LiDAR, 항공사진 등으로부터 얻은 포인트 클라우드를 분석해 지면만 분리하고, 그위에 있는 구조물(건물, 나무 등)은 제거합니다. CSF(Cloth Simulation Filtering)란?CSFsms DTM을 추출하는 대표적인 방법중.. 2025. 4. 14.

[pcd] 도로 포인트클라우드를 평면으로 정렬하는 4가지 방법: 딥러닝 전처리를 위한 접근(2. Moving Least Squares) 포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬하거나 2D 이미지처럼 표현하는 전처리 과정이 필요합니다. 이 글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 두 번째를 소개합니다. 2. Moving Least Squares(MLS)Moving Least Squares(MLS)는 포인트클라우드에서 곡면 구조를 추정하거나, 노이즈를 제거하고 점들을 부드럽게 보관할 수 있는 기법입니다. 이름처럼 이동하면서 최소제곱을 반복해, 각 점 주변의 로컬 곡면 또는 평면을 계산합니다. 즉, 각 점 주변의 지역적인 평면/곡면을 만들어.. 2025. 4. 14.

[pcd] 도로 포인트클라우드를 평면으로 정렬하는 4가지 방법: 딥러닝 전처리를 위한 접근(1. RANSAC) 포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬하거나 2D 이미지처럼 표현하는 전처리 과정이 필요합니다. 이글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 첫 번째 방법을 소개합니다. 1. RANSAC기반 평면추정RANSAC(Random Sample Consensus)은 노이즈나 이상치가 많은 데이터에서도 강건하게 평면을 추정할 수 잇는 고전적 기법입니다. 도로면이 전체 포인트 클라우드에서 가장 넓은 평면일 것이라는 가정 하에 사용됩니다. 핵심 아이디어1. 임의로 최소 샘플 수 만큼 점을 선택(예: 평면 -> 3점).. 2025. 4. 14.

[ViT] Vision Transformer 리뷰 비전 트랜스포머(ViT)는 이미지를 입력으로 받아 Transformer 인코더만으로 특징을 추출하는 모델입니다. ViT는 먼저 입력 이미지를 고정 크기의 패치(patch)들로 분할합니다. 예를 들어 224 ×224 RGB 이미지를 16 ×16 크기의 패치로 나누면 패치 1개는 16 ×16 ×3 픽셀이고, 전체 패치는 14 ×14=196개가 생성됩니다. 각 패치는 2차원 픽셀을 1차원으로 평탄화한 후 선형 변환을 거쳐 패치 임베딩 벡터로 변환됩니다 1. ViT 모델 구조 개요이미지를 일정 크기의 패치들로 분할한 뒤(아래 패치 예시) 각 패치를 벡터로 임베딩하고, 위치 인코딩을 더하여 Transformer 인코더(위 부분)에 입력한다. 인코더는 여러 층의멀티헤드 자가주목과 MLP로 이루어진다. 최종적으로 .. 2025. 3. 24.

[PCD]Frontal view Lane Detection K-lane 논문 리뷰 K-lane LLDN(Lidar Lane Detection Network ) 1. 역사CLDN : 카메라 기반 차선 감지는 조명 조건에서 상당한 성능 문제가 존재하지만 라이다는 야간, 빛 등 다양한 조명 조건에 강함카메라 기반 방법은 자차로부터의 거리에 따라 두께가 감소하여 동일한 소실점을 향하게 되어 차선 끝에 왜곡 문제 존재LLDN : 초기 라이다 기반 차선 감지는 차선 표시를 식별하기 위해 강도 또는 반사율 임계값 설정에 의존하였지만 사전 정의된 임계값에만 한정되어 다양한 조로 환경 조건에 부합하지 않았음2. LLDN GFC(Lidar Lane Detection Networks utilizing Global Feature Correlator) LLDN-GFC(Lidar lane detection n.. 2025. 3. 17.

[PCD] Point Transformer V3(PTv3) 논문리뷰 PTv3는 3D 점군 데이터를 처리하기 위한 Transformer 기반 U-Net 형태 백본입니다. 전체 아키텍처는 U-Net처럼 4단계 인코더와 4단계 디코더로 구성되며, 각 인코더 단계에서 일정 비율로 점들을 다운샘플링하고 연속된 Transformer 블록을 쌓은 뒤, 디코더 단계에서 업샘플링을 통해 원래 해상도로 복원합니다. 모델 전반의 설계 철학은 단순성과 효율성을 극대화하여 대규모 점군에 대한 **확장성(scalability)**을 확보하는 데 있습니다. 이를 위해 PTv3는 이전 버전들에서 복잡하게 사용되던 연산들을 과감히 단순화하거나 제거하고, 효율적인 점군 구조화 기법을 도입하여 더 빠른 속도와 적은 메모리로 동등한 성능을 달성합니다. 주요 구성 요소점군 직렬화(Point Cloud Ser.. 2025. 3. 17.

[PCD] start 오늘부터 point cloud data를 다루게됐습니다. 해본적이 없어서 앞으로 공부하고 정리할 내용이 많아질 것 같습니다. 기대가 되네요 2025. 3. 12.

[Super Resolution] Using Hugging Face Diffusers 출처 : https://pyimagesearch.com/2024/06/03/sharpen-your-vision-super-resolution-of-cctv-images-using-hugging-face-diffusers/ 의 글을 한글 번역과 저의 의견 및 코드 수정을 거친 Post입니다. Sharpen Your Vision: Super-Resolution of CCTV Images Using Hugging Face Diffusers - PyImageSearchLearn how to perform super-resolution on real-life CCTV images using Hugging Face Diffusers, enhancing clarity and detail.pyimagesearch.co.. 2024. 9. 10.

[SAM2] SAM2 transfer learning with custom datasets, .py format SAM2 모델의 배치 학습 구현하기안녕하세요! 오늘은 SAM2(Segment Anything Model 2) 모델의 배치 학습을 구현하는 방법에 대해 알아보겠습니다. SAM2는 이미지 세그멘테이션 작업에 매우 효과적인 모델이지만, 기본 구현은 단일 이미지 처리에 초점이 맞춰져 있습니다. 여기서는 배치 학습을 통해 학습 효율성을 높이는 방법을 소개하겠습니다.1. 필요한 라이브러리 임포트 및 설정먼저, 필요한 라이브러리를 임포트 하고 GPU 설정을 합니다:pythonimport torchimport os import numpy as np import cv2 from sam2.build_sam import build_sam2 from sam2.sam2_image_predictor import SAM2Image.. 2024. 9. 9.

[SAM2] Custom 학습 - SAM2 transfer learning with custom datasets, .ipynb SAM2 model의 custom 학습을 진행해 보겠습니다. 대화형 인터프리터 버전import torchimport numpy as npimport cv2,osimport matplotlib.pyplot as pltfrom PIL import Imagefrom sam2.build_sam import build_sam2from sam2.sam2_image_predictor import SAM2ImagePredictor 우선 필요한 package들을 import 해줍니다. # use bfloat16 for the entire notebooktorch.autocast(device_type="cuda", dtype=torch.bfloat16).__enter__()if torch.cuda.get_device_.. 2024. 9. 9.

[SAM2] segment anything 2 Sam2가 공개됐습니다. https://sam2.metademolab.com/demo 직접해보시면 아시겠지만 성능이 매우 뛰어납니다. 없어졌다 다시 나오는것도 찾아 tracking하구요. 이름은 Segment anything인데 yolo도 씹어먹을 tracking성능까지 뛰어난것을 확인 할 수 있습니다. https://github.com/facebookresearch/segment-anything-2또한, 빅테크에서 시원하게 오픈한 기술답게 github를 통해 쉽게 사용할 수있습니다. 환경설정도 쉽고 ipynb예시도 줘서 간단하게 사용해 볼 수 있습니다. notebook폴더에 들어있는 ipynb를 사용할 때 한가지 기본적인 내용은 ipynb파일들이 notebook보다 상위 폴더에서 실행된다는 것입니다.. 2024. 8. 8.

[ECW] ECW 파일포맷을 다루고싶어!! ECW을 앞선 포스팅으로 해결하실수 있으시다면 그거슨 축복입니다.. 아래의 코드를 실행했을때 None이 나오지 않아야 ECW를 다룰수있는데요from osgeo import gdalprint(gdal.__version__)print(gdal.GetDriverByName('ECW')) 저는 약 10일간의 고군분투를 하고있으나 여전히 None을 return 하고있는 상황입니다.. # Install ECW SDKsudo unzip erdas-ecw-sdk-5.4.0-linux.zipsudo chmod +x ERDAS_ECWJP2_SDK-5.4.0.bin./ERDAS_ECWJP2_SDK-5.4.0.binsudo cp -r ~/hexagon/ERDAS-ECW_JPEG_2000_SDK-5.4.0/Desktop_Rea.. 2024. 8. 6.

[ECW] ECW file 포맷을 다루고 싶어! 출처 : https://www.adobe.com/kr/creativecloud/file-types/image/raster/ecw-file.html ECW 파일 탐구: 향상된 압축 웨이브릿 형식 항공 사진이나 위성 사진과 같은 대규모 이미지를 처리할 때 파일 크기를 줄이면서도 품질을 유지하는 것은 매우 중요합니다. 이때 유용한 것이 ECW(Enhanced Compression Wavelet) 파일입니다. 최대 1:100의 놀라운 압축 비율로 잘 알려진 이 형식은 기상학과 해양학처럼 대규모 이미지가 필요한 분야에 이상적입니다. ECW 파일이란? ECW 파일은 호주의 소프트웨어 개발사 Earth Resource (ER) Mapping Ltd.에 의해 개발되었습니다. 이 파일 형식은 대용량 이미지 파일을 효율적.. 2024. 8. 6.

History of Super Resolution AI Methodologies of Super-Resolution TechniquesSuper-resolution technology has evolved using three main methodologies: Convolutional Neural Networks (CNN), Generative Adversarial Networks (GAN), and Transformers.1. CNN-based Super-Resolution1.1. SRCNN (Super-Resolution Convolutional Neural Network): Introduced in 2015, SRCNN was one of the first CNN-based super-resolution models. It has a simple st.. 2024. 7. 17.

위성영상에 대한 이해 There are four types of resolution in the satellite image industry:Spatial Resolution: The real-world metric represented by one pixel.Spectral Resolution: The ability to measure specific bands or wavelength ranges.Radiometric Resolution: The number of bits representing the variety of colors (e.g., 8-bit = 2^8 = 256 levels, ranging from 0 to 255).Temporal Resolution: The time interval required to.. 2024. 7. 5.

SLAM의 input과 output에 대해 알아보자 우선 다양한 종류의 data를 종합하여 environment를 조성한다는 것을 이해해야 한다. DATA Input 1. LIDAR(light detection and ranging)- Data : Distance Measurements in the form of point clouds.- Usage : Provides highly accurate spatial information, useful for building detailed maps. 2. cameras- Data : Vsual information in the form of images or video streams.- Usage : Used in visual SLAM to extract features from the environment... 2024. 6. 18.

SLAM (Simultaneous Localization and Mapping) 관련 개념정리 SLAM은 이름에서부터 알 수 있듯 Localization과 Mapping을 동시에 하는 알고리즘이다. Key concpets of SLAM1. Localization : Determining the position and orientation of the robot within the map. (map상에서 robot의 위치와 방향을 결정)2. Mapping : building a map of the environment using sensor data. (sensor data를 이용한 주변 공간의 map 생성)3. Sensors : Typically involves various types of sensors, such as Lidar, cameras. IMUs(Inertial measurement .. 2024. 6. 18.

Multi-modal learning 1. Over of multi-modal learning(다중 감각) Challenge (1) - Different representations between modalities (2) - Unbalance between heterogeneous feature spaces - 1:N matching가능성 (3) - May a model be biased on a specific modality Desipite the challenges, multi-modal learning is fruitful and important Matching : 서로 다른 데이터 타입을 공통된 space로 match Translating : 하나의 데이터타입을 다른 데이터 타입으로 translate Referencing : 서.. 2023. 12. 7.

이전 1 2 다음

티스토리툴바