• 제목/요약/키워드: Image flipping

검색결과 19건 처리시간 0.024초

Projection-Type Integral Imaging Using a Pico-projector

  • Yang, Yucheol;Min, Sung-Wook
    • Journal of the Optical Society of Korea
    • /
    • 제18권6호
    • /
    • pp.714-719
    • /
    • 2014
  • A pico-projector is a compact and mobile projector that has an infinite focus. We apply the pico-projector to a projection-type integral imaging system, which can expand the image depth to form multiple central depth planes. In a projection-type integral imaging system, the image flipping problem arises because the expanded elemental images pass through a lens array. To solve this problem, we propose the ray tracing of a pico-projector at a central depth plane and compensate the elemental image using a pixel-mapping process. Experiments to verify the proposed method are performed, and the results are presented.

CBIR 기반 데이터 확장을 이용한 딥 러닝 기술 (CBIR-based Data Augmentation and Its Application to Deep Learning)

  • 김세송;정승원
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.403-408
    • /
    • 2018
  • 딥 러닝의 학습을 위해서 일반적으로 많은 양의 데이터가 필요하다. 그러나 많은 양의 데이터 세트를 만드는 것은 쉽지 않기 때문에, 회전, 반전 (flipping), 필터링 (filtering) 등의 간단한 데이터 확장 (data augmentation) 기법을 통해 작은 데이터 세트를 좀 더 큰 데이터 세트로 만드는 여러 시도들이 있었다. 그러나 이러한 기법들은 이미 보유하고 있는 데이터 세트만을 이용하기 때문에 확장성에 제약을 갖는다. 이런 문제를 해결하기 위해 본고에서는 보유하고 있는 영상 데이터를 이용하여 새로운 영상 데이터를 획득하는 기술을 제안한다. 이는 기존 데이터 세트의 영상 데이터를 CBIR(Contents based image retrieval)의 쿼리로 이용하여 유사 영상들을 검색하여 획득하는 방식으로 이루어진다. 최종적으로 CBIR을 이용해 확장한 데이터를 딥 러닝으로 학습시켜 확장 전후의 성능을 비교하였다.

CT 이미지 세그멘테이션을 위한 3D 의료 영상 데이터 증강 기법 (3D Medical Image Data Augmentation for CT Image Segmentation)

  • 고성현;양희규;김문성;추현승
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.85-92
    • /
    • 2023
  • X-ray, Computed Tomography (CT), Magnetic Resonance Imaging (MRI)과 같은 의료데이터에서 딥러닝을 활용해 질병 유무 판별 태스크와 같은 문제를 해결하려는 시도가 활발하다. 대부분의 데이터 기반 딥러닝 문제들은 높은 정확도 달성과 정답과 비교하는 성능평가의 활용을 위해 지도학습기법을 사용해야 한다. 지도학습에는 다량의 이미지와 레이블 세트가 필요하지만, 학습에 충분한 양의 의료 이미지 데이터를 얻기는 어렵다. 다양한 데이터 증강 기법을 통해 적은 양의 의료이미지와 레이블 세트로 지도학습 기반 모델의 과소적합 문제를 극복할 수 있다. 본 연구는 딥러닝 기반 갈비뼈 골절 세그멘테이션 모델의 성능 향상과 효과적인 좌우 반전, 회전, 스케일링 등의 데이터 증강 기법을 탐색한다. 좌우 반전과 30° 회전, 60° 회전으로 증강한 데이터셋은 모델 성능 향상에 기여하지만, 90° 회전 및 ⨯0.5 스케일링은 모델 성능을 저하한다. 이는 데이터셋 및 태스크에 따라 적절한 데이터 증강 기법의 사용이 필요함을 나타낸다.

인공우주물체 추적 및 관측용 시스템 개발 (DEVELOPMENT OF TRACKING AND OBSERVING SYSTEM FOR MAN-MADE SPACE OBJECTS)

  • 김원규;민상웅
    • Journal of Astronomy and Space Sciences
    • /
    • 제20권2호
    • /
    • pp.153-162
    • /
    • 2003
  • 인공우주물체의 추적 및 관측을 위해 LX-200 12인치 망원경시스템을 도입하여 시스템의 구동부(모터, 모터드라이버, 모션컨트롤러)를 응답특성이 빠르고 능동제어가 가능한 것으로 개선하였다. 또한, PC를 이용하여 대상물의 실시간 궤적정보를 계산하여 모터 드라이버 내의 PID 제어기에 신호를 제공하였고, 명령신호 제어주기도 20ms까지 줄였다. 그 결과, 가대의 구동속도는 $18^{circ}/sec$로 향상되고 상용시스템보다 응답속도가 빠르며 대상물의 이미지 관측시 flipping 현상을 최소화하는 시스템을 개발하였다.

3차원 영상 재생 장치의 기능 분석 (A fount ion analysis of 3-dimers ion image Player)

  • 고윤호;최철호;권병헌;최병렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.604-606
    • /
    • 2002
  • 본 논문에서는 3차원 영상의 생성 원리와 3차원 영상 모드 그리고 기존의 3차원 영상 재생 장치를 분석하였다. 3차원 영상 모드에는 interlace page-flipping, sync-doubling 모드가 있으며, LCD(Liquid Crystal Display) shutter glasses를 이용한 3차원 영상 재생 장치의 동작 원리 및 파형을 분석하였고 현 재생 장치의 장. 단점을 논하였다 이 장비는 심한 flicker를 유발하였고, 완전한 3차원 입체 영상의 효과를 얻을 수 없었다. 마지막으로 LCD 모니터용 3차원 영상 재생 장치의 필요성과 향후 연구 방향을 제시하였다.

  • PDF

Multi-resolution Lossless Image Compression for Progressive Transmission and Multiple Decoding Using an Enhanced Edge Adaptive Hierarchical Interpolation

  • Biadgie, Yenewondim;Kim, Min-sung;Sohn, Kyung-Ah
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권12호
    • /
    • pp.6017-6037
    • /
    • 2017
  • In a multi-resolution image encoding system, the image is encoded into a single file as a layer of bit streams, and then it is transmitted layer by layer progressively to reduce the transmission time across a low bandwidth connection. This encoding scheme is also suitable for multiple decoders, each with different capabilities ranging from a handheld device to a PC. In our previous work, we proposed an edge adaptive hierarchical interpolation algorithm for multi-resolution image coding system. In this paper, we enhanced its compression efficiency by adding three major components. First, its prediction accuracy is improved using context adaptive error modeling as a feedback. Second, the conditional probability of prediction errors is sharpened by removing the sign redundancy among local prediction errors by applying sign flipping. Third, the conditional probability is sharpened further by reducing the number of distinct error symbols using error remapping function. Experimental results on benchmark data sets reveal that the enhanced algorithm achieves a better compression bit rate than our previous algorithm and other algorithms. It is shown that compression bit rate is much better for images that are rich in directional edges and textures. The enhanced algorithm also shows better rate-distortion performance and visual quality at the intermediate stages of progressive image transmission.

A Study on Improving the Accuracy of Medical Images Classification Using Data Augmentation

  • Cheon-Ho Park;Min-Guan Kim;Seung-Zoon Lee;Jeongil Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.167-174
    • /
    • 2023
  • 본 연구는 합성곱 신경망 모델에서 이미지 데이터 증강을 통하여 대장암 진단 모델의 정확도를 개선하고자 하였다. 이미지 데이터 증강은 기초 이미지 조작 방법을 이용하여 뒤집기, 회전, 이동, 밀림, 주밍을 사용하였다. 본 연구에서는 실험설계를 위해 보유하고 있는 5000개의 이미지 데이터에 대해 훈련 데이터와 평가 데이터로 각각 4000개와 1000개로 나누었으며, 훈련 데이터 4000개에 대해 이미지 데이터 증강 기법으로 4000개와 8000개의 이미지를 추가하여 모델을 학습시켰다. 평가 결과는 훈련 데이터 4000개, 8000개, 12000개에 대한 분류 정확도가 각각 85.1%, 87.0%, 90.2%로 나왔으며 이미지 데이터 증강에 따른 개선 효과를 확인하였다.

딥러닝을 이용한 화강암 X-ray CT 영상에서의 균열 검출에 관한 연구 (Pixel-level Crack Detection in X-ray Computed Tomography Image of Granite using Deep Learning)

  • 현석환;이준성;전성환;김예진;김광염;윤태섭
    • 터널과지하공간
    • /
    • 제29권3호
    • /
    • pp.184-196
    • /
    • 2019
  • 본 연구에서는 화강암 시편에서 수압 파쇄법에 의해 생성된 미세균열의 3차원 형상을 X-ray CT 영상과 딥러닝을 이용하여 추출하였다. 실험으로 생성된 미세균열은 X-ray CT 영상 상에서 일반적인 영상처리방법으로는 추출하기 매우 어렵고 육안으로만 관찰이 가능한 형태를 지닌다. 하지만 본 연구에서 제안한 합성곱 신경망(Convolutional neural network) 기반 인코더-디코더(Encoder-Decoder) 구조의 딥러닝 모델을 통해 미세균열을 정량적으로 추출할 수 있었다. 특히 픽셀 단위의 미세균열 추출을 위해 인코딩 과정에서 소실되는 정보를 디코딩 과정으로 직접 전달하는 디코더 모델을 제안하였다. 또한, 딥러닝 기반 신경망 학습에 필요한 데이터의 수를 증가시키기 위해 이미지의 분할(Division), 회전(Rotation), 그리고 반전(Flipping) 등으로 데이터를 생성하는 영상 증대 방법을 적용하였으며 이때 최적의 조합을 확인하였다. 최적의 영상 학습 데이터 증대 방법을 적용하였을 때 검증 데이터뿐만 아니라 테스트 데이터에서의 성능 향상을 확인하였다. 학습 데이터의 원본 개수가 딥러닝 기반 신경망의 균열 추출 성능에 미치는 영향을 확인하고 딥러닝 기술을 사용하여 성공적으로 미세균열을 추출하였다.

시각센서를 이용한 SMT 부품장착상태 검사 (Placement inspection of the SMT components using 3-D vision)

  • 손영탁;오형렬;윤한종
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1996년도 한국자동제어학술회의논문집(국내학술편); 포항공과대학교, 포항; 24-26 Oct. 1996
    • /
    • pp.605-608
    • /
    • 1996
  • The aim of this thesis is to develop a SMT-components placement inspection system equipped with a visual sensor. The visual sensor, which consists of a camera and 2-layer LED illuminator, developed to inspect the component placement state such as missing, shift, flipping, polarity and tomb-stone. on PCB in the reflow-process. In practical applications, however, it is too hard to classify component from images mixed pad on PCB, cream solder paste and component. To overcome the problem, this thesis proposes the 2-layer illumination method and the heuristic image processing algorithms according to inspection type. To show the effectiveness of the proposed approach, a series of experiments on the inspection were conducted. The results show that the proposed method is robust to visual noise and variations in component conditions.

  • PDF

Precise segmentation of fetal head in ultrasound images using improved U-Net model

  • Vimala Nagabotu;Anupama Namburu
    • ETRI Journal
    • /
    • 제46권3호
    • /
    • pp.526-537
    • /
    • 2024
  • Monitoring fetal growth in utero is crucial to anomaly diagnosis. However, current computer-vision models struggle to accurately assess the key metrics (i.e., head circumference and occipitofrontal and biparietal diameters) from ultrasound images, largely owing to a lack of training data. Mitigation usually entails image augmentation (e.g., flipping, rotating, scaling, and translating). Nevertheless, the accuracy of our task remains insufficient. Hence, we offer a U-Net fetal head measurement tool that leverages a hybrid Dice and binary cross-entropy loss to compute the similarity between actual and predicted segmented regions. Ellipse-fitted two-dimensional ultrasound images acquired from the HC18 dataset are input, and their lower feature layers are reused for efficiency. During regression, a novel region of interest pooling layer extracts elliptical feature maps, and during segmentation, feature pyramids fuse field-layer data with a new scale attention method to reduce noise. Performance is measured by Dice similarity, mean pixel accuracy, and mean intersection-over-union, giving 97.90%, 99.18%, and 97.81% scores, respectively, which match or outperform the best U-Net models.