• Title/Summary/Keyword: 픽셀 값

Search Result 611, Processing Time 0.023 seconds

Local variable binarization and color clustering based object extraction for AR object recognition (AR 객체인식 기술을 위한 지역가변이진화와 색상 군집화 기반의 객체 추출 방법)

  • Cho, JaeHyeon;An, HyeonWoo;Moon, NamMe
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.481-483
    • /
    • 2018
  • AR은 VR과 달리 실세계 공간의 객체에 대한 서비스를 제공하므로 서비스 개발을 방해하는 많은 요인들이 발생한다. 이를 보완하기위해 비주얼 마커, SLAM, 객체인식 등 여러 AR 기술이 존재한다. 본 논문은 AR 기술 중에서 객체인식의 정확도 향상을 위해 지역가변 이진화(Local variable binarization)와 색상의 군집화를 사용해서 이미지에서 객체를 추출하는 방법을 제안한다. 지역 가변화는 픽셀을 순차적으로 읽어 들이면서 픽셀 주위의 값의 평균을 구하고, 이 값을 해당 픽셀의 임계 값으로 사용하는 알고리즘이다. 픽셀마다 주위 색상 값에 의해 임계 값이 변화되므로 윤곽선 표현이 기존의 이진화보다 뚜렷이 나타난다. 색상의 군집화는 객체의 중요색상과 배경의 중요색상을 중심으로 유사한 색상끼리 군집화 하는 것이다. 객체 내에서 가장 많이 나온 값과 객체 외에 가장 많이 나온 값을 각 각 기준으로 색조와 채도의 값을 Euclidean 거리를 사용해 객체의 색상과 배경 색상을 분리했다.

Rotation Invariant Face Detection with Boosted Random Ferns (Boosted Random Ferns를 이용한 회전 불변 얼굴 검출)

  • Kim, Hoo Hyun;Cho, Dong-Chan;Bae, Jong Yeop;Kim, Whoi-Yul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.06a
    • /
    • pp.52-55
    • /
    • 2013
  • 본 논문은 Boosted Random Ferns 기반의 회전 불변 얼굴 검출 방법을 제안한다. 기존 Random Ferns 의 경우 특징값을 추출할 때 임의로 선택한 두 픽셀의 밝기값 비교를 통하여 이진 특징값을 추출한다. 이 경우 해당 픽셀의 밝기값에 잡음이 포함되면 특징값이 부정확하게 추출되는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 임의로 두 블록을 선택하고 해당 블록내 밝기값의 평균을 비교하여 이진 특징값을 추출하였다. 또한 픽셀 위치를 임의로 선택하여 ferns 를 구성하였던 기존의 방법 대신 최고의 분류 성능을 가지는 fern 들을 이용하여 분류기를 구성하기 위해, AdaBoost 의 방법을 Random Ferns 에 맞게 변경하였다. Boosted Random Ferns 를 트리 구조의 cascade 노드에 방향과 각도에 따라 배치하여 연산 속도를 향상시키고 false-positive를 줄이는 효과를 보았다. CMU Rotated Face Database 를 사용하여 평가하였을 때, 기존 Random Ferns 는 false-positive 의 수가 57 개 일 때 66%의 검출률을 보인 반면, Boosted Random Ferns 는 false-positive 의 수가 45 개 일 때 88%의 검출률을 보였다.

  • PDF

Adaptive Multiview Subpixel Interlacing for Autostereoscopic Display (무안경 입체 디스플레이를 위한 적응적 다시점 서브 픽셀 재배치 기법)

  • Hong, Jong-Ui;Shim, Hyun-Bo;Choi, Yoo-Joo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.450-451
    • /
    • 2015
  • 본 논문에서는 렌티큘러 렌즈를 이용한 무안경 입체 디스플레이 환경에서 렌티큘러 렌즈의 속성과 디스플레이 장치의 속성의 변화에 따라 다중 시점에서 촬영한 영상으로부터 적응적으로 하나의 다시점 입체 합성 영상을 생성하는 방법을 제안한다. 제안 방법에서는 렌티큘러 렌즈의 기본 속성과 디스플레이 장치의 기본 속성값을 고려하여 다중 시점에서 획득된 영상의 서브픽셀들의 가중 평균을 구하고 이를 다시점 입체 합성 영상의 서브 픽셀의 값으로 사용하도록 하였다. 여러 다시점 영상을 이용한 실험을 통하여, 렌티큘러 렌즈의 속성과 디스플레이 장치의 속성이 정확히 하드웨어적으로 일치 하지 않은 상황에서도 본 논문에서 제안하는 적응적 다시점 서브 픽셀 재배치 기법을 통하여 3D 입체감이 안정적으로 제공됨을 확인하였다.

  • PDF

Character Segmentation with Segmentation Cost in Optical Character Recognition (문자 인식에서 분할 비용에 따른 문자 분할 연구)

  • Jung Minchul
    • Proceedings of the KAIS Fall Conference
    • /
    • 2004.06a
    • /
    • pp.179-181
    • /
    • 2004
  • 인쇄체 문자 인식에서 접합 문자는 주요한 에러 발생의 원인이다. 본 논문에서는 접합 문자를 분할하기 위해 두 개의 분할 비용을 정의한다. 첫째, 절단 비용은 한 패턴을 분할하는 데 얼마나 많은 블랙픽셀이 분리되어야 하는가이다. 둘째, 접선 비용은 분할선이 얼마나 많은 블랙 픽셀과 화이트 픽셀사이를 지나가는가이다. 폰트 분류기는 접합 문자의 후보 문자를 제공한다. 후보 문자의 문자 폭은 접합 문자를 분리하기 위한 기준선을 제공하며, 그 기준선 부근의 픽셀들이 분할 가능 영역을 나타낸다. 절단 비용의 최소값과 접선 비용의 최대값이 되는 지점이 최종적으로 접합 문자를 분할하는 위치이다. 이렇게 정의된 절단 비용과 접선 비용을 가지고 접합 문자를 분할하면 보다 정확한 문자 분할을 하여 문자 인식에서 에러 발생을 줄일 수 있다.

  • PDF

Fuzzy Neural Networks for Face Detection (퍼지 신경망을 이용한 얼굴 영상 검출)

  • 이창수;이정훈
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.11a
    • /
    • pp.301-304
    • /
    • 2000
  • 본 논문에서는 디지털 영상에서 얼굴 영상 검출을 위해 픽셀의 퍼지 소속도를 이용하여 신경망으로 학습하는 퍼지 신경망을 이용한 얼굴영상 검출을 제안한다. 입력 영상의 피라미드 영상에서 추출된 20$\times$20 윈도우 템플릿 영상안의 각 픽셀의 소속도로 얼굴 영상 패턴을 학습하여 얼굴 영상을 검출하는 방법은 단순히 영상의 픽셀 값 하나씩만을 고려해서 각 픽셀의 소속도를 고려하여 수행하는 얼굴 영상 분할보다 얼굴 영상을 훨씬 더 정확하고 인식률이 높게 검출해 낼 수 있다.

  • PDF

Region Based Fuzzy Neural Networks for Face Detection (영상영역 기반 퍼지 신경망을 이용한 얼굴 검출)

  • 이창수;이정훈
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.11 no.1
    • /
    • pp.39-44
    • /
    • 2001
  • 본 논문에서는 디지털 영상에서 얼굴 영상 검출을 위해 픽셀의 퍼지 소속도를 이용하여 신경망으로 학습하는 퍼지 신경망을 이용한 얼굴영상 검출을 제안한다. 입력 영상의 피라미드 영상에서 추출된 20$\times$20 윈도우 영상 안의 각 픽셀의 소속도로 얼굴 영상 패턴을 학습하여 얼굴 영상을 검출하는 방법은 단순히 영상의 픽셀 값 하나씩만을 고려해서 각 픽셀의 소속도를 고려하여 수행하는 얼굴 영상 분할보다 얼굴 영상을 더 정확하고 인식률이 높게 검출해 낼 수 있다.

  • PDF

An efficient method for segmentation of fast motion video (움직임이 큰 비디오에 효율적인 비디오 분할 방법)

  • Park, Min-Ho;Park, Rae-Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.181-184
    • /
    • 2005
  • 기존의 비디오 분할 방법은 밝기의 변화가 큰 영상이나 움직임이 큰 영상에 대해서는 정확한 분할이 이루어지지 않았다. 본 논문은 움직임 정보를 이용하여 움직임이 큰 영상에서 좀 더 정확하게 비디오를 분할할 수 있는 방법을 제안한다. 이를 위해 블록 정합 알고리즘을 이용하여 얻어진 움직임 벡터로부터 움직임 유사도를 찾는 방법을 제안한다. 또 연속된 프레임에서 픽셀의 차이 값을 계산할 때 motion blur 로 생기는 오차를 각 블록의 움직임 크기로 보상하여 좀 더 정확한 픽셀의 차이 값을 계산하는 방법을 제안한다. 이렇게 얻어진 두 가지 정보를 이용하여 discontinuity value 를 계산한다. 움직임이 많은 액션 영화 3 편에 대해 실험한 결과 제안한 방법이 기존의 움직임 유사도와 픽셀 차이 값을 구하여 샷 경계 검출을 하는 방법보다 좀 더 정확한 샷 경계 검출을 하고 있다는 것을 보여준다.

  • PDF

A Balancing Method of Stereo Pairs for Stereo Coding (스테레오 코딩을 위한 스테레오 영상의 밸런싱 방법)

  • Kim, Jong-Su;Choi, Jong-Ho;Kim, Tae-Yong;Choi, Jong-Soo
    • KSCI Review
    • /
    • v.15 no.1
    • /
    • pp.173-177
    • /
    • 2007
  • 3D 디스플레이 기술이 발전함에 따라 스테레오 영상의 전송시 요구되는 비트레이트의 감소가 절실히 필요하다. 하지만, 스테레오 영상은 서로 다른 카메라에 의해 취득되기 때문에 잠재적으로 서로 차이가 있고, 이것은 디스패리티 추정시 큰 오차를 유발할 수 있으며 전송될 비트레이트에 영향을 줄 수 있다. 따라서 스테레오 영상들 사이의 밸런싱이 필요하다. 스테레오 영상의 밸런싱을 위해, 본 논문에서는 히스토그램 Specification 방법과 타깃 영상의 국부정보, 스테레오 영상간의 오차 분포를 이용한다. 히스토그램 Specification 방법은 그레이레벨의 맵핑관계를 정의한다. 따라서 이를 통해 맵핑될 레벨의 맵핑 구간을 구할 수 있다. 그 구간에서, 맵핑될 기준영상의 히스토그램 분포와 스테레오 오차값의 분포는 서로 모양이 유사할 것이다. 그러나, 폐색된 영역이나 노이즈에 의해 그 모양이 변하므로 우리는 맵핑될 픽셀들을 오차영상에서 그 픽셀들의 근방에서 구한 평균들과 오른쪽 영상(타깃 영상)에서 맵핑될 픽셀의 근방에서 구한 평균이 최소 값을 갖는 위치 값으로 맵핑한다. 제안된 방법은 실험에서 기존 방법보다 향상된 결과를 나타내는 것을 보여 준다.

  • PDF

Segmentation Algorithm using 3D Region Growing Based on Gradient Magnitude in Small-Animal PET Images (Small Animal PET 영상에서의 기울기 크기 기반 3차원 영역확장 분할 알고리즘)

  • Lee Yu-Bu;Kim Kyeong Min;Cheon Gi-Jeong;Kim Myoung-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.703-705
    • /
    • 2005
  • 본 논문에서는 기울기 크기 기반의 3차원 영역확장 알고리즘을 사용하여 small animal PET(Positron Emission Tomography) 영상으로부터 종양을 분할하는 연구를 수행하였다. 픽셀 값의 범위가 다양하고 저해상도의 특성을 갖는 PET영상으로부터 대상영역을 정확하게 분할하기 위해서 전처리(preprocessing)과정으로 영상 픽셀값의 분포를 펼쳐줌으로써 영상의 가시화를 높이는 히스토그램 스트레칭(histogram stretching) 기법을 적용하고 대상영역과 픽셀값이 유사한 인접영역과의 경계를 찾기 위해 가우시안의 1차 미분 함수를 사용하여 계산된 기울기 크기(gradient magnitude) 기반의 3차원 영역확장(region growing) 알고리즘을 제안한다. 제안한 알고리즘은 영역확장의 결과에 가장 큰 영향을 미치는 적절한 동질성 기준의 선택으로 대상영역의 분할을 성공적으로 수행하여 일반적인 영역확장의 단점을 보완하였다.

  • PDF

Colorful Image Colorization using GAN with MLP (MLP 기반의 GAN을 사용한 흑백 사진 채색 기법)

  • Wang, Zhe;Joe, Inwhee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.415-418
    • /
    • 2019
  • 본 논문에서 grayscale 이미지를 그럴듯한 컬러 이미지로의 전환을 다루고자 한다. 기존의 CNN Network 를 통해 실제 Image 를 만들어내려는 기법들은 모든 Pixel 의 Error 를 Loss 로 사용한다. 각 픽셀별로 가장 완벽한 답을 찾으려고 하기보다는, 전체 픽셀의 관점에서의 Loss 를 줄이려고 하기 때문에, 픽셀 값이 정확한 값대신 안전한 값으로 넘어간다는 단점이 있다. 이 문제를 해결하기 위해 본 논문에서 GAN 기반의 Image-to-Image Translation 기법에 NIN(Network in Network) 적용해 이 문제를 해결할 수 있음을 보인다. 전통 CNN 기법보다 더 Photo-realistic 한 이미지를 생성할 수 있게 된다.