• 제목/요약/키워드: 피사체 인식

검색결과 19건 처리시간 0.019초

카메라 문서 영상의 이진화 및 기울어짐 보정 방법 (A Method for Thresholding and Correction of Skew in Camera Document Images)

  • 장대근;전병태
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.143-150
    • /
    • 2005
  • 카메라 영상은 조명에 매우 민감하다. 그 결과 문자 인식을 매우 어렵게 만든다. 또한 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 비네팅현상이 발생하며 카메라와 피사체간의 위치와 각도의 불일치에 의해 기학적 왜곡이 발생한다. 비네팅 효과에 의한 문자분리의 어려움과 기하학적 왜곡으로 인한 문자모양의 변형으로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 양선형 변환을 이용하여 카메라로 획득한 문서영상의 기하학적 왜곡을 보정함으로써 문자인식 성능을 향상시킬 수 있는 방법을 제안한다. 기존에는 카메라의 위치정보 없이 기하하적 왜곡을 보정하기 어려웠으나 제안한 방법은 이진화한 문서영상을 대상으로 문자와 문자줄을 추출하여 상하로는 문자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

  • PDF

ROI 추출을 통한 사진 구도 자동 보정 기법 (Auto Correction Technique of Photography Composition Using ROI Extraction Method)

  • 하호생;박대현;김윤
    • 정보화연구
    • /
    • 제10권1호
    • /
    • pp.113-122
    • /
    • 2013
  • 본 논문에서는 영상을 3분할 기법에 맞춰 재구성함으로써 자동으로 구도를 안정적이고 세련되게 보정하는 기법을 제안한다. Saliency Map과 Image Segmentation기술을 이용하여 사진에서 피사체의 관심영역(Region Of Interest, ROI)을 구하고, 그 영역을 기준으로 3분할 기법에 맞도록 사진을 Cropping하여 구도를 보정한다. 또한, 얼굴 인식(Face Detection)기법을 활용하여 사람의 얼굴을 ROI에 추가하고 ROI에 따른 다양한 시나리오에 의하여 구도를 보정함으로써, 좀 더 자연스러운 사진을 얻는다. 실험결과를 통해 보정된 구도의 사진이 원본사진과 비교하여 자연스럽게 보정이 되었는다는 것을 알 수 있다.

카메라 획득 문서영상에서의 글자모양 왜곡보정 (Character Shape Distortion Correction of Camera Acquired Document Images)

  • 장대근;김의정
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.680-686
    • /
    • 2006
  • 스캐너로 획득한 문서영상을 대상으로 문자인식을 하는 경우와 달리 카메라로 획득한 문서 영상을 대상으로 문자인식을 수행할 경우 카메라 렌즈의 특성과 카메라와 피사체간의 위치와 각도의 불일치에 의해 글자모양의 왜곡이 발생한다. 따라서 이러한 왜곡들로 인해 실제로 사용이 가능한 카메라 문자인식 기술의 개발이 쉽지 않았다. 본 논문에서는 문서 영상을 카메라로 획득할 때 발생하는 3차원의 비선형적 왜곡을 2차원의 선형 변환을 이용하여 근사화함으로써 왜곡된 글자모양을 교정한다. 또한 변환과정에서 글자와 글자줄을 추출하여 상하로는 글자줄의 배열방향을, 좌우로는 문자획의 기울어진 각도를 측정함으로써 왜곡으로 인해 사변형 형태로 변형된 글자영역 즉 변환영역을 자동으로 설정함으로써 부가적인 정보의 획득 없이 문서영상 자체만으로 기하하적 왜곡보정이 가능하다.

3차원 영상의 깊이 인식에 대한 매핑 알고리즘 구현 (A New Mapping Algorithm for Depth Perception in 3D Screen and Its Implementation)

  • 함운철;김승환
    • 전자공학회논문지SC
    • /
    • 제45권6호
    • /
    • pp.95-101
    • /
    • 2008
  • 본 연구에서는 입체영상을 위한 실시간 스테레오 화면을 생성하는 기법 중에서 특별히 깊이 감도를 충실하게 구현할 수 있는 새로운 알고리즘에 대하여 다루어 본다. 제안한 내용 중에는 깊이 질감에 간접적 영향을 주는 빛의 강도를 물리학에서 이용되는 라플라시안 방정식에 근거를 두어 영상처리를 하는 개념도 다루어 본다. 본 논문에서 다루어 진 내용들은 N.Holliman 교수의 연구 내용 중 다중영역 알고리즘과 유사하나, 큰 차이점은 본 연구에서는 관찰자와 피사체 사이의 거리를 고려하고, 여기에 라플라시안 방정식의 개념을 도입한 부분이다. 제안된 알고리즘은 원형편광 처리가 된 LCD 화면에 OpenGL 라이브러리 함수를 이용하여 구현되었으며, 실제 인체의 시각의 생체적인 기능 하에서 입체적인 느낌이 잘 발휘되도록 처리를 하였다 비록 현재는 가상적으로 생성한 입체화된 물체에 대하여 컴퓨터 시뮬레이션을 시도하였지만, 본 논문에서 다루어진 알고리즘은 개인 컴퓨터의 편광모니터는 물론 공중파용 입체 단말기에도 적용가능하리라 사료된다.

차량주행 환경에서 다중라이다센서를 이용한 효과적인 검출 시스템 개발 (A Development of Effective Object Detection System Using Multi-Device LiDAR Sensor in Vehicle Driving Environment)

  • 권진산;김동순;황태호;박현문
    • 한국전자통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.313-320
    • /
    • 2018
  • 자동차의 자율주행 기술이 확대되면서 '눈'의 역할을 하는 센서가 점차 중요시되고 있다. 최근 차량에 장착되는 라이다 센서는 채널이 많을수록 피사체에 반사된 신호 또한 풍부해짐에 따라 장애물, 지형, 차량 등 주변 환경 탐색의 정확도가 높아진다. 하지만, 라이다 센서는 채널 증가에 따른 열배 이상 가격의 차이가 있으며, 이러한 가격적인 문제로 보급형 차량보다는 고가의 차량에만 부분적으로 사용되고 있다. 본 연구는 저 가격의 16 채널의 라이다를 복수개로 구성하여 동시에 신호를 수집 처리하여 하나의 입체공간으로 융합하고 이를 나타낼 수 있게 함으로써 64 채널의 라이더와 같은 효과를 나타낼 수 있게 하였다. 이를 통해서 차량 심미성의 개선과 함께 보급화를 위한 기반을 제공할 수 있다.

지정맥 인식 시스템을 이용한 심박신호 검출 (Heart Rate Signal Extraction by Using Finger vein Recognition System)

  • 복진영;서건하;이의철
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권6호
    • /
    • pp.701-709
    • /
    • 2019
  • 최근에 헬스케어와 관련된 다양한 분야에서 생체신호 중 하나인 심박신호가 사용되고 있다. 기존에 제안된 심박신호 검출 방법으로는 접촉식 방법이 대부분이었지만, 피사체가 장치를 접촉하고 있어야 한다는 불편함의 문제가 있었다. 이를 해결하기 위해 최근 비접촉식 방법에 의한 검출 연구가 진행되고 있다. 본 논문에서는 지정맥 인식을 위해 설계된 손가락 영상 촬영 장치를 이용해 심박 유사 신호를 얻어내는 방법을 제안한다. 검출된 심박 유사 신호는 지정맥의 위조 여부 판단과 심박 신호를 통한 다양한 응용분야에 활용될 수 있다. 제안하는 방법은 적외선을 이용한 지정맥 영상의 시간 도메인상의 밝기 값의 변화로부터 신호를 검출하고 영상처리 기반 알고리즘을 이용해 주파수 도메인으로 변환하였다. 변환 후, 대역 통과 필터링을 통해 심박신호와 관련이 없는 노이즈를 제거하였다. 신호의 정확성을 판단하기 위해 지정맥 획득 장치와 식품의약품안전처로부터 승인을 받은 접촉식 PPG 센서를 이용해 동시에 취득된 두 신호의 상관관계를 분석하였다. 결과적으로, 지정맥 영상을 통해 비접촉식으로 검출된 심박신호가 실제 심박신호의 파형과 일치함을 확인하는 것이 가능했다.

그래픽 하드웨어 가속을 이용한 실시간 색상 인식 (Real-time Color Recognition Based on Graphic Hardware Acceleration)

  • 김구진;윤지영;최유주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권1호
    • /
    • pp.1-12
    • /
    • 2008
  • 본 논문에서는 야외 및 실내에서 촬영된 차량 영상에 대해 실시간으로 차량 색상을 인식할 수 있는 GPU(Graphics Processing Unit) 기반의 알고리즘을 제시한다. 전처리 과정에서는 차량 색상의 표본 영상들로부터 특징벡터를 계산한 뒤, 이들을 색상 별로 조합하여 GPU에서 사용할 참조 텍스쳐(Reference texture)로 저장한다. 차량 영상이 입력되면, 특징벡터를 계산한 뒤 GPU로 전송하고, GPU에서는 참조 텍스쳐 내의 표본 특징리터들과 비교하여 색상 별 유사도를 측정한 뒤 CPU로 전송하여 해당 색상명을 인식한다. 분류의 대상이 되는 색상은 가장 흔히 발견되는 차량 색상들 중에서 선택한 7가지 색상이며, 검정색, 은색, 흰색과 같은 3가지의 무채색과 빨강색, 노랑색, 파랑색, 녹색과 같은 4가지의 유채색으로 구성된다. 차량 영상에 대한 특징벡터는 차량 영상에 대해 HSI(Hue-Saturation-Intensity) 색상모델을 적용하여 색조-채도 조합과 색조-명도 조합으로 색상 히스토램을 구성하고, 이 중의 채도 값에 가중치를 부여함으로써 구성한다. 본 논문에서 제시하는 알고리즘은 다양한 환경에서 촬영된 많은 수의 표본 특징벡터를 사용하고, 색상 별 특성을 뚜렷이 반영하는 특징벡터를 구성하였으며, 적합한 유사도 측정함수(likelihood function)를 적용함으로써, 94.67%에 이르는 색상 인식 성공률을 보였다. 또한, GPU를 이용함으로써 대량의 표본 특징벡터의 집합과 입력 영상에 대한 특징벡터 간의 유사도 측정 및 색상 인식과정을 병렬로 처리하였다. 실험에서는, 색상 별로 1,024장씩, 총 7,168장의 차량 표본 영상을 이용하여 GPU에서 사용하는 참조 텍스쳐를 구성하였다. 특징벡터의 구성에 소요되는 시간은 입력 영상의 크기에 따라 다르지만, 해상도 $150{\times}113$의 입력 영상에 대해 측정한 결과 평균 0.509ms가 소요된다. 계산된 특징벡터를 이용하여 색상 인식의 수행시간을 계산한 결과 평균 2.316ms의 시간이 소요되었고, 이는 같은 알고리즘을 CPU 상에서 수행한 결과에 비해 5.47배 빠른 속도이다. 본 연구에서는 차량만을 대상으로 하여 색상 인식을 실험하였으나, 일반적인 피사체의 색상 인식에 대해서도 제시된 알고리즘을 확장하여 적용할 수 있다.

휴대폰에서의 홍채인식을 위한 고속 홍채검출에 관한 연구 (A Study on Fast Iris Detection for Iris Recognition in Mobile Phone)

  • 박현애;박강령
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.19-29
    • /
    • 2006
  • 최근 휴대폰에서 개인 정보 보안의 중요성이 대두되고 있으며, 이에 따라 생체인식 기능이 내장된 휴대폰에 관심이 집중되고 있다. 그러므로 본 논문에서는 휴대용 기기에 홍채인식기술을 적용하기 위한 방법을 제안한다 기존의 홍채 인식 알고리즘에서는 고 배율의 줌 렌즈(zoom lens)와 초점렌즈(focus lens)를 사용하여 홍채인식에 사용될 확대된 홍채영상을 획득하였다. 이와 같이 이 전에 휴대폰에 홍채인식기술을 적용하기 위해서는 줌 렌즈와 초점렌즈를 추가 장착하여야 했으며, 이는 가격 상승과 부피 증가의 문제를 발생시켰다. 그러나 최근 휴대폰의 멀티미디어 기기 융 복합 추세로 인해 휴대폰 내에 장착된 메가픽셀 카메라(Mega-pixel Camera)의 성능이 급속히 발전함에 따라, 고 배율의 줌 렌즈 및 초점렌즈(zoom & focus lens) 없이도 확대된 홍채영상의 획득이 가능하게 되었다. 즉, 메가 픽셀 카메라 폰을 사용하여 사용자로부터 원거리에서 취득한 얼굴영상에서의 홍채영역이 홍채인식을 수행하기 위한 충분한 픽셀정보를 가지게 되었다. 본 논문에서는 이러한 얼굴영상에서 각막에 반사된 조명 반사광을 기반으로 휴대폰에서의 홍채인식을 위한 고속 홍채검출 방법을 제안한다. 또한 눈, 카메라, 조명 모델을 기반으로 각막에 반사된 조명반사광의 밝기와 크기를 추정하는 이론적 배경을 제안하며, 입력영상에서 태양광의 존재 유무와 광학적으로 또는 피사체의 움직임에 의해 반사된 흐림 현상 (Optical & Motion blur)을 판별하기 위해 조명을 연속적으로 On/Off 시키는 방법을 제안한다. 실험결과, 삼성 SCH-S2300(150MHz의 ARM 9 CPU) 휴대폰에서 홍채 영역 추출 총 수행시간은 평균 65ms이었고, 홍채 검출 성공률은 태양광이 존재하지 않는 실내에서 99%, 태양광이 존재하는 실외에서 98.5%였다._{SSH}$ 전압이 약 1.1V 일 때까지 오류 없이 동작함을 관측하였다. 본 논문의 SRAM 스위칭 전력감소는 I/O의 bit width가 증가하면 더욱 더 중요해질 것으로 예상할 수 있다.어 자료 형태를 32.4%의 순으로 개발을 희망하였다. 다섯째, 주로 사용하는 웹 사이트는 가정과 교사나 교과 연구회에서 운영하는 사이트를 46.2%, 에듀넷이나 한국교육학술정보원(KERIS) 사이트는 30.8%가 활용하는 것으로 나타났다. 또한 학습 자료 개발은 제작 능력이 있는 가정과 교사들이 교과 연구회를 만들어 공동으로 제작 할 수 있기를 희망하고 있었다. 시대적인 변화와 교육 환경의 변화로 웹 콘텐츠 자료를 활용한 교수 학습 방법이 중요한 도구로 인식되고 있다. 특히 가정 교과는 일상생활에 필요한 기초적인 경험을 실생활과 접목시켜 종합적으로 다루는 교과이기 때문에 다양하고 창의적인 콘텐츠가 절실히 요구되는 실정이다. 본 연구의 결과들에서 제시한 여러 가지 사항들을 고려하여 웹 콘텐츠 자료 활용과 개발이 이루어진다면 보다 효율적인 교수 학습이 이루어질 것으로 기대된다.변연계통과 대뇌겉질 전체에 영향을 미칠 것으로 여겨지는데, 본 실험에서는 네 종류의 바닥핵들, 즉 꼬리핵, 줄무늬체바닥핵, 중격옆핵 및 중격핵과 관련된 신경연접들을 관찰하였으며, 그 결과를 문헌 고찰한 결과 변연계통과 줄무늬체계통이 앞뇌의 바닥에 있는 신경핵들에서 형태학적 교차연결을 통해 정서와 마음의 상태를 행동과 대응으로 표현하는 중요한 신경회로가 존재함을 제안하였다.腎臟組織)에서 더많이 발생되었다. 틸라피아의 신사구체(腎絲球體)는 담수(淡水)에서 10%o의 해수(海水)로 이주된지 14일(日) 이후에 신장(腎臟)에서 수축된 것으로 나타났다. 30%o의 해수(海水)에 적응(適應)된 틸라피아의 평균 신사구체(腎絲球體)의 면적은 담수(淡水)에 적응된 개체의 면적보다

단일 투사 절대 코드 패턴을 이용한 3차원 얼굴 데이터의 유클리디안 복원 (A Euclidean Reconstruction of 3D Face Data Using a One-Shot Absolutely Coded Pattern)

  • 김병우;유선진;이상윤
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.133-140
    • /
    • 2005
  • 본 논문에서는 3차원 얼굴 인식기에서의 입력 데이터로 적합한 얼굴 데이터의 유클리디안 복원 시스템을 제안한다. 카메라 영상을 통한 유클리디안 복원을 위해서는 카메라의 보정정보와 복원할 특징 점의 대응 쌍 정보가 필요한데, 보정정보는 시스템의 변경이 없다면 불변한다. 따라서 고속의 유클리디안 복원을 위해서는 스테레오 영상간의 대응 쌍 정보 획득이 가장 중요하다. 시스템은 두 개의 카메라와 프로젝터 한 대로 구성하며, 피사체에 패턴을 투사하고 두 개의 카메라로부터 영상을 획득함으로써 동작한다. 사용 패턴은 단일 투사 줄무늬 패턴을 사용하며 줄무늬의 색도 정보와 채도 정보를 이용하여 '절대 코드 패턴'을 생성한다. 사용 시스템은 두 개의 카메라를 사용하기 때문에 색도 정보와 채도 정보가 비슷한 두 개의 영상을 얻을 수 있으며 이것은 획득한 두 개의 영상에 있는 줄무늬들에 대해 동일한 절대 라벨을 얻을 수 있게 한다. 절대 라벨링 된 줄무늬는 에피폴라 라인(epipolar line)상의 점들과 일대일 정합을 통해 고속의 3차원 데이터 복원을 가능하게 한다. 제안 방식은 얼굴 데이터에 적용되었으며 정확도와 총 소요 시간의 측정을 통해 제안 방식이 기존 방식에 비해 정확도 면에서 뒤지지 않으면서도 복원 속도 면에서 장점을 가짐을 확인할 수 있었다.