• 제목/요약/키워드: 카메라 모듈

검색결과 440건 처리시간 0.025초

컬러 필터 어레이 영상에 대한 공동의 컬러보간과 임의 배율 다운샘플링 알고리즘 (Joint Demosaicking and Arbitrary-ratio Down Sampling Algorithm for Color Filter Array Image)

  • 이민석;강문기
    • 전자공학회논문지
    • /
    • 제54권4호
    • /
    • pp.68-74
    • /
    • 2017
  • 본 논문은 컬러 필터 어레이 (CFA) 영상에 대한 공동의 컬러보간(Demosaicking)과 임의 배율의 다운샘플링(arbitrary-ratio down sampling)알고리즘을 제시한다. 컬러보간은 단일 센서를 사용하는 다양한 영상 저장 시스템에서 영상 신호 처리 파이프 라인의 필수적인 부분이다. 또한, 스마트폰과 같은 소구경 카메라 시스템에서는 영상 센서에서 획득되는 고해상도 영상이 보다 작은 해상도의 영상으로 스크린에 다운샘플링되어 디스플레이 된다. 기존 방법에서는 이러한 과정들을 거치기 위해 "컬러보간 후 다운샘플링" 모듈의 순서대로 영상을 처리하게 된다. 하지만 이러한 독립적이고 순차적인 방법은 많은 메모리 소모와 계산량을 필요로 하게 되고, 또한 영상 처리 과정에서 아티팩트(artifact)가 발생하여 영상 디테일의 손상을 가져오게 된다. 본 논문에서는 이러한 문제점을 해결하기 위해 컬러보간과 다운샘플링을 동시에 동작하도록 하는 알고리즘을 제안한다. 제안하는 방법에서는 입력되는 컬러 필터 영상으로부터 고주파 및 저주파 성분으로 신호를 분해하는 방법에 기초하여 임의의 배율에서 컬러 필터 영상으로 역 사상(inverse mapping)을 하고 컬러보간 및 다운샘플링을 동시에 수행하게 된다. 제안하는 알고리즘은 종래의 기술보다 더 나은 영상 품질 성능을 나타내면서 동시에 보다 적은 계산량이 필요로 하는 것을 보여준다.

베이지안 네트워크 기반 계층적 CPV 태양광 추적 시스템 (A Hierarchical CPV Solar Generation Tracking System based on Modular Bayesian Network)

  • 박수상;양견모;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권7호
    • /
    • pp.481-491
    • /
    • 2014
  • 지구 온난화 문제와 화석 연료 양의 한계 때문에 재생 가능한 전력 생산에 대한 관심이 증가하고 있다. 특히 재생 에너지 중 태양광 에너지의 전력 생산 비율은 점차 증가함에 따라 집광형 태양광발전 시스템은 높은 전력 생산량으로 각광받고 있다. 하지만 이 시스템은 태양광 중첩률이 높을 때 가장 높은 발전 효율을 내기 때문에 허용 오차 범위가 작은 정밀 태양 추적 시스템이 필요하다. 본 논문에서는 복잡한 환경에 대응할 수 있는 베이지안 네트워크와 나이브 베이즈 분류기를 이용한 계층적 추적 시스템을 제안한다. 베이지안 네트워크는 불완전하고 불확실한 상황을 모델링 하는데 강력한 모델로 충분한 양의 데이터가 없을 경우에도 도메인 지식을 바탕으로 네트워크를 설계할 수 있다는 장점이 있다. 제안하는 계층적 확률 시스템에서는 불확실한 하늘 상황을 9개로 분류하고 모듈형 베이지안 네트워크를 이용하여 현재 날씨 상황을 추론한다. 또한 나이브 베이즈 분류기를 이용하여 추론된 날씨 상황을 고려한 효율적인 추적 방법을 분류하고 선택한다. 베이지안 네트워크의 유용성을 평가하기 위해 실제 날씨 데이터를 수집하였고 평균 93.9%의 정확도(Accuracy)를 보였다. 또한, 제안하는 시스템과 핀홀 카메라 시스템의 태양광발전 효율을 비교한 결과 약 16.58%의 성능이 향상됨을 확인하였다.

딥러닝 객체 탐지 기술을 사용한 스마트 쇼핑카트의 구현 (Implementation of Smart Shopping Cart using Object Detection Method based on Deep Learning)

  • 오진선;천인국
    • 한국산학기술학회논문지
    • /
    • 제21권7호
    • /
    • pp.262-269
    • /
    • 2020
  • 최근 다양한 쇼핑 환경에서 결제에 소요되는 시간을 줄이기 위한 많은 시도들이 이루어지고 있다. 또한 4차 산업혁명시대에 들어서면서 인공지능 기술이 고도화되고 있으며, IoT 장비들은 더욱 소형화되고 저렴해져서 이 두 가지 기술을 융합시킴으로써 사용자의 시간을 절약할, 인간을 대신하는 무인 환경을 구축하는 것에 대한 접근이 용이해졌다. 본 논문에서는 저가 IoT 장비들과 딥러닝 객체 탐지 기술을 기반으로 하는 스마트 쇼핑카트 시스템을 제안한다. 제안된 스마트 카트 시스템은 실시간 상품 인식을 위한 카메라와 라즈베리파이, 트리거 역할을 하는 초음파 센서, 상품이 쇼핑카트에 들어온 것인지 나간 것인지를 판단하기 위한 무게 센서, 가상의 장바구니에 대한 UI를 제공하는 스마트폰 어플리케이션, 학습된 데이터가 저장되는 딥러닝 서버로 구성된다. 각 모듈 간의 통신은 TCP/IP 네트워크 및 HTTP 네트워크로 이루어지며, 서버의 상품 인식을 위해서는 객체탐지 기술이 구현된 YOLO darknet 라이브러리를 사용한다. 사용자는 스마트폰의 앱을 통하여 스마트 카트에 넣은 물건들의 목록을 점검하고 자동으로 결제할 수 있다. 본 논문에서 제안된 스마트 카트 시스템은 가성비가 높은 무인 상점을 구현하는데 응용될 수 있다.

이동형 단말기 사용자를 위한 축구경기 비디오의 시청경험 향상 방법 (Raising Visual Experience of Soccer Video for Mobile Viewers)

  • 안일구;고재승;김원준;김창익
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권3호
    • /
    • pp.165-178
    • /
    • 2007
  • 최근 멀티미디어 신호처리 및 통신 기술의 발전에 힘입어 작은 LCD 패널을 통한 스포츠경기 시청이 증가하고 있다. 하지만 멀티미디어 단말에 방송되는 대부분의 영상들은 주로 경제적인 이유로 일반 TV나 HDTV 용으로 제작되어 단순히 크기만을 변환하거나 추가적인 편집 없이 녹화되고 있는 실정이다. 이는 작은 이동형 단말 사용자들이 경기화면 내의 상황을 인식하는데 있어서 많은 불편함을 겪는다. 예를 들어, 원거리 샷 카메라 기법으로 찍힌 축구 경기 동영상의 경우, 운동장 내의 공과 선수들은 매우 작아서 알아보기가 힘든 경우가 발생한다. 또한 경기 진행 시간이나 점수를 포함하는 점수상자(scorebox)의 내용 역시 시청자가 쉽게 알아보기 힘들다. 따라서 소형 디스플레이 시청자들의 원활한 이해를 위한 지능형 디스플레이 기술이 필요하다. 이를 위한 핵심기술의 하나가 관심 영역을 자동으로 결정하고 확대하여 보여주는 일이다. 여기서 관심영역이란 시청자들이 화면 내에서 다른 부분에 비해 더욱 관심을 갖게 되는 영역을 말하며 축구경기 비디오의 경우, 주로 상단 모서리에 존재하는 점수상자나 원거리 샷에서의 공을 둘러싼 주변영역 등이 해당된다. 본 논문에서 우리는 이동형 단말기 시청자들을 위한 시청경험 향상을 위한 방법을 제안한다. 경기장면에서 관심영역의 추출을 위해 화면 내에서 시각적으로 현저한 부분의 검출에 관심을 갖는 방법 대신, 축구 경기 비디오 고유의 특징을 이용하는 도메인 한정적인 접근법을 이용한다. 제안된 시스템은 크게 두 가지 모듈 관심영역 결정, 점수상자 추출로 구성된다. 실험 결과를 통해 제안된 알고리즘이 이동형 단말기상에서 지능형 디스플레이를 위한 좋은 해결책임을 보이고자 한다.

모바일 멀티모달 센서 정보의 앙상블 학습을 이용한 장소 인식 (Place Recognition Using Ensemble Learning of Mobile Multimodal Sensory Information)

  • 이충연;이범진;온경운;하정우;김홍일;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.64-69
    • /
    • 2015
  • 본 논문에서는 시각, 음향, 위치 정보를 포함하는 멀티모달 센서 입력 정보로부터 사용자가 위치한 장소의 환경 정보를 학습하고 기계학습 추론을 통해 장소를 인식하는 방법을 제안한다. 이 방법은 음영 지역에서의 정확도 감소나 추가 하드웨어 필요 등 기존 위치 정보 인식 방법이 가지는 제약을 극복 가능하고, 지도상의 단순 좌표 인식이 아닌 논리적 위치 정보 인식을 수행 가능하다는 점에서 해당 위치와 관련된 특정 정보를 활용하여 다양한 생활편의를 제공하는 위치 기반 서비스를 수행하는데 보다 효과적인 방법이 될 수 있다. 제안하는 방법에서는 스마트폰에 내장된 카메라, 마이크로폰, GPS 센서 모듈로부터 획득한 시각, 음향, 위치 정보로부터 특징 벡터들을 추출하여 학습한다. 이때 서로 다른 특성을 가진 특징 벡터들을 학습하기 위해 각각의 특징 벡터들을 서로 다른 분류기를 통해 학습한 후, 그 결과를 기반으로 최종적인 하나의 분류 결과를 얻어내는 앙상블 기법을 사용한다. 실험 결과에서는 각각의 데이터를 따로 학습하여 분류한 결과와 비교하여 높은 성능을 보였다. 또한 사용자 상황인지 기반 서비스의 성능 향상을 위한 방법으로서 제안하는 모델의 스마트폰 앱 구현을 통한 활용 가능성에 대해 논의한다.

제한적 인지 데이터에 기초한 에이전트 움직임-데이터 궤적의 인간다움 (Human-likeness of an Agent's Movement-Data Loci based on Realistically Limited Perception Data)

  • 한창희;김원일
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.1-10
    • /
    • 2010
  • 본 논문의 목적은 제한적 인지에 기초한 가상인간 에이전트의 움직임-데이터 궤적이 인간과 유사하다는 것을 보이는 것이다. 이 움직임-데이터 궤적의 인간 유사성을 결정하기 위해서, 우리는 두 파라미터들 -사실적으로 제한된 인지(RLP: Realistically Limited Perception) 데이터와 점증적 움직임 경로 데이터의 생성 (IMPG: Incremental Movement-Path Generation)- 사이의 상호작용을 활용한다. 즉, 어떻게 전자인 인간사고 혹은 그 구성요소의 모의 파라미터(즉 RLP 데이터)가 후자인 인간 움직임-데이터 궤적의 모의 파라미터(즉 IMPG 데이터)를 지배하는지를 에이전트 움직임-데이터 궤적에서 고찰하는 것이다. 지도 제작 DB는 인지와 움직임 경로-데이터 생성 사이의 인터페이스이므로, 에이전트에게 항해를 위해 필요한 선결 요소이다. Hill과 동료들에 의해 RLP에 의한 지도 DB 제작은 연구되었지만, 이러한 기존의 연구들은 단지 렌더링 카메라의 시점 데이터의 변화에 의해서만 수행되었다. 이에 비해 본 논문에서는 Hill의 지도 DB 제작 모듈을 에이전트 시스템에 통합하여 예기치 않은 적 출현을 수반한 정찰 임무 상에서 두 파라미터 데이터간의 상호작용을 고찰하였다. 인간 피실험자와 에이전트에 의해 생성된 움직임 데이터의 궤적들이 서로 비교되었다. 비록 에이전트 움직임-데이터 궤적의 인간유사성이 두개의 파라미터 데이터들(즉 RLP와 IMPG)과 단지 30명의 피실험자들로 얻어진 파일럿실험(pilot-test)의 결과이지만, 본 연구의 에이전트 시스템은 인간과 유사한 움직임-데이터를 생성하기 위한 최소한의 기능적인 테스트베드(functional testbed)가 될 수 있음을 입증하였다.

DI 방식의 대형 멀티터치스크린을 위한 영상처리 알고리즘 설계 (Image Processing Algorithms for DI-method Multi Touch Screen Controllers)

  • 강민구;정용진
    • 대한전자공학회논문지SP
    • /
    • 제48권3호
    • /
    • pp.1-12
    • /
    • 2011
  • 대형 멀티터치스크린의 구현은 기존의 저항막, 정전용량, 초음파 방식으로는 기술 제약 및 비용 등의 문제로 구현에 어려움이 있어 주로 적외선을 이용하는 방식을 많이 사용한다. 적외선을 사용한 멀티터치스크린은 대형스크린을 구현하기 용이하지만 멀티터치에 기술적인 제한을 갖고 있는 경우가 많다. 이러한 단점을 보완하기 위해 적외선 카메라를 이용한 FTIR(Frustrated Total Internal Reflection), DI(Diffuse Illumination)방식들이 Microsoft의 차세대 유저인터페이스인 Surface를 통해 제안되었다. FTIR이나 DI 방식은 대형스크린의 구현이 쉽고 멀티터치의 개수에 제한을 받지 않는다. 하지만 FTIR은 터치 포인트의 검출은 쉬운 반면에 스크린의 크기와 재질, 적외선 LED 배열을 위한 모듈, 많은 소비전력 등의 단점을 가지고 있고 DI 방식은 구조상의 문제로 터치 검출이 어려운 반면 FTIR이 가지고 있는 단점을 해결할 수 있다. 본 논문에서는 기존에 제안된 DI 방식의 터치 포인트 검출시의 문제점을 해결하기 위해 손가락 외곽선을 이용한 영상처리 알고리즘, 광학 렌즈 왜곡 현상을 효과적으로 보정하기 위한 알고리즘에 대해 연구하였다. 또한 멀티터치의 터치 정확도를 높이기 위한 Calibration 알고리즘과 정확한 제스처 및 정확한 이동을 위한 Tracking 기법을 고안하였다. 연구 결과 DI 방식을 위해 본 논문에서 제안한 영상처리 알고리즘들은 간단하면서 쉽게 대형 멀티터치스크린 구현을 위한 효과적인 방법이 될 수 있을 것으로 판단된다.

초소형 영상 전송 모듈용 DOE(Diffractive optical element)렌즈의 설계 및 평가 (Hybrid (refrctive/diffractive) lens design for the ultra-compact camera module)

  • 이환선;임천석;조재흥;장수;김현규
    • 한국광학회지
    • /
    • 제12권3호
    • /
    • pp.240-249
    • /
    • 2001
  • IMT2000용 단말기, 휴대용 개인정보단말기(PDA), 노트북 PC 등에 내장이 가능한 고속(f/2.2)의 1/7인치 CMOS칩용 초소형 카메라 렌즈를 설계하였다 설계의 특징으로는 회절소자의 마이너스 고분산특성을 십분 활용하여 단매의 렌즈로도 고속 및 광화각에 걸쳐 고차수가 및 색수차를 충분히 보정한 것이고 동시에 경박단소화(렌즈포함 상거리=3.3mm)도 실현한 것이다. 한편 설계방법으로는 단매로도 최상의 성능을 확보하기 위해 가능한 초기형상을 (Seidel 3차 수차론 활용) 최적설계의 입력치로 두고 다양한 면배치에 대해 최적설계후 상호간의 광학성능 및 기타 특성치를 비교·분석하였다 그리고 성능향상의 한방법으로써 기존 단매 렌즈의 굴절능을 전체 (2매)렌즈의 굴절능으로 하면서 petzval sum이 제로가 되도록 렌즈를 추가 하였고 이로 말미암아 최적설계 후 기존 광학성능을 크게 향상시킬수 있었다.

  • PDF

얼굴 검출을 위한 SoC 하드웨어 구현 및 검증 (A design and implementation of Face Detection hardware)

  • 이수현;정용진
    • 대한전자공학회논문지SD
    • /
    • 제44권4호
    • /
    • pp.43-54
    • /
    • 2007
  • 본 논문에서는 실시간 처리를 위한 얼굴 검출 알고리즘의 하드웨어 엔진을 설계하고 검증하였다. 얼굴 검출 알고리즘은 주어진 이미지에서 학습된 얼굴의 특징데이터를 통하여 얼굴의 대략적인 위치를 찾는 연산을 수행한다. 얼굴 검출 알고리즘을 하드웨어 구조로 설계하기 위해 Integral Image Calculator, Feature Coordinate Calculator, Feature Difference Calculator, Cascade Calculator, Window Detector 등의 5 단계로 구조를 나누었으며, On-Chip Integral Image memory 와 Feature Parameter Memory를 설계하였다. 삼성전자의 S3C2440A 프로세서 칩과 Xilinx사의 Virtex4LX100을 이용하여 검증 플랫폼을 구축하고, CCD카메라를 통하여 실제 얼굴의 영상을 받아들여 얼굴 검출을 실시간으로 구동시켜 검증하였다. 설계된 하드웨어는 Virtex4LX100 FPGA를 타겟으로 합성 시에 3,251 LUTs 를 사용하고, 24MHz의 동작 속도에서 검색 윈도우의 이동 간격에 따라 프레임 당 1.96$\sim$0.13 초의 실행속도를 가진다. 그리고 매그나칩 0.25um ASIC 공정으로 제작 시 41만 게이트 (Combinational area 약 34.5만 게이트, Noncombinational area 약 6.5만 게이트)의 크기를 가지며, 100MHz의 동작 속도에서 프레임 당 0.5초 미만의 실행 속도로, 임베디드 시스템의 실시간 얼굴 검출 솔루션에 적합함을 보여준다. 실제 XF1201칩의 일부 모듈로 구현되어 동작함이 확인되었다.

HMD(Head Mounted Display)에서 시선 추적을 통한 3차원 게임 조작 방법 연구 (A Study on Manipulating Method of 3D Game in HMD Environment by using Eye Tracking)

  • 박강령;이의철
    • 대한전자공학회논문지SP
    • /
    • 제45권2호
    • /
    • pp.49-64
    • /
    • 2008
  • 최근에 휴먼 컴퓨터 인터페이스 분야에서 사용자의 시선 위치를 파악하여 더욱 편리한 입력장치를 구축하고자 하는 연구가 많이 진행되고 있다. 하지만 복잡한 하드웨어 구성으로 제품의 가격이 매우 비싸고, 까다로운 사용자 캘리브레이션 과정으로 인해 시스템의 사용에 어려움을 겪는다. 본 논문에서는 HMD(Head Mounted Display)에 USB 카메라와 적외선을 반사시키는 hot-mirror와 적외선 조명을 이용한 시선 추적 모듈을 부착하고, 이를 통해 획득한 눈 영상의 2차원적인 분석과 간단한 사용자 캘리브레이션 과정을 통해 시선 위치를 파악하는 방법을 제안한다. HMD는 사용자의 얼굴 움직임과 함께 움직이므로, 얼굴움직임에 영향을 받지 않는 시선 추적 시스템을 구현할 수 있다. 또한, 시선 추적 시스템을 3차원 1인칭 슈팅 게임에 적응하여, 캐릭터의 시선 방향을 조정하고, 적 캐릭터를 조준하여 사격이 가능하도록 하여, 게임의 몰입감과 흥미성을 높일 수 있게 하였다. 실험 결과, 한 대의 데스크톱 컴퓨터 환경에서 게임과 시선 추적 시스템이 실시간으로 동작 가능했으며, 약 $0.88^{\circ}$의 시선 위치 추출 오차를 보였다. 또한 3차원 1인칭 슈팅게임에서 일반 마우스의 역할을 시선 추적 시스템이 문제없이 대신할 수 있음을 확인하였다.