• 제목/요약/키워드: Gray Scale Image

검색결과 254건 처리시간 0.029초

운전자 졸음 검출을 위한 눈 개폐 검출 알고리즘 연구 (A Study on an Open/Closed Eye Detection Algorithm for Drowsy Driver Detection)

  • 김태형;임웅;심동규
    • 전자공학회논문지
    • /
    • 제53권7호
    • /
    • pp.67-77
    • /
    • 2016
  • 본 논문에서는 변형된 하우스더프 거리 (MDH: Modified Hausdorff Distance)를 이용한 눈 개폐 감지 알고리즘을 제안한다. 제안하는 알고리즘은 얼굴 검출과 눈 개폐 감지로 크게 구분된다. 얼굴 영역의 검출을 위하여 고정 크기의 영역 내에서 픽셀 값을 이용하는 지역 구조특성의 MCT (Modified Census Transform)특징기반 방법을 사용하였다. 이후, 검출된 얼굴 영역 내에서 MHD를 이용하여 눈의 위치 및 개폐를 판단한다. 얼굴 검출의 처리절차는 먼저, 오프라인에서 다양한 얼굴 영상에 대해 MCT 이미지를 생성하고, 이를 기반으로 PCA를 이용하여 기준이 되는 특징벡터들을 추출한다. 다음으로, 온라인에서는 입력되는 실험 영상 내에서 새롭게 추출된 특징벡터들과 기준이 되는 특징 벡터들 간의 유클리드 거리를 이용하여 얼굴 영역을 검출하는 순서로 진행된다. 이후, 검출된 얼굴 영역 내에서 MHD 기반의 눈 영역 검출과 템플릿 매칭을 수행하여 눈의 개폐를 감지한다. 제안하는 방법의 성능 검증을 위하여 그레이 스케일 영상 (30FPS, $320{\times}180$)을 입력으로 실험을 수행한 결과, 눈 계폐 검출율에서 평균 94.04%의 정확도를 달성하였다.

효율적 프랙탈 영상 압축 복호기의 설계 및 구현 (Design and Implementation of Efficient Decoder for Fractal-based Compressed Image)

  • 김춘호;김이섭
    • 전자공학회논문지C
    • /
    • 제36C권12호
    • /
    • pp.11-19
    • /
    • 1999
  • 최근에 등장한 프랙탈 영상 압축 알고리즘은 소프트웨어적인 측면에서는 많이 연구되고 있으나, 하드웨어 구현을 위한 연구는 드물다. 그러나 , 프랙탈 영상 압축 기법이 동영상 처리를 위해 사용될 경우 소프트웨어적으로는 실시간 처리의 어려움이 있어 고속의 전용 하드웨어가 필요하다. 그러나 , 아직 복호기의 구체적인 하드웨어의 설계 예는 드물다. 본 연구에서는 $256{\times}256$의 크기의 흑백 영상의 실시간 처리가 가능한 quadtree 방식의 프랙탈 영상 압축 복호기를 전용 하드웨어로 설계하였으며, 이를 위한 저전력 기법을 제안한다. 제안한 두 가지 방법 중 첫번째는 영상의 복원 후 발생하는 블록 현상을 제거하기 위한 post-processing 방법을 하드웨어 측면에서 최적화하는 것이다. 이 방식은 기존의 소프트웨어에서 사용하던 승산기가 필요한 가중 평균 방식보다 하드웨어를 적게 소모하여 비용을 줄이며, 속도는 69%정도의 향상이 있다. 두번째 방식은 데이터 패스 내부의 곱셈기를 입력 벡터의 통계적 특성을 이용하여 소비 전력이 적도록 설계하는 것이다. 이 방식으로 설계할 경우 8 bits 이하의 크기의 곱셈기에서 저전력에 유리하다고 알려진 어레이(array) 형태의 곱셈기에 비해 약 28%정도 소비 전력을 줄일 수 있었다. 위 두 가지 전력 절감 방식을 사용하여 동작 전압 3.3V, 1 poly 3 metal, $0.6{\mu}m$ CMOS 공정으로 복호기의 코어 부분을 칩으로 제작하였다.

  • PDF

영상 자료 획득시의 오류가 전자토모그래피 결과에 미치는 영향 고찰-모델 시뮬레이션을 중심으로 (Model Simulation for Assessment of Image Acquisition Errors Affecting Electron Tomography)

  • 주형태;이수정;김윤중;석봉출
    • Applied Microscopy
    • /
    • 제38권1호
    • /
    • pp.51-61
    • /
    • 2008
  • 전자 토모그래피의 첫 단계인 2차원 투시영상의 획득 과정에서 발생하는 잡음 중 영상형식과 입사빔 값의 영향이 토모그램에 미치는 영향을 모델링 시뮬레이션을 통해 평가하였다. 사용된 두 가지의 모델은 타원체의 흡수계수 차이가 매우 적은 원래의 3D head phantom 모델과, 흡수계수의 차이가 40% 이상인 수정된 3D head phantom 모델이다. 흡수계수의 차이가 매우 적은 모델에서 8-bit 영상형식을 사용한 토모그램 결과가 매우 큰 잡음들로 인해 심하게 왜곡되어 나타났으며, 흡수계수의 차이가 큰 모델에서는 영상 형식의 차이가 큰 영향을 주지 않았다. 비어의 법칙을 무시하고 투과빔 값을 그대로 사용한 경우는 흡수계수의 차이가 매우 적은 경우 토모그램은 심각하게 왜곡되었다. 흡수계수가 큰 경우에도 z축 방향을 따라 바깥쪽에 잡음이 심하게 나타났다. 비어의 법칙에 따라 입사빔 값을 취하더라도 잘못된 값을 넣게 되면 흡수계수의 차이가 매우 적을 경우 다소 왜곡된 토모그램을 얻었으며, 흡수계수의 차이가 큰 경우에도 심한 잡음을 유발하는 것으로 확인되었다. 따라서 구별이 힘든 내부 구조를 3차원적으로 재구성하는 토모그래피 본래의 특성을 최대한 살리기 위해서는 정화한 입사빔 값을 비어의 법칙에 따라 취하되, 가능한 한 16-bit 영상 형식으로 처리하여야 영상의 왜곡이나 작위적인 결과를 만들지 않고 토모그램의 분해능을 저하시키는 잡음도 감소시킬 수 있다.

FACS와 AAM을 이용한 Bayesian Network 기반 얼굴 표정 인식 시스템 개발 (Development of Facial Expression Recognition System based on Bayesian Network using FACS and AAM)

  • 고광은;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.562-567
    • /
    • 2009
  • 얼굴 표정은 사람의 감정을 전달하는 핵심 메커니즘으로 이를 적절하게 활용할 경우 Robotics의 HRI(Human Robot Interface)와 같은 Human Computer Interaction에서 큰 역할을 수행할 수 있다. 이는 HCI(Human Computing Interface)에서 사용자의 감정 상태에 대응되는 다양한 반응을 유도할 수 있으며, 이를 통해 사람의 감정을 통해 로봇과 같은 서비스 에이전트가 사용자에게 제공할 적절한 서비스를 추론할 수 있도록 하는 핵심요소가 된다. 본 논문에서는 얼굴표정에서의 감정표현을 인식하기 위한 방법으로 FACS(Facial Action Coding System)와 AAM(Active Appearance Model)을 이용한 특징 추출과 Bayesian Network 기반 표정 추론 기법이 융합된 얼굴표정 인식 시스템의 개발에 대한 내용을 제시한다.

HD 블랙박스 녹화과정에서의 위치정보 은익방법 (Location Information Hiding Way Of HD Black Box Recording process)

  • 석진환;윤종철;홍종성;한찬호
    • 융합신호처리학회논문지
    • /
    • 제17권1호
    • /
    • pp.10-17
    • /
    • 2016
  • HD 블랙박스에 포함되는 GPS 위치정보 저장방법은 특정한 표준을 가지지 않고 제조사마다 고유한 방식을 사용하고 있다. 본 논문에서는 GPS 위치정보를 저장하기 위한 저장 공간의 한계성을 극복하고 이에 따른 화질저화를 유발하는 문제점을 해결하기 위하여, 숨겨진 필수영역을 이용한 HDTV 비디오 콘텐츠에 포함된 위치정보 은닉방법을 제안한다. HDTV 비디오 콘텐츠는 압축을 위하여 프레임 하단에 8-라인의 Border Extender가 반드시 필요하게 된다. 이는 현 위치정보를 은닉하는 공간으로 사용되며 화질열화를 방지하기 위하여 그레이스케일 블록 형태의 이미지로 삽입하였다. 제안 방법은 실제 HD블랙박스를 사용하여 확인되었으며, 기존의 부가영역을 사용한 ASCII 코드의 형식보다 해석이 어려우며 편집 재 압축할 경우 위치정보가 사라지는 보안효과가 있다. 따라서 제안방법은 페이스 북이나 유튜브 등과 같은 위치기반 동영상 서비스에도 적합하다.

관광객 공유한 사진 및 머신 러닝을 활용한 도시 색채 특성 분석 연구 - 중국 대리시를 대상으로 - (Research on Characterizing Urban Color Analysis based on Tourists-Shared Photos and Machine Learning - Focused on Dali City, China -)

  • 인샤오옌;정태열
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.39-50
    • /
    • 2024
  • 색채는 중요한 시각적 요소로서 도시 이미지와 사람들의 인식 형성에 중요한 영향을 미친다. 도시환경에서 색채를 정량적으로 분석하는 작업은 복잡한 과정을 필요로 하여 과거에는 실행하기가 어려웠다. 그러나 최근 머신 러닝 기술의 급속한 발전으로 관광객이 공유한 사진을 이용하여 도시 색채를 분석하는 것이 가능해졌다. 본 연구는 중국의 인기 관광지인 대리시를 사례로 선정하여 관광객이 공유한 대리시의 사진을 수집하였으며, 머신 러닝 기술을 결합하여 대규모 도시 색채를 측정하는 방법을 탐색하였다. 구체적으로는 먼저 DeepLabv3+ 모델을 사용하여 ADE20k 데이터 셋을 기반으로 관광객이 공유한 사진의 의미 분할을 수행하여 사진에서 인공 요소를 분리했다. 다음으로 K-means 클러스터링 알고리즘을 사용하여 대리시의 인공 요소의 주요 색상을 추출하고, 이러한 색상 간의 상관관계를 분석하기 위해 인접 매트릭스를 구축했다. 연구 결과에 따르면 대리시의 인공 요소의 주요 색상은 주황-회색이 가장 높은 비율을 차지한다. 또한, 회색 계열의 색상이 다른 색상과 자주 조합되어 사용되는 경향이 있다. 분석에 따르면 대리시의 인공 요소의 색채 특성은 지역의 민족 문화와 불교 문화의 영향을 받는 것으로 나타났다. 본 연구는 색채 분석을 위한 새로운 접근 방법을 제공하며, 연구 결과는 대리시가 관광객의 기대에 부합하는 도시 색채 이미지를 형성하는 데 도움이 될 뿐만 아니라 향후 대리시의 색채 계획을 위한 참고 자료를 제공하고자 한다.

진동촉각 공간 마우스 (Vibrotactile Space Mouse)

  • 박준형;최예림;이광형;백종원;장태정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.337-341
    • /
    • 2008
  • 본 논문에서는 핀형 진동촉각 디스플레이 장치와 자이로스코프 칩을 이용한 진동 촉각 공간 마우스를 제시한다. 이 마우스는 자이로스코프 칩을 이용하여 공중에서 동작하는 공간마우스에 본 연구실에서 자체 제작한 진동촉각 디스플레이 모듈을 통합하여 위치 입력과 진동 촉각 출력이 동시에 가능한 새로운 형식의 인터페이스 장치이다. 최근 진동촉각 디스플레이의 소형화, 저전력 소모 방향으로의 발전으로 인해 마우스나 모바일 장치 등 소형 임베디드 환경에서도 사용이 가능하게 되었다. 또한 MEMS 기술로 인한 자이로스코프나 센서 기술의 발전으로 인해 이젠 마우스 같은 소형화 제품에도 소형 자이로스코프 칩을 이용하여 평면 환경이 아닌 공간상에서 사용 가능한 마우스를 제작할 수 있게 되었다. 이 진동 촉각 마우스는 자이로스코프 칩을 이용하여 손의 동작을 인식하고 그 데이터를 블루투스 통신을 통해 PC에 전달하여 포인터를 이동시킨다. 또한 마우스와 손가락의 접촉 부위에는 $2\;{\times}\;3$의 핀형 진동촉각 디스플레이 장치가 장착되어 PC 어플리케이션 상에서 포인터 위치에 따른 흑백 이미지 정보를 제공하거나 문자를 점자로 출력시켜 주는 등 진동 촉각을 통한 정보 전달을 가능하게 해준다.

  • PDF

Webcam-Based 2D Eye Gaze Estimation System By Means of Binary Deformable Eyeball Templates

  • Kim, Jin-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제8권5호
    • /
    • pp.575-580
    • /
    • 2010
  • Eye gaze as a form of input was primarily developed for users who are unable to use usual interaction devices such as keyboard and the mouse; however, with the increasing accuracy in eye gaze detection with decreasing cost of development, it tends to be a practical interaction method for able-bodied users in soon future as well. This paper explores a low-cost, robust, rotation and illumination independent eye gaze system for gaze enhanced user interfaces. We introduce two brand-new algorithms for fast and sub-pixel precise pupil center detection and 2D Eye Gaze estimation by means of deformable template matching methodology. In this paper, we propose a new algorithm based on the deformable angular integral search algorithm based on minimum intensity value to localize eyeball (iris outer boundary) in gray scale eye region images. Basically, it finds the center of the pupil in order to use it in our second proposed algorithm which is about 2D eye gaze tracking. First, we detect the eye regions by means of Intel OpenCV AdaBoost Haar cascade classifiers and assign the approximate size of eyeball depending on the eye region size. Secondly, using DAISMI (Deformable Angular Integral Search by Minimum Intensity) algorithm, pupil center is detected. Then, by using the percentage of black pixels over eyeball circle area, we convert the image into binary (Black and white color) for being used in the next part: DTBGE (Deformable Template based 2D Gaze Estimation) algorithm. Finally, using DTBGE algorithm, initial pupil center coordinates are assigned and DTBGE creates new pupil center coordinates and estimates the final gaze directions and eyeball size. We have performed extensive experiments and achieved very encouraging results. Finally, we discuss the effectiveness of the proposed method through several experimental results.

카메라 영상의 실시간 분석에 의한 차선 및 차간 인식 (Road Lane and Vehicle Distance Recognition using Real-time Analysis of Camera Images)

  • 강문설;김유신
    • 한국정보통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.2665-2674
    • /
    • 2012
  • 본 논문에서는 실시간의 도로 환경에서 위험상황을 감지하고 안전 운전을 돕는 실시간 차선 및 차간 인식 방법을 제안한다. 먼저 전방주시 카메라를 활용하여 촬영한 도로영상으로부터 도로와 차량에 해당하는 관심 영역을 추출한다. 관심 영역에 대한 허프 변환을 통하여 직선 성분을 검출하고 확률 계산을 통하여 차선을 확정하여 필터링을 실시한다. 그리고 관심 영역에서 전방 차량의 그림자 임계값 분석을 통해 전방 차량 객체를 추출하고 전방 차량과의 거리를 계산한다. 제안한 차선 및 차간 인식 기술을 실제 도로상황에 적용하여 실험한 결과 95% 이상의 인식률을 나타내어 안전 운전에 대응할 수 있는 것으로 입증되었다.

Pavement Crack Detection and Segmentation Based on Deep Neural Network

  • Nguyen, Huy Toan;Yu, Gwang Hyun;Na, Seung You;Kim, Jin Young;Seo, Kyung Sik
    • 한국정보기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.99-112
    • /
    • 2019
  • 도로 포장면의 크랙(crack)은 도로포장 구조의 열화를 입증하는 중요한 신호와 증상이다. 카메라 영상기반 도로포장 크랙 탐지는 강도 비균질성, 위상 복잡성, 낮은 대조도 및 노이즈성의 텍스처 배경 때문에 어려운 문제이다. 본 논문은 흑백영상에 대하여 깊은 신경망(DNN)에 기반하여 픽셀수준의 도로 크랙 탐지 및 분할 문제에 대해 다룬다. 변형된 U-net 네트워크와 고수준 특징 네트워크를 포함하는 새로운 DNN 구조를 제안한다. 본 연구의 중요 기여는 융합 층을 통해 공급되는 이들 네트워크의 결합 방법이다. 우리가 아는 한, 본 연구는 보도블럭 크랙 분할 및 탐지 문제를 결합을 소개한 최초의 논문이다. 크랙 탐지 및 분할의 시스템 성능은 새로운 구조를 사용하여 급격히 향상되었다. 제안된 시스템을 2개의 공개 데이터셋­크랙 포레스트 데이터셋(CFD)와 AigleRN 데이터셋­에 대하여 구현하고 평가하였다. 본 논문의 시스템은 여덟 가지의 최신 알고리즘과 같은 데이터셋으로 실험을 하였을 때, 가장 뛰어난 결과를 보여주었다.