• 제목/요약/키워드: YCbCr Color Space

검색결과 68건 처리시간 0.021초

칼라 상관관계 역투영법을 적용한 효율적인 객체 지역화 기법 (Efficient Object Localization using Color Correlation Back-projection)

  • 이용환;조한진;이준환
    • 디지털융복합연구
    • /
    • 제14권5호
    • /
    • pp.263-271
    • /
    • 2016
  • 이미지 내에서 객체를 검출하고 해당 위치를 추출하는 지역화 기법은 컴퓨터 비전에서 많이 활용되는 기술이다. 기존 연구들은 하나의 객체를 대상으로 위치 검출을 수행하지만, 실제 사진에서는 다수의 유사 객체를 포함하는 경우가 많기 때문에, 활용에 한계가 있다. 이러한 문제를 해결하기 위해, 본 논문에서는 이미지 인식을 위해 객체 지역화의 새로운 알고리즘을 제안한다. 제안 알고리즘은 YCbCr 색채 성분에서 코렐로그램 역투영 기법을 활용하여 객체 지역화 문제를 해결한다. 제안 알고리즘에서는 질의 이미지의 객체가 포함되는 이미지의 위치를 검출할 수 있으며, 다수의 유사 객체가 존재할 경우 포함되는 객체 개수 정보 없이도 유사 후보 객체의 영역과 위치를 검출할 수 있다. 제안 알고리즘의 성능을 평가할 실험 결과, 기존에 연구된 방법에 비해, 21%의 성능 향상을 보였다. 이러한 결과를 통해, 색상 코렐로그램이 히스토그램 기법보다 성능적 우위를 보였다. 본 논문의 주요 공헌은 색 공간과 공간-색상 정보를 통해 객체 지역화 문제를 해결할 수 있는 또다른 기술을 제시한 것으로 학문적 기여를 검증하였다.

Hand Gesture Recognition using Improved Hidden Markov Models

  • Xu, Wenkai;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제14권7호
    • /
    • pp.866-871
    • /
    • 2011
  • In this paper, an improved method of hand detecting and hand gesture recognition is proposed, it can be applied in different illumination condition and complex background. We use Adaptive Skin Threshold (AST) to detect the areas of hand. Then the result of hand detection is used to hand recognition through the improved HMM algorithm. At last, we design a simple program using the result of hand recognition for recognizing "stone, scissors, cloth" these three kinds of hand gesture. Experimental results had proved that the hand and gesture can be detected and recognized with high average recognition rate (92.41%) and better than some other methods such as syntactical analysis, neural based approach by using our approach.

Research on Methods to Increase Recognition Rate of Korean Sign Language using Deep Learning

  • So-Young Kwon;Yong-Hwan Lee
    • Journal of Platform Technology
    • /
    • 제12권1호
    • /
    • pp.3-11
    • /
    • 2024
  • Deaf people who use sign language as their first language sometimes have difficulty communicating because they do not know spoken Korean. Deaf people are also members of society, so we must support to create a society where everyone can live together. In this paper, we present a method to increase the recognition rate of Korean sign language using a CNN model. When the original image was used as input to the CNN model, the accuracy was 0.96, and when the image corresponding to the skin area in the YCbCr color space was used as input, the accuracy was 0.72. It was confirmed that inserting the original image itself would lead to better results. In other studies, the accuracy of the combined Conv1d and LSTM model was 0.92, and the accuracy of the AlexNet model was 0.92. The CNN model proposed in this paper is 0.96 and is proven to be helpful in recognizing Korean sign language.

  • PDF

스테레오 영상에서 임베디드 데이터를 이용한 거리에 따른 얼굴인식률 비교 (Face recognition rate comparison with distance change using embedded data in stereo images)

  • 박장한;남궁재찬
    • 전자공학회논문지CI
    • /
    • 제41권6호
    • /
    • pp.81-89
    • /
    • 2004
  • 본 논문에서는 스테레오 영상에서 좌·우측 영상을 입력 받아 거리변화와 임베디드 데이터를 이용해 얼굴인식률을 PCA알고리듬으로 비교한다. 제안된 방법에서는 RGB컬러공간에서 YCbCr컬러공간으로 변환하여 얼굴영역을 검출한다. 또한 거리변화에 따라 추출된 얼굴영상의 확대 및 축소하여 보다 강건한 얼굴영역을 추출한다. 실험을 통하여 제안된 방법은 30cm∼200cm 정도의 거리에서 기준 거리(100cm)를 설정하고, 스케일 변화에 따른 평균적인 인식결과로 99.05%(100cm)의 인식률을 얻을 수 있었다. 정규화된 크기(92×112)에서 특정영역인 슈퍼 상태를 정의하고, 각각 정의된 슈퍼 상태의 내부요소인 임베디드 데이터만을 추출하여 PCA 알고리듬을 통하여 얼굴인식을 수행하였다. 원본영상을 모두 학습하는 것이 아니라 임베디드 데이터만을 학습시키기 때문에 제한된 영상의 크기(92×112)에서 특정 데이터를 받아들일 수 있으며, 평균적으로 92×112크기의 영상에서는 99.05%, 실험1은 99.05%, 실험2는 98.93%, 실험3은 98.54%, 실험4는 97.85%의 얼굴인식률을 보였다. 따라서 실험을 통하여 제안된 방법은 거리변화율을 적용하면 높은 인식률을 얻을 수 있음을 보였으며, 얼굴정보를 축소할 뿐만 아니라 처리속도도 향상되었다.

통계적 특징 기반 SVM을 이용한 야간 전방 차량 검출 기법 (Night Time Leading Vehicle Detection Using Statistical Feature Based SVM)

  • 정정은;김현구;박주현;정호열
    • 대한임베디드공학회논문지
    • /
    • 제7권4호
    • /
    • pp.163-172
    • /
    • 2012
  • A driver assistance system is critical to improve a convenience and stability of vehicle driving. Several systems have been already commercialized such as adaptive cruise control system and forward collision warning system. Efficient vehicle detection is very important to improve such driver assistance systems. Most existing vehicle detection systems are based on a radar system, which measures distance between a host and leading (or oncoming) vehicles under various weather conditions. However, it requires high deployment cost and complexity overload when there are many vehicles. A camera based vehicle detection technique is also good alternative method because of low cost and simple implementation. In general, night time vehicle detection is more complicated than day time vehicle detection, because it is much more difficult to distinguish the vehicle's features such as outline and color under the dim environment. This paper proposes a method to detect vehicles at night time using analysis of a captured color space with reduction of reflection and other light sources in images. Four colors spaces, namely RGB, YCbCr, normalized RGB and Ruta-RGB, are compared each other and evaluated. A suboptimal threshold value is determined by Otsu algorithm and applied to extract candidates of taillights of leading vehicles. Statistical features such as mean, variance, skewness, kurtosis, and entropy are extracted from the candidate regions and used as feature vector for SVM(Support Vector Machine) classifier. According to our simulation results, the proposed statistical feature based SVM provides relatively high performances of leading vehicle detection with various distances in variable nighttime environments.

다중 불법콘텐츠 복제자 추적 기술 개발 (Development of Forensic Marking technology for tracing multiple users)

  • 김종안;김진한;김종흠
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2008년도 정보통신설비 학술대회
    • /
    • pp.102-106
    • /
    • 2008
  • Forensic Marking is the technology that enables the service providers (SP) to identify the illegal digital contents distributors by first inserting markings (data indicating the user information and playback time) in realtime into the digital contents at time of playback of digital contents, and then later by extracting inserted markings from the contents which are illegally captured from the multimedia device such as IPTV STBs and distributed over the Internet. Digital Rights Management (DRM), which is a very popular content protection technology, has the security hole that can be vulnerable because the encrypted digital contents are transformed into their original plaintext forms after the decrypting process on the STBs. Therefore Forensic Marking (FM) has now become a companion content protection solution to DRM. This article describes a new way of tracking up to 4 illegal content users in FM implementation using the blue-difference chroma component of YCbCr color space. This FM technology has many advantages like fast processing time and easy portability to STB devices compared to that of the traditional watermarking processing in the frequency domain.

  • PDF

멀티미디어 콘텐츠 제어를 위한 사용자 경험 기반 동작 인식 기술 (Human Gesture Recognition Technology Based on User Experience for Multimedia Contents Control)

  • 김윤식;박상윤;옥수열;이석환;이응주
    • 한국멀티미디어학회논문지
    • /
    • 제15권10호
    • /
    • pp.1196-1204
    • /
    • 2012
  • 본 논문에서는 다양한 멀티미디어 매체의 제어 및 인터랙션을 위하여 별도의 입력장치 없이 사용자의 경험기반의 동작 인식을 통하여 멀티미디어 콘텐츠를 제어 하는 알고리즘을 제안하였다. 본 논문에서 제안한 사용자 경험 기반 멀티미디어 콘텐츠 제어를 위한 휴먼 동작 인식 방법은 먼저, 카메라로부터 입력받은 영상을 조명의 변화에 크게 영향을 받지 않는 YCbCr컬러 영역으로 변환하여 피부색 추출과 모폴로지에 의한 잡음제거, Boundary Energy 및 Depth 영상을 이용하여 손 영역을 검출하였다. 검출된 손 영상에서 PCA 알고리즘을 이용하여 손 모양을 인식하고 차영상 및 모멘트 이론을 이용하여 손의 중심점 검출 및 궤적을 획득한 후, 손의 궤적을 시간을 기준으로 8분할하여 8방향 체인코드를 이용하여 심볼화하였다. 심볼화된 정보로 부터 HMM 알고리즘을 이용하여 손동작을 인식, 사용자의 동작 인식을 통하여 멀티미디어 콘텐츠를 제어하도록 하였다. 제안한 알고리즘을 실험에 적용한 결과 손 영역 검출은 94.25%, 손 모양 인식은 92.6%, 손 동작 인식은 85.86%, 얼굴 검출은 89.58%의 성능을 나타내었으며 이를 기반으로 컴퓨터 환경에서 생성 구축된 영상, 음성, 동영상, MP3, e-book 등과 같은 다양한 콘텐츠들을 동작인식만으로 제어할 수 있도록 하였다.

안드로이드 기반의 도로 밝기 측정 어플리케이션 구현 (A Road Luminance Measurement Application based on Android)

  • 최영환;김홍래;홍민
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.49-55
    • /
    • 2015
  • 최근 5년간의 주 야간별 교통사고 통계에 따르면 대부분의 자동차 교통사고는 주간보다 야간에 더 많이 발생했다. 교통사고는 다양한 원인으로 발생하게 되는데 그 중 중요한 요소는 조명 미설치 또는 조명 위치의 부적합으로 운전자의 시야 혼란을 야기하여 교통사고를 유발하게 된다. 본 논문은 부적절한 도로 조명 시설 위치와 미설치 구역을 파악하고 관련 정보들을 데이터베이스화 하였다. 이를 위해 운전자의 위치 정보, 주행 정보, 도로 밝기 정보를 스마트폰을 이용하여 실시간으로 데이터베이스 서버에 저장하는 도로 밝기 측정 어플리케이션을 설계 및 구현하였다. 본 어플리케이션은 안드로이드 NDK을 이용하여 Native C/C++ 환경에서 구현되었으며, 이에 따라 자바나 다른 언어로 작성된 어플리케이션 보다 연산속도를 향상시켰다. 도로 밝기를 측정하기 위하여 카메라 영상인 RGB 색 공간의 영상을 YCbCr 색 공간의 영상으로 변환하여 휘도를 측정한다. 이를 위해 먼저 차선을 검출하고 도로 밝기 검출 영역의 휘도 값을 계산하여 데이터베이스에 저장한다. 또한 스마트폰의 카메라를 이용하여 실시간으로 도로의 영상을 입력 받고 도로의 차선부분에 대한 관심영역을 지정하여 연산 속도를 향상시켰다. 관심영역의 영상은 Grayscale 영상으로 변환하고 Canny 에지 검출기를 사용하여 외곽선을 추출하고 Hough line transform을 적용하여 차선의 후보군을 선별한다. 선별된 후보 차선의 기울기를 계산하여 양쪽의 차선을 선정한다. 양쪽 차선이 검출되면 차선의 교차점으로부터 아래로 20픽셀의 높이를 가진 삼각형을 도로 밝기 측정범위로 설정한다. 삼각형 부분의 모든 픽셀에 대한 R, G, B값을 추출하여 Y값을 계산하고 픽셀 밝기 값의 평균을 0부터 100사이의 값으로 계산하여 검은색부터 초록색으로 도로의 밝기를 표현하였다. 계산된 60m 전방의 도로 밝기 값은 스마트폰의 GPS 센서를 통해 측정된 운전자의 주행 정보와 위치 정보를 획득하여 10분 간격으로 무선통신을 통해 데이터베이스 서버에 저장하였다. 향후 수집된 도로 밝기 정보들은 스마트폰 어플리케이션이나 차량 내비게이션을 통해 운전자들에게 조심 운전을 경고하거나 효율적인 도로 조명 관리를 위한 개보수 계획에 반영될 수 있을 것으로 기대된다.