통합 검색 | Korea Science

HLF(Haar-like Feature)를 이용한 실시간 손 포즈 인식 (Real-time Hand Pose Recognition Using HLF)

김장운;김송국;홍석주;장한별;이칠우
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2007년도 학술대회 1부
- /
- pp.897-902
- /
- 2007
인간과 컴퓨터간의 전통적인 인터페이스는 인간이 요구하는 다양한 인터페이스를 제공하지 못한다는 점에서 점차 사용하기 불편하게 되었고 이는 새로운 형태의 인터페이스에 대한 요구로 이어지게 되었다. 본 논문에서는 이러한 추세에 맞추어 카메라를 통해 인간의 손 제스처를 인식하는 새로운 인터페이스를 연구하였다. 손은 자유도가 높고 3차원의 view direction에 의해 형상이 매우 심하게 변한다. 따라서 윤곽선 기반방법과 같은 2차원으로 투영된 영상에서 contour나 edge의 정보로 손 제스처를 인식하는 데는 한계가 있다. 그러나 모델기반 방법은 3차원 정보를 이용하기 때문에 손 제스처를 인식하는데 좋으나 계산량이 많아 실시간으로 처리하기가 쉽지 않다. 이러한 문제점을 해결하기 위해 손 형상에 대한 대규모 데이터베이스를 구성하고 정규화된 공간에서 Feature 간의 연관성을 파악하여 훈련 데이터 모델을 구성하여 비교함으로써 실시간으로 손 포즈를 구별할 수 있다. 이러한 통계적 학습 기반의 알고리즘은 다양한 데이터와 좋은 feature의 검출이 최적의 성능을 구현하는 것과 연관된다. 따라서 배경으로부터 노이즈를 최대한 줄이기 위해 피부의 색상 정보를 이용하여 손 후보 영역을 검출하고 검출된 후보 영역으로부터 HLF(Haar-like Feature)를 이용하여 손 영역을 검출한다. 검출된 손 영역으로부터 패턴 분류 과정을 거쳐 손 포즈를 인식 하게 된다. 패턴 분류 과정은 HLF를 이용하여 손 포즈를 인식하게 되는데 미리 학습된 각 포즈에 대한 HLF를 이용하여 손 포즈를 인식하게 된다. HLF는 Violar가 얼굴 검출에 적용한 것으로 얼굴 검출에 좋은 결과를 보여 주었으며, 이는 적분 이미지로부터 추출한 HLF를 이용한 Adaboost 학습 알고리즘을 사용하였다. 본 논문에서는 피부색의 색상 정보를 이용 배경과 손 영상을 최대한 분리하여 배경의 대부분이 Adaboost-Haar Classifier의 첫 번째 스테이지에서 제거되는 방법을 이용하여 그 성능을 더 향상 시켜 손 형상 인식에 적용하였다.
PDF

하이브리드 인식 기술을 이용한 전사적 인적자원관리 (Enterprise Human Resource Management using Hybrid Recognition Technique)

한정수;이정헌;김귀정
- 디지털융복합연구
- /
- 제10권10호
- /
- pp.333-338
- /
- 2012
인적자원관리는 IT기술을 접목하여 다양한 변화를 가져오고 있다. 특히 HRM이 집단차원의 관리, 물리적 사업장, 근무시간의 제약, 개인적 접촉 등 비과학적 방법으로 이루어졌다면, 현재의 전자적 인적자원관리(e-HRM)는 개별 차원의 관리, 가상 작업 공간의 등장(예. 스마트워크센터, 홈워크 등), 근무시간의 유연화 및 탄력화, 컴퓨터 기반의 통계자료 및 과학적 방법에 의한 분석 및 관리를 근간으로 이루어지고 있다는 점에서 큰 차이가 있다. 따라서 환경의 변화에 따라 기업들은 보다 효율적이고 전략적인 인적자원 관리 체계를 구축하기 위하여 RFID 카드, 지문인식 근태관리 시스템 등 다양한 기술을 도입하고 있다. 본 논문에서는 효율적인 전사적 인적자원 관리를 위한 멀티 카메라를 이용하여 2D 및 3D 얼굴인식기술 기반의 근태관리, 출입통제관리 시스템을 개발하였다. 여기서는 기존 2D방식의 얼굴인식기술이 가지고 있는 문제점인 조명 및 자세에 따른 인식률 저하를 극복하여 90% 이상의 인식률을 확보하였다. 또한 3D 얼굴인식방식의 문제점인 많은 계산량을 개선하기 위하여 3D와 2D 인식기술을 병행하여 처리함으로써 하이브리드 영상인식 및 인식속도를 개선할 수 있었다.
https://doi.org/10.14400/JDPM.2012.10.10.333 인용 PDF

얼굴 인식을 위한 연립 대각화와 국부 선형 임베딩 (Locally Linear Embedding for Face Recognition with Simultaneous Diagonalization)

김은솔;노영균;장병탁
- 정보과학회 논문지
- /
- 제42권2호
- /
- pp.235-241
- /
- 2015
국부 선형 임베딩(Locally Linear Embedding, LLE) [1]는 다양체 학습(manifold learning) 알고리즘 중 하나로 고차원 공간에 있는 데이터들 사이의 내적 값을 기반으로 임베딩하는 방법이다. LLE를 이용하여 임베딩 한 결과는 독특한 성질이 있는데, 고차원 공간 상에서 같은 평면에 있는 데이터들은 내적 값이 크기 때문에 저차원 공간에서도 가깝게 위치하도록 임베딩 되는 반면 수직으로 위치한 평면에있는 데이터들은 내적 값이 0이 되기 때문에 서로 떨어진 위치에 임베딩된다. 한편, 한 사람의 얼굴에 다양한 각도에서 조명을 비추면서 촬영한 이미지들은 저차원의 선형 부분공간을 구성한다는 사실이 잘 알려져 있다 [2]. 이에 본 논문에서는 다른 평면에 위치하는 데이터들을 자연스럽게 분류하여 임베딩하는 LLE 알고리즘을 얼굴 이미지에 사용하여 효과적으로 얼굴 인식 문제를 해결할 수 있는 방법을 제안한다. 제안하는 방법은 LLE에 연립 대각화(Simultaneous Diagonalization, SD)를 적용한 방법으로, S연립 대각화를 적용하면 데이터들이 형성하는 평면이 수직이 되도록 바꿀 수 있기 때문에 LLE의 성질을 극대화 할 수 있다. 실험 결과, 연립 대각화를 적용하고 LLE를 적용하면 서로 다른 사람의 얼굴 이미지들이 겹치지 않고 뚜렷하게 구분되는 효과가 있음을 확인하였다.
https://doi.org/10.5626/JOK.2015.42.2.235 인용 KSCI

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

남기환;배철수
- 한국정보통신학회논문지
- /
- 제6권5호
- /
- pp.783-788
- /
- 2002
최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 논은 입모양 인식을 일반 퍼스널 컴퓨터상에서 구현하고자 한다. 본 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 입모양 인식을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형살 모델을 입력 동영상에 정합시키고 정합된 3차원 형상모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의하여 이루어지고, 인식은 각각의 3차인 특징벡터를 이산 HMM 인식기의 인식 파라메타로 사용하였다.
PDF KSCI

얼굴 인식을 위한 2D DLDA 알고리즘 (2D Direct LDA Algorithm for Face Recognition)

조동욱;장언동;김영길;송영준;안재형;김봉현
- 한국통신학회논문지
- /
- 제30권12C호
- /
- pp.1162-1166
- /
- 2005
본 논문에서는 얼굴 인식을 위한 새로운 저차원 특징 표현 기법을 제안하였다. 선형판별기법(LDA)는 인기있는 특징추출 기법이다. 하지만 고차원 데이터의 경우에 계산적인 복잡도가 높고 샘플의 개수가 적은 경우 역행렬을 구할 수 없는 특이행렬문제에 직면한다. 이러한 문제들을 해결하기 위해 일반적인 선형판별기법과 다르게 우리는 이차원 이미지 공분산 행렬을 구한 다음 직접선형판별기법(dirct LDA)을 적용하였으며 이것을 2D-DLDA라고 부른다. ORL 얼굴데이터베이스를 사용하여 실험한 결과 기존의 직접선형판별기법보다 성능이 우수함을 확인하였다.
PDF KSCI

CT 전처리 기법을 이용하여 조명변화에 강인한 얼굴인식 시스템 설계 (Design of Robust Face Recognition System with Illumination Variation Realized with the Aid of CT Preprocessing Method)

진용탁;오성권;김현기
- 한국지능시스템학회논문지
- /
- 제25권1호
- /
- pp.91-96
- /
- 2015
본 연구는 조명변화에 강인한 CT 전처리 기법 기반 개선된 얼굴인식 시스템을 소개한다. 전처리 알고리즘으로 CT알고리즘은 조명이 없는 환경에서도 얼굴의 지역적인 특징만을 추출한다. 얼굴의 지역적인 특징 추출을 가능하게 해준다. 처리된 데이터는 $(2D)^2$ 기반 대표적인 차원축소 알고리즘인 PCA를 사용하여 특징을 추출하였다. 전처리 알고리즘을 통한 특징 데이터는 제안한 방사형 기저함수 신경회로망의 입력으로 사용하였다. 방사형 기저함수 신경회로망의 은닉층은 FCM으로 구성하였고, 연결가중치는 1차 선형식을 사용하였다. 또한 ABC 알고리즘을 이용하여 제안된 분류기의 파라미터, 즉 입력의 수, 퍼지 클러스터링의 퍼지화 계수를 최적화 한다. 본 연구는 제안된 시스템의 성능 평가를 위해 Yale Face database B와 CMU PIE database로 실험하였다.
https://doi.org/10.5391/JKIIS.2015.25.1.091 인용 PDF KSCI

교통 표지판 자동 인식에 관한 연구 (Study of Traffic Sign Auto-Recognition)

권만준
- 한국산학기술학회논문지
- /
- 제15권9호
- /
- pp.5446-5451
- /
- 2014
내비게이션 단말기에 사용되는 전자지도 제작이 수작업으로 이루어지고 있어 오기가 발생할 수 있기 때문에, 본 논문에서는 내비게이션 정보의 요소로 다루어지는 교통 표지판에 대한 오프라인 자동 인식에 대해 제안하였다. 컴퓨터 비전과 패턴 인식 응용 분야로 2차원 얼굴 인식 분야에 널리 활용되고 있는 주성분분석기법(PCA)과 선형판별분석기법(LDA)을 이용하여 교통표지판을 인식하고자 한다. 먼저 PCA를 이용하여 높은 차원의 2차원 이미지 데이터를 저차원의 특징 벡터영역으로 투영을 시킨다. PCA로부터 구해진 저차원의 특징 벡터를 이용하여 LDA로 분산 매트릭스들 간에 최대가 되고 하고, 분산 매트릭스 내에서는 최소가 되도록 하였다. 실제 도로 환경에서 추출된 교통 신호판의 대부분을 제안된 알고리즘에 의해서 특징 벡터를 40개 이상 사용하였을 경우 92.3%이상의 높은 인식률을 보임을 확인하였다.
https://doi.org/10.5762/KAIS.2014.15.9.5446 인용 PDF KSCI

얼굴 및 눈동자 움직임에 의한 시선 위치 추적 (Gaze Detection by Computing Facial and Eye Movement)

박강령
- 대한전자공학회논문지SP
- /
- 제41권2호
- /
- pp.79-88
- /
- 2004
시선 위치 추적이란 현재 사용자가 응시하고 있는 위치를 컴퓨터 시각 인식 방법에 의해 파악하는 연구이다. 이러한 시선 위치 추적 기술은 많은 응용 분야를 가지고 있는데, 그 대표적인 예로는 양 손을 사용하지 못하는 심신 장애자를 위한 컴퓨터 인터페이스 및 3차원 시뮬레이터 프로그램에서 사용자의 시선 위치에 따른 화면 제어 등이 있다. 이 논문에서는 적외선 조명이 부착된 단일 카메라를 이용한 컴퓨터 비전 시스템으로 시선 위치 추적 연구를 수행하였다. 사용자의 시선 위치를 파악하기 위해서는 얼굴 특징점의 위치를 추적해야하는데, 이를 위하여 이 논문에서는 적외선 기반 카메라와 SVM(Support Vector Machine) 알고리즘을 사용하였다. 사용자가 모니터상의 임의의 지점을 쳐다볼 때 얼굴 특징점의 3차원 위치는 3차원 움식임량 추정(3D motion estimation) 및 아핀 변환(affine transformation)에 의해 계산되어 질 수 있다. 얼굴 특징점의 변화된 3차원 위치가 계산되면, 이로부터 3개 이상의 얼굴 특징점으로부터 생성되는 얼굴 평면 및 얼굴 평면의 법선 벡터가 구해지게 되며, 이러한 법선 벡터가 모니터 스크린과 만나는 위치가 사용자의 시선위치가 된다. 또한, 이 논문에서는 보다 정확한 시선 위치를 파악하기 위하여 사용자의 눈동자 움직임을 추적하였으면 이를 위하여 신경망(다층 퍼셉트론)을 사용하였다. 실험 결과, 얼굴 및 눈동자 움직임에 의한 모니터상의 시선 위치 정확도는 약 4.8㎝의 최소 자승 에러성능을 나타냈다.
PDF KSCI

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

김동수;남기환;한준희;배철수;나상동
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 1998년도 추계종합학술대회
- /
- pp.181-185
- /
- 1998
최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 독순(lipreading)을 PC에서 구현하고자 한다. 간 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 독순(lipreading)을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식 단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의한다. 인식은 다차원(multi-dimensional), 다단계 라벨링 방법을 사용하여 3차원 특징벡터를 입력으로 한 이산 HMM을 사용하였다.
PDF

실시간 음성인식 및 립싱크 구현에 관한 연구 (A Study on the Implementation of Realtime Phonetic Recognition and LIP-synchronization)

이형호;최두일;조우연
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 2000년도 추계학술대회 논문집 학회본부 D
- /
- pp.812-814
- /
- 2000
본 논문에서는 실시간 음성 인식에 의한 립싱크(Lip-synchronization) 애니메이션 제공 방법에 관한 것으로서, 소정의 음성정보를 인식하여 이 음성 정보에 부합되도록 애니메이션의 입모양을 변화시켜 음성정보를 시각적으로 전달하도록 하는 립싱크 방법에 대한 연구이다. 인간의 실제 발음 모습에 보다 유사한 립싱크와 생동감 있는 캐릭터의 얼굴 형태를 실시간으로 표현할 수 있도록 마이크 등의 입력을 받고 신경망을 이용하여 실시간으로 음성을 인식하고 인식된 결과에 따라 2차원 애니메이션을 모핑 하도록 모델을 상고 있다.
PDF

검색결과 85건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)