통합 검색 | Korea Science

바이모달 음성인식기의 시각 특징 추출을 위한 색상 분석자 SVM을 이용한 입술 위치 검출 (Lip Detection using Color Distribution and Support Vector Machine for Visual Feature Extraction of Bimodal Speech Recognition System)

정지년;양현승
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제31권4호
- /
- pp.403-410
- /
- 2004
바이모달 음성인식기는 잡음 환경하 음성인식 성능을 향상하기 위해 고안되었다. 바이모달 음 성인식기에 있어 영상을 통한 시각 특징 추출은 매우 중요한 역할을 하며 이를 위한 입술 위치 검출은 시각 특징 추출을 위한 중요한 선결 과제이다 본 논문은 색상분포와 SVM을 이용하여 시각 특징 추출을 위한 입술 위치 검출 방법을 제안하였다. 제안된 방법은 얼굴색/입술 색상 분포를 학습하여 이로부터 입술의 초기 위치를 빠르게 찾아내고 SVM을 이용하여 입술의 정확한 위치를 찾음으로써 정확하고 빠르게 입술의 위치를 찾도록 하였으며 실험을 통해 바이모달 인식기에 적용하기에 적합함을 알 수 있었다.
PDF KSCI

능동적 형태 모델과 가중치 벡터를 이용한 입술 인식 (Lip Recognition Using Active Shape Model and Shape-Based Weighted Vector)

장경식
- 지능정보연구
- /
- 제8권1호
- /
- pp.75-85
- /
- 2002
이 논문은 입술의 형태와 입술 외곽선 부근의 화소값을 이용하여 입술을 효과적으로 인식하는 방법을 제안하였다. 입술의 형태는 학습 영상을 통계적으로 분석하는 능동적 형태 모델을 기반으로 구성하였다. 이 방법은 탐색시 초기 위치의 영향을 받기 때문에 이 논문에서는 입술의 형태에 기반한 가중치 벡터를 이용하여 두 입술 사이의 경계선을 찾고 탐색의 초기 위치로 사용하였다. 다양한 입술 영상들을 대상으로 실험하여 좋은 결과를 얻었다.
PDF

형태계수의 Mixture Model을 이용한 입술 형태 표현과 입술 경계선 추출 (Lip Shape Representation and Lip Boundary Detection Using Mixture Model of Shape)

장경식;이임건
- 한국멀티미디어학회논문지
- /
- 제7권11호
- /
- pp.1531-1539
- /
- 2004
본 논문은 입술의 경계선을 효과적으로 추출하는 방법을 제안하였다. 입술 형태는 PDM(Point Distribution Model)과 주성분 분석법을 이용하여 표현하고 입술 경계선은 GLDM(Gray Level Distribution Model)을 기반으로 표현하였다 입술 경계선 추출은 모델에 대한 입력영상의 정확도에 대한 목적함수를 최적화하는 문제로 단순화하였으며, 최적화를 위해 다운힐 심플렉스(Down Hill Simplex) 알고리즘을 이용하였다. 탐색과정에서 지역 최소점으로 수렴하는 문제를 해결하기 위하여 입술 형태 모델의 형태계수를 GMM(Gaussian Mixture Model)을 이용하여 표현하였다. 형태계수에 대한 GMM을 이용하여 입술의 대략적인 형태를 찾고, 이때 사용된 mixture 성분을 이용하여 탐색과정에서 입술의 형태를 조정함으로써 지역 최소점에 수렴하여 입술의 정확한 위치를 찾지 못하는 문제점을 해결하였다. 여러 영상을 대상으로 실험하여 좋은 결과를 얻었다.
PDF

형태 군집화를 이용한 입술 형태 모델과 입술 추출 (Lip Shape Model and Lip Localization using Shape Clustering)

장경식
- 한국멀티미디어학회논문지
- /
- 제6권6호
- /
- pp.1000-1007
- /
- 2003
이 논문은 입술의 모양을 효과적으로 추출하는 방법을 제안하였다. 입술은 Point Distribution Model에 근거하여 점들의 집합으로 표현하였다. Isodata군집 알고리듬을 이용하여 전체 학습 영상을 입술 형태별로 군집화 하고 주성분 분석법을 사용하여 각 군집에 대한 입술의 형태 모델을 구하였다 추출 결과가 입력 영상의 실제 입술 위치를 올바르게 찾았는지 판정하기 위하여 입술 경계선 주변의 화소값들을 이용한 입술의 경계선 모델을 구하고 이를 반영하는 평가함수를 구성하였다. 형태 차이를 반영하여 얻은 입술 형태 모델을 사용하여 입술을 추출하기 때문에 전체 학습 영상의 평균 모양과 많은 차이를 보이는 입술을 정확하게 추출할 수 있었다. 여러 영상을 대상으로 실험하여 약 92%의 성공률을 얻었다.
PDF

하안면부에서 입술의 돌출 정도와 안면 비대칭의 인지도에 관한 연구 (Level of perception of changed lip protrusion and asymmetry of the lower facial height)

김규선;김영진;이근혜;국윤아;김영호
- 대한치과교정학회지
- /
- 제36권6호
- /
- pp.434-441
- /
- 2006
교정 치료를 하고자 하는 가장 큰 동기 중의 하나는 좋은 안면을 얻고자 하는 것이므로 교정 치료 후 안면부에 나타나는 변화에 대한 환자들의 인지도를 이해하는 것은 교정 치료의 진단과 치료 계획 수립에 매우 중요한 일이다. 이에 본 연구는 정면 및 측모에서 하 안면부위의 입술의 위치와 안면 비대칭의 변화에 관하여 인지할 수 있는 최소한의 변화량을 알아보고자 근형 잡힌 비율을 지닌 가상의 정모와 측모 사진을 컴퓨터 영상으로 제작한 후 입술의 위치는 Ricketts의 E-line을 기준으로, 안면의 비대칭은 턱 끝의 중앙 지점을 기준으로 각각 1, 2, 3, 4 mm 변화시킨 디지털 영상을 이용하여 40명의 미술학도를 관찰자로 인지도 조사를 하였다. 연구 결과 환자가 입술의 위치와 비대칭의 변화를 인지하기 위해서는 측모에서 최소한 2 mm 이상, 정모에서 3 mm 이상의 변화가 필요하였으며 하 안면부 변화에 대한 인지도는 정모에서보다 측모 변화에 대한 인지도가 높았다. 또한 변화에 대한 사전 정보는 변화에 대한 인지율을 현저하게 높여 주었다.
PDF KSCI

입술정보를 이용한 입술모양의 기하학적 보정 (Geometric Correction of Lips Using Lip Information)

황동국;박희정;전병민
- 한국통신학회논문지
- /
- 제29권6C호
- /
- pp.834-841
- /
- 2004
화자의 입술영상에는 카메라와 화자의 위치나 자세로 인하여 정상적인 입술이 기하학적으로 변환될 수 있다. 이러한 변환은 본래 입술위상의 기하학적 정보를 변경시킨다. 따라서 기하학적으로 변환된 입술모양을 보정하는데 부분적인 입술위상정보를 사용함으로써 전체 입술정보를 개선하고자, 본 논문에서는 입술모양의 기하학적 보정 기법을 제안한다. 제안한 기법은 특징결정 단계와 보정 단계로 구성된다. 특징결정 단계에서는 원영상과 목표영상의 입술모델에 따라 원영상의 특징점과 특징을 추출하고 목표영상의 특징점과 특징을 결정한다. 보정단계에서는 이전 단계에서 추출한 정보를 기반으로 영상을 부분영상으로 분할하고 사상 후 보정된 영상을 통합한다. 실험영상은 6개의 한국어 단모음 발음에 대한 동영상 프레임이고 알고리즘 평가를 위하여 입술의 좌우 대칭성을 활용한다. 실험 결과, 윗입술보다는 아랫입술의 보정률, 입술의 움직임이 작은 발음보다는 움직임이 큰 발음의 보정률이 높게 개선되었다.
PDF KSCI

에너지 최소화 기반 능동형태 모델을 이용한 입술 윤곽선 추출 (Lip Contour Extraction Using Active Shape Model Based on Energy Minimization)

장경식
- 한국정보통신학회논문지
- /
- 제10권10호
- /
- pp.1891-1896
- /
- 2006
이 논문에서는 능동형태 모델을 개선하여 입술의 형태를 효과적으로 추출하는 방법을 제안하였다. 입술의 형태변형은 능동형태 모델에 기반을 둔 통계적 형태 변형 모델을 사용하여 표현하였다. 능동형태 모델에서 각 점은 지엽적인 정보인 프로파일을 기반으로 독립적으로 이동하기 때문에 많은 오류가 발생할 수 있다. 전역적인 정보를 사용하기 위하여 이 논문에서는 능동윤곽선 모델에서 사용하는 것과 유사한 에너지 함수를 정의하고 전체 에너지가 최소화되는 위치로 점들이 이동하게 하였다. Tulip 1 데이터 베이스에 있는 입술 영상을 대상으로 실험한 결과, 제안한 방법이 기존 방법보다 실제 형태에 가깝게 입술을 추출하였다.
PDF KSCI

모바일 환경에서의 시각 음성인식을 위한 눈 정위 기반 입술 탐지에 대한 연구 (A Study on Lip Detection based on Eye Localization for Visual Speech Recognition in Mobile Environment)

송민규;;김진영;황성택
- 한국지능시스템학회논문지
- /
- 제19권4호
- /
- pp.478-484
- /
- 2009
음성 인식 기술은 편리한 삶을 추구하는 요즘 추세에 HMI를 위해 매력적인 기술이다. 음성 인식기술에 대한 많은 연구가 진행되고 있으나 여전히 잡음 환경에서의 성능은 취약하다. 이를 해결하기 위해 요즘은 청각 정보 뿐 아니라 시각 정보를 이용하는 시각 음성인식에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 모바일 환경에서의 시각 음성인식을 위한 입술의 탐지 방법을 제안한다. 시각 음성인식을 위해서는 정확한 입술의 탐지가 필요하다. 우리는 입력 영상에서 입술에 비해 보다 찾기 쉬운 눈을 이용하여 눈의 위치를 먼저 탐지한 후 이 정보를 이용하여 대략적인 입술 영상을 구한다. 구해진 입술 영상에 K-means 집단화 알고리듬을 이용하여 영역을 분할하고 분할된 영역들 중 가장 큰 영역을 선택하여 입술의 양 끝점과 중심을 얻는다. 마지막으로, 실험을 통하여 제안된 기법의 성능을 확인하였다.
https://doi.org/10.5391/JKIIS.2009.19.4.478 인용 PDF KSCI

자극양식에 따른 청감각기억에서의 여러가지 부호화방식과 처리방식 (Different Types of Encoding and Processing in Auditory Sensory Memory according to Stimulus Modality)

김정환;이만영
- 한국음향학회지
- /
- 제9권4호
- /
- pp.77-85
- /
- 1990
본 연구는 청각조건과 입술운동 조건에서 나타나는 최근 및 접미효과가 동일한 기제에 의해 처리된 결과라는 Greene 와 Crowder(1984)의 수정된 PAS모형을 검증하기 위해 시행되었다. 최근 및 접미효과와 상호작용하는 것으로 보이는 음성적 특성을 실험조작하여 청각과 입술운동 조건에서 자음과 모음간에 차별적 회상효과를 보이는지 알아보았다. 이것은 Turner 등(1987)의 주장과 일치하는 결과이다. 한편, 잡음-입술운동 조건과 입술운동 조건의 마지막 계열위치에서 유의미한 회상 차이를 보이지 않았으므로, 잡음은 입술운동 정보에 대한 최근 효과에 영향을 주지 않고, 따라서 청각정보와 입술운동 정보는 다른 기제를 통해 부호화되는 것으로 보인다.
PDF

임베디드 환경에서의 실시간 립리딩 시스템 구현 (Real Time Lip Reading System Implementation in Embedded Environment)

김영운;강선경;정성태
- 정보처리학회논문지B
- /
- 제17B권3호
- /
- pp.227-232
- /
- 2010
본 논문은 임베디드 환경에서의 실시간 립리딩 방법을 제안한다. 기존 PC 환경에 비하여 임베디드 환경은 사용할 수 있는 자원이 제한적이므로, 기존 PC 환경의 립리딩 시스템을 임베디드 환경에서 실시간으로 구동하기는 어렵다. 이러한 문제를 해결하기 위해 본 논문은 임베디드 환경에 적합한 입술영역 검출 방법과 입술 특징추출 방법, 그리고 발성 단어 인식 방법을 제안한다. 먼저 정확한 입술영역을 찾기 위해 얼굴 색상정보를 이용해 얼굴영역을 검출하고 검출된 얼굴 영역에서 양쪽 두 눈의 위치를 찾아 기하학적 관계를 이용해 정확한 입술영역을 검출한다. 검출된 입술영역에서 주위 환경 변화에 따른 조명 변화에 강인한 특징을 추출하기위해 히스토그램 매칭과 입술 폴딩, RASTA 필터를 적용하고 주성분 분석(PCA)을 이용한 특징계수를 추출해 인식에 사용하였다. 실험결과 CPU 806Mhz, RAM 128MB 사양의 임베디드 환경에서 발성 단어에 따라 1.15초에서 2.35초까지의 처리 속도를 보였으며, 180개의 단어 중 139개의 단어를 인식해 77%의 인식률을 얻을 수 있었다.
https://doi.org/10.3745/KIPSTB.2010.17B.3.227 인용 PDF KSCI

Search Result 62, Processing Time 0.03 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)