• 제목/요약/키워드: 입술 추출

검색결과 76건 처리시간 0.038초

포먼트 주파수 대역폭 추출 및 분석을 이용한 신장 질환 진단 방법의 설계 (A Design of Kidney Diseases Diagnosis Method Using Formant Frequency Bandwidth Extraction and Analysis)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제34권10B호
    • /
    • pp.1062-1069
    • /
    • 2009
  • 비만으로 인해 대사증후군을 많이 앓고 있는 상황에서 후유증으로 신장 질환이 커다란 사회문제가 되고 있는 실정이다. 따라서 자각증상이 없는 신장의 이상 유무를 조기에 판단하여 적절한 조치를 취하는 것이 무엇보다 중요하다. 이를 위해 본 논문에서는 음성 분석을 통해 신장 질환을 무자각, 무구속, 무통종의 방법으로 진단할 수 있는 방법을 제안하였다. 구성하고자 하는 전체 시스템은 크게 음성 분석과 얼굴색을 살피는 방법을 결합시키는 시스템이 개발되고 있으며 이 중 본 논문은 입술소리를 기반으로 신장 질환을 진단하는 방법에 설계하였다. 이를 위해 본 논문에서는 첫째, 신장 질환을 앓고 있는 환자와 정상인을 대상으로 피실험자 집단을 각각 구성하고 입술소리의 수치학적 분석을 실험으로 출력하고 그 결과값에 대한 비교 분석을 수행하였으며 둘째, 한의학적 청진 이론과 언어학, 음성학과의 상관성을 분석하고 이를 기반으로 음성에 대한 신장의 특징 요소를 추출하여 제1포먼트 주파수와의 연관성을 도출하였다. 실험 결과 신장 질환자 집단이 정상인 집단보다 제1포먼트 주파수 대역폭이 넓게 형성되는 결과를 추출하였으며 최종적으로 입술소리만으로 신장 질환을 진단할 때의 오진 확률에 대해 계산하였다.

입술 움직임 영상 선호를 이용한 음성 구간 검출 (Speech Activity Detection using Lip Movement Image Signals)

  • 김응규
    • 융합신호처리학회논문지
    • /
    • 제11권4호
    • /
    • pp.289-297
    • /
    • 2010
  • 본 논문에서는 음성인식을 위한 음성구간 검출과정에서 유입될 수 있는 동적인 음향에너지 이외에 화자의 입술움직임 영상신호까지 확인함으로써 외부 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위한 한 가지 방법이 제시된다. 우선, 연속적인 영상이 PC용 영상카메라를 통하여 획득되고 그 입술움직임 여부가 식별된다. 다음으로, 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세서와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서 공유메모리에 저장되어진 데이터를 확인함으로써 화자의 발성에 의한 음향에너지인지의 여부가 입증된다. 최종적으로, 음성인식기와 영상처리기를 연동시켜 실험한 결과, 영상카메라에 대면해서 발성하면 음성인식 결과의 출력에 이르기까지 연동처리가 정상적으로 진행됨을 확인하였고, 영상카메라에 대면치 않고 발성하면 연동처리시스템이 그 음성인식 결과를 출력치 못함을 확인하였다. 또한, 오프라인하의 입술움직임 초기 특정값 및 템플릿 초기영상을 온라인하에서 추출된 입술움직임 초기특정값 및 템플릿 영상으로 대체함으로써 입술움직임 영상 추적의 변별력을 향상시켰다. 입술움직임 영상 추적과정을 시각적으로 확인하고 실시간으로 관련된 패러미터를 해석하기 위해 영상처리 테스트베드를 구축하였다, 음성과 영상처리 시스템의 연동결과 다양한 조명환경 하에서도 약 99.3%의 연동율을 나타냈다.

조명 변화에 견고한 얼굴 특징 추출 (Robust Extraction of Facial Features under Illumination Variations)

  • 정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.1-8
    • /
    • 2005
  • 얼굴 분석은 얼굴 인식 머리 움직임과 얼굴 표정을 이용한 인간과 컴퓨터사이의 인터페이스, 모델 기반 코딩, 가상현실 등 많은 응용 분야에서 유용하게 활용된다. 이러한 응용 분야에서는 얼굴의 특징점들을 정확하게 추출해야 한다. 본 논문에서는 눈, 눈썹, 입술의 코너와 같은 얼굴 특징을 자동으로 추출하는 방법을 제안한다. 먼저, 입력 영상으로부터 AdaBoost 기반의 객체 검출 기법을 이용하여 얼굴 영역을 추출한다. 그 다음에는 계곡 에너지. 명도 에너지, 경계선 에너지의 세 가지 특징 에너지를 계산하여 결합한다. 구해진 특징 에너지 영상에 대하여 에너지 값이 큰 수평 방향향의 사각형을 탐색함으로써 특징 영역을 검출한다. 마지막으로 특징 영역의 가장자리 부분에서 코너 검출 알고리즘을 적용함으로써 눈, 눈썹, 입술의 코너를 검출한다. 본 논문에서 제안된 얼굴 특징 추출 방법은 세 가지의 특징 에너지를 결합하여 사용하고 계곡 에너지와 명도 에너지의 계산이 조명 변화에 적응적인 특성을 갖도록 함으로써, 다양한 환경 조건하에서 견고하게 얼굴 특징을 추출할 수 있다.

  • PDF

컬러 입술영상과 주성분분석을 이용한 자동 독순 (Automatic Lipreading Using Color Lip Images and Principal Component Analysis)

  • 이종석;박철훈
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.229-236
    • /
    • 2008
  • 본 논문은 화자의 입술 움직임으로부터 음성을 인식하는 자동 독순에서 회색조 영상 대신 컬러 영상을 사용하는 것의 유용성에 대해 고찰한다. 먼저 인간의 독순 실험을 통해 컬러 정보가 인식 성능에 어떠한 영향을 미치는지 확인한다. 다음으로 주성분분석을 이용한 자동 독순에서 회색조 또는 컬러 입술영상을 사용하는 경우에 대해 인식 성능을 비교한다. 다양한 컬러 좌표계에 대한 실험을 통해 컬러 영상의 사용으로 인식율이 향상됨을 보인다. 특히 RGB 좌표계를 사용했을 때 가장 좋은 성능을 얻으며, 회색조의 경우에 비해 잡음이 없는 환경에서는 4.7%, 잡음이 있는 경우 평균 13.0%의 상대적 오인식율 감소를 얻을 수 있음을 확인한다.

눈 주위의 피부색을 이용한 피부영역검출과 입술검출에 관한 연구 (A Study on Extraction of Skin Region and Lip Using Skin Color of Eye Zone)

  • 박영재;장석우;김계영
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.19-30
    • /
    • 2009
  • 본 논문에서는 입력된 영상에서 얼굴의 구성요소와 얼굴을 검출하는 방법을 제안하고자 한다. 얼굴 구성 요소탐지 방법으로는 EyeMap과 MouthMap을 이용하여 눈과 입술을 검출하는 방법을 사용한다. 먼저 눈의 영역을 찾은 후에 그 주변의 색상을 이용하여 피부 영역의 색상값 분포를 찾는다. 피부영역은 YCbCr에서 특징적인 분포를 나타내는데 이를 이용하여 배경영역과 피부영역을 분리한다. 피부영역으로 검출된 영역의 색상값 분포를 찾고 전체 영상에 그 분포와 근거리에 있는 영역들을 피부영역으로 검출한다. 여기서 추출된 피부영역을 기반으로 MouthMap을 구하여 입술을 검출한다. 기존의 방법과 달리 환경에 적응된 피부색상모델을 만들 수 있어 피부 영역 검출에서 좋은 결과를 얻을 수 있을 뿐 아니라 보다 정확한 입술영역을 찾을 수 있다.

오디오-비디오 정보 융합을 통한 멀티 모달 음성 인식 시스템 (Audio-Visual Integration based Multi-modal Speech Recognition System)

  • 이상운;이연철;홍훈섭;윤보현;한문성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.707-710
    • /
    • 2002
  • 본 논문은 오디오와 비디오 정보의 융합을 통한 멀티 모달 음성 인식 시스템을 제안한다. 음성 특징 정보와 영상 정보 특징의 융합을 통하여 잡음이 많은 환경에서 효율적으로 사람의 음성을 인식하는 시스템을 제안한다. 음성 특징 정보는 멜 필터 캡스트럼 계수(Mel Frequency Cepstrum Coefficients: MFCC)를 사용하며, 영상 특징 정보는 주성분 분석을 통해 얻어진 특징 벡터를 사용한다. 또한, 영상 정보 자체의 인식률 향상을 위해 피부 색깔 모델과 얼굴의 형태 정보를 이용하여 얼굴 영역을 찾은 후 강력한 입술 영역 추출 방법을 통해 입술 영역을 검출한다. 음성-영상 융합은 변형된 시간 지연 신경 회로망을 사용하여 초기 융합을 통해 이루어진다. 실험을 통해 음성과 영상의 정보 융합이 음성 정보만을 사용한 것 보다 대략 5%-20%의 성능 향상을 보여주고 있다.

  • PDF

비전 기반 3차원 얼굴 모델의 실시간 표정 제어 (Real-time Expression Control of Vision Based 3 Dimensional Face Model)

  • 김정기;민경필;전준철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.748-750
    • /
    • 2004
  • 본 논문은 연속적으로 입력되는 2차원 얼굴 영상에서 얼굴의 특징 영역들을 추출하여 3차원 얼굴 모델의 표정을 실시간으로 제어하는 방법에 관한 연구이다. 2차원 얼굴 영상에서 얼굴을 추출하기 위해 Hue, Saturation 색상 값을 사용하며, 두 가지 색상 값을 이용하여 피부색과 배경색을 분리함으로써 얼굴 영역을 추출 할 수 있다. 추출 된 얼굴에서 특징 영역인 눈 코, 입술 영역 등의 일지를 각각의 영역에 적합한 추출 방법을 이용하여 추출한 뒤, 프레임 별로 영역들의 움직임을 비교함으로써 영역의 움직임 정보를 획득 할 수 있다. 이 정보를 3차원 얼굴 모델에 적용하여 2차원 동영상에서 획득된 대상의 얼굴의 표정을 3차원 얼굴 모델에 실시간으로 표현 할 수 있도록 한다.

  • PDF

향상된 자동 독순을 위한 새로운 시간영역 필터링 기법 (A New Temporal Filtering Method for Improved Automatic Lipreading)

  • 이종석;박철훈
    • 정보처리학회논문지B
    • /
    • 제15B권2호
    • /
    • pp.123-130
    • /
    • 2008
  • 자동 독순(automatic lipreading)은 화자의 입술 움직임을 통해 음성을 인식하는 기술이다. 이 기술은 잡음이 존재하는 환경에서 말소리를 이용한 음성인식의 성능 저하를 보완하는 수단으로 최근 주목받고 있다. 자동 독순에서 중요한 문제 중 하나는 기록된 영상으로부터 인식에 적합한 특징을 정의하고 추출하는 것이다. 본 논문에서는 독순 성능의 향상을 위해 새로운 필터링 기법을 이용한 특징추출 기법을 제안한다. 제안하는 기법에서는 입술영역 영상에서 각 픽셀값의 시간 궤적에 대역통과필터를 적용하여 음성 정보와 관련이 없는 성분, 즉 지나치게 높거나 낮은 주파수 성분을 제거한 후 주성분분석으로 특징을 추출한다. 화자독립 인식 실험을 통해 영상에 잡음이 존재하는 환경이나 존재하지 않는 환경에서 모두 향상된 인식 성능을 얻음을 보인다.

입술 영역의 움직임과 밝기 변화를 이용한 음성구간 검출 알고리즘 개발 (Voice Activity Detection using Motion and Variation of Intensity in The Mouth Region)

  • 김기백;유제웅;조남익
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.519-528
    • /
    • 2012
  • 음성구간을 검출하는 일반적인 방법은 음향신호로부터 특징값을 추출하여 판별식을 거치는 것이다. 그러나 잡음이 많은 환경에서 그 성능은 당연히 저하되며, 이 경우 영상신호를 이용하거나 영상과 음성을 동시에 사용함으로써 성능향상을 도모할 수 있다. 영상신호를 이용하여 음성구간을 검출하는 기존 방법들에서는 액티브 어피어런스 모델, 옵티컬 플로우, 밝기 변화 등 주로 하나의 특징값을 이용하고 있다. 그러나 음성구간의 참값은 음향신호에 의해 결정되므로 한 가지의 영상정보만으로는 음성구간을 검출하는데 한계를 보이고 있다. 본 논문에서는 입술 영역의 옵티컬 플로우와 밝기 변화 두 가지 영상정보로부터 특징값을 추출하고, 추출된 특징값들을 결합하여 음성구간을 검출하는 알고리즘을 제안하고자 한다. 또한, 음성구간 검출 알고리즘이 다른 시스템의 전처리로 활용되는 경우에 적은 계산량만으로 수행되는 것이 바람직하므로, 통계적 모델링에 의한 방법보다는 추출된 특징값으로부터 간단한 대수적 연산만으로 스코어를 산정하여 문턱값과 비교하는 방법을 제안하고자 한다. 입술 영역 검출을 위해서는 얼굴에서 가장 두드러진 특징점을 갖는 눈을 먼저 검출한 후, 얼굴의 구조와 밝기값을 이용하는 알고리즘을 제안하였다. 실험 결과 본 논문에서 제안하는 두 가지 특징값을 결합한 음성구간 검출 알고리즘이 하나의 특징값만을 이용했을 때보다 우수한 성능을 보임을 확인할 수 있다.

정자직접주입술에 있어 Vero Cells 공배양이 인간 정소정자의 운동성에 미치는 영향에 관한 연구 (The Effects of Vero Cells Coculturing on the Motility of Human Testicular Spermatozoa in an Intracytoplasmic Sperm Injection Program)

  • 김현규;엄기붕;김현주;고정재;이숙환;윤태기;차광열
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제24권2호
    • /
    • pp.225-232
    • /
    • 1997
  • 폐색성 혹은 비폐색성 무정자증에서 부정소 정자채취법 등이 부적절하다고 여겨질때는 정소 조직을 일부 절제하여 그 조직으로부터 정자를 직접 채취하게 되는데 일반적으로 이렇게 정소로부터 추출한 정소정자는 운동성이 전혀 없거나 매우 약한 운동성을 보이는 경우가 많다. 본 연구의 목적은 이러한 정소정자를 Vero cell과 공배양을 시킴으로써 운동성을 획득시키거나 향상시키고 이를 수정시키는 시기까지 지속시킴으로써 정소정자추출술 (TESE)을 시행하는 환자나 의료진들에게 보다 편안하고 융통성있는 시간대를 부여하고, 아울러 정자직접주입술 (ICSI)을 보다 용이하게 하여 성공적인 수정률과 임신율을 얻음에 있다. 또한 ICSI를 시행한 후, 운동성이 향상된 잉여의 정소정자를 냉동보존함으로써 차후에 TESE을 다시 시행치않고도 시험관 아기 시술을 시도할 수 있는 부가적인 잇점도 있다고 할 수 있다. 대상환자군은 정관폐색증(n=11) 혹은 비정관폐색증(n=2)을 보이는 13명의 무정자증의 남성불임환자였으며 난자회수예정일 3일전에 TESE를 시행하여 정소정자를 얻은 후 이를 정자직접주입술이 시행되는 당일까지 Vero cell과 공배양을 실시하였다. Vero cell과의 공배양에 의하여 운동성이 있는 정소정자의 수는 공배양전과 비교하여 평균 3.3배가 증가하였으며, 특히 공배양전에 운동성이 있는 정소정자의 수가 50,000/ml이하의 미약한 운동성만을 보였던 경우 (n=5)에는 공배양 후에 운동성이 있는 정소정자 수의 평균증가율이 7.7배였다. 공배양전 정자운동성이 전혀 없었던 2례의 비정관폐색증환자중 3일간의 공배양을 통하여 1례에서 운동성을 획득한 정소정자를 얻을 수 있었으며 (14,300/ml), 정자직접주입술을 통하여 성공적인 수정 및 임신에 도달할 수 있었다. Vero cell과 공배양을 하고 ICSI했던 결과, 평균 수정률은 75.0% 이었으며 임신율은 61.5%였다.

  • PDF