• 제목/요약/키워드: 강인화

검색결과 720건 처리시간 0.026초

성도 정규화를 이용한 감정 변화에 강인한 음성 인식 (Robust Speech Recognition using Vocal Tract Normalization for Emotional Variation)

  • 김원구;방현진
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.773-778
    • /
    • 2009
  • 본 논문에서는 인간의 감정 변화에 강인한 음성 인식 시스템을 구현하기 위하여 감정 변화의 영향을 최소화 하는 방법에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화에 따른 음성 신호의 변화를 관찰하였다. 감정이 포함되지 않은 평상의 음성으로 학습된 음성 인식 시스템에 감정이 포함된 인식 데이터가 입력되는 경우 감정에 따른 음성의 차이가 인식 시스템의 성능을 저하시킨다. 본 연구에서는 감정의 변화에 따라 화자의 성도 길이가 변화한다는 것과 이러한 변화는 음성 인식 시스템의 성능을 저하시키는 원인 중의 하나임을 관찰하였다. 본 연구에서는 이러한 음성의 변화를 감소시키는 방법으로 성도 길이 정규화 방법을 사용한 감정 변화에 강인한 음성 인식 시스템을 개발하였다. HMM을 사용한 단독음 인식 실험에서 제안된 학습 방법을 사용하면 감정 데이터의 오차가 기존방법보다 41.9% 감소되었다.

히스토그램 평활화를 이용한 조명변화에 강인한 영상 매칭 (Illumination invariant image matching using histogram equalization)

  • 오창범;강민성;손광훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.161-164
    • /
    • 2011
  • 영상 매칭은 컴퓨터 비전에서 기초적인 기술로써 영상 추적, 물체인식 등 다양한 분양에서 많이 사용되고 있다. 하지만 스케일, 시점변화, 조명 변화에 강인한 매칭점을 찾는 것은 어려운 일이다. 이러한 문제점을 보완하기 위해 SURF(Scale Invariant Feature Transform), SIFT(Speed up Robust Features) 등의 알고리즘이 제안 되었지만, 여전히 조명변화에 불안정하고 정확하지 못한 성능을 보인다. 본 논문에서는 이러한 조명변화에 대한 문제점을 해결하기 위해 히스토그램 평활화를 이용하여 영상을 보정 후, SURF를 통한 영상 매칭을 하였다. 열악한 조명환경 내에서 촬영된 영상에서 SURF를 이용하여 표현자(Descriptor)를 생성 할 때 특징점이 잘 추출되지 않는 문제점을 해결하기 위하여 히스토그램 평활화를 이용하였고, 보정 후 특징점 개수가 많이 증가하는 것을 보여 확인하였다. 기존의 SURF와 개량된 SURF를 조명이 서로 다른 영상간의 매칭 성능을 비교함으로써 제안한 알고리즘의 우수성을 확인하였다

  • PDF

파일시스템의 슬랙공간에 데이터 숨기기 방법의 강인성 조사를 위한 디스크조각모음 실험방법 (Experimental Method of Disk Defragmentation for Robustness Test of Data Hiding Method in Slack Space of File System)

  • 조규상
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.65-66
    • /
    • 2020
  • 이 논문에서는 NTFS 파일시스템에서 여러 개의 클러스터에 걸쳐서 슬랙 영역에 데이터 숨기기를 수행하는 데이터 숨기기 방법의 강인성을 조사하기 위하여 디스크 조각모음 실험을 수행할 때 필요한 방법을 제안한다. 디스크 조각모음의 실행으로 클러스터의 위치가 변동되기 위해서는 여러 클러스터에 걸친 디스크 조각의 단편화가 일어날 수 있도록 파일을 생성하고 삭제하는 작업을 수행한다. 그 후에 용량이 큰 파일을 복사하여 여러 클러스터에 걸친 단편화된 파일을 작위적으로 생성한다. 단편화된 파일만을 남기고 그 이외의 다른 파일들을 삭제한 후에 디스크조각 모음을 수행한다. 이 실험에 필요한 준비과정과 실험과정을 제안한다.

  • PDF

변형 Otsu 이진화와 Hu 모멘트에 기반한 얼굴 인식에 관한 연구 (A Study on Face Recognition Based on Modified Otsu's Binarization and Hu Moment)

  • 이형지;정재호
    • 한국통신학회논문지
    • /
    • 제28권11C호
    • /
    • pp.1140-1151
    • /
    • 2003
  • 본 논문에서는 변형 Otsu 이진화 방법과 Hu 모멘트를 기반으로 밝기, 명암도, 크기, 회전, 위치 변화에 강인한 얼굴 인식 방법을 제안한다. 제안하는 변형 Otsu 이진화 방법은 기존의 Otsu 이진화 방법으로부터 또 다른 문턱치 값을 결정하고 이로부터 얻어진 이진 얼굴 영상 2개를 사용함으로써 이진 영상 하나보다 고차원의 특징벡터를 추출할 수 있고, 기존의 Otsu 이진화 방법과 마찬가지로 밝기 및 명암도 변화에 강인한 속성을 가지고 있다. 특징 값으로는 Hu 모멘트를 사용함으로써 크기, 회전, 위치 변화에 강인한 특성을 추가로 가지고 있다 기존의 주요 성분 분석(Principal Component Analysis, PCA) 방법과 제안한 방법을 비교 실험한 결과, 위에서 언급한 5가지 다양한 환경 변화에 대하여 PCA 방법의 평균 인식률은 olivetti Research Laboratory (ORL) 데이터베이스와 AR 데이터베이스에 대해서 각각 68.4%와 51.2%이고, 제안한 방법의 평균 인식률은 각각 93.2%와 81.4%로서 제안한 방법의 인식 성능이 우수함을 확인하였다.

측면 포즈정규화를 통한 부분 영역을 이용한 포즈 변화에 강인한 얼굴 인식 (Face Recognition under Varying Pose using Local Area obtained by Side-view Pose Normalization)

  • 안병두;고한석
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.59-68
    • /
    • 2005
  • 본 논문에서는 측면 포즈 정규화를 통해 얻어진 부분영역을 이용해 대상의 포즈 변화에 강인한 얼굴인식 방법을 제안한다. 포즈변화에 강인한 얼굴인식을 위해 일반적으로 사용되는 방법인 포즈 정규화 방법은 포즈정규화과정 중에 가려져 보이지 않는 영역에 대한 정보를 가지고 있지 않기 때문에 문제가 발생하게 된다 일반적으로는 보상을 통해 문제를 해결 하고 있지만, 보상에 의해 영상이 왜곡이 되거나 특징정보를 잃는 경우가 많다. 이런 문제를 해결하기 위해 깊이찬가 큰 영역에서 주로 발생하는 왜곡을 줄이도록 정면이 아닌 측면으로의 정규화를 시도한다 또한 정규화후 왜곡이 발생한 영역은 제거하고 왜곡이 발생하지 않은 영역만을 이용해 인식과정을 수행한다 포즈가 좌우변화만 존재하는 경우와 상하변화도 존재하는 경우 두 가지 경우로 나누어 다루었으며 각각의 경우에 대해 실험을 통해 인식 성능의 향상을 확인하였다

퍼지양자화 은닉 마르코프 모델에서 코드워드 종속거리 정규화와 Instar 형태의 퍼지 기여도에 기반한 출력확률의 평활화 (Codeword-Dependent Distance Normalization and Smoothing of Output Probalities Based on the Instar-formed Fuzzy Contribution in the FVQ-DHMM)

  • 최환진;김연준;오영환
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.71-79
    • /
    • 1997
  • 본 논문에서는 FVQ-DHMM(fuzzy vector quantization-discrete hidden Markov model)에서 강인한 출력확률의 추정을 위해서 코드워드 종속 거리 정규화와 출력확률에 대한 instar 형태의 퍼지 평활화 방법을 제안한다. FVQ-DHMM은 DHMM의 변형된 모델로, 상태별 출력확률이 입력패턴에 대한 각 코드워드와의 가중치와 출력확률의 곱에 대한 합의 형태로 추정된다. FVQ-DHMM의 성능이 가중치 요소와 상태별 출력분포에 영향을 받으므로, 가중치 요소와 상태별 출력분포를 강인하게 추정하는 방법이 필요하게 된다. 실험결과, 제안된 코드워드 종속 거리 정규화(CDDN : codeword dependent distance normalization)를 적용한 방법이 기존의 FVQ-DHMM에 비해 24%의 오인식률 감소가 있었으며, 상태별 출력분포에 대해서 평활화를 적용한 경우 79%의 오식율을 감소 시킴을 알 수 있었다. 이러한 결과는 제안된 CDDN과 퍼지 평활화의 사용이 향상된 인식율을 얻는데 주요하며, 결과적으로 제안된 방법이 FVQ-HMM을 위한 강인한 출력확률의 추정을 위한 대안으로 유용함을 보여준다고 할 수 있다.

  • PDF

회전 변환에 강인한 주파수 영역 로고 삽입 워터마크 방법 (A Rotation Resistant Logo Embedding Watermark on Frequency Domain)

  • 이인정;이형;민준영
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2006년도 춘계학술대회
    • /
    • pp.730-736
    • /
    • 2006
  • 본 논문에서는 멀티미디어 저작권 보호를 위한 회전(Rotation) 변환 공격에 견디는 강인한 로고 삽입 방법을 제안한다. 기하학적인 처리는 영상의 화질을 많이 훼손하지 않으면서 워터마크 탈지 과정을 매우 복잡하고 어렵게 한다. 정규화 된 영상 (Normalized Image)에 워터마크를 삽입하는 방법은 영상의 정규화 과정에서 보간에 의해 평탄화 (Smoothing effect) 현상이 발생하는 단점이 있다. 이것은 워터마크를 정규화 된 영상에 직접 삽입하는 대신, 영상 정규화를 변환 파라미터를 계산하는데 사용함으로써 해결할 수 있다. 회전 변환에 대응하기 위한 기존의 방법은 주로 전체 영상에 대해 DFT 변환을 수행한다. 그러나 이 방법은 전체 영상에 변환을 취함으로써 효과적인 마스킹 방법의 적용이 어려운 단점이 있다. 따라서 본 논문에서는 DCT를 채용하고 계수의 공간-주파수 특성을 이용한 마스킹 방법을 사용한다. 실험결과. 제안된 방법이 회진변환 공격에 강인한 특성을 보였다.

  • PDF