• 제목/요약/키워드: background information

검색결과 4,907건 처리시간 0.032초

시변 잡음에 강인한 음성 인식을 위한 PCA 기반의 Variational 모델 생성 기법 (PCA-based Variational Model Composition Method for Roust Speech Recognition with Time-Varying Background Noise)

  • 김우일
    • 한국정보통신학회논문지
    • /
    • 제17권12호
    • /
    • pp.2793-2799
    • /
    • 2013
  • 본 논문에서는 시간에 따라 변하는 잡음 환경에 강인한 음성 인식을 위해 효과적인 특징 보상 기법을 제안한다. 제안하는 기법에서는 기존의 Variational 모델 생성 기법의 모델 정확도를 향상시키고자 PCA를 도입한다. 제안된 기법은 다중 모델을 사용하는 PCGMM 기반의 특징 보상에 적용된다. 실험 결과는 제안한 PCA 기반의 Variational 모델 생성 기법이 배경 음악 환경의 다양한 SNR 조건에서 기존의 전처리 기법에 비하여 음성 인식 성능을 향상 시키는데 우수함을 입증한다. 제안한 모델 생성 기법이 기존의 Variational 모델 생성 방법에 비해 배경 음악 환경에서 평균 12.14%의 상대적 인식 성능 향상률을 나타낸다.

SG 정보를 이용한 강인한 물체 추출 알고리즘 (Robust Object Detection Algorithm Using Spatial Gradient Information)

  • 주영훈;김세진
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.422-428
    • /
    • 2008
  • 본 논문에서는 spatial gradient를 이용한 강인한 물체 추출 방법을 제안한다. 제안한 방법은 먼저 복잡한 환경과 다양한 빛의 변화에 의해 나타나는 에러 값 등을 해결하기 위해 기존에 제안된 입력 영상과 기준 영상에서 밝기와 색 성분을 이용하여 최초 배경을 제거한다. 배경을 제거한 다음, 그림자로 인식되어 전경 영역에 추가된 부분을 RGB 칼라 모델과 정규화 된 RGB 칼라 모델을 이용하여 제거하고, HSI 칼라 모델을 이용하여 불필요한 정보 값을 갖는 영역을 제거한다. 마지막으로, 배경으로 인식되어 전경으로부터 제거된 부분을 입력 영상의 공간상 정보인 spatial gradient와 HSI 칼라 모델을 이용하여 복구하는 방법을 제안한다. 마지막으로, 본 논문에서 제안한 알고리즘은 복잡하고 다양한 실내 외 환경에서의 실험을 통해 그 응용 가능성을 증명한다.

수리 형태론을 이용한 texture 영상의 방향성 결함검출 (A directional defect detection in texture image using mathematical morphology)

  • 김한균;윤정민;오주환;최태영
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.141-147
    • /
    • 1996
  • In this paper an improved morphological algorithm for directional defect detection is proposed, where the defect is parallel to the texture image. The algorithm is based on obtaining the background image while removing the defect by comparing every directional morphological result with max or min except that of defect. The defect can of defect and the background image. For a computer simulation, it is shown that the proposed method has better performance than the conventional algorithm.

  • PDF

형태연산자를 이용한 심전도신호에 있어서의 임펄시브 노이즈와 기저선의 흔들림의 제거 (Rejection of Impulsive Noise and Baseline Wandering Using Morphological Operators)

  • 김창재;남승우;신건수;이명호
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1990년도 추계학술대회
    • /
    • pp.110-113
    • /
    • 1990
  • A new approach to impulsive noise rejection and background normalization of digitized electrocardiogram signals is presented using mathematical morphological operators that incoporate the shape information of a signal. A brief introduction to these nonlinear signal processing operators, as well as detailed description of the new algorithm, is presented. Empirical results show that the new algorithm has good performance in impulsive noise rejection and background normalization.

  • PDF

입술의 기울기특징과 눈과의 위상관계를 이용한 얼굴확인기법 (Face Identification Using Topological Relationship between Lips′ Axes and Eyes)

  • 김민석;한헌수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2028-2031
    • /
    • 2003
  • This paper proposes a face identification algorithm, robust on lighting condition and complex background. The proposed method estimates facial area under bad light condition by expanding face color boundaries and then finds a lip using the templates for lips. Then the eyes are found using their topological relationship with the long and short axes of lip area. The experimental results have shown that the proposed algorithm is robust on lighting conditions and complex background.

  • PDF

다수 시점의 TIP 영상기반렌더링 (Seamless Image Blending based on Multiple TIP models)

  • 노창현
    • 한국게임학회 논문지
    • /
    • 제3권2호
    • /
    • pp.30-34
    • /
    • 2003
  • Image-based rendering is an approach to generate realistic images in real-time without modeling explicit 3D geometry, Especially, TIP(Tour Into the Picture) is preferred for its simplicity in constructing 3D background scene. However, TP has a limitation that a viewpoint cannot go far from the origin of the TIP for the lack of geometrical information. in this paper, we propose a method to interpolating the TIP images to generate smooth and realistic navigation. We construct multiple TIP models in a wide area of the virtual environment. Then we interpolate foreground objects and background object respectively to generate smooth navigation results.

  • PDF

수정된 캐니 에지 맵으로부터 만들어진 LOD 에지 맵을 이용한 물체 추적 및 소거 (Object Tracking And Elimination Using Lod Edge Maps Generated from Modified Canny Edge Maps)

  • 박지헌;장영대;이동훈;이종관;함미옥
    • 정보처리학회논문지B
    • /
    • 제14B권3호
    • /
    • pp.171-182
    • /
    • 2007
  • 본 논문은 하나의 움직이는 카메라와 수시로 바뀌는 배경을 가진 환경 하에서 파라미터를 사용하지 않는 외곽선을 사용한 움직이는 물체의 외곽을 추적하고, 추적된 물체의 외곽을 다른 장면에서 가져온 배경으로 대체하여 추적물체를 제거하는 기법을 제안한다. 먼저 캐니 에지 이미지(map)를 수정하여 만들어 내고, 이들 에지들의 강도에 대한 정보를 LOD (Level-of-Detail)로 만든 결과 LOD 캐니 에지 이미지(map)을 생성한다. 이들 LOD 캐니 에지 이미지 화소에 대해 그래프를 사용한 경로 설정 방법을 사용한다. 이 작업으로 결정되는 외곽선을 이용하여 추적대상이 되는 물체를 다른 이미지에서부터 얻은 배경이미지로 대체함으로써 제거한다. 우리의 물체 추적을 위한 방법은 LOD 수정된 캐니에지 이미지를 위주로 이루어진다. 추가 에지 정보를 얻기 위해 LOD 계층에 따라서 자세한 외곽선 정보를 얻는다. 우리의 경로 설정 방법은 보다 강한 이미지 차에서 만들어진 에지 화소를 선호하는 것이다. 이 방법은 이전 외곽선 정보를 최소한으로 참고하기 때문에, 이전 외곽선 정보를 새로운 외곽선을 생성하는데 있어서 가중치를 사용 이전 외곽선을 포함시키는 방법에 비해 탁월하다. 외곽선 추적 후 추적 물체를 배경으로 대체하는데, 첫 이미지 배경은 이후에 나타나는 이미지로부터 추적 물체에 대해 가려진 배경정보를 가져오는 카메라 운동법이라 부르는 방법에 의하여 계산되어진다. 첫 프레임을 위한 배경 계산이 완료되면, 다음 이미지의 배경 계산은 첫 프레임의 배경에 의존한다. 본 논문에서 제시된 방법을 사용할 경우, 추적 물체의 형상 변화가 극심하지 않고, 카메라의 움직임이 매우 빠르지 않을 경우 성공적으로 추적할 수 있었다.

차영상 및 윤곽선에 의한 배경에서 화자분리 (Image Separation of Talker from a Background by Differential Image and Contours Information)

  • 박종일;박용범;유현중
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.671-678
    • /
    • 2005
  • 본 논문에서는 동영상에서 주요 객체를 추출하여 기존의 배경을 임의의 배경으로 교체하는 알고리즘을 제안한다. 제안된 기법은 이동 통신 화상전화기 및 영상전달 시스템등을 사용한 화상 전송함시 개인의 프라이버시를 보호하고, 배경을 제거함으로써 실제 전송할 데이터의 양을 줄일 수도 있을 뿐만 아니라, 현재배경을 임의의 배경으로 바꾸는 등의 여러 용도로 사용가능하다. 영상처리는 대용량의 데이터를 처리하기 때문에 많은 메모리와 시간 등의 자원을 사용하게 된다. 이는 특히 자원이 제한된 이동통신기기에서 문제가 된다. 실험에서 일반적으로 주요 객체의 움직임의 범위가 크지 않다는 점에 근거하여 검색의 범위를 이전 윤곽선정보의 주변으로 제한함으로써 영상처리에서 걸리는 시간과 자원을 줄일 수 있었다. 구체적으로는 동영상의 초기영상에서 윤곽선 정보를 이용하여 후보 객체영역을 추출하였고, 추출한 영역을 기준으로 다음 영상과 현재 영상과의 차영상을 구하여 움직이는 객체를 추적하는데 이용하였으며, 선택된 영역에서 윤곽선을 구하여 객체영역을 찾는데 이용하였다 이를 통하여 주요 객체와 배경을 효율적으로 분리할 수 있었으며, 사용자가 선택한 임의의 배경으로 대체할 수 있었다.

Fuzzy C-means와 CONDENSATION을 이용한 객체 검출 및 추적 시스템 (An Object Detection and Tracking System using Fuzzy C-means and CONDENSATION)

  • 김종호;김상균;황구선;안상호;강병두
    • 한국산업정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.87-98
    • /
    • 2011
  • 동영상에서의 움직이는 객체 검출과 추적은 객체 식별, 상황인식, 지능형 영상 감시 시스템 등 많은 시각 기반 응용 시스템에서 기본적이고 필수적인 전처리 작업이다. 본 논문에서는 배경과 조명이 실시간으로 변화하는 상황에서 움직이는 객체를 빠르고 정확하게 추출하고 움직이는 객체가 다른 물체에 가려지는 경우에도 강인하게 객체를 추적하는 방법을 제안한다. 객체의 효과적인 검출을 위해서 효과적인 고유 공간과 Fuzzy C-means(FCM) 를 결합하여 사용하고 검출된 객체를 강인하게 추적하기 위해 Conditional Density Propagation (CONDENSATION) 알고리즘을 사용한다. 먼저 Principal Component Analysis(PCA)를 이용하여 배경 영상에서 수집한 학습데이터를 주성분(Principal component)으로 선형변환 한다. 주성분들의 고유 특성에 대한 해석을 통하여 객체와 배경에 대하여 판별 능력이 우수한 주성분을 선별하여 고유 배경을 구성한다. 다음으로 이전단계에서 구성된 고유 벡터와 입력 영상을 결합한 연산 결과를 FCM의 입력 값으로 사용해서 객체를 검출한다. 최종적으로 검출된 객체의 좌표를 CONDENSATION의 입력으로 사용해서 객체를 추적한다. 고정된 카메라에서 조명변화와 배경변화에 적용 가능한 시스템을 구현하기 위해 고정된 카메라에서 움직이는 다양한 객체가 포함된 영상을 수집하여 학습데이터로 구성하여 사용하였다. 실험 결과에 따르면 제안하는 방법이 조명변화와 배경변화 그리고 객체의 부분적 움직임에 모두 강인하게 객체를 검출하고 다른 물체나 배경에 의해 객체가 일부 가려지더라도 객체를 추적함을 보여준다.

스토리 기반의 정보 검색 연구 (Story-based Information Retrieval)

  • 유은순;박승보
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.81-96
    • /
    • 2013
  • 웹의 발전과 콘텐츠 산업의 팽창으로 비디오 데이터가 폭발적으로 증가함에 따라 데이터의 정보 검색은 매우 중요한 문제가 되었다. 그동안 비디오 데이터의 정보 검색과 브라우징을 위해 비디오의 프레임(frame)이나 숏(shot)으로부터 색채(color)와 질감(texture), 모양(shape)과 같은 시각적 특징(features)들을 추출하여 비디오의 내용을 표현하고 유사도를 측정하는 내용 기반(content-based)방식의 비디오 분석이 주를 이루었다. 영화는 하위 레벨의 시청각적 정보와 상위 레벨의 스토리 정보를 포함하고 있다. 저차원의 시각적 특징을 통해 내용을 표현하는 내용 기반 분석을 영화에 적용할 경우 내용 기반 분석과 인간이 인지하는 영화의 내용 사이에는 의미적 격차(semantic gap)가 발생한다. 왜냐하면 영화의 스토리는 시간의 진행에 따라 그 내용이 변하고, 관점에 따라 주관적 해석이 가능한 고차원의 의미정보이기 때문이다. 따라서 스토리 차원의 정보 검색을 위해서는 스토리를 모델링하는 정형화된 모형이 필요하다. 최근 들어 소셜 네트워크 개념을 활용한 스토리 기반의 비디오 분석 방법들이 등장하고 있다. 그러나 영화 속 등장인물들의 소셜 네트워크를 통해 스토리를 표현하는 이 방법들은 몇 가지 문제점들을 드러내고 있다. 첫째, 등장인물들의 관계에만 초점이 맞추어져 있으며, 스토리 진행에 따른 등장인물들의 관계 변화를 역동적으로 표현하지 못한다. 둘째, 등장인물의 정체성과 심리상태를 보여주는 감정(emotion)과 같은 심층적 정보를 간과하고 있다. 셋째, 등장인물 이외에 스토리를 구성하는 사건과 배경에 대한 정보들을 반영하지 못하고 있다. 따라서 본 연구는 기존의 스토리 기반의 비디오 분석 방법들의 한계를 살펴보고, 문제 해결을 위해 문학 이론에서 제시하고 있는 서사 구조에 근거하여 스토리 모델링에 필요한 요소들을 인물, 배경, 사건의 세 가지 측면에서 제시하고자 한다.