• 제목/요약/키워드: 비음수 행렬 분해

검색결과 80건 처리시간 0.027초

군집과 위키피디아를 이용한 문서군집 (Document Clustering using Clustering and Wikipedi)

  • 박선;이성호;박희만;김원주;김동진;산드라 아벨;이성로
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.392-393
    • /
    • 2012
  • 본 논문은 군집과 위키피디아(Wikipedia)를 이용하여 문서를 군집하는 새로운 방법을 제안한다. 제안된 방법은 비음수행렬분해를 이용하여 군집을 대표할 수 있는 군집 주제(topic)의 개념을 잘 표현할 수 있으며, 위키피디아의 동음이의어를 사용함으로써 문서와 군집 간의 의미관계를 고려하지 않는 용어집합(bag-of-words) 문제를 해결할 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

  • PDF

Matrix Factorization을 이용한 음성 특징 파라미터 추출 및 인식 (Feature Parameter Extraction and Speech Recognition Using Matrix Factorization)

  • 이광석;허강인
    • 한국정보통신학회논문지
    • /
    • 제10권7호
    • /
    • pp.1307-1311
    • /
    • 2006
  • 본 연구에서는 행렬 분해 (Matrix Factorization)를 이용하여 음성 스펙트럼의 부분적 특정을 나타낼 수 있는 새로운 음성 파라마터를 제안한다. 제안된 파라미터는 행렬내의 모든 원소가 음수가 아니라는 조건에서 행렬분해 과정을 거치게 되고 고차원의 데이터가 효과적으로 축소되어 나타남을 알 수 있다. 차원 축소된 데이터는 입력 데이터의 부분적인 특성을 표현한다. 음성 특징 추출 과정에서 일반적으로 사용되는 멜 필터뱅크 (Mel-Filter Bank)의 출력 을 Non-Negative 행렬 분해(NMF:Non-Negative Matrix Factorization) 알고리즘의 입 력으로 사용하고, 알고리즘을 통해 차원 축소된 데이터를 음성인식기의 입력으로 사용하여 멜 주파수 캡스트럼 계수 (MFCC: Mel Frequency Cepstral Coefficient)의 인식결과와 비교해 보았다. 인식결과를 통하여 일반적으로 음성인식기의 성능평가를 위해 사용되는 MFCC에 비하여 제안된 특정 파라미터가 인식 성능이 뛰어남을 알 수 있었다.

의미 특징 행렬과 의미 가변행렬을 이용한 질의 기반의 문서 요약 (Query-Based Summarization using Semantic Feature Matrix and Semantic Variable Matrix)

  • 박선
    • 한국항행학회논문지
    • /
    • 제12권4호
    • /
    • pp.372-377
    • /
    • 2008
  • 본 논문은 의미특징행렬(semantic feature matrix)과 의미변수행령(semantic variable matrix)을 이용하는 질의 기반의 새로운 문서를 요약방법을 제안한다. 제안된 방법은 비지도 학습 방법으로 질의와 문장 간에 사전학습이 필요 없고, 의미 특징(semantic feature)과 의미변수(semantic variable)를 이용하여 질의에 적합한 하위 주제를 잘 반영하여서 정확한 문서를 요약 할 수 있다. 이것은 비음수 행렬 분해가 주제들로 구성된 문서의 내부구조를 나타내는 의미특징을 자연스럽게 추출할 수 있기 때문이다. 실험결과 제안방법이 다른 방법에 비하여 좋은 성능을 보인다.

  • PDF

군집 주제의 유의어와 유사도를 이용한 문서군집 향상 방법 (Enhancing Document Clustering Method using Synonym of Cluster Topic and Similarity)

  • 박선;김경준;이진석;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.30-38
    • /
    • 2011
  • 본 논문은 군집 주제의 유의어와 유사도를 이용하여 문서군집의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 비음수 행렬분해의 의미특징을 이용하여 군집 주제(topic)의 용어들을 선택함으로서 문서 군집 집합의 내부구조를 잘 표현할 수 있으며, 군집 주제의 용어들에 워드넷의 유의어를 사용하여서 확장함으로써 문서를 용어집합(BOW, bag-of-words)으로 표현하는 문제를 해결할 수 있다. 또한 확장된 군집 주제의 용어와 문서집합에 코사인 유사도를 이용하여서 군집의 주제에 적합한 문서를 잘 군집하여서 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

NMF와 이미지 보정을 이용한 적조 이미지 인식 향상 (Enhancing Red Tide Image Recognition using NMF and Image Revision)

  • 박선;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.331-336
    • /
    • 2012
  • 적조는 유해 조류의 이상 대량번식으로 바닷물의 색이 적색이나 황색으로 변하며, 어패류를 대량으로 집단 폐사시키는 등 바다환경에 좋지 않은 영향을 미치는 전 세계적인 자연현상이다. 국내에서는 90년대 이후로 어패류 양식장에 지속적인 피해를 입히고 있다. 적조 생물에 대한연구는 수산업 피해가 증가함에 따라서 많은 연구가 이루어지고 있다. 그러나 자동으로 적조 이미지를 인식하여서 유해적조를 판별하는 적조이미지 검색에 대한 국내의 연구는 미흡한 실정에 있다. 특히 전 세계적으로 200여종의 적조 생물은 각기 다른 크기와 모양을 가지고 있기 때문에 이미지 인식을 위한 기준 특징을 추출하기 어렵다. 이 때문에 기존이 연구들은 몇 종류의 적조 생물만을 이미지 인식에 이용하고 있다. 본 논문은 이러한 문제를 해결 할 수 있도록 NMF(non-negative matrix factorization, 비음수 행렬분해)와 이미지의 회전각 보정을 이용한 새로운 적조 이미지 인식 향상방법을 제안한다.

문장군집의 응집도와 의미특징을 이용한 포괄적 문서요약 (Generic Document Summarization using Coherence of Sentence Cluster and Semantic Feature)

  • 박선;이연우;심천식;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.2607-2613
    • /
    • 2012
  • 지식 기반의 포괄적 문서요약은 문장집합의 구성이 요약 결과에 영향을 받는다. 이러한 문제를 해결하기 위해서 본 논문은 의미특징에 의한 군집과 문장군집의 응집도를 이용하여 포괄적 문서요약을 하는 새로운 방법을 제안한다. 제안 방법은 비음수행렬분해에서 유도되는 의미특징을 이용하여 문장을 군집하고, 문서의 내부구조를 잘 표현하는 문장군집들로 문서의 주제 그룹을 분류할 수 있다. 또한 문장군집의 응집도와 재군집에 의한 군집의 정재를 이용하여 중요한 문장을 추출함으로써 요약의 질을 향상시킬 수 있다. 실험결과 제안방법은 다른 포괄적 문서요약 방법에 비하여 좋은 성능을 보인다.

보행 과정에서 발생하는 복합 근육 활성의 양성 및 음성 공변 메커니즘 (Positive and Negative Covariation Mechanism of Multiple Muscle Activities During Human Walking)

  • 김유신;홍영기
    • 한국콘텐츠학회논문지
    • /
    • 제18권1호
    • /
    • pp.173-184
    • /
    • 2018
  • 보행 과정에서 여러 근육이 동시에 수축하는 운동 모듈 또는 근육 시너지는 매우 중요한 중추신경계 운동조절 메커니즘이다. 본 연구는 걷는 동안 근육 간 양성 및 음성 공변 패턴을 이해하는 것을 목표로 한다. 본 연구에서는 트레드밀 보행 시 발생하는 다리 근육 활성을 근전도 검사를 통해 측정하였다. 동시 수축근육 그룹, 즉 운동 모듈을 확인하기 위해 우리는 양쪽 4 개의 다리 근육(전경골근, 내측 비복근, 대퇴직근, 내측 슬괵근)에서 근전도 데이터를 수집하였고, 이를 바탕으로 비음수행렬분해 및 주성분 분석을 수행하였다. 이후 근육 또는 운동 모듈 간의 다양한 조합으로부터 공변이 값을 계산하였고, 이원배치분산분석을 이용하여 각 조합들에서 발생하는 공변이 패턴을 비교하였다. 그 결과, 다양한 조합 사이에 유의미한 공변이 값의 차이가 발견되었다(p < 0.05). 같은 운동 모듈로 정의된 특정 근육 사이에서 발생하는 근 활성은 양성공변이를 보여주었으나 운동 모듈 사이에서는 음성 공변이를 보여주었다. 모든 근육 조합들 사이에서는 음성 공변이가 발생하였다. 운동 모듈 사이에서 안정적으로 발생하는 음성 공변이는 운동 모듈이 복잡한 운동 조정의 제어 단위(control unit) 일 수 있음을 암시하고 있다.

군집의 중요 용어와 위키피디아를 이용한 문서군집 향상 (Enhancing Document Clustering using Important Term of Cluster and Wikipedia)

  • 박선;이연우;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.45-52
    • /
    • 2012
  • 본 논문은 군집 중요 용어들과 위키피디아(Wikipedia)의 동음이의어를 이용하여 문서군집의 성능을 향상시키는 새로운 방법을 제안한다. 제안된 방법은 비음수행렬분해의 의미특징을 이용하여 군집 중요 용어들을 선택함으로서 군집을 대표할 수 있는 군집 주제(topic)의 개념을 잘 표현할 수 있으며, 군집의 중요 용어에 위키피디아의 동음이의어를 사용하여 확장함으로써 문서와 군집 간의 의미관계를 고려하지 않는 용어집합(bag-of-words) 문제를 해결할 수 있다. 또한 확장된 군집의 중요 용어를 이용하여 문서집합을 재 군집하여 초기 군집을 정제함으로써 군집방법의 성능을 높일 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

강인 음성 인식을 위한 가중화된 음원 분산 및 잡음 의존성을 활용한 보조함수 독립 벡터 분석 기반 음성 추출 (Speech extraction based on AuxIVA with weighted source variance and noise dependence for robust speech recognition)

  • 신의협;박형민
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.326-334
    • /
    • 2022
  • 이 논문에서는 배경 잡음이 포함되는 환경에서 강인한 음성 인식을 하기 위한 전처리 단계로서 쓰이는 목표 음성 향상 방법을 제안한다. 보조 함수 기반의 독립 벡터 분석(Auxiliary-function-based Independent Vector Analysis, AuxIVA) 기법을 기반으로 가중 공분산 행렬에서 시간에 따라 변하는 분산에 의해서 가중치가 결정된다. 목표 음성에 대한 시간-주파수별 기여도를 나타내는 마스크를 통해 분산의 크기를 조절한다. 이러한 마스크는 음성 향상을 위해서 학습된 신경망 혹은 목표 화자로부터의 직선 성분의 기여도를 찾기 위한 확산성으로부터 추정할 수 있다. 이에 더하여 둘러싼 잡음에 대한 출력들은 서로 다차원 독립 성분 분석을 도입하여 의존성을 주어 안정적으로 노이즈 성분을 추출할 수 있다. 이 AuxIVA 기반의 목표 음성 추출 알고리즘은 또한 노이즈에 대해서 비음수 행렬 분해(Non-negative Matrix Factorization, NMF)를 비음수 텐서 분해(Non-negative Tensor Factorization, NTF)로 확장하여 독립 단순 행렬 분석(Independent Low-Rank Matrix Analysis, ILRMA)의 틀에서도 수행될 수 있다. 이러한 확장을 통해서 여전히 잡음 출력 채널에서의 채널간 의존성을 유지할 수 있다. CHiME-4데이터셋에 대한 실험 결과는 소개된 알고리즘에 대한 효과를 보여준다.

잡음 데이터를 활용한 음성 기저 행렬과 NMF 기반 음성 향상 기법 (Speech Basis Matrix Using Noise Data and NMF-Based Speech Enhancement Scheme)

  • 권기수;김형용;김남수
    • 한국통신학회논문지
    • /
    • 제40권4호
    • /
    • pp.619-627
    • /
    • 2015
  • 본 논문은 비음수 행렬 인수분해(NMF)를 이용한 음성향상 기법을 다루고 있다. 음성과 잡음에서 적절한 훈련을 통해 각각의 기저(basis) 행렬을 구하고 이 행렬들을 이용하여 두 음원을 분리 하는 것이다. 그 중에서도 음성향상의 성능은 사용하게 되는 기저 행렬에 따라 크게 달라짐을 보인다. 기존의 독립적으로 구한 음성 기저 행렬에 비해서, 잡음 데이터를 복원하는데 부적합한 방향으로 최적화시킨 음성 기저 행렬을 사용하였을 때 더 높은 음성향상 성능을 보임을 실험으로 확인하였다. 이 때 잡음 데이터의 복원 오차 자체를 크게 해주는 방향과 해당 인코딩 행렬(encoding matrix) 원소의 값을 작게 해주는 두 가지 방법을 적용하여 비교하였다. 좀 더 음성 복원에만 특화된 기저 행렬을 구함으로서 음성 기저 행렬이 잡음 데이터 복원에 사용되는 것을 최소화 하였다. 실험 결과에서는 perceptual evaluation speech quality값과 signal to distortion ratio를 지표로 사용하였고, 기존 기법에서 사용하는 기저 행렬 보다 더 높은 성능을 보임을 확인 하였다.