• 제목/요약/키워드: 행렬인수분해

검색결과 34건 처리시간 0.021초

NMF 와 코사인유사도를 이용한 질의 기반 문서요약 (Query-Based Text Summarization Using Cosine Similarity and NMF)

  • 박선;이주홍;안찬민;박태수;송재원;김덕환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.473-476
    • /
    • 2006
  • 인터넷의 발달로 인하여 정보의 양은 시간이 지날수록 폭발적으로 증가하고 있다. 이러한 방대한 정보로부터 정보검색시스템은 사용자에게 너무 많은 검색결과를 제시하여 사용자가 원하는 정보를 찾기 위해 너무 많은 시간을 소요하게 하는 정보의 과적재 문제가 있다. 질의 기반의 문서요약은 정보의 사용자가 원하는 정보의 검색시간을 줄임으로써 정보의 과적재 문제를 해결하는 방법으로서 점차 중요성이 증가하고 있다. 본 논문은 비음수 행렬 인수분해 (NMF, Non-negative Matrix Factorization)과 코사인 유사도를 이용하여 질의 기반의 문서를 요약하는 새로운 방법을 제안하였다. 제안된 방법은 질의와 문서 간에 사전학습이 필요 없다. 또한 문서를 그래프로 변형시키는 복잡한 처리 없이 NMF 에 의해 얻어진 의미 특징(semantic feature)과 의미 변수(semantic variable)로 문서의 고유 구조를 반영하여 요약의 정확도를 높일 수 있다. 마지막으로 단순한 방법으로 문장을 쉽게 요약할 수 있다.

  • PDF

스테레오 음악 신호에서의 보컬 음원 분리를 위한 통합 알고리즘 (A Unified Method for Vocal Source Separation From Stereophonic Music Signals)

  • 김민제;장인선;강경옥
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.89-99
    • /
    • 2010
  • 본 논문에서는 스테레오 형식의 음악 신호에서 가창 신호와 같은 음원을 분리하기 위한 통합 알고리즘을 제시한다. 스테레오 형식의 음악 신호에서 특정한 악기 음원을 분리하는 문제는, 획득한 음악 신호가 다양한 악기들이 동시에 연주되는 혼합신호라는 점을 고려하고, 각각의 악기를 음원이라고 가정할 때, 획득한 혼합 신호의 개수가 음원의 개수보다 적은 비결정(underdetermined) 환경에서의 음원 분리 문제가 된다. 비결정 환경에서는 신호가 혼합되는 공간에 대한 가정을 기반하는 전통적 음원 분리 방식을 적용하기 힘들며, 목표 음원의 특정한 특성을 활용하여 추출하게 된다. 본 논문에서 제안하는 통합 알고리즘은 이종의 특성을 활용하는 음악 음원 분리 알고리즘들을 유기적으로 통합하는 구조이며, 구체적으로는 가창 신호와 같은 특정한 음원 추출을 위해 주로 사용되어 왔던 스테레오 채널 정보를 활용하는 방식과, 모노 혼합 신호에서 두드러지는 음원의 음정을 이용하여 음원을 추출하는 두 가지 방식을 통합하는 것을 목표로 한다. 본 논문에서 제안하는 구조는 각각의 음악 음원 분리 알고리즘이 가지고 있는 고유의 약점을 해소함으로써, 목표 음원의 복원 신호가 통합 과정에 의해 향상될 수 있다는 강점이 있으며, 그것을 실제 상업 음악 콘텐츠를 대상으로 한 실험을 통해 검증한다.

인수분해 된 분모를 갖는 두 변수 유리함수 근사에 기반한 3차원 음향 포물선 방정식 제곱근 연산자의 분할기법 제안 (Suggestion for a splitting technique of the square-root operator of three dimensional acoustic parabolic equation based on two variable rational approximant with a factored denominator)

  • 이근화
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.1-11
    • /
    • 2017
  • 본 연구에서는 두 변수 유리함수 근사법에 기반한 3차원 음향 포물선 방정식의 제곱근 연산자의 새로운 근사식을 제안한다. 이 근사식은 기존의 제곱근 연산자에 대한 근사 연구와 비교해서 두 가지의 장점을 가진다. 첫 번째는 광대역 각도 능력이다. 제안된 식은 방위각 $45^{\circ}$에서 3차원 음향 포물선 방정식의 거리 축으로부터 $62^{\circ}$까지 넓은 각도에 대해 정확도를 가지는데, 이 값은 기존에 연구된 3차원 음향 포물선 방정식 알고리즘의 각도 한계의 약 세 배이다. 두 번째로는 본 근사식의 분모는 수심과 횡 거리에 대한 연산자의 곱으로 표현된다는 점이다. 이러한 분할 형태는 3차원 포물선 방정식을 손쉽게 삼중대각행렬 방정식으로 변환할 수 있다는 점에서 수치해석에서 선호된다. 제안된 식의 성능을 검증하기 위해 위상 오차분석을 통해 타 근사법과의 비교 연구가 수행되었고, 제안된 방법은 가장 우수한 성능을 보였다.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.