• Title/Summary/Keyword: 문맥

Search Result 1,002, Processing Time 0.024 seconds

Statistical ratio based classification of multi-temporal/sensor remote sensing data (다중 시기/센서 원격탐사 자료의 통계비 기반 분류)

  • Park No-Wook;Chi Kwang-Hoon
    • Proceedings of the KSRS Conference
    • /
    • 2006.03a
    • /
    • pp.3-6
    • /
    • 2006
  • 이 연구에서는 다중 센서 융합과 시간적 문맥 정보의 결합을 통한 분류 정확도 향상을 목적으로 통계비 기반 결정수준 융합 기법을 제안하였다. 다중 센서 융합을 목적으로 개별 센서 자료로부터 얻어진 사후 확률의 결합에 기존 확률론적 자료 융합에서 널리 사용되어온 조건부 독립의 가정을 완화한 통계비 기반 결합 규칙을 적용하였다. 그리고 시간적 문맥 정보를 새로운 정보 근원으로 간주하고 이전 시기 자료의 분류결과로부터 추출 및 결합하였다. 이 제안기법은 통계비 기반의 틀 안에서 다중 센서의 분광정보 및 시간적 문맥 정보의 결합이 용이한 장점이 있다 제안기법의 적용성 평가를 위해 다중 시기/센서 융합의 사례연구를 수행하였다.

  • PDF

Contextualized Embedding-based Korean Movie Review Sentiment Analysis (문맥 표현 기반 한국어 영화평 감성 분석)

  • Park, Cheoneum;Kim, Geonyeong;Kim, Hyunsun;Lee, Changki
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.75-78
    • /
    • 2018
  • 감성 분석은 특정 대상에 대한 의견을 수집하고 분류하는 과정이다. 그러나 자연어에 담김 사람의 주관을 파악하는 일은 어려운 일로써, 기존의 감성 단어 사전이나 확률 모델은 이러한 문제를 해결하기 어려웠으나 딥 러닝의 발전으로 문제 해결을 시도할 수 있게 됐다. 본 논문에서는 사전 학습된 문맥 표현을 한국어 감성 분석에 활용하여 더 높은 성능을 낼 수 있음을 보인다.

  • PDF

Song-lyrics Generation system by Deep Learning (딥러닝 기법을 이용한 노래 가사 생성 시스템)

  • Son, Sung-Hwan;Lee, Hyun-Young;Nam, Gyu-Hyeon;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.570-573
    • /
    • 2018
  • 본 논문에서는 한국 가요 학습 데이터를 노래 가사 마디 단위로 문자열을 역전시키는 형태로 변형하고 LSTM으로 학습하여, 마디 간의 문맥을 고려해 문자열을 생성하는 방법에 대해 제안한다. 그리고 이를 통해 특정 가요 가사와 유사하면서도 다른 가사를 생성하는 것도 가능하다. 문자열의 우측 끝에 위치하면서 마디 간의 문맥을 연결해 주는 서술어, 접속사와 같은 요소를 활용하기 위해 데이터를 변형하여 적용한다. 제안하는 방식으로 생성한 문자열이 단순히 문자열 데이터를 그대로 학습하여 생성하는 것보다 상대적으로 더 자연스러운 문맥으로 생성되는 것을 확인하였다.

  • PDF

Deep learning model that considers the long-term dependency of natural language (자연 언어의 장기 의존성을 고려한 심층 학습 모델)

  • Park, Chan-Yong;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.281-284
    • /
    • 2018
  • 본 논문에서는 machine reading 분야에서 기존의 long short-term memory (LSTM) 모델이 가지는 문제점을 해결하는 새로운 네트워크를 제안하고자 한다. 기존의 LSTM 모델은 크게 두가지 제한점을 가지는데, 그 중 첫째는 forget gate로 인해 잊혀진 중요한 문맥 정보들이 복원될 수 있는 방법이 없다는 것이다. 자연어에서 과거의 문맥 정보에 따라 현재의 단어의 의미가 크게 좌지우지될 수 있으므로 올바른 문장의 이해를 위해 필요한 과거 문맥의 정보 유지는 필수적이다. 또 다른 문제는 자연어는 그 자체로 단어들 간의 복잡한 구조를 통해 문장이 이루어지는 반면 기존의 시계열 모델들은 단어들 간의 관계를 추론할 수 있는 직접적인 방법을 가지고 있지 않다는 것이다. 본 논문에서는 최근 딥 러닝 분야에서 널리 쓰이는 attention mechanism과 본 논문이 제안하는 restore gate를 결합한 네트워크를 통해 상기 문제를 해결하고자 한다. 본 논문의 실험에서는 기존의 다른 시계열 모델들과 비교를 통해 제안한 모델의 우수성을 확인하였다.

  • PDF

KoELMo: Deep Contextualized word representations for Korean (KoELMo: 한국어를 위한 문맥화된 단어 표상)

  • Hong, Seung-Yean;Na, Seung-Hoon;Shin, Jong-Hoon;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.296-298
    • /
    • 2018
  • 기존의 Word2Vec이나 Glove 등의 단어 임베딩 모델은 문맥에 상관없이 단어의 Vector들이 고정된 Vector를 가지는 문제가 있다. ELMo는 훈련된 Bi-LSTM 모델을 통해서 문장마다 Word Embedding을 수행하기 때문에 문맥에 상관없이 고정된 Vector를 가지는 문제를 해결하였다. 본 논문에서는 한국어와 같이 형태적으로 복잡한 언어의 경우 수 많은 단어가 파생될 수 있어 단어 임베딩 벡터를 직접적으로 얻는 방식에는 한계가 있기 때문에 형태소의 표상들을 결합하여 단어 표상을 사용한 ELMo를 제안한다. ELMo 단어 임베딩을 Biaffine attention 파싱 모델에 적용 결과 UAS에서 91.39%, LAS에서 90.79%으로 기존의 성능보다 향상된 성능을 얻었다.

  • PDF

Phoneme-Model Word Recognizer on RASTA-PLP (RASTA-PLP의 음소 모델 단어 인식기 적용)

  • 허창원
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1997.06a
    • /
    • pp.9-12
    • /
    • 1997
  • 대부분의 음성 파?너 추정 기법은 통신 채널의 주파수 응답에 의해 쉽게 영향을 받는다. 이 논문에서 우리는 음성에서 그러한 안정상태의 스펙트럼 계수에 있어서 좀더 강인한 기법인 RASTA-PLP 방법을 적용하여 파라미터를 추출하고 그 파라미터를 연속 HMM 인식기의 입력으로 사용하여 문맥독립 음소 모델을 훈련하는 과정에서 최적의 모델을 찾게 된다. 여기서는 ETRI 445 DB에 RASTA-PLP를 적용하였을 때 가장 좋은 성능을 나타내는 재추정 횟수와 mixutre 수를 찾는 데 목표를둔다. 문맥독립음소모델은 한국어의 발성학적 근거를 토대로 하고 여기에 묵음(silence)을 추가하여 총 40개로 정의하였다. 문맥독립 음소모델은 3개의 상태를 가지는 전형적인 left-to right CHMM(Continuous Hidden Markov Model)을 이용하여 훈련한다. 그리고 훈련시간을 줄이기 위해 Viterbi beam 탐색법을 적용한다.

  • PDF

Development of a Speech Recognition System uSing e++ Language and Standard library (C++ 언어와 Standard Library 를 이용한 음성인식기 개발)

  • 황규웅
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.74-77
    • /
    • 1998
  • 우리는 C++를 이용하여 음성인식기를 구현하여 기존의 C를 이용한 경우에 비하여 30% 수준의 소스로 표현하였고 인식기의 공동개발, 확장 및 개선, 기술 전수 등이 용이하게 되었으며 이를 음성인식 엔진 및 음성인식 연구를 위한 툴로 사용할 수 있게 되었다. 이 인식기의 특징으로는 연속 음성 및 대화체 음성을 인식할 수 있으며 trigram 언어 모델을 사용하였고 문맥 종속 음소 모델링에서는 기존의 triphone 보다 넓은 문맥을 고려한 n-phone context modeling을 사용하였으며 모델의 선정에는 음성학적 지식을 기반으로 한 질문을 사용한 decision tree를 사용하여 훈련에 나타나지 않은 단어나 문맥인 경우라도 가장 가까운 모델을 선정할 수 있게 하였다. 또, tree lexicon을 사용하여 속도를 개선하였으며 state 단위의 모델 공유를 통해 제한된 데이터를 이용하여 더 많은 모델을 훈련할 수 있어 성능을 개선하였다. 상용화를 염두에 두고 pc에서 구현하였다.

  • PDF

Similarity Estimation of Argument Between Noun using Predicate (술어를 활용한 명사 논항간의 유사도 계산)

  • Jo, Byeong-Cheol;Seok, Mi-Ran;Kim, Yu-Seop
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.238-241
    • /
    • 2014
  • 본 논문에서는 명사간의 유사도 추정을 위하여 명사 어휘와 술어-논항 관계에 있는 동사들의 유사도를 측정하여 이를 활용하는 연구를 제안한다. 어휘 유사도 추정은 정보 통합과 정보 검색 분야에서 중요한 역할을 한다. 본 연구에서는 유사한 명사 어휘들은 유사한 문맥을 가지고 있으며 동시에 명사 어휘의 문맥에 있어 가장 중요한 문맥 정보는 명사 어휘와 직접적인 구문 관계를 가지고 있는 술어 정보임을 가정하였다. 실험을 위하여 본 연구에서 제시된 유사도와 명사 계층 클래스간의 유사도간의 상관관계를 계산하였다.

  • PDF

Performance Evaluation of HM-Net Speech Recognition System using Korea Large Vocabulary Speech DB (한국어 대어휘 음성DB를 이용한 HM-Net 음성인식 시스템의 성능평가)

  • 오세진;김광동;노덕규;송민규;김범국;황철준;정현열
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2443-2446
    • /
    • 2003
  • 본 논문에서는 한국전자통신연구원에서 제공된 대어휘 음성DB를 이용하여 HM-Net(Hidden Markov Network) 음성인식 시스템의 성능평가를 수행하였다. 음향모델 작성은 음성인식에서 널리 사용되고 있는 통계적인 모델링 방법인 HMM(Hidden Markov Model)을 개량한 HM-Net을 도입하였다 HM-Net은 PDT-SSS 알고리즘에 의해 문맥방향과 시간방향의 상태분할을 수행하여 생성되는데, 특히 문맥방향 상태분할의 경우 학습 음성데이터에 출현하지 않는 문맥정보를 효과적으로 표현하기 위해 음소결정트리를 채용하고 있으며, 시간방향 상태분할의 경우 학습 음성데이터에서 각 음소별 지속시간 정보를 효과적으로 표현하기 위한 상태분할을 수행한다. 이러한 상태분할을 수행하여 파라미터를 공유하게 되며 최적인 모델 네트워크를 작성하게 된다. 대어휘 음성데이터를 이용하여 음향모델을 작성하고 인식실험을 수행한 결과, 100명의 100단어와 60문장에 대해 평균 97.5%, 96.7%의 인식률을 보였다.

  • PDF

Context-aware caching Strategy in Digital Television Environment (디지털 텔레비전 환경에서의 문맥인지 캐슁 정책)

  • 최지혁;이해원;김수연;최양희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.510-512
    • /
    • 1999
  • 컴퓨터통신 분야 및 개인이동통신 분야 등에서 먼저 도입된 멀티미디어 데이터의 사용이 큰 호응을 얻으면서, 최근 디지털 텔레비전 환경에서 멀티미디어 데이터 방송서비스를 시행하려는 노력들이 이루어지고 있다. 이는 다수의 사용자를 겨냥한 방송서비스로 데이터가 개별 사용자의 요구에 의해서가 아닌 정해진 방송 순서에 의해 제공된다. 따라서 사용자들은 원하는 정보를 수신할때까지 대기하게 된다. 이러한 응답시간 (response time)을 감소시키기 위해서, 문맥인지 캐슁(context-aware caching) 정책과 캐쉬 점유 우선순위 결정에 핵심이 되는 두 노드사이의 거리 산출을 위한 방법을 제안한다. 또한 선입산출(first-in-first-out) 정책과의 비교 모의실험(simulation)을 통해, 제안한 문맥인지 캐슁 정책이 응답시간 감소효과가 좋음을 확인하고, 이를 분석한다.

  • PDF