• 제목/요약/키워드: 문맥

검색결과 999건 처리시간 0.026초

문맥 표현과 음절 표현 기반 포인터 네트워크를 이용한 한국어 상호참조해결 (Contextualized Embedding- and Character Embedding-based Pointer Network for Korean Coreference Resolution)

  • 박천음;이창기;류지희;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.239-242
    • /
    • 2018
  • 문맥 표현은 Recurrent neural network (RNN)에 기반한 언어 모델을 학습하여 얻은 여러 층의 히든 스테이트(hidden state)를 가중치 합(weighted sum)을 하여 얻어낸 벡터이다. Convolution neural network (CNN)를 이용하여 음절 표현을 학습하는 경우, 데이터 내에서 발생하는 미등록어를 처리할 수 있다. 본 논문에서는 음절 표현 CNN 기반의 포인터 네트워크와 문맥 표현을 함께 이용하는 방법을 제안하고, 이를 상호참조해결에 적용한다. 실험 결과, 질의응답 데이터셋에서 CoNLL F1 57.88%로 규칙기반에 비하여 11.09% 더 좋은 성능을 보였다.

  • PDF

유전자 알고리즘을 이용한 화자인식 시스템 성능 향상 (Performance Improvement of Speaker Recognition System Using Genetic Algorithm)

  • 문인섭;김종교
    • 한국음향학회지
    • /
    • 제19권8호
    • /
    • pp.63-67
    • /
    • 2000
  • 본 논문에서는 화자인식의 성능향상을 위한 dynamic time warping (DTW) 기반의 문맥 제시형 화자인식에 대해 연구하였다. 화자인식에 있어 중요한 요소인 화자의 특성을 잘 반영할 수 있는 참조패턴을 생성하기 위해 유전자 알고리즘을 적용하였다. 또한, 문맥 종속형과 문맥 독립형 화자인식의 단점을 개선하기 위해 문맥 제시형 화자인식을 수행하였다. Clos set에서 화자식별과 open set에서 화자확인 실험을 하였으며 실험결과 기존 방법의 참조패턴을 이용하였을 경우보다 유전자 알고리즘에 의한 참조패턴이 인식률과 인식속도 면에서 우수함을 보였다.

  • PDF

영어초점구문에 나타나는 초점발화의 음향음성학적 특성

  • 김기호
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.129-225
    • /
    • 2003
  • 초점에 대한 언급이 Halliday(1967)에 의해 처음으로 시작된 이래로 초점의 개념에 대한 다양한 접근과 많은 논의가 이루어져 왔다. 일반적으로, 초점은 다음과 같이 정의할 수 있다. 첫째, 초점은 문맥에서 복구가 불가능한 요소를 가리킨다. 초점이라는 용어를 최초로 언급한 Halliday (1967)에 따르면, 초점이란 신정보를 가리키며 이전 담화 문맥에서 복구할 수 없는 정보가 곧 초점이다. 둘째, 초점은 전제 (presupposition)와 대응되는 개념이다. Jackendoff(1972)에 따르면, 담화 문맥에서 이루어지는 발화는 화자와 청자 사이에 공유된 정보와 그렇지 않은 정보로 나뉘며, 그 중 공유된 정보가 전제이고 이에 상보적으로 대응되는 비전제 (non-presupposed)가 곧 초점이다. 셋째, 초점은 화제(topic)와 대응되는 개념이다. Sgall(1973)과 Gundel(1974)에 따르면, 하나의 발화는 문맥상 화제와 초점으로 나뉘며 화제는 흔히 문장에서 무엇에 대해 말하려고 하는가'인 반면, 초점은 발화에서 화제를 제외한 나머지 부분으로서 담화에서 '화제에 대해서 서술되고 있는 바'를 나타낸다고 본다. (중략)

  • PDF

한국어 특수조사 '도'의 의미, 문맥적 기능 분석 (An Analysis of the Semantic and Discourse Functions of the Korean Special Marker '-to')

  • 박준경;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.324-331
    • /
    • 1999
  • 본 논문은 한국어의 특수조사, 특히 '도'의 의미, 문맥적 기능에 대하여 다루고 있다. '도'는 문맥의 자연스러운 연결에 있어서 중요한 역할을 수행한다. '도'가 쓰인 문장의 배경에는 반드시 일정한 전제가 존재한다. 전제는 그 문장의 의미 뿐만 아니라 기존 문맥과도 직접적으로 연관된다. 본 논문에서는 '같음', '유사함', '극한', '첨가' 및 병렬문에서 쓰이는 다섯 가지 '도'의 기능에 대하여 설명하고, alternatives semantics를 이용하여 이를 결합범주문법(CCG)에서 구현하는 방법을 제시한다.

  • PDF

다중 물체의 효과적 검출과 분할을 위한 문맥자유 마커 제어 분수계 변환 (Context-free marker controlled watershed transform for efficient multi-object detection and segmentation)

  • 서경석;박창준
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.1-1
    • /
    • 2001
  • 본 논문에서는 복잡 배경으로부터 임의의 다중물체를 효과적으로 검출함과 동시에 고속 분할할 수 있는 문맥자유 마커제어 분수계 변환 (context-free marker controlled watershed transform)을 제안하였다. 먼저 잡음에 강건한 주목 연산자 (attention operator)를 써서 복잡 배경 속의 여러 물체 별로 그 위치를 검출하여 문맥자유 마커를 추출하고, 이를 마커로 한정된 레이블링 (marker constrained labeling)을 하여 최소값 부과과정이 필요 없는 문맥자유 마커제어 분수계 변환을 제안함으로써 과분할없이 신속하게 분할할 수 있도록 하였다. 다중 물체가 포함된 복잡 영상에 적용 실험하여, 대상 물체에 대한 사전정보 없이도 과분할과 처리시간을 대폭 줄여 효과적으로 다중 물체를 검출함과 동시에 고속 분할이 가능함을 확인 할 수 있었다.

전화망 환경에서의 연속숫자음 인식 성능평가 (Performance Evaluation of Telephone Continuous Digit Recognition)

  • 김성탁;김상진;정호영;김회린;한민수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.253-256
    • /
    • 2002
  • 한국어 숫자는 단음절로 이루어져 있고, 연속적으로 발음할 때 조음현상에 의해 발음이 심하게 변하고, 숫자간의 경계를 규정하기가 어려워진다. 특히 잡음환경에서는 한국어의 무성음인 자음구간의 주파수 특징이 많이 왜곡되어 성능이 저하된다. 본 논문에서는 전화망에서의 고성능 연속숫자음 인식기 개발을 위하여 그 첫 단계로서 다양한 조건에서 MFCC 특징계수를 구하는 방법들과 문맥독립 및 문맥종속 HMM의 상태수 및 각 상태에서의 mixture 수 변화에 대한 성능을 분석해본다. 음향모델로는 문맥독립 모델인 음소와 문맥종속 모델인 triphone 모델을 모두 평가하였다.

  • PDF

가변어휘 음성인식기 구현에 관한 연구 (A Study on the Implementatin of Vocalbulary Independent Korean Speech Recognizer)

  • 황병한
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제5권
    • /
    • pp.60-63
    • /
    • 1998
  • 본 논문에서는 사용자가 별도의 훈련과정 없이 인식대상 어휘를 추가 및 변경이 가능한 가변어휘 인식시스템에 관하여 기술한다. 가변어휘 음성인식에서는 미리 구성된 음소모델을 토대로 인식대상 어휘가 결정되명 발음사전에 의거하여 이들 어휘에 해당하는 음소모델을 연결함으로써 단어모델을 만든다. 사용된 음소모델은 현재 음소의 앞뒤의 음소 context를 고려한 문맥종속형(Context-Dependent)음소모델인 triphone을 사용하였고, 연속확률분포를 가지는 Hidden Markov Model(HMM)기반의 고립단어인식 시스템을 구현하였다. 비교를 위해 문맥 독립형 음소모델인 monophone으로 인식실험을 병행하였다. 개발된 시스템은 음성특징벡터로 MFCC(Mel Frequency Cepstrum Coefficient)를 사용하였으며, test 환경에서 나타나지 않은 unseen triphone 문제를 해결하기 위하여 state-tying 방법중 음성학적 지식에 기반을 둔 tree-based clustering 기법을 도입하였다. 음소모델 훈련에는 ETRI에서 구축한 POW (Phonetically Optimized Words) 음성 데이터베이스(DB)[1]를 사용하였고, 어휘독립인식실험에는 POW DB와 관련없는 22개의 부서명을 50명이 발음한 총 1.100개의 고립단어 부서 DB[2]를 사용하였다. 인식실험결과 문맥독립형 음소모델이 88.6%를 보인데 비해 문맥종속형 음소모델은 96.2%의 더 나은 성능을 보였다.

  • PDF

다양한 언어 정보를 이용한 음소 단위 억양 및 VoiceXML 문서 생성 (Diphone-based Intonation and VoiceXML document Generation using Multi-dimensional Linguistic Information)

  • 이화진;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-76
    • /
    • 2002
  • 최근 음성 합성 과정에서 화자의 의도를 가장 많이 반영하는 언어 정보인 문맥 정보를 사용하려는 시도가 이루어지고 있으나 문맥 정보를 적은 비중으로 사용하기 때문에 자연성 향상에 큰 도움을 주지 못하고 있다. 본 연구에서는 구문 정보, 의미 정보를 억양 생성 과정에 이용함과 동시에 문맥 정보와 음성 정보와의 관계를 음성 데이터를 바탕으로 분석하여 다양한 문맥 정보를 음성 합성 과정에 반영하는 방법을 제안한다. 또한 한국어에서 나타나는 다양한 억양 곡선 유형을 형태소를 이용하여 의다 효율적으로 처리할 수 있는 방법을 제안하여 자연스러운 억양 생성 시스템을 구현하고 시스템의 결과를 음소 단위 억양 생성기와 VoiceXML을 이용하여 적용시켜보고 결과를 논의한다.

  • PDF

어절간 문맥 정보를 이용한 혼합형 품사 태깅 (Hybrid Part-of-Speech Tagging using Context Information among Words)

  • 임희동;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.376-380
    • /
    • 2000
  • 본 논문에서는 규칙 정보와 통계 정보의 상호 보완적 특성을 이용한 혼합형 방법을 기반으로 규칙 정보와 통계 정보의 추출 및 적용 시에 어절간 문맥 정보를 보다 효율적으로 이용하는 혼합형 품사 태깅 시스템을 제안한다. 먼저 규칙이 적용되는 중의성들에 대해서 높은 정확률로 태깅을 수행한 후, 규칙으로 해결할 수 없는 중의성들에 대해서는 통계 정보를 이용하여 태깅을 수행한다. 규칙 정보는 중의성을 갖는 어절과 주변 어절들의 형태소 및 태그를 이용하여 정의하고 통계 정보는 문맥에 영향을 많이 미치고 많은 중의성의 원인이 되는 조사와 어미의 형태를 그대로 활용하여 추출함으로써 어절간 문맥을 보다 효율적으로 이용한다.

  • PDF

ARM Cortex-M3의 HW/SW 기반 문맥교환 시간의 정량적인 평가 (A Quantitative Evaluation of SW/HW-Based Context Switch Time for ARM Cortex-M3)

  • 최하연;박상수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.12-14
    • /
    • 2013
  • 임베디드 마이크로프로세서인 ARM Cortex-M3는 기존의 것들과는 달리 짧은 문맥교환을 제공하기 위해 Trap을 이용하여 문맥교환 과정을 일부 하드웨어적으로 처리하는 기능을 제공한다. 일반적으로 Trap (혹은 소프트웨어 인터럽트)은 그 자신만의 오버헤드를 갖고 있는 것으로 알려져 있다. 따라서 본 논문에서는 소프트웨어적으로 문맥교환을 하던 방식에 비해 어느 정도의 성능 향상이 있을지에 대한 정량적인 비교 평가를 수행하여 Cortex-M3를 기반으로 한 임베디드 시스템의 설계에 도움을 주도록 한다.