• 제목/요약/키워드: 문맥

검색결과 999건 처리시간 0.021초

Sparse Attention 모델을 활용한 효율적인 문맥 이해 (Improving Contextual Understanding Using Sparse Attention Models)

  • 허태훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.694-697
    • /
    • 2023
  • 본 논문은 문맥 이해에서 발생할 수 있는 문제점을 개선하기 위해 Sparse Attention 모델을 적용하였다. 실험 결과, 이 방법은 문맥 손실률을 상당히 줄이며 자연어 처리에 유용하다는 것을 확인하였다. 본 연구는 기계 학습과 자연어 처리분야에서 더 나은 문맥 이해를 위한 새로운 방향을 제시하며, 향후 다양한 모델과 방법론을 탐구하여 문맥 이해를 더욱 향상시킬 계획이다.

  • PDF

출입자 판별을 위한 문맥 제시형 화자인식 (The Text-Prompt Speaker Recognition for Customer Discrimination)

  • 서광석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.127-130
    • /
    • 1998
  • 본 연구에서는 문맥 종속 또는 문맥 독립형 화자 인식에서의 단점을 개선하는 방법으로 문맥 제시형 화자 인식을 수행하였다. 문맥 종속형 화자 인식은 제한된 문장이나 단어를 발성하여 출입 판별을 하는 방식으로 구현하기는 쉬우나 사칭자가 사용자의 목소리를 흉내낼 수 있으며[1], 문맥 독립형 화자 인식은 임의의 대화 문장이나 대화를 사용에게 유도하여 일정 시간 동안 녹음한 후에 이를 이용하여 사칭자가 접근을 허가 받을 수 있다는 단번이 있다. 또한 문맥 독립형 화자 인식에서는 접근 허가를 받기까지 많은 학습 시간이 필요하며 학습 시간이 적을 경우에 상당한 인식률의 저하가 발생된다. 문맥 제시형 화자 인식은 랜덤하게 제시된 단어만을 화자가 발성함으로써 특정한 문장이나 단어의 배열을 미리 녹음했다가 재생하는 방법을 배제할 수 있을 뿐만 아니라 동시에 학습을 위한 많은 시간을 소모하지 않는다는 장점이 있다. 본 논문에서는 화자로 하여금 랜덤하게 제시된 여러 개의 단어들을 순서적으로 발성하도록 하여, 발성 단어를 인식한 후에 인식된 단어를 통하여 화자를 판별하는 방법을 사용하였다.

  • PDF

다중 프로그램 환경에서 블록화 알고리즘을 지원하기 위한 지연 선점 스케줄링 (A Delayed Preemption Scheduling for Supporting Blocked Algorithm on Multiprogramming Environment)

  • 정인범;이준원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권3호
    • /
    • pp.324-332
    • /
    • 1999
  • 다중 프로그래밍 환경에서 운영체제는 시스템의 시간 할당량에 따라서 프로세스들에 대하여 문맥교환을 수행한다. 문맥교환은 현재 수행중인 프로세스 문맥의 저장과 다음에 수행되는 프로세스 문맥의 적재라는 비용 뿐만 아니라 캐쉬 메모리의 커다란 영향을 미친다. 특히 블록화 알고리즘은 사용하는 프로그램들은 재사용되기 위하여 캐쉬 메모리에 적재된 블록화 요소가 프로그램들의 문맥 교환사이에 다른 프로그램들에 의하여 손상되는 경우 프로그램의 캐쉬 성능이 크게 떨어진다. 본 논문에서는 하나의 블록화 요소에 대한 계산이 완료될 때까지 운영체제가 문맥 교환을 지연시키는 지연된 선점 스케쥴링 방법을 제안한다. 모의 시험을 통하여 지연된 선점 스케줄링을 사용할 경우 블록화 알고리즘을 사용한 프로그램들은 재사용되기 위하여 캐쉬 메모리에 적재된 블록화 요소가 프로그램들의 문맥 교환 사이에 다른 프로그램들에 의하여 손상되는 경우 프로그램의 캐쉬 성능이 크게 떨어지게 된다. 본 논문에서는 하나의 블록화 요소에 대한 계산이 완료될 때까지 운영체제가 문맥 교환을 지연시키는 지연된 선점 스케쥴링 방법을 제안한다. 모의 시험을 통하여 지연된 선점 스케줄링을 사용할 경우 블록화 알고리즘을 사용한 프로그램은 캐쉬 메모리에 적재된 블록화 요소를 문맥 교환으로부터 보호 받으므로 향상된 캐쉬성능을 나타냄을 보인다.

생의학 도메인에서 약어 중의성 해결을 위한 최적 자질의 규명 (Identifying Optimum Features for Abbreviation Disambiguation in Biomedical Domain)

  • 임호건;서희철;김선호;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.173-180
    • /
    • 2004
  • 생의학 도메인에서 약어 중의성 해결이란 생의학 문서에 나타난 약어의 원래 형태(long form)를 판별하는 작업이다. 본 논문은 생의학 도메인에서 약어 중의성 해결에 적합한 자질들을 실험적으로 탐색하는데 목적이 있다. 이를 위해서 약어 중의성 해결에 사용할 문맥을 전역 문맥(topical context)과 지역 문맥(local context)으로 구분하고, 각각의 문맥에서 스테밍(stemming), 불용어 제거, 품사 부착 등의 과정을 통해서 다양한 자질들을 고려하도록 한다. 생의학 도메인에서 약어 중의성 해결을 위한 실험 자료의 부족을 해결하기 위해서, 학습 자료와 평가 자료를 자동으로 구축했으며, 평가를 위한 약어로는 기존 연구에서 사용된 두 가지 약어 목록을 사용했다. 또한 단순 베이지언 모델(Naive Bayesian Model)을 이용해서 각 자질들의 유용성을 평가하였다 실험 결과, 전역 문맥이 지역 문맥보다 더 좋은 성능을 보였으며, 전역 문맥에서는 불용어만을 제거한 경우가 각각의 평가 자료에서 94.2%와 96.2%로 가장 좋은 결과를 보였으며, 전역 문맥과 지역 문맥을 함께 사용하는 경우에 각각의 평가 자료에서 1.8%와 0.3%의 성능 향상이 있었다.

  • PDF

한국어 중의적 형태소 표상양식과 처리 특성 : 실어증 환자를 중심으로 (The Processing and Representations of Ambiguos Morpheme in Korean Words : Centered in Aphasics.)

  • 정재범;편성범;김태훈;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.151-156
    • /
    • 2002
  • 중의적인 단어를 처리하는 방법에 대한 선행연구로, 첫째 문맥에 맞는 의미가 먼저 활성화된다는 가설과 둘째, 여러 뜻 중에 상대적인 빈도에 따라 많이 쓰이는 의미가 먼저 활성화되고, 그것이 문맥과 일치하지 않는다면, 다른 관련된 의미를 찾는다는 가설이 제기되었다. 마지막으로 문맥에 상관없이 모든 의미가 활성화 된 후 문맥을 고려하여 문맥에 적절한 의미를 선택한다는 가설이 있다. 본 연구에서는 '먹을', '감을' 등과 같이 2가지 의미의 품사가 다른 중의 어절과 '쥐어', '감어' 등과 같이 어절 문맥('어')이 주어진 어절의 의미 활성화가 어떻게 다른지를 조사하였다. 본 연구의 목적을 위해 점화어휘 판단 과제를 사용하였다. 실험 1의 결과는 SOA 150ms 조건에서 점화자극어절과 관련된 의미가 품사와 관련 없이 모두 활성화되었다. SOA 1000ms 조건에서는 상대적으로 많이 쓰이는 체언의 의미는 계속 활성화 되어 있는 반면, 용언의 의미 점화량은 감소하였다. 명칭성 실어증 환자인 SDK의 경우 SOA 150ms 조건에서는 일반인과 같은 형태소 처리특성을 보였으나 1000ms 조건에서는 달랐다. 다른 명칭성 실어증 환자인 BIS과 전반성 실어증 환자인 PSB는 SOA 150ms 조건과 1000ms 조건에서 일반인과 아주 다른 양상을 보였다. 이것은 실어증 환자의 타잎에 따라 형태소의 처리나 중의적인 의미 활성화가 일반인과는 다르다는 것을 보여준다. 실험 2에서는 어절 문맥이 있는 '먹어', '쥐어', '감어' 등과 같은 어절을 사용하였다. 실험 2의 결과는 SOA 150ms 조건일 때 어절문맥의 영향으로 용언의 의미만 촉진적 점화효과가 있었고, 체언의 의미는 활성화되지 않았다. 그러나 SOA 1000ms로 지연시켰을 때는 용언뿐만 아니라 체언의 의미도 촉진적 점화효과가 있었다. 실험 1과 2의 결과는 중의적인 한국어 어절의 경우에도 모든 의미가 활성화되나 어절 문맥이 존재할 때는 어절 문맥의 제약으로 어절 문맥에 맞는 한 가지 의미만 활성화된다는 것을 암시한다. 또한 이러한 결과는 한국어 어절이 분석된 형태가 아닌 어절 형태로 심성 어휘집에 저장되어 있다는 것을 암시한다. 실어증 환자의 경우 실험 1과 마찬가지로 환자의 수준이나 종류에 따라 다양한 반응을 보여주었다.

  • PDF

적절다의의미 선택과정에서 관찰되는 숙련독자의 문맥의존적인 처리특성 (Context-dependent processing of skilled readers in selecting appropriate meaning of ambiguous words)

  • 이병택
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.225-230
    • /
    • 2002
  • 연구는 다의어의 문맥통합과정에서 관찰되는 숙련독자와 미숙련독자간의 개인차가 숙련독자의 문맥의존적인 처리특성에서 비롯되는지를 살펴보고자 하였다. 숙련독자의 문맥의존적인 처리특성을 좀 더 직접적으로 검토하기 위해 검사단어 강제선택과제를 고안하여 일련의 실험을 수행하였다. 편중문맥을 사용한 실험 1에서 숙련독자는 다의어의 주도적 의미가 부적절 검사단어로 사용된 실험조건과 무관단어가 부적절 검사단어로 사용된 통제조건간의 선택반응시간에 차이가 없었다. 한편 적절검사단어 선택을 방해하도록 구성된 갈등문맥이 사용된 실험 2에서 숙련독자는 미숙련독자보다 선택반응 시간이 느려서, 숙련독자가 적절검사단어 선택과정에서 더욱 큰 간섭을 경험했음을 보여주었다. 전체적으로 실험의 결과들은 숙련독자의 다의어 처리 특성이 문맥의존적이라고 가정할 때 잘 설명될 수 있는 것으로 보여진다.

  • PDF

Feed-Forward Neural Network를 이용한 문맥의존 철자오류 교정 (Context-sensitive Spelling Error Correction using Feed-Forward Neural Network)

  • 황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.124-128
    • /
    • 2015
  • 문맥의존 철자오류는 해당 단어만 봤을 때에는 오류가 아니지만 문맥상으로는 오류인 문제를 말한다. 이러한 문제를 해결하기 위해서는 문맥정보를 보아야 하지만, 형태소 분석 단계에서는 자세한 문맥 정보를 보기 어렵다. 본 논문에서는 형태소 분석 정보만을 이용한 철자오류 수정을 위한 문맥으로 사전훈련(pre-training)된 단어 표현(Word Embedding)를 사용하고, 기존의 기계학습 알고리즘보다 좋다고 알려진 딥 러닝(Deep Learning) 기술을 적용한 시스템을 제안한다. 실험결과, 기존의 기계학습 알고리즘인 Structural SVM보다 높은 F1-measure 91.61 ~ 98.05%의 성능을 보였다.

  • PDF

문맥정보를 이용한 이중모드 음성인식 (Blmodal Speech Recognition Using Contextual Feature)

  • 류정우;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.631-633
    • /
    • 2004
  • 최근 잡음환경에서 신뢰도 높은 음성인식을 위해 음성정보와 영상정보를 융합하는 이중모드 음성인식 방법이 활발히 연구되고 일다. 본 논문에서는 보다 음성 인식률을 향상시키기 위해 사용자가 말한 단어들의 순차 패턴을 나타내는 문맥정보를 이용한 후처리 방법을 제안한다. 이러한 문맥정보를 인식하기 위해 다층퍼셉트론 구조를 갖는 문맥정보 인식기를 제안한다 이중모드 음성인식기와 문맥정보 인식기 결과를 효율적으로 결합하기 위한 후처리 방법으로 순차 결합방법을 제안한다. 문맥정보를 이용한 이중모드 음성인식이 잡음 환경에서 90%이상의 인식률을 보였다 본 논문은 잡음환경에서 강인한 음성인식을 위해 문맥정보와 같은 사용자 행동패턴이 새로운 정보로 이용될 수 있다는 가능성을 제시한다.

  • PDF

문맥 정보 조절을 통한 관계 추출 성능 개선 (Improving relation extraction performance using contextual information control)

  • 오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.391-394
    • /
    • 2022
  • 딥러닝을 통해 자연어처리 분야에서 대용량 정보를 기반으로 학습 할 수 있게 되었고 높은 성능을 얻을 수 있게 되었다. 본 논문에서는 학습에 포함되는 문맥 정보 중 분야 또는 데이터에 맞게 조절이 필요하다는 것을 주장하고, TACRED 데이터를 기반으로 문맥 정보 자질 선택에 따른 성능 변화를 확인하였다. 해당 데이터에서 엔터티와 연관된 문맥 정보를 사용함으로써 약 1.4%의 성능 보완을 이루었다.

  • PDF

생성적 적대적 신경망을 이용한 생성기반 멀티턴 챗봇 (Generative Multi-Turn Chatbot Using Generative Adversarial Network)

  • 김진태;김학수;권오욱;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-30
    • /
    • 2018
  • 기존의 검색 기반 챗봇 시스템과 다르게 생성 기반 챗봇 시스템은 사전에 정의된 응답에 의존하지 않고 채팅 말뭉치를 학습한 신경망 모델을 사용하여 응답을 생성한다. 생성 기반 챗봇 시스템이 사람과 같이 자연스러운 응답을 생성하려면 이전 문맥을 반영해야 할 필요가 있다. 기존 연구에서는 문맥을 반영하기 위해 이전 문맥과 입력 발화를 통합하여 하나의 벡터로 표현했다. 이러한 경우 이전 문맥과 입력 발화가 분리되어 있지 않아 이전 문맥이 필요하지 않는 경우 잡음으로 작용할 수 있다. 본 논문은 이러한 문제를 해결하기 위해 입력 발화와 이전 문맥을 각각의 벡터로 표현하는 방법을 제안한다. 또한 생성적 적대적 신경망을 통해 챗봇 시스템을 보강하는 방법을 제안한다. 채팅 말뭉치(55,000 개의 학습 데이터, 5,000개의 검증 데이터, 5,260 개의 평가 데이터)를 사용한 실험에서 제안한 문맥 반영 방법과 생성적 적대적 신경망을 통한 챗봇 시스템 보강 방법은 BLEU와 임베딩 기반 평가의 성능 향상에 도움을 주었다.

  • PDF