• Title/Summary/Keyword: 근거 추출

Search Result 875, Processing Time 0.034 seconds

Extracting Supporting Evidence with High Precision via Bi-LSTM Network (양방향 장단기 메모리 네트워크를 활용한 높은 정밀도의 지지 근거 추출)

  • Park, ChaeHun;Yang, Wonsuk;Park, Jong C.
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.285-290
    • /
    • 2018
  • 논지가 높은 설득력을 갖기 위해서는 충분한 지지 근거가 필요하다. 논지 내의 주장을 논리적으로 지지할 수 있는 근거 자료 추출의 자동화는 자동 토론 시스템, 정책 투표에 대한 의사 결정 보조 등 여러 어플리케이션의 개발 및 상용화를 위해 필수적으로 해결되어야 한다. 하지만 웹문서로부터 지지 근거를 추출하는 시스템을 위해서는 다음과 같은 두 가지 연구가 선행되어야 하고, 이는 높은 성능의 시스템 구현을 어렵게 한다: 1) 논지의 주제와 직접적인 관련성은 낮지만 지지 근거로 사용될 수 있는 정보를 확보하기 위한 넓은 검색 범위, 2) 수집한 정보 내에서 논지의 주장을 명확하게 지지할 수 있는 근거를 식별할 수 있는 인지 능력. 본 연구는 높은 정밀도와 확장 가능성을 가진 지지 근거 추출을 위해 다음과 같은 단계적 지지 근거 추출 시스템을 제안한다: 1) TF-IDF 유사도 기반 관련 문서 선별, 2) 의미적 유사도를 통한 지지 근거 1차 추출, 3) 신경망 분류기를 통한 지지 근거 2차 추출. 제안하는 시스템의 유효성을 검증하기 위해 사설 4008개 내의 주장에 대해 웹 상에 있는 845675개의 뉴스에서 지지 근거를 추출하는 실험을 수행하였다. 주장과 지지 근거를 주석한 정보에 대하여 성능 평가를 진행한 결과 본 연구에서 제안한 단계적 시스템은 1,2차 추출 과정에서 각각 0.41, 0.70의 정밀도를 보였다. 이후 시스템이 추출한 지지 근거를 분석하여, 논지에 대한 적절한 이해를 바탕으로 한 지지 근거 추출이 가능하다는 것을 확인하였다.

  • PDF

Korean Sentiment Analysis using Rationale (근거를 이용한 한국어 감성 분석)

  • Young-Jun Jung;Chang-Ki Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.160-163
    • /
    • 2022
  • 감성 분석(sentiment analysis)은 자연어 문장에 나타나는 감정 상태나 주관적인 의견을 분석하는 작업이다. 최근에는 자연어 처리(Natural Language Processing) 작업에서 딥러닝 기반의 모델이 좋은 성능을 보여주고 있다. 하지만, 모델의 복잡한 구조 때문에 모델이 어떠한 근거(rationale)로 판단하였는지 해석하기 어려운 문제가 있다. 모델이 좋은 성능을 보여도 예측에 관한 판단 근거가 없으면 결과를 해석하기 어렵고, 모델에 대한 신뢰가 떨어진다. 본 논문에서는 한국어 감성 분석 작업에 대해 사후 해석 모델을 이용하여 모델의 예측 결과에 대한 근거를 추출하고, 추출한 근거 정보를 이용한 근거 임베딩을 사용하여 근거 정보를 통합하는 방법이 감성 분석 모델의 성능을 개선함을 보인다.

  • PDF

Evidence Extraction Method for Machine Reading Comprehension Model using Recursive Neural Network Decoder (디코더를 활용한 기계독해 모델의 근거 추출 방법)

  • Kyubeen Han;Youngjin Jang;Harksoo Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.609-614
    • /
    • 2023
  • 최근 인공지능 시스템이 발전함에 따라 사람보다 높은 성능을 보이고 있다. 또한 전문 지식에 특화된 분야(질병 진단, 법률, 교육 등)에도 적용되고 있지만 이러한 전문 지식 분야는 정확한 판단이 중요하다. 이로 인해 인공지능 모델의 결정에 대한 근거나 해석의 중요성이 대두되었다. 이를 위해 설명 가능한 인공지능 연구인 XAI가 발전하게 되었다. 이에 착안해 본 논문에서는 기계독해 프레임워크에 순환 신경망 디코더를 활용하여 정답 뿐만 아니라 예측에 대한 근거를 추출하고자 한다. 실험 결과, 모델의 예측 답변이 근거 문장 내 등장하는지에 대한 실험과 분석을 수행하였다. 이를 통해 모델이 추론 과정에서 예측 근거 문장을 기반으로 정답을 추론한다는 것을 확인할 수 있었다.

  • PDF

Text segmentation using concept hierarchy tree (계층적 개념 트리를 이용한 문서 분할 기법)

  • 이병희;최익규;박승규;김인구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.166-168
    • /
    • 2003
  • 문서 분할 기법은 문서 내에 존재하는 다양한 주제들을 자동적으로 추출하는 기법이다. 이 분야의 연구는 크게 사전적 관계에 근거한 기법과 통계적 데이터에 근거한 기법으로 나누어져 연구되어 왔다. 사전적 관계에 의한 기법은 단어들의 사전적 의미와 관계에 근거한 기법이고 통계적 데이터에 의한 기법은 주로 단어들의 분포를 이용한 기법이다. 여기에는 몇가지 문제점이 있는데 사전적 관계에 근거한 경우에는 분산된 주제들을 통합하여 추출하기 어렵고. 통계적 데이터에 근거한 기법은 정확한 주제의 개수를 찾기 어렵다는 점이다. 본 논문에서는 계층적 개념 트리를 이용하여 보다 정확한 개수의 주제들을 찾아낼 수 있는 문서 분할 기법에 대해 소개 하고자 한다.

  • PDF

붓스트랩방법의 실제적활용1) -군집표본추출법에 근거한 분할표분석을 중심으로

  • 전명식
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.1
    • /
    • pp.179-188
    • /
    • 1996
  • 복합조사표본추출법(complex survey sampling)에 근거한 분할표분석에 카이제곱검정법을 사용할 때의 문제점들과 해결방법들을 살펴보았다. 나아가, 군집표본추출의 경우에 붓스트랩방법의 타당성을 보였으며, 실제자료분석을 통하여 실제 활용가능성과 잇점을 제시하였다.

  • PDF

A Recognition of Power Distributed Facility Map Based on Circularity and Connectivity of Line (원형성과 선의 연결성에 근거한 배전설비도면 인식)

  • Kim, Gye-Young;Lee, Bong-Jae;Han, Chil-Sung;Cho, Seon-Ku
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.10
    • /
    • pp.3300-3309
    • /
    • 2000
  • 본 논문에서는 변전소에서 수용가까지의 전력공급설비를 나타내는 도면인 배전설비도면의 주요 기호인 전주와 전선인식 방법에 과하여 기술한다. 제안하는 방법은 원형성에 근거하여 전주후보를 추출한 후 이들 사이의 연결성에 근거하여 전선을 인식한 다음, 전주후보들 중에서 전주를 확인하는 방법으로 다음과 같이 네 개의 단계로 구성된다. 첫 번째는 히스토그램 분석을 통하여 얻어진 임계값을 사용하여 입력영상에서 배전설비영역을 추출하는 단계이고, 두 번째는 추출된 배전설비영역을 세선화 하는 단계이다. 세 번째는 세선영상의 분기점 근처에 정의된 탐색영역에서 원형성을 측정하여 전주후보를 추출하는 단계이다. 네 번째는 전주후보들이 가지는 분기점들 간의 연결성을 측정하여 전선을 인식하는 단계이다. 전선인식이 완료되면 전주후보들 중에서 전선을 가지는 후보들만을 추출하여 전주를 인식한다. 제안된 방법은 한국전력공사의 배전설비도면들 중에서 무작위로 추출한 표본 약 30매를 대상으로 실험하고 그 결과를 제시한다.

  • PDF

Thematic Word Extraction from Book Based on Keyword Weighting Method (키워드 가중치 방식에 근거한 도서 본문 주제어 추출)

  • Ahn, Hee-Jeong;Choi, Gun-Hee;Kim, Seung-Hoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.19-22
    • /
    • 2015
  • 본 논문에서는 문장 및 문단에서 키워드의 역할에 따른 가중치에 근거하여 도서 본문에서 주제어를 추출하는 방법을 제안한다. 기존의 주제어 추출 방식은 도서 본문이 아닌 신문이나 논문에 대한 방식이므로 도서 본문에서의 주제어 추출에 그대로 적용하기에는 어려움이 있다. 따라서 본 논문에서는 빈도수뿐만 아니라 문장 내 중요 요소에 대한 가중치와 중요 문장에 대한 가중치를 후보 키워드에 부여하는 방식을 제안하였다. 제안한 계산 방식을 비문학 도서에 대하여 실험한 결과, 빈도수만으로 주제어를 추출한 기존 방식보다 본 논문에서 제안한 방식의 주제어 추출 결과의 정확도가 향상되는 것을 확인하였다.

  • PDF

Feature Extraction of Off-line Handwritten Characters Based on Optical Neural Field (시각 신경계 반응 모델에 근거한 필기체 off-line 문자에서의 특징 추출)

  • Hong, Keong-Ho;Jeong, Eun-Hwa;Ahn, Byung-Chul
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.12
    • /
    • pp.3530-3538
    • /
    • 1999
  • In this paper, we propose a novel method for feature extraction of off-line handwritten characters recognition based on human optical neural field model. The proposed feature extraction system divide into three parts ; 1) smoothing process, 2) removing boundaries(boundary lines), 3) extracting feature information. The proposed system first removes rough pixels which are easy to occur in handwritten characters. The system then extracts and removes the boundary information which have no influence on characters recognition. Finally, the feature information for off-line handwritten characters recognition is extracted. With PE2 Hangul database, we perform feature extraction experiments for off-line handwritten characters recognition. In the experiment results, the proposed system based on optical neural field shows that can extract the feature information of off-line handwritten characters including curve lines, circles, quadrangles and so on.

  • PDF

A Recognition of Electric Pole and Wire on Power Distribution Facility Map (배전설비도면의 전주 및 전선 인식)

  • 이봉재;김계영;한칠성;조선구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.446-448
    • /
    • 2000
  • 본 논문에서는 배전설비도면의 주요 기호인 전주와 전선인식 방법에 관하여 기술한다. 본 논문에서는 원형성에 근거하여 전주후보를 추출한 후 이들 사이의 연결성에 근거하여 전선을 인식한 다음, 전주후보들 중에서 전주를 확인함으로서 전주와 전선을 인식하는 방법을 제안한다. 제안된 방법은 한국전력공사의 배전설비도면들 중에서 무작위로 추출한 표본 약 30매를 대상으로 실험하고 그 결과를 제시한다.

  • PDF

A Study for Evidence Based Clinical Pathway Extraction using Data of Inpatient (입원환자를 대상으로한 근거기반 임상진료지침 추출에 관한 연구)

  • Bae, Inho;Park, Hanna;Kim, Yong Oock
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.833-834
    • /
    • 2013
  • 진료데이터는 진료를 보면서 축척된 데이터로서 다양한 병명들에 대한 의사들의 진료행위를 추적해 볼 수 있는 유용한 정보가 될 수 있으며, 진료에 재활용함으로써 환자들에 대한 진료행위를 표준화하는데 사용될 수 있다. 본 연구에서는 다양한 상황에서 환자를 진료한 근거자료인 진료데이터를 이용하여 병원에서 활용 가능한 임상진료데이터를 추출하기 위한 방법에 대한 연구를 진행하였다.