• 제목/요약/키워드: 프레임넷

검색결과 30건 처리시간 0.023초

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

중첩 분할된 양방향 LSTM 기반의 한국어 프레임넷의 프레임 분류 및 논항의 의미역 분류 (Frame-semantics and Argument Disambiguation of Korean FrameNet using Bi-directional LSTM)

  • 함영균;신기연;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.352-357
    • /
    • 2018
  • 본 논문에서는 한국어 프레임넷 분석기를 구축하기 위하여 한국어 프레임넷 데이터를 가공하여 공개하고, 한국어 프레임 분류 및 논항의 의미역 분류 문제를 해결하기 위한 방법을 제안한다. 프레임넷은 단어 단위가 아닌 단어들의 범위로 구성된 범위에 대해 어노테이션된 코퍼스라는 점에 착안하여, 어휘 및 논항의 내부 의미 정보와 외부 의미 정보, 그리고 프레임과 각 의미역들의 임베딩을 학습한 중첩 분할된 양방향 LSTM 모델을 사용하였다. 이를 통해 한국어 프레임 분류에서 72.48%, 논항의 의미역 분류에서 84.08%의 성능을 보였다. 또한 본 연구를 통해 한국어 프레임넷 데이터의 개선 방안을 논의한다.

  • PDF

워드넷 신셋에 대한 사건구조 프레임 반자동 태깅 (Semi-automatic Event Structure Frame tagging of WordNet Synset)

  • 임서현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-105
    • /
    • 2018
  • 이 논문은 가장 잘 알려진 어휘부중 하나인 워드넷의 활용 범위 확장을 위해 워드넷 신셋에 "사건구조 프레임(Event Structure Frame)"을 주석하는 연구에 관한 것이다. 워드넷을 비롯하여 현재 사용되고 있는 어휘부는 풍부한 어휘의미정보가 구조화되어 있지만, 사건구조에 관한 정보를 포함하고 있지는 않다. 이 연구의 가장 큰 기여는 워드넷에 사건구조 프레임을 추가함으로써 워드넷과의 연결만으로 핵심적인 어휘의미정보를 모두 추출할 수 있도록 해준다는 점이다. 예를 들어 텍스트 추론, 자연어처리, 멀티 모달 태스크 등은 어휘의미정보와 배경지식(상식)을 이용하여 태스크를 수행한다. 워드넷에 대한 사건구조 주석은 자동사건구조 주석 시스템인 GESL을 이용하여 워드넷 신셋에 있는 예문에 먼저 자동 주석을 하고, 오류에 대해 수동 수정을 하는 반자동 방식이다. 사전 정의된 23개의 사건구조 프레임에 따라 예문에 출현하는 타겟 동사를 분류하고, 해당 프레임과 매핑한다. 현재 이 연구는 시작 단계이며, 이 논문에서는 빈도 순위가 가장 높은 100개의 동사와 각 사건구조 프레임별 대표 동사를 포함하여 총 106개의 동사 레마에 대해 실험을 진행하였다. 그 동사들에 대한 전체 워드넷 신셋의 수는 1337개이다. 예문이 없어서 GESL이 적용될 수 없는 신셋을 제외하면 1112개 신셋이다. 이 신셋들에 대해 GESL을 적용한 결과 F-Measure는 73.5%이다. 향후 연구에서는 워드넷-사건구조 링크를 계속 업데이트하면서 딥러닝을 이용해 GESL 성능을 향상 할 수 있는 방법을 모색할 것이다.

  • PDF

프레임넷을 통한 디비피디아 온톨로지 인스턴스 생성의 커버리지 개선 (DBpedia Ontology Population Coverage Enhancement with FrameNet)

  • 함영균;서지우;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.32-37
    • /
    • 2014
  • 비구조 텍스트로부터 지식을 추출하여 온톨로지 기반 지식베이스를 구축하는 연구가 최근 국내외로 다양하게 진행되고 있다. 이러한 목적을 달성하기 위해서는 자연어 텍스트에서 나타난 지식요소들의 다양한 속성들을 표현할 수 있는 온톨로지를 필요로 한다. 디비피디아 역시 위키피디아의 지식들을 표현하기 위하여 디비피디아 온톨로지를 사용한다. 그러나 디비피디아 온톨로지는 위키피디아의 인포박스에 기반한 온톨로지로서, 요약된 정보를 설명하기에는 적합할 수 있으나 자연어 텍스트로 표현된 다양한 지식표현을 충분히 커버하는 것은 보증되지 않는다. 본 논문에서는 자연어 텍스트로 쓰여진 지식을 디비피디아 온톨로지가 충분히 표현할 수 있는지를 검토하고, 또한 그 불완전성을 프레임넷이 어느정도까지 보완할 수 있는지를 살핀다. 이를 통해 한국어 텍스트로부터 지식베이스를 자동구축하는 온톨로지 인스턴스 자동생성 연구의 방향으로서 디비피디아 온톨로지와 프레임넷의 효용성을 전망한다.

  • PDF

대화문에서의 이벤트 추출을 위한 프레임 논항 역할 분류기 (Frame Arguments Role Labeling for Event extraction in Dialogue)

  • 허철훈;노영빈;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.119-123
    • /
    • 2020
  • 이벤트 추출은 텍스트에서 구조화된 이벤트를 분석하는 것이다. 본 논문은 대화문에서 발생하는 다양한 종류의 이벤트를 다루기 위해 이벤트 스키마를 프레임넷으로 정한다. 대화문에서의 이벤트 논항은 이벤트가 발생하는 문장 뿐만 아니라 다른 문장 또는 대화에 참여하는 발화자에서 발생할 수 있다. 대화문 주석 데이터의 부재로 대화문에서의 프레임 파싱 연구는 진행되지 않았다. 본 논문이 제안하는 모델은 대화문에서의 이벤트 논항 구간이 주어졌을 때, 논항 구간의 역할을 식별하는 모델이다. 해당 모델은 이벤트를 유발한 어휘, 논항 구간, 논항 역할 간의 관계를 학습한다. 대화문 주석 데이터의 부족을 극복하기 위해 문어체 주석 데이터인 한국어 프레임넷을 활용하여 전이학습을 진행한다. 이를 통해 정확도 51.21%를 달성한다.

  • PDF

WPAN에서의 신속한 망 복구를 위한 능동적인 PNC 핸드오버방법 및 PNC Heart Beat 의 비컨 프레임 정렬 방식의 성능분석 (Performance of active PNC Handover and PNC Heart Beat based Beacon Alignment Schemes for Wireless PAN Systems)

  • 남혜진;김재영;전영애;이형수;김세한;윤종호
    • 한국통신학회논문지
    • /
    • 제31권2B호
    • /
    • pp.117-128
    • /
    • 2006
  • 일반적인 IEEE 802.15.3 WPAN에서는 피코넷을 관리하던 PicoNet Coordinator(PNC)가 비정상적으로 망을 떠나게 되거나, 두 개 이상의 피코넷들이 인접해 있을 때 각 PNC로부터 주기적으로 송신되는 비컨 프레임들 사이에 충돌이 발생하게 되면, 각 피코넷에 속한 단말들이 해당 비컨 프레임을 수신하지 못하게 되면서 피코렛의 동작이 와해되는 심각한 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위하여, 다음과 같은 두 가지의 방안을 제안하였다. 첫 번째는 PNC의 비정상적인 이탈에 대비하기 위해서 각 단말들이 능동적으로 프로브 프레임을 전송하여 해당 PNC의 동작여부를 확인하도록 함으로써 신속히 새로운 PNC를 선출하는 능동적 PNC 핸드오버 방법인 Active Seamless Coordinator Switching(ASCS) 방식이다. 두 번째는 밀집된 피코넷들의 각 PNC가 주기적으로 전송하는 비컨 프레임간의 충돌을 방지하기 위한 것으로써, 각 PNC들이 해당 피코넷의 수퍼프레임 정보를 수납한 Heart Beat(HB) 프레임을 비 주기적으로 전송하여 PNC의 비컨 프레임 송신시점을 조정하도록 함으로써 비컨 프레임간의 충돌을 방지하는 PNC Heart Beat 기반의 비컨 프레임 정렬(PNC HB based Beacon Alignment) 방식이다. 제안된 두 가지 방안에 대하여 모의실험을 통해 성능을 평가한 결과, 각 방식들은 유사한 기존 방식에 비해 피코넷의 와해기간을 단축시킬 수 있어, 각 단말이 겪는 프레임당 평균 지연시간과 수퍼프레임 별 전송효율이 향상됨을 확인하였다. 특히, 제안된 방식은 WPAN규격에서 허용되는 프레임들을 활용할 수 있으므로, 구현성이 높은 장점이 있다.

IEEE 802.15.3 고속 WPAN 메쉬 네트워크의 멀티-홉 통신을 위한 가용 슈퍼프레임 크기와 디바이스 탐색 성능 분석 (Performance Analysis of Available Superframe Size and Device Discovery Time for Multi-hop Communications in IEEE 802.15.3 High-rate WPAN Mesh Network)

  • 정쌍봉;임순빈;김현기;이태진
    • 한국통신학회논문지
    • /
    • 제32권6B호
    • /
    • pp.350-357
    • /
    • 2007
  • IEEE 802.15.3 High-rate WPAN(Wireless Personal Area Network)은 무선으로 약 l0m이내의 근거리 디바이스들을 연결하여 고속 통신을 지원하기 위해 개발되었다. 피코넷(piconet)은 하나의 PNC (Piconet Coordinator)와 하나 이상의 디바이스(device)로 구성된다. 부모 피코넷(parent piconet)에 합류(association)한 디바이스는 PNC가 되어 자식 피코넷(child piconet)을 형성할 수 있다. 부모 피코넷과 자식 피코넷들로 구성된 메쉬(mesh) 네트워크에서는 멀티-홉(multi-hop) 통신이 가능하게 된다. 본 논문에서 메쉬 네트워크의 최대 레벨과 가용 슈퍼프레임 크기를 분석하고, 멀티-홉 전송을 위한 디바이스 탐색시간을 랜덤 메쉬 네트워크 환경에서 분석한다. 일정한 영역에서 디바이스 수가 증가함에 따라 형성되는 메쉬 네트워크의 레벨은 최대 약 1.9까지 가능하며, 가용 슈퍼프레임 크기는 약 52ms이고, 디바이스 탐색시간은 약 155ms 소요됨을 확인할 수 있다.

Koinonia 고속 WPAN의 다중 피코넷 레벨 몇 용량 분석 (Analysis of Level and Capacity for Multi-piconet in Koinonia High-Rate WPAN)

  • 정쌍봉;임순빈;이태진;전선도;이현석;권대길;조진웅
    • 한국통신학회논문지
    • /
    • 제31권3B호
    • /
    • pp.216-223
    • /
    • 2006
  • Koinonia는 고속 무선 개인 네트워크(Wireless Personal Atra Network: WPAN) 기술로 무선으로 근거리 디바이스들을 연결하여 통신을 하기위해 개발되었다. 피코넷(piconet)은 하나의 마스터(master)와 하나 이상의 슬레이브(slave)로 구성되며, 다중 피코넷(multi-piconet)은 처음 구성된 피코넷(최상위피코넷: parent piconet)과 이를 기반으로 형성된 하위 피코넷(child piconet)으로 구성된다. 이와 같은 하위 피코넷은 상위 피코넷에서 슬레이브 역할과 하위 피코넷에서 마스터 역할을 하는 하위 마스터(child master)와 슬레이브로 구성된다. 본 논문에서는 이와 같은 구조로 다중 피코넷이 형성되고, 이에 따라 할당되어지는 CTA(Channel Time Allocation)의 최대 용량(maximum capacity)을 계층 수, 하위 피코넷의 슬레이브 수 등에 따라 비교, 분석하였다. 하나의 슈퍼프레임이 최대로 이용할 수 있는 용량(capacity)이 65.535ms로 일정하기 때문에 계층에 따라 형성되는 하위 피코넷의 수와 피코넷에 속한 슬레이브 수가 증가함에 따라 이용할 수 있는 용량이 감소하는데, 이에 대한 일정한 용량 감소를 정량적으로 제시하였다. 또한 다중 피코넷의 하위 피코넷의 수가 증가함에 따라 이용 할 수 있는 용량의 감소를 분석하였다.

한국어 질의응답 시스템을 위한 프레임 시멘틱스 기반 질의 의미 분석 (Semantic Parsing of Questions based on the Frame Semantics for Korean Question Answering System)

  • 함영균;남상하;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.122-127
    • /
    • 2016
  • 본 논문에서서는 질의응답 시스템을 위한 자연언어 질의 이해를 위하여 프레임 시멘틱스 기반 의미 분석방식을 제안한다. 지식베이스에 의존적인 질의 이해는 지식베이스의 불완전성에 의해 충분한 정보를 분석하지 못한다는 점에 착안하여, 질의의 술부-논항구조 및 그 의미에 대한 분석을 수행하여 자연언어 질의에서 나타난 정보들을 충분히 파악하고자 하였다. 본 시스템은 자연언어 질의를 입력으로 받아 이를 프레임 시멘틱스의 구조에 기반하여 기계가 읽을 수 있는 임의의 RDF 표현방식의 모형 쿼리를 생성한다.

  • PDF