• Title/Summary/Keyword: 언어적 프레임

Search Result 240, Processing Time 0.05 seconds

Expansion and Improvement of Korean FrameNet utilizing linguistic features (언어적 특징을 반영한 한국어 프레임넷 확장 및 개선)

  • Kim, Jeong-uk;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

Expansion and Improvement of Korean FrameNet utilizing linguistic features (언어적 특징을 반영한 한국어 프레임넷 확장 및 개선)

  • Kim, Jeong-uk;Choi, Key-Sun
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

Frame Structure Modeling of OWL (OWL의 프레임 구조 모델링)

  • 시대근;오지훈;장영진;전양승;한성국
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.97-99
    • /
    • 2004
  • 현재의 웹 환경에서의 정보는 점점 대량화되고 있으며, 정보에 대한 의미처리가 지원되지 않는 까닭에 많은 양의 정보가 무분별하게 검색되고 필요한 정보를 찾는데 많은 노력이 필요하다. 이를 해결하고자 XML의 의미태그를 중심으로 한 메타데이터 정보 모델링 등이 출현하였고, 이를 개념 수준의 의미처리로 추상화한 온톨로지(ontology) 기술이 개발되게 되었다. 온톨로지는 컴퓨터가 처리할 수 있는 명시적인 개념 표현을 상호 공유할 수 있도록 하여 줌으로써, 컴퓨터가 의미를 이해하고 추론할 수 있는 기반을 제공한다. 최근에는 여러 온톨로지 언어는 기술 논리(Description Logic)의 의미 모델에 기반을 두고 있는 OWL언어로 표준화되고 있다. 그러나, 온톨로지 언어를 사용한 직접적인 온톨로지 구축은 거의 불가능하다. 본 논문에서는 지식 표현의 기초가 되고 OWL의 이론적 기반이 되고 있는 프레임 구조로 개념 모델링 하는 방법을 통해 OWL기반의 온톨로지 구축을 보다 편리하고 효과적으로 수행할 수 있는 방법을 제공하며, 효율적인 OWL 문서의 생성과 편집 방안을 도출한다.

  • PDF

Pivot Weighting Approach to Extract Korean Paraphrases (피봇 가중치 접근을 통한 한국어 패러프레이즈 추출)

  • Park, Esther;Lee, Hyoung-Gyu;Kim, Min-Jeong;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.31-36
    • /
    • 2010
  • 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇 언어로 하여 단어 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류 전파 문제가 큰 단점이 된다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우, 단어 정렬 오류가 더 많고 이로 인해 잘못된 피봇 프레이즈가 선정되는 문제가 더욱 심각하다. 이런 문제를 보완하기 위해, 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서, 올바른 피봇 프레이즈에 더 높은 가중치를 부여 하는 방법을 제안한다. 실험 결과, 기존의 패러프레이즈 추출 방법에 제안하는 피봇 가중치 부여 방법을 추가적으로 적용했을 때, 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다.

  • PDF

An Analysis of the Conflict Frames Related to the Process of the National Geopark in Jeonbuk Western Coast Area, Korea (전북 서해안권 국가지질공원의 추진과정과 관련된 갈등 프레임 분석)

  • Chung, Duk Ho;Hwang, Kyeong Su;Cho, Kyu Seong;Park, Kyeong-Jin
    • Journal of the Korean earth science society
    • /
    • v.40 no.3
    • /
    • pp.283-299
    • /
    • 2019
  • The purpose of this study is to identify the conflict frames in the process of designating the national geopark, among local residents, geology experts, and local public officials. For this purpose, the progress of the public hearing on the implementation of the national geopark in Buan and Gochang were recorded with prior consent from the participants and transferred in text form. Subsequently, we developed a reference frames for analyzing conflict frames through literature review, and analyzed the conflict frames by three researchers based on this. These analyzed conflict frames were again analyzed by using semantic network analysis. The results are as follows. In the Buan area, 'Sagree' frame, 'Snot' frame, and 'Sdisagree' frame showed high eigenvector centrality, and 'Gharm' frame and 'Cmeconomy' frame were closely connected to the 'Snot' frame located at the center of the semantic network. In the Gochang area, 'Aresource' frame, 'Cmexample' frame, and 'Gharm' frame showed high eigenvector centrality, and 'Gharm' frame and 'Cmproblemsolution' frame were closely connected to the 'Snot' frame located at the center of the semantic network. Through these results, we could see that there is still the conflict about the certification of national geopark between stakeholders in Buan, and that Gochang's stakeholders are proudly aware of their own resources. The Buan's stakeholders focused on economic gains in resolving conflicts, while Gochang's stakeholders focused on problem solving. This result of this study provides information in conflict from the national geopark in other regions.

Semantic Network Analysis of 'Young-Kl(panic buying)': Focusing on News Source Diversity ('영끌' 보도에 대한 언어망 분석: 뉴스 정보원 다양성을 중심으로)

  • Lee, Jeng Hoon
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.12
    • /
    • pp.23-33
    • /
    • 2021
  • This study analyzed news articles about 'Young-Kl' reported by 11 media outlets, identifying news frames and quotation frames. Using a semantic network analysis, this study inspected the quotations frames and measured the frequency of the quotes and sources types. Also, the concentration index of the frames was measured. The results showed that news frames consisted of 10 topics and quotation frames consisted of 14 topics. Although the differences among quotation frames by media as well as by source types were observed, the concentration index of sources such as government, political arena, and business appeared high. Therefore, this study suggested that numerical diversity of news sources would not establish the diversity of news frames.

A Study on a New SIP Presence Service using Partial Publication and Extended Call Processing Language (부분 Publication 및 확장 호처리언어를 사용한 새로운 SIP 프레즌스 서비스에 관한 연구)

  • Lee, Ki-Soo;Jang, Choon-Seo;Jo, Hyun-Gyu
    • The Journal of the Korea Contents Association
    • /
    • v.7 no.3
    • /
    • pp.34-41
    • /
    • 2007
  • The presence service which provides user's presence information by subscription and notification is one of SIP(session initiation protocol) extension services, and it is used importantly in VoIP(Voice over IP) and Instant Messaging service. In this paper, we propose a new method in which users can combine and control presence service and call processing services in various ways by extending call processing language, and only changed parts of the presence information are published instead of full presence information document. Each user registers full presence information document with his own call processing script during the first publication to a presence server. The presence server executes these call processing scripts, so it can provide various services with combination of presence service and call processing services during the presence subscriptions and notifications. Afterwards, users publish only changed parts of the presence information and the presence server notify only these changed parts to watchers. Therefore the efficiency of the overall system can be improved. The performance of our proposed model is evaluated by experiments.

A Comparative Study on Building Korean & Chinese Music Request Sentence Patterns for AI Assistant Platforms (AI 어시스턴트 플랫폼의 한국어와 중국어 음악청취 요청문 패턴구축 비교 연구)

  • Yun, Soeun;Li, Jiabin;Nam, Jeesun
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.383-388
    • /
    • 2020
  • 본 연구에서는 AI 어시스턴트의 음악청취 도메인 내 요청문을 인식 및 처리하기 위해 한국어와 중국어를 중심으로 도메인 사전 및 패턴문법 언어자원을 구축하고 그 결과를 비교분석 하였다. 이를 통해 향후 다국어 언어자원 구축의 접근 방법을 모색할 수 있으며, 궁극적으로 패턴 기반 문법으로 기술한 언어자원을 요청문 인식에 직접 활용하고 또한 주석코퍼스 생성을 통해 기계학습 성능 향상에 도움을 줄 수 있을 것으로 기대된다. 본 연구에서는 우선 패턴문법의 구체적인 양상을 살펴보기에 앞서, 해당 도메인의 요청문 유형의 카테고리를 결정하는 과정을 거쳤다. 이를 기반으로 한국어와 중국어 요청문의 실현 양상과 패턴유형을 LGG 프레임으로 구조화한 후, 한국어와 중국어 패턴문법 간의 통사적, 형태적, 어휘적 차이점을 비교분석 하여 음악청취 도메인 요청문의 언어별 생성 구조 차이점을 관찰할 수 있었다. 구축한 패턴문법은 개체명을 변수(X)로 설정하는 경우, 한국어에서는 약 2,600,600개, 중국어에서는 약 11,195,600개의 표현을 인식할 수 있었다. 결과적으로 본 연구에서 제안한 언어자원의 언어별 차이에 대한 통찰을 통해 다국어 차원의 요청문 인식 자원과 기계학습 데이터로서의 효용을 확인하였다.

  • PDF

Korean NLP2RDF Framework (한국어 NLP2RDF 프레임워크)

  • Won, Yousung;Seo, Jiwoo;Kim, Jeonguk;Hahm, YoungGyun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.215-220
    • /
    • 2014
  • 본 논문은 LOD2 커뮤니티 과제 중 하나인 NLP2RDF를 한국어에 적용하면서 고안한 프레임워크에 대해 제시하고 있다. 이 프레임워크를 통해, 한국어 NLP2RDF는 다양한 한국어 자연언어처리 도구들로 부터의 결과물 및 다양한 한국어 언어 자원에 대한 활용도 높은 이용 방법에 대한 제시 및 국제적 상호 운용성을 위해 NIF(NLP Interchange Format)[1] 규격을 준수한 RDF(Resource Description Framework)를 생성하기 위한 방법론을 소개한다. 또한 NIF(NLP Interchange Format)를 통한 포맷 통일화 과정에서 발생하는 NIF 온톨로지의 불완전성에 대한 개선 방향에 대해서도 갼략하게 제시한다.

  • PDF

A Preliminary Study on Serious Game for C Language Study of Beginners : freCman (초보자를 위한 C 언어 학습 기능성 게임 개발 사례 : 프레C맨)

  • Hwang, Kitae;Jung, Inhwan
    • Journal of Korea Game Society
    • /
    • v.15 no.4
    • /
    • pp.199-206
    • /
    • 2015
  • This paper introduces a serious game called freCman developed for C programming language beginners. Since key words, syntax, and programming structure of C programming language are unfamiliar for them, they feel uneasy and have many difficulties to study. We developed three games such as shooting star C, finding hidden errors, unscrambling C codes through which C beginners can study C language easily. Also we developed CTS(Code to Speech) which speeches C source codes like English statements so that C beginners can be familiar with C key words and statements. To prove effectiveness of the freCman, some experiments have been conducted with C language beginners. Experiment results show that the freCman helps beginners studying C programming language much.