• 제목/요약/키워드: 언어적 프레임

검색결과 241건 처리시간 0.032초

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

OWL의 프레임 구조 모델링 (Frame Structure Modeling of OWL)

  • 시대근;오지훈;장영진;전양승;한성국
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.97-99
    • /
    • 2004
  • 현재의 웹 환경에서의 정보는 점점 대량화되고 있으며, 정보에 대한 의미처리가 지원되지 않는 까닭에 많은 양의 정보가 무분별하게 검색되고 필요한 정보를 찾는데 많은 노력이 필요하다. 이를 해결하고자 XML의 의미태그를 중심으로 한 메타데이터 정보 모델링 등이 출현하였고, 이를 개념 수준의 의미처리로 추상화한 온톨로지(ontology) 기술이 개발되게 되었다. 온톨로지는 컴퓨터가 처리할 수 있는 명시적인 개념 표현을 상호 공유할 수 있도록 하여 줌으로써, 컴퓨터가 의미를 이해하고 추론할 수 있는 기반을 제공한다. 최근에는 여러 온톨로지 언어는 기술 논리(Description Logic)의 의미 모델에 기반을 두고 있는 OWL언어로 표준화되고 있다. 그러나, 온톨로지 언어를 사용한 직접적인 온톨로지 구축은 거의 불가능하다. 본 논문에서는 지식 표현의 기초가 되고 OWL의 이론적 기반이 되고 있는 프레임 구조로 개념 모델링 하는 방법을 통해 OWL기반의 온톨로지 구축을 보다 편리하고 효과적으로 수행할 수 있는 방법을 제공하며, 효율적인 OWL 문서의 생성과 편집 방안을 도출한다.

  • PDF

피봇 가중치 접근을 통한 한국어 패러프레이즈 추출 (Pivot Weighting Approach to Extract Korean Paraphrases)

  • 박에스더;이형규;김민정;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.31-36
    • /
    • 2010
  • 이중 언어 병렬 말뭉치를 이용하는 패러프레이즈 추출 과정에서는 일반적으로 다른 언어를 피봇 언어로 하여 단어 및 구 정렬 과정을 두 번 거친다. 따라서 단어 정렬의 오류 전파 문제가 큰 단점이 된다. 특히 한국어와 영어와 같이 언어의 구조적인 차이가 큰 경우, 단어 정렬 오류가 더 많고 이로 인해 잘못된 피봇 프레이즈가 선정되는 문제가 더욱 심각하다. 이런 문제를 보완하기 위해, 본 논문에서는 패러프레이즈 추출 과정에서 피봇 프레이즈를 차별화하는 방안으로서, 올바른 피봇 프레이즈에 더 높은 가중치를 부여 하는 방법을 제안한다. 실험 결과, 기존의 패러프레이즈 추출 방법에 제안하는 피봇 가중치 부여 방법을 추가적으로 적용했을 때, 패러프레이즈 추출 정확률과 재현율이 모두 향상됨을 확인할 수 있었다.

  • PDF

전북 서해안권 국가지질공원의 추진과정과 관련된 갈등 프레임 분석 (An Analysis of the Conflict Frames Related to the Process of the National Geopark in Jeonbuk Western Coast Area, Korea)

  • 정덕호;황경수;조규성;박경진
    • 한국지구과학회지
    • /
    • 제40권3호
    • /
    • pp.283-299
    • /
    • 2019
  • 본 연구의 목적은 국가지질공원 추진 과정에서 지역주민, 지질 전문가 및 지방자치단체 공무원 사이에서 나타나는 갈등 프레임의 양상을 규명하는 데 있다. 이를 위하여 각각 부안과 고창에서 실시된 국가지질공원 추진 관련 주민 공청회의 진행 과정을 참여자들의 사전 동의를 얻어 녹음한 후 텍스트 형태로 전사하였다. 이후 문헌연구를 통해 갈등 프레임을 분석하기 위한 기준 프레임을 개발하였으며, 이를 토대로 3명의 연구자에 의해 갈등 프레임을 분석하였다. 이렇게 분석된 갈등 프레임은 다시 언어네트워크 분석을 활용하여 지역별로 갈등 프레임 간의 구조적 특성을 분석하였으며, 그 결과는 다음과 같다. 먼저, 부안 지역에서는 'Sagree' 프레임, 'Snot' 프레임, 'Sdisagree' 프레임이 높은 위세중심성을 보였고, 언어네트워크의 중심에 위치한 'Snot' 프레임에 Cmexample 프레임, Gharm 프레임, Cmeconomy 프레임 등이 긴밀하게 연결되었다. 반면 고창에서는 'Aresource' 프레임, 'Cmexample' 프레임, 'Gharm' 프레임이 높은 위세중심성을 보였고, 언어네트워크의 중심에 위치한 'Aresource' 프레임에 'Cmexample' 프레임, 'Gharm' 프레임, 'Cmproblemsolution' 프레임 등이 긴밀하게 연결되었다. 이를 통해 부안 지역에서는 아직 이해당사자 사이의 갈등이 진행되고 있고, 고창 지역에서는 자신들의 자원을 자랑스럽게 인식하고 있음을 알 수 있었다. 그리고 부안의 이해당사자들은 갈등 해소에 있어서 경제적 이득에 초점을 둔 반면, 고창의 이해당사자들은 문제 해결에 초점을 두었다. 본 연구의 결과는 국가지질공원 추진에서 나타날 수 있는 갈등 관계를 해소하기 위한 중요한 정보를 제공했다는 점에서 의의가 있다.

'영끌' 보도에 대한 언어망 분석: 뉴스 정보원 다양성을 중심으로 (Semantic Network Analysis of 'Young-Kl(panic buying)': Focusing on News Source Diversity)

  • 이정훈
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.23-33
    • /
    • 2021
  • 이번 연구는 일간지, 경제지, 지상파 TV 등 총 11개의 언론 매체들이 보도한 '영끌' 관련 뉴스 기사를 분석하여 각 보도 프레임과 인용문 프레임을 파악하였다. 의미망 분석을 활용하여 매체별 인용문의 프레임, 정보원의 종류별 인용문 프레임 등을 비교, 분석하였고 인용된 정보원의 종류와 빈도, 그리고 각 프레임의 집중도 지수도 측정하였다. 분석 결과, 보도 프레임은 10개의 주제로 구성되었고 인용문의 프레임은 14개의 주제로 구성된 것으로 나타났다. 매체별 인용문과 정보원 종류별 인용문 프레임들 사이 차이는 관찰되었지만 인용 빈도가 높은 정부, 정치권, 비즈니스 정보원 프레임의 집중도가 상대적으로 높은 것으로 나타났다. 따라서 정보원의 수적 다양성만으로는 보도 프레임의 다양성을 확립하는 것이 제한적일 수 있다는 실증적 근거를 제시하였다.

부분 Publication 및 확장 호처리언어를 사용한 새로운 SIP 프레즌스 서비스에 관한 연구 (A Study on a New SIP Presence Service using Partial Publication and Extended Call Processing Language)

  • 이기수;장춘서;조현규
    • 한국콘텐츠학회논문지
    • /
    • 제7권3호
    • /
    • pp.34-41
    • /
    • 2007
  • 프레즌스(presence) 서비스는 사용자들에 관한 각종 프레즌스 정보를 등록(subscription)과 통지(notification)를 통해 제공하는 SIP(session initiation protocol) 확장 서비스 중 하나로서 VoIP(Voice over IP)나 인스턴트 메시징 서비스 등에서 중요하게 사용되고 있다. 본 논문에서는 프레즌스 서비스를 구현함에 있어 사용자가 다양한 방식으로 프레즌스 서비스와 호 처리 서비스를 조합하여 제어할 수 있도록 호 처리 언어를 확장하고, publication 시 프레즌스 정보에 변화가 있을 경우에는 전체 내용 대신 변화된 부분만 전송하는 새로운 방식을 제안하였다. 본 방식에서는 사용자는 최초 publication 시 전체 프레즌스 정보 및 자신이 원하는 내용을 기술한 호 처리 언어 스크립트를 프레즌스 서버에 등록하며, 서버는 와처(watcher)로 부터의 등록과 통지 시 이를 실행하여 프레즌스 서비스와 호 처리를 조합한 다양한 서비스를 제공할 수 있게 된다. 또한, 사용자는 이후 publication 시 프레즌스 정보의 변화된 부분만 전송하고, 프레즌스 서버도 프레즌스 정보의 통지 시 변화된 부분만 와처에게 전송하도록 하여 전체적인 시스템 효율을 높일 수 있다. 제안된 방식은 실험을 통하여 성능을 측정하였다.

AI 어시스턴트 플랫폼의 한국어와 중국어 음악청취 요청문 패턴구축 비교 연구 (A Comparative Study on Building Korean & Chinese Music Request Sentence Patterns for AI Assistant Platforms)

  • 윤소은;이가빈;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.383-388
    • /
    • 2020
  • 본 연구에서는 AI 어시스턴트의 음악청취 도메인 내 요청문을 인식 및 처리하기 위해 한국어와 중국어를 중심으로 도메인 사전 및 패턴문법 언어자원을 구축하고 그 결과를 비교분석 하였다. 이를 통해 향후 다국어 언어자원 구축의 접근 방법을 모색할 수 있으며, 궁극적으로 패턴 기반 문법으로 기술한 언어자원을 요청문 인식에 직접 활용하고 또한 주석코퍼스 생성을 통해 기계학습 성능 향상에 도움을 줄 수 있을 것으로 기대된다. 본 연구에서는 우선 패턴문법의 구체적인 양상을 살펴보기에 앞서, 해당 도메인의 요청문 유형의 카테고리를 결정하는 과정을 거쳤다. 이를 기반으로 한국어와 중국어 요청문의 실현 양상과 패턴유형을 LGG 프레임으로 구조화한 후, 한국어와 중국어 패턴문법 간의 통사적, 형태적, 어휘적 차이점을 비교분석 하여 음악청취 도메인 요청문의 언어별 생성 구조 차이점을 관찰할 수 있었다. 구축한 패턴문법은 개체명을 변수(X)로 설정하는 경우, 한국어에서는 약 2,600,600개, 중국어에서는 약 11,195,600개의 표현을 인식할 수 있었다. 결과적으로 본 연구에서 제안한 언어자원의 언어별 차이에 대한 통찰을 통해 다국어 차원의 요청문 인식 자원과 기계학습 데이터로서의 효용을 확인하였다.

  • PDF

한국어 NLP2RDF 프레임워크 (Korean NLP2RDF Framework)

  • 원유성;서지우;김정욱;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-220
    • /
    • 2014
  • 본 논문은 LOD2 커뮤니티 과제 중 하나인 NLP2RDF를 한국어에 적용하면서 고안한 프레임워크에 대해 제시하고 있다. 이 프레임워크를 통해, 한국어 NLP2RDF는 다양한 한국어 자연언어처리 도구들로 부터의 결과물 및 다양한 한국어 언어 자원에 대한 활용도 높은 이용 방법에 대한 제시 및 국제적 상호 운용성을 위해 NIF(NLP Interchange Format)[1] 규격을 준수한 RDF(Resource Description Framework)를 생성하기 위한 방법론을 소개한다. 또한 NIF(NLP Interchange Format)를 통한 포맷 통일화 과정에서 발생하는 NIF 온톨로지의 불완전성에 대한 개선 방향에 대해서도 갼략하게 제시한다.

  • PDF

초보자를 위한 C 언어 학습 기능성 게임 개발 사례 : 프레C맨 (A Preliminary Study on Serious Game for C Language Study of Beginners : freCman)

  • 황기태;정인환
    • 한국게임학회 논문지
    • /
    • 제15권4호
    • /
    • pp.199-206
    • /
    • 2015
  • 본 논문은 C 언어를 배우는 초보자를 위한 기능성 게임 프레C맨(freCman)의 개발 사례를 소개한다. C 언어를 처음 배우는 사람들은 C 언어의 키워드나 문법, 문장 구조에 생소하여 학습에 어려움을 느낀다. 본 논문은 슈팅스타C, 숨은 오류 찾기, 코드 순서 맞추기 등의 3 가지의 게임을 개발하고, 이를 통해 C 언어에 보다 쉽게 접근할 수 있도록 하였고, CTS(Code to Speech) 기능을 추가하여 C 소스 코드를 읽어 줌으로써 청각적으로 C 언어의 키워드나 문장에 친숙하도록 하였다. C 언어를 처음 배우는 학생들을 대상으로 실험한 결과 프레C맨이 C 프로그래밍 학습에 도움이 되었다는 결과를 얻었다.