• 제목/요약/키워드: 의미 어휘

검색결과 555건 처리시간 0.027초

한국어 어휘의미망을 활용한 의미 오류 검사 규칙 일반화 연구 (A Study on Generalization of Semantic Error Detection Rules in a Grammar Checker for Korean Using Korean WordNet 『KorLex』)

  • 소길자;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.640-643
    • /
    • 2010
  • 영어권에서는 통계적 기반 의미 오류 검사기에 대한 연구가 활발하게 진행되었으나 한국어에서는 자주 나타나는 오류를 중심으로 오류 단어를 검사할 문맥이나 공기정보를 갖는 규칙 기반의 연구가 이루어져왔다. 본 논문에서는 표제어나 사전 기반 범주화 정보로 표현되고 있는 기존 문법 검사기의 성능을 개선하는 방안으로 한국어 명사 어휘 의미망인 KorLex를 활용하는 방법을 연구한다. 특히, 용언은 목적어나 주어에 사용되는 명사의 표제어가 의미 제약 조건으로 사용되는 예가 많다. 본 논문에서는 용언의 의미 제약 조건을 명사 표제어 단위에서 명사 의미 그룹(class) 단위로 확대하여 문법 검사기의 의미 오류 검사 규칙의 의미 오류 제약 조건을 일반화 하는 방안을 연구한다.

의미 투명성이 단어 학습에 미치는 영향: 사건관련전위 연구 (Semantic transparency effects in the learning of new words: An ERP study)

  • 배성봉;이광오;박태진
    • 인지과학
    • /
    • 제27권3호
    • /
    • pp.421-439
    • /
    • 2016
  • 새로운 한자합성어의 학습에서 의미 투명성의 효과를 행동 실험과 ERP 실험을 통해 조사하였다. 참가자들은 구성형태소와 단어 의미의 관계가 투명한 조건(=투명 신단어)과 불투명한 조건(=불투명 신단어)에서 3회기에 걸쳐 새로운 단어-의미쌍을 학습하였다. 학습 단계에서는 자기 조절 의미 학습 시간과 ERP를 측정하고, 검사 단계에서는 학습한 단어에 대한 어휘판단시간과 의미 회상 점수를 측정하였다. 의미 학습 시간, 어휘판단, 의미 회상 검사 모두에서 의미 투명성의 효과가 유의하게 나타났다. 투명 신단어의 경우, 불투명 신단어에 비해 의미 학습 시간이 더 짧았음에도 불구하고, 어휘판단이 더 정확하고 빨랐으며, 의미 회상 검사 수행이 더 좋았다. 의미 투명성 효과는 ERP의 N400 성분의 진폭에서도 나타났다. 단어 의미가 투명한 조건에 비해 불투명한 조건에서의 N400 진폭이 더 컸다. 본 연구의 결과는 단어 재인 연구에서 발견된 의미 투명성 효과가 단어 학습에서도 나타남을 보여주며, 이는 단어 학습에서 형태소 정보가 중요한 역할을 한다는 것을 시사한다.

백과사전 질의응답 시스템을 위한 어휘개념망 구축 (Constructing Korean Lexical Concept Network for Encyclopedia Question-Answering System)

  • 최미란;오효정;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.99-105
    • /
    • 2004
  • 백과사전 질의응답 시스템은 사용자의 자연어 질문과 검색 대상 문서인 백과사전 내용의 의미를 파악하기 위한 고정밀 자연어 처리 기술이 요구된다. 이러한 고정밀 자연어 처리 기술을 위한 중요한 언어자원을 제공하기 위하여 한국어 명사와 동사로 구성되는 대규모 어휘개념망을 구축하였다. 한국어 어휘개념망은 명사와 동사의 상하위 관계를 주요 계층구조로 하여 다양한 한국어 어휘 기초 자료를 바탕으로 구축되었다. 구축된 규모는 일반명사 약 6만 어휘와 동사 약 2만 어휘를 포함한다. 이 논문에서는 어휘개념망을 구축하기 위한 방법과 과정을 소개하고 지금까지 구축된 어휘개념망의 특성에 대해 기술하며, 백과사전 질의응답 시스템에서 어떻게 활용되는지 시스템 구성요소의 예를 들어서 설명한다. 또한 현재 구축된 어휘개념망의 성능 평가를 위해 일반 코퍼스에 대한 커버리지 측정 결과를 기술한다.

  • PDF

이미지 개체 표현을 위한 논리적 프레임워크 (A Logical Framework for Image Object Representation)

  • 최준호;김성석;최창;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.197-200
    • /
    • 2005
  • 의미 기반 영상 검색은 Color, Texture, Region 정보, Spatial Color Distribution 등의 저차원 특징 정보와 이미지 데이터에 의미를 부여하기 위해 주석 처리하는 것이 일반적이다. 그리고 부여된 키워드나 시소러스와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 따라서 본 논문에서는 WordNet 어휘 사전을 확장한 개념적 어휘 체계를 갖는 대형 Ontology를 기반으로 하여 이미지 데이터 내의 객체 인식과 추출된 객체간의 관계를 정의하여 이를 논리적으로 표현할 수 있는 방법을 제시하고자 한다.

  • PDF

자연어 질의유형 판별과 응답 추출을 위한 어휘 의미 체계에 관한 연구 (A Study on Work Semantic Categories for Natural Language Question Type Classification and Answer Extraction)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권6호
    • /
    • pp.539-545
    • /
    • 2004
  • 자연어 질의를 입력하고 문서로부터 질의에 대한 정답을 추출하여 제공하는 질의응답 시스템에서는 사용자의 질의 의도를 파악하여 질의 유형을 분류하는 과정이 매우 중요하다. 본 논문에서는 질의 유형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 사전 정보를 이용하지 않고 질의의 의도를 나타내는 어휘들을 추출하고 인접 명사들의 의미 정보를 이용하여 질의 및 정답 유형을 결정할 수 있는 방법을 제안한다. 또 동의어 정보와 접미사 정보를 이용하고, 의문사가 생략된 경우 어휘 의미 정보를 이용하여 질의 유형 분류기의 성능을 향상시킬 수 있음을 보인다.

  • PDF

다중 온톨로지를 활용한 워드넷 확장 (Wordnet Extension Using Multiple Ontology)

  • 박경국;김진환;구태완;김병관;정연진;이광모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.425-428
    • /
    • 2007
  • 웹에 대한 사용자의 다양한 요구와 더불어 웹 서비스에 관한 연구가 활발히 진행되고 있다. 그 중 사용자가 원하는 정보를 정확하게 제공하기 위한 의미기반의 검색방법이 중요한 이슈로 등장하였다. 사용자 질의에 대한 의미 분석 및 검색과 온톨로지 구축의 기반으로는 어휘망이 사용된다. 그러나 어휘망은 작성 시기와 그 내용이 일반적인 내용으로 구성되어 전문적인 의미 검색으로 사용하기에는 부족함이 있다. 따라서 본 논문에서는 다중 온톨로지를 이용한 어휘망 확장을 제안한다.

종자 어휘를 이용한 자질 추출과 지지 벡터 기계(SVM)을 이용한 문서 감정 분류 시스템의 개발 (A Sentiment Classification System Using Feature Extraction from Seed Words and Support Vector Machine)

  • 황재원;전태균;고영중
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.938-942
    • /
    • 2007
  • 신문 기사 및 상품 평은 특정 주제나 상품을 대상으로 하여 글쓴이의 감정과 의견이 잘 나타나 있는 대표적인 문서이다. 최근 여론 조사 및 상품 의견 조사 등 다양한 측면에서 대용량의 문서의 의미적 분류 및 분석이 요구되고 있다. 본 논문에서는 문서에 나타난 내용을 기준으로 문서가 나타내고 있는 감정을 긍정과 부정의 두 가지 범주로 분류하는 시스템을 구현한다. 문서 분류의 시작은 감정을 지닌 대표적인 종자 어휘(seed word)로부터 시작하며, 자질의 선정은 한국어 특징상 감정 및 감각을 표현하는 명사, 형용사, 부사, 동사를 대상으로 한다. 가중치 부여 방법은 한글 유의어 사전을 통해 종자 어휘의 의미를 확장하여 각각의 가중치를 책정한다. 단어 벡터로 표현된 입력 문서를 이진 분류기인 지지벡터 기계를 이용하여 문서에 나타난 감정을 판단하는 시스템을 구현하고 그 성능을 평가한다.

  • PDF

아동영문어휘책에 제시된 그림과 문자의 사용에 대한 분석 (Analysis on the Use of Picture and Letter Used in the Books of English Vocabulary for Children)

  • 이미영
    • 한국콘텐츠학회논문지
    • /
    • 제14권1호
    • /
    • pp.150-157
    • /
    • 2014
  • 본 논문은 현재 출간된 아동영문어휘책의 현황분석을 통해 그림과 문자의 관계적 속성을 이해하고 사용자인 아동을 고려해 시각적 심상을 얼마나 잘 활용하고 있는가를 파악하고자 하였다. 이에 아동영문어휘책에 사용된 그림의 유형과 그림의 활용도, 그림과 문자의 결합 형태, 그림과 문자와의 의미일치도 정도를 살펴보았다. 분석결과 그림의 활용도는 일러스트, 만화, 일러스트와 만화의 혼용 순으로 전반적으로 높은 것으로 나타났다. 그림과 문자의 결합 형태에서는 그림+어휘형, 일러스트가 없는 문자형, 그림문자형 순으로 나타났다. 특히나 그림과 문자의 의미일치도가 높을수록 학습에 효과적인데 반해 의미일치도는 전반적으로 낮게 나타났다. 의미일치도가 높게 나타난 5개의 그룹 중 그림문자형이 가장 높은 결합형태 빈도를 보이고 있었다. 따라서 현재 출간된 아동영문어휘책에 나타난 그림과 문자의 제시형태는 비슷한 형태로 출판사별로 출간되고 있음을 알 수 있었고 아동의 다양한 수준을 바탕으로 한 효과적인 디자인연구가 필요하다고 보아진다.

고전언어에서의 어휘 의미망 구축을 위한 전문용어 추출 자동화 방안 (Automated Approaches for Extracting Specialized Terminology in Building Semantic Networks for Classical Languages)

  • 백영윤;박용범
    • Journal of Platform Technology
    • /
    • 제12권1호
    • /
    • pp.85-90
    • /
    • 2024
  • 지식이나 정보를 찾는 경우 아날로그적인 인쇄된 책이나 출판물 등등의 종이로 기록된 매체보다는 디지털적으로 구현되는 웹을 이용하는 방법이 증가하고 있다. 이러한 현상은 고전적인 종이 사전 보다 디지털 사전을 사용하는 것이 더 효과적이고 시간을 절약할 수 있다는 인식이 증가되고 있다. 따라서 이러한 어휘를 구성하는 어휘 의미망 구축은 언어학계와 전산언어학, 자연어 처리 전공자들에게 있어서 중요한 문제로 떠오르고 있다. 이를 위해 언어학자들은 어휘의 의미와 개념을 구조화하여 분류할 수 있는 방법을 찾기 위해 수많은 연구가 진행되었다. 이러한 연구에서 어휘 의미망을 구성하기 위한 전문용어는 일반어와 같이 중요한 요소이다. 하지만 이러한 과정에서 전문용어를 찾고 축적하는 과정에서 여전히 종이로 된 사전 문서나 디지털로 된 방대한 자료를 사람이 직접 확인하고 그 중에서 전문용어를 추출하고 정리하는 과정을 수작업으로 거치고 있다. 본 논문에서는 이러한 인적 작업의 오류를 보완하기 위해서 디지털로 된 자료에서 사용자가 원하는 전문용어를 추출할 수 있는 자동화된 프로그램을 제안한다.

  • PDF