• 제목/요약/키워드: 어휘의미분석

검색결과 255건 처리시간 0.022초

어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기 성능 향상 (Improvement of Korean Grammar Checker Using Partial Parsing based on Dependency Grammar and Disambiguation Rules)

  • 소길자;남현숙;김수남;원상연;권혁철;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-260
    • /
    • 1998
  • 한국어 문서에는 여러 어절을 검증해야만 처리할 수 있는 의미 오류와 문체 오류가 있다. 다수 어절 사이에 있는 오류는 부분 문장 분석을 한다. 논문에서는 의미 오류와 문체 오류를 처리할 때 어휘적 중의성 때문에 생기는 문제점을 제시하고 해결방법을 제안한다. 어휘적 중의성이란 한 단어가 두 가지 이상의 형태소 정보를 가짐을 뜻한다. 철자검사기와는 달리 문법 검사기에서는 어휘적 중의성을 제거하지 않으면 여러 가지 검사 오류가 발생한다. 이 논문에서는 의미, 문체 시스템에서 어휘적 중의성 때문에 검사 오류가 발생할 수 있는 과정을 크게 세 단계로 분류하였다. 연어 오류가 발생할 수 있는 검사단어가 어휘적 중의성을 가지면 표제어가 다른 규칙이 여러 개 존재한다. 이 때 규칙 선택 문제가 생긴다. 중의성 문제는 부분 문장분석 과정에서도 지배소와 의존소 사이의 의존관계를 정확하게 설정하기 어렵게 한다. 본 논문에서는 각 단계에서 발생한 문제를 최소화하여 문법 검사기의 성능을 향상시킨다.

  • PDF

우리말 감성 어휘의 범주-차원 모형 - 직물 디자인의 시각적 요소와 관련하여 - (Category-based dimensional model of affective words)

  • 박수진;정찬섭
    • 감성과학
    • /
    • 제2권1호
    • /
    • pp.77-94
    • /
    • 1999
  • 직물 및 직물 관련 제품에서 주로 사용되는 감성 어휘들의 관계 및 구조를 분석하기 위해 잡지 및 설문 조사 과정을 통해 어휘를 수집하였다. 수집된 어휘의 빈도를 조사하고, 어휘 적절성을 평가하여 감성어라고 생각될 수 있는 어휘들만을 정리하였다. 여기서 추출된 372개의 어휘는 직물 및 직물 관련 상황에서의 감성어로 사용될 수 있을 분만 아니라 유사 분야의 감성어 모형에 대한 기본 자료로 활용될 수 있을 것이다. 어휘들 간 관계구조에 대한 분석은 몇 가지 면에서 이뤄졌다. 자유연상 과제를 실시하여 어휘들 간 관계의 연결망(network)을 확인할 수 있었다. 어휘들이 내포하고 있는 의미의 여러 측면에서 어휘들 간 관계를 파악할 수 있도록 어휘들에 대해 다차원 분석을 실시한 결과 어휘 간 관계는 3차원이면 충분히 설명될 수 있는 것으로 나타났다. 두 개의 주차원을 중심으로 어휘들의 공간 분포를 그리고 이들 어휘를 범주로 분류한 결과 대략 11개의 범주로 어휘들을 나눠볼 수 있었다.

  • PDF

반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템 (A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary)

  • 명재석;이동주;이상구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.68-75
    • /
    • 2007
  • 웹 2.0 시대에 사용자가 작성한 리뷰는 다양한 활용성을 갖는 가치있는 데이터이다. 특히 온라인 쇼핑몰에서의 상품평은 사용자의 구매 결정에 직접적인 영향을 미치는 중요한 정보이다. 본 논문에서는 실제 쇼핑몰 사이트에 있는 상품평을 분석하여 각 상품의 특징과 이에 대한 사용자의 의견을 요약하는 상품평 분석 시스템을 설계하고 구현하였다. 각 상품평을 분석하는 과정에서는 자연언어처리 기법과 의미 사전을 사용한다. 의미 사전에는 상품의 특징을 표현하는 어휘와 각 어휘들의 극성(Polarity) 정보들을 반자동으로 정의할 수 있도록 구현하였다. 이에 더하여 문맥에 따라 다른 의미를 갖는 어휘에 대한 처리 방법에 대해서도 논의한다. 실험은 2개 상품 분류의 63개 실제 리뷰를 대상으로 수행하였으며 결과로 평균 88.94%의 정확률, 47.92%의 재현율을 나타냈다.

  • PDF

어휘정보와 명사의미정보를 이용한 사용자 질의문장 분석 (Question Analysis using Lexico Information and Noun Semantic Information)

  • 정규철;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.185-189
    • /
    • 2003
  • 고성능의 질의 응답 시스템을 구현하기 위해서는 질의 유형 분류기의 성능이 중요하다. 본 논문에서는 복잡한 분류규칙이나 대용량의 사전 정보를 이용하지 않고 질의문에서 의문사에 해당하는 어휘들을 이용하여 질의 유형을 결정하고, 의문사 주변에 출현하는 명사들의 의미 정보를 이용하여 세부적인 정답유형을 결정할 수 있는 질의 유형분류기를 제안한다. 의문사에 해당하는 어휘가 생략된 경우는 질의문의 마지막 어절의 의미 정보를 이용하여 질의유형을 분류한다. 의문사 주변의 명사들이 마지막 어절에 출현하는 명사들에 대해 동의어 정보와 접미사 정보를 이용하여 질의 유형 분류의 성능을 향상시킨다. 본 논문에서 제안한 시스템은 질의 유형에 대한 분류는 97.4%의 정확도를 보였다.

  • PDF

문맥 및 어휘 그룹 기반 지능형 영어 어휘 학습 시스템 설계 (A Design of an Intelligent English Vocabulary Learning System based on Context and Vocabulary Group)

  • 김도현;옥준혁;장홍준;황요한;김병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.88-90
    • /
    • 2022
  • 영어 교육 시장이 증대되면서 영어 학습을 효과적으로 지원하는 다양한 학습 시스템들이 개발되고 있다. 영어문장을 구성하는 기본적인 단위는 어휘로 문장 전체의 의미를 파악하기 위해서는 어휘의 의미를 이해하는 것이 필수적이다. 따라서 영어 어휘 능력 향상을 위한 다양한 영어 어휘 학습 시스템들이 개발되고 있으나, 어휘가 사용되는 문맥을 고려하거나 동시에 학습하면 효과적인 어휘 등 어휘 학습에 효과적인 교수학습 방법의 원리가 적용된 영어 어휘 학습 시스템에 대한 연구는 미비한 상황이다. 본 논문에서는 n 개의 영어 단어가 하나의 그룹으로 동시에 제시되면서 그 n개의 영어 단어가 모두 포함된 예문을 제공하는 지능형 영어 어휘 학습 시스템을 설계한다. 임의로 n 개의 영어 어휘가 주어졌을 경우 문맥에 맞게 영어 예문을 자동으로 생성하는 지능형 영어 문장 생성 모델이 본 연구의 핵심이다. 또한, 어휘 능력 평가에서 기존 어휘 학습 시스템과 같이 단순히 어휘를 얼마나 암기하고 있는지에 대한 평과 결과만을 제시하는 것이 아니라, 그룹별 취약 어휘 분석을 통해 효과적인 그룹 어휘 선택 규칙을 파악할 수 있는 기반을 마련하고자 한다. 본 논문에서 제안한 지능형 영어 어휘 학습 시스템을 통해 영어 어휘 학습자들의 학습 능력 향상에 도움이 될 것으로 기대한다.

단어의 의미연상을 이용한 시소러스 설계 (Thesaurus Construction Using Word Association)

  • 한승희
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2006년도 제13회 학술대회 논문집
    • /
    • pp.233-238
    • /
    • 2006
  • 본 연구에서는 단어의 의미연상을 이용하여 시소러스를 작성해봄으로써 탐색 시소러스 구축에 있어 단어연상검사법의 적용가능성을 살펴보았다. 문헌정보학 분야를 대상으로 단어연상검사를 실시한 후 자극어와 반응어간의 의미관계를 파악하고 반응어와 통제어휘를 비교 분석하였다. 실험 및 분석결과, 단어연상검사를 이용하면 다양한 연관관계 용어들을 시소러스에 포함시킬 수 있으며, 통제어휘집에 나타난 하위관계와 동등관계 용어들을 어느 정도 반영할 수 있다는 것을 확인하였다. 단어의 의미연상을 이용하여 구축된 탐색 시소러스는 정보검색환경에서 질의확장에 응용될 수 있다.

  • PDF

감성 측정을 위한 우리말 형용사의 의미구조 (Measuring meaning of korean adjectives and colors)

  • 박미자;신수길;한광희;황상민
    • 감성과학
    • /
    • 제1권2호
    • /
    • pp.1-11
    • /
    • 1998
  • 최근 감성연구의 한 측정 방법으로 의미변별 기법을 이용해 형용사를 제시하는 연구가 증가하고 있다. 본 연구는 의미변별 기법을 사용하는 감성 연구의 기초적인 연구로서 우리말 형용사의 전체적인 의미구조를 분석해 보았다. 우리말 형용사의 의미구조는 기존의 다른 언어권에서 얻은 연구결과와 거의 일치하는 것으로 나타났다. 전체 형용사의 의미구조는 다섯 요인으로 나타났으나, 기존 연구들과 마찬가지로 세 요인이 주요 요인으로 작용했다. 한편, 이러한 의미구조가 색채라는 특정 자극과 관련해서 나타나는 의미구조를 파악하기 위해 NCS단색과 형용사 쌍을 사용하여 측정하였다. 색채 이미지와 관련된 형용사의 의미구조도 세부적인 차이는 있으나, 첫 연구에서 발견된 결과와 크게 다르지 않았다. 감성의 표현수단으로서 어휘를 고려할 때, 이 결과는 사용하는 어휘가 다를지라도 기저에 있는 의미구조는 문화에 상관없이 보편적이라는 것을 제시한다. 다시 말해 어휘로 표현되는 감성의 기본구조가 공통적일 수 있음을 제시한다.

  • PDF

격틀집합을 이용한 한국어 형용사 유형 분류 (The Classification of Korean Adjectives using Case Frame Set)

  • 전지은;최재웅
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.254-261
    • /
    • 2006
  • 형용사 분류에 격틀이 중요한 역할을 한다는 주장은 여러 연구에서 제기된 바 있다. 본 연구에서는 격틀이 의미 분류에 기여하는 바를 보다 체계적으로 검토하기 위하여 '격틀집합'을 활용한다. 격틀집합은 한 개의 어휘가 취할 수 있는 격틀의 집합을 말한다. 격틀집합에 근거하여 형용사를 분류할 경우, 의미적으로 연관성이 높은 그룹으로 나뉠 수 있다는 가설을 바탕으로 이러한 가설의 타당성을 검증하고 이를 입증하는 것이 본 연구의 목적이다. 아울러 본 연구에서는 그러한 가설을 검증하기 위한 구체적인 방법론을 제시한다. 격틀집합정보는 세종전자사전에 들어있는 어휘별 격틀정보를 추출하여 활용한다. 본 연구 결과 도출된 총 101개의 격틀집합 중에서 한 개의 격틀만을 갖는 유형과 어휘목록이 5개미만인 유형을 제외한 12개의 격틀집합이 주요 분석 대상으로, 본 연구에서는 그 중에서 6개를 자세히 분석한다. 격틀집합별 어휘들을 살펴보면 의미적 연관성이 파악되지 않는 어휘들도 일부 포함되어 있기는 하나, 대부분은 의미적으로 상관관계가 있음을 확인할 수 있었다 이와 같은 방법론을 통해 국어 형용사 전체의 유형, 더 나아가 국어 용언을 분류하는데 본 연구의 가설과 방법론이 활용될 수 있다.

  • PDF

한국어 명사의 내재적/외재적 의미특징 연구: 곡식, 과일, 채소 범주를 중심으로 (A Study of Intrinsic and Extrinsic Semantic Features of Korean Nouns: Focusing on the Categories of Grains, Fruits and Vegetables)

  • 정영철;이정모
    • 인지과학
    • /
    • 제15권1호
    • /
    • pp.43-67
    • /
    • 2004
  • 본 연구는 곡식, 과일, 채소의 범주에 속하는 39개 한국어 명사의 의미자질을 질적 연구방법론의 관점에서 분석하였다. 대학생을 대상으로 한 설문조사에서, 연구 대상자들에게 각 어휘항목과 연상되는 의미자질을 열거하도록 하였다. 설문자료를 귀납적으로 분석한 결과, 과일의 범주에 속하는 본보기들의 개념형성은 외재적 의미자질보다 내재적 의미자질에 의해 압도적인 영향을 받았고. 곡식과 채소범주에 속하는 본보기들은 내재적 의미자질보다는 외재적 의미자질이 더욱 중요하게 그들의 개념형성에 영향을 미쳤다. 내재적 의미자질은 지시대상 자체에 내재하는 보편적인 의미자질을 말하며, 외재적 의미자질은 특정한 상황에서의 대상과 관련된 개인적 경험이나 다른 대상과의 관계 속에서 형성되어지는 의미자질을 말한다. 하지만, 본 연구는 부록의 도표에서 나타나는 바와 같이, 한 종류의 의미자질(즉, 내재적 혹은 외재적 의미자질)이 전적으로 각 범주 본보기들의 개념을 형성하고 있지 않음을 보여준다. 과일범주 어휘의 개념에서 내재적 의미자질이 매우 두드러졌고 곡식과 채소 범주의 어휘 개념에서는 외재적 의미 자질이 두드려졌지만, 그 두 가지 종류의 의미자질들이 각 어휘의 개념형성에 일정부분씩 기여하는 것으로 드러났다.

  • PDF

한국어 어휘의미망(UWordMap)을 이용한 동형이의어 분별 개선 (Improvement of Korean Homograph Disambiguation using Korean Lexical Semantic Network (UWordMap))

  • 신준철;옥철영
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.71-79
    • /
    • 2016
  • 한국어처리 분야에서 동형이의어 분별은 의미처리를 위해서는 매우 중요하고 오랫동안 연구되어온 주제이다. 최근에 말뭉치를 학습하는 기계학습 방법이 정확률과 속도면에서 좋은 결과를 보이고 있으며, 미학습 어절을 처리하기 위해 어휘의미망을 이용한 지식기반 방법도 연구되고 있다. 본 논문은 말뭉치를 학습한 기계학습 방법에 어휘의미망과 함께 사용하는 방법을 제시한다. 이 방법의 기본 전략은 하위범주화 정보를 말뭉치화하여서 기존 말뭉치와 함께 학습시키고, 동형이의어 태깅 시점에서 분석 대상 명사의 상위어를 찾아서 학습정보와 같이 사용하는 것이다. 이 방법의 효과를 확인하기 위해 세종말뭉치와 UWordMap으로 실험을 하였으며, 정확률이 96.51%에서 96.52%로 미미하지만 상승하는 것을 확인하였다.