• Title/Summary/Keyword: 의미분별

Search Result 98, Processing Time 0.024 seconds

가변길이 윈도우를 이용한 통계 기반 동형이의어의 중의성 해소 (Statistical Word Sense Disambiguation based on using Variant Window Size)

  • 박기태;이태훈;황소현;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.40-44
    • /
    • 2012
  • 어휘가 갖는 의미적 중의성은 자연어의 특성 중 하나로 자연어 처리의 정확도를 떨어트리는 요인으로, 이러한 중의성을 해소하기 위해 언어적 규칙과 다양한 기계 학습 모델을 이용한 연구가 지속되고 있다. 의미적 중의성을 가지고 있는 동형이의어의 의미분별을 위해서는 주변 문맥이 가장 중요한 자질이 되며, 자질 정보를 추출하기 위해 사용하는 문맥 창의 크기는 중의성 해소의 성능과 밀접한 연관이 있어 신중히 결정되어야 한다. 본 논문에서는 의미분별과정에 필요한 문맥을 가변적인 크기로 사용하는 가변길이 윈도우 방식을 제안한다. 세종코퍼스의 형태의미분석 말뭉치로 학습하여 12단어 32,735문장에 대해 실험한 결과 용언의 경우 평균 정확도 92.2%로 윈도우를 고정적으로 사용한 경우에 비해 향상된 결과를 보였다.

  • PDF

지지벡터기계를 이용한 단어 의미 분류 (Word Sense Classification Using Support Vector Machines)

  • 박준혁;이성욱
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.563-568
    • /
    • 2016
  • 단어 의미 분별 문제는 문장에서 어떤 단어가 사전에 가지고 있는 여러 가지 의미 중 정확한 의미를 파악하는 문제이다. 우리는 이 문제를 다중 클래스 분류 문제로 간주하고 지지벡터기계를 이용하여 분류한다. 세종 의미 부착 말뭉치에서 추출한 의미 중의성 단어의 문맥 단어를 두 가지 벡터 공간에 표현한다. 첫 번째는 문맥 단어들로 이뤄진 벡터 공간이고 이진 가중치를 사용한다. 두 번째는 문맥 단어의 윈도우 크기에 따라 문맥 단어를 단어 임베딩 모델로 사상한 벡터 공간이다. 실험결과, 문맥 단어 벡터를 사용하였을 때 약 87.0%, 단어 임베딩을 사용하였을 때 약 86.0%의 정확도를 얻었다.

`단어-의미 의미-단어` 관계에 기반한 번역어 선택 (Translation Disambiguation Based on 'Word-to-Sense and Sense-to-Word' Relationship)

  • 이현아
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.71-76
    • /
    • 2006
  • 기계번역에서 올바른 번역 문장을 구성하기 위해서는 원시 문장의 의미를 올바르게 표현하면서 자연스러운 목적 문장을 구성하는 번역어를 선택해야 한다. 본 논문에서는 '단어-의미 의미-단어' 관계, 즉 원시언어의 한 단어는 하나 이상의 의미를 가지고 각 의미는 각기 다른 목적언어 단어로 표현된다는 점에 기반하여, 원시 단어의 의미 분별과 목적 단어 선택을 결합하여 번역어를 선택하는 방식을 제안한다. 기존의 번역방식은 원시 단어에 대한 목적단어를 직접 선택하는 '단어-단어' 관계에 기반하고 있기 때문에, 원시언어를 목적 언어로 직접 대응시키기 위한 지식을 필요로 하여 지식 획득에 어려움이 있었다. 본 논문의 방식에서는 원시 단어의 의미 분별과 목적 언어의 단어 선택의 결합을 통해 번역어를 선택함으로써, 손쉽게 획득할 수 있는 원시 언어와 목적 언어 각각의 지식원에서 번역어 선택을 위한 지식을 자동으로 추출할 수 있다. 또한 원시 언어의 의미와 목적 언어의 쓰임새를 모두 반영하여 충실도와 이해도를 모두 만족시키는 보다 정확한 번역어를 선택할 수 있다.

선호 오감 정보의 관련기호분석을 통한 감성척도 개발 (Development of Sensitivity Scale based on Taste Analysis of Preferred Five-Senses)

  • 박정순
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2002년도 춘계학술대회 논문집
    • /
    • pp.131-134
    • /
    • 2002
  • 원래 오감은 말 그대로 각 감각이 개별적으로 존재하는 것이 아니라 다섯 개의 감각이 때로는 겹치고 보완하고 서로 상승하기도 하면서 우리의 감성구조를 보다 입체적으로 구성한다. 따라서 사람들은 뭔가를 판단할 때 오감을 총동원하게 된다. 그러나 일반적으로 디자인이나 제품개발을 하기 위해 사용하는 의미분별척도는 사물의 성질이나 모양을 묘사하는 이미지 형용사를 사용하기 때문에 이런 감성구조를 파악하기에는 많은 한계를 가질 수 밖에 없다. 본 연구에서는 형용사 이미지어에 의존하는 의미분별척도법(SD법)의 한계를 밝히고, 형태, 색채, 음감, 미감, 후각, 촉감과 같은 오감 정보의 관련기호분석을 바탕으로 보다 입체적으로 감성구조를 파악할 수 있는 감성척도를 개발하였다.

  • PDF

승용차의 내부소음평가에 대한 연구사고찰 (History of Evaluation of sound and noise in passenger cars)

  • Schick, August
    • 감성과학
    • /
    • 제1권2호
    • /
    • pp.133-147
    • /
    • 1998
  • 이 글은 영구의 자동차내부 소음연구와 보버르트(Bobbert)의 첫 번재 독일어로 쓰인 연구를 다루고 있다. 승용차내부소음은 높은 적외파음향(infra sound)으로 특징지어 진다. 그런 까닭으로 그러한 종류의 소음을 A-평가계측(A-rated measurement)으로 그 영향을 파알하는 것은 한계가 있다. 자동차음향공학은 특히 인공청각(artificial head)기술의 발전, 소리의 합성적 제조 및 다양한 자동차 내부 음색(timbre)에 대한 일본연구가들 (하쉬모토, 쿠와노, 남바)에 의해 상당산 성취를 경험하였다. 위의 연구들은 무엇보다도 의미분별기법(Semantic Differentials)과 다차원측정방법(Multidimen-sional Scaling)을 사용하고 있다. 그러한 기법의 사용은 심리측정방법을 심리음향학(Psycho-acoustics), 특히 츠뷔커학파(Zwicker school)의 심리음향학 방법론과 결합한 것으로 볼 수 있다.

  • PDF

의미분별법에 의한 초등학생의 소프트웨어 이미지 분석 (Analysis of Software Image using Semantic Differential Scale in Elementary School Students)

  • 류미영;한선관
    • 정보교육학회논문지
    • /
    • 제20권5호
    • /
    • pp.527-534
    • /
    • 2016
  • 본 연구는 소프트웨어에 대해 초등학생들이 가진 이미지를 의미분별법을 이용하여 분석하였다. 검사의 항목은 총 35쌍의 소프트웨어 이미지 형용사를 선정하여 요인분석을 통해 7개의 주요인으로 구분하고 초등학생을 대상으로 조사하였다. 성별 간 SW이미지를 분석한 결과 남학생보다는 여학생이 소프트웨어를 어렵고 복잡하게 여기며 느리고 갖고 싶지 않다는 인식을 보였다. 또한 소프트웨어에 대한 자기 인식의 분석 결과 소프트웨어에 대해 잘 안다고 인식할 경우 소프트웨어에 대한 긍정적인 용어를 선호하고 있었다. 학년간 분석에서 고학년이 될수록 소프트웨어를 어렵고 복잡하며 소프트웨어의 객관적인 특징에 대한 답변을 하였다. 본 연구를 통해 소프트웨어 교육이 정규교과로 안착되는데 필요한 방향을 안내하였다.

사전에 나타난 인지정보를 이용한 단어 개념의 지식표현 (Knowledge Representation of Concept Word Using Cognitive Information in Dictionary)

  • 윤덕한;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.118-125
    • /
    • 2004
  • 인간의 언어지식은 다양한 개념 관계를 가지며 서로 망(network)의 모습으로 연결되어 있다. 인간의 언어지식의 산물 중에서 가장 체계적이며 구조적으로 언어의 모습을 드러내고 있는 결과물이 사전이라고 할 수 있다. 본 논문에서는 이러한 사전 뜻풀이 말에서 개념 어휘와 자동적인 지식획득을 통하여 의미 정보를 구조적으로 추출한다. 이러한 의미 정보가 추출되면서 동시에 자동적으로 개념 어휘의 의미 참조 모형이 구축된다. 이러한 것은 사전이 표제어 리스트와 표제어를 기술하는 뜻풀이말로 이루어진 구조의 특성상 가능하다. 먼저 172,000여 개의 사전 뜻풀이말을 대상으로 품사 태그와 의미 태그가 부여된 코퍼스에서 의미 정보를 추출하는데, 의미분별이 처리 된 결과물을 대상으로 하기 때문에 의미 중의성은 고려하지 않아도 된다. 추출된 의미 정보를 대상으로 정제 작업을 거쳐 정보이론의 상호 정보량(Ml)을 이용하여 개념 어휘와 의미 정보간에 연관도를 측정한 후, 개념 어휘간의 유사도(SMC)를 구하여 지식표현의 하나로 연관망을 구축한다.

  • PDF

한국어 어휘의미망(UWordMap)을 이용한 동형이의어 분별 개선 (Improvement of Korean Homograph Disambiguation using Korean Lexical Semantic Network (UWordMap))

  • 신준철;옥철영
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.71-79
    • /
    • 2016
  • 한국어처리 분야에서 동형이의어 분별은 의미처리를 위해서는 매우 중요하고 오랫동안 연구되어온 주제이다. 최근에 말뭉치를 학습하는 기계학습 방법이 정확률과 속도면에서 좋은 결과를 보이고 있으며, 미학습 어절을 처리하기 위해 어휘의미망을 이용한 지식기반 방법도 연구되고 있다. 본 논문은 말뭉치를 학습한 기계학습 방법에 어휘의미망과 함께 사용하는 방법을 제시한다. 이 방법의 기본 전략은 하위범주화 정보를 말뭉치화하여서 기존 말뭉치와 함께 학습시키고, 동형이의어 태깅 시점에서 분석 대상 명사의 상위어를 찾아서 학습정보와 같이 사용하는 것이다. 이 방법의 효과를 확인하기 위해 세종말뭉치와 UWordMap으로 실험을 하였으며, 정확률이 96.51%에서 96.52%로 미미하지만 상승하는 것을 확인하였다.