• 제목/요약/키워드: 의미 어휘

검색결과 555건 처리시간 0.025초

한국어 어휘의미망을 이용한 자동 수화 번역 시스템의 개발 (Development of Automatic Sign Language Translation System using Korean WordNet)

  • 김민호;최성기;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1358-1361
    • /
    • 2013
  • 한국어와 한국 수화 간 자동 번역을 위해서는 한국어-한국 수화 대역어 사전이 필요하지만, 현재 한국 수화 사전으로 가장 공신력 있는 한국 수화 사전은 등재 어휘 수가 약 12,000개에 불과하다. 이 때문에 한국어를 한국 수화로 자동 번역을 할 때 대치어가 없어 완벽하게 번역이 되지 않는다. 본 연구에서는 한국 수화 사전의 미등재어로 말미암은 번역률 저하를 최소화하고자 한국어 어휘의미망의 동의어와 상 하위어 정보를 이용한다. 또한, 자동 번역에서 빈번하게 발생하는 어의 중의성 문제도 한국어 어휘의미망의 정보를 이용하여 어의 중의성 해소 규칙을 일반화한다.

난이도 자동제어가 구현된 객관식 문항 생성 시스템 (A Sentence Generation System for Multiple Choice Test with Automatic Control of Difficulty Degree)

  • 김용범;김유섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1404-1407
    • /
    • 2007
  • 본 논문에서는 객관식 문항을 난이도에 따라 자동으로 생성하는 방법을 고안하여, 학습자 수준에 적합하도록 다양하고 동적인 형태로 문항 제시를 할 수 있는 시스템을 제안하였다. 이를 위해서는 주어진 문장에서 형태소 분석을 통해 키워드를 추출하고, 각 키워드에 대하여 워드넷의 계층적 특성에 따라 의미가 유사한 후보 단어를 제시한다. 의미 유사 후보 단어를 제시할 때, 워드넷에서의 어휘간 유사도 측정 방법을 사용함으로써 생성된 문항의 난이도를 사용자가 원하는 수준으로 조정할 수 있도록 하였다. 단어의 의미 유사도는 동의어를 의미하는 수준 0에서 거의 유사도를 찾을 수 없는 수준 9 까지 다양하게 제시할 수 있으며, 이를 조절함으로써 문항의 전체 난이도를 조절할 수 있다. 후보 어휘들의 의미 유사도 측정을 위해서, 본 논문에서는 두 가지 방법을 사용하여 구현하였다. 첫째는 단순히 두 어휘의 워드넷 상에서의 거리만을 고려한 것이고 둘째는 두 어휘가 워드넷에서 차지하는 비중까지 추가적으로 고려한 것이다. 이러한 방법을 통하여 실제 출제자가 기존에 출제된 문제를 토대로 보다 다양한 내용과 난이도를 가진 문제 또는 문항을 보다 쉽게 출제하게 함으로써 출제에 소요되는 비용을 줄일 수 있었다.

우리말 감성 어휘의 범주-차원 모형 - 직물 디자인의 시각적 요소와 관련하여 - (Category-based dimensional model of affective words)

  • 박수진;정찬섭
    • 감성과학
    • /
    • 제2권1호
    • /
    • pp.77-94
    • /
    • 1999
  • 직물 및 직물 관련 제품에서 주로 사용되는 감성 어휘들의 관계 및 구조를 분석하기 위해 잡지 및 설문 조사 과정을 통해 어휘를 수집하였다. 수집된 어휘의 빈도를 조사하고, 어휘 적절성을 평가하여 감성어라고 생각될 수 있는 어휘들만을 정리하였다. 여기서 추출된 372개의 어휘는 직물 및 직물 관련 상황에서의 감성어로 사용될 수 있을 분만 아니라 유사 분야의 감성어 모형에 대한 기본 자료로 활용될 수 있을 것이다. 어휘들 간 관계구조에 대한 분석은 몇 가지 면에서 이뤄졌다. 자유연상 과제를 실시하여 어휘들 간 관계의 연결망(network)을 확인할 수 있었다. 어휘들이 내포하고 있는 의미의 여러 측면에서 어휘들 간 관계를 파악할 수 있도록 어휘들에 대해 다차원 분석을 실시한 결과 어휘 간 관계는 3차원이면 충분히 설명될 수 있는 것으로 나타났다. 두 개의 주차원을 중심으로 어휘들의 공간 분포를 그리고 이들 어휘를 범주로 분류한 결과 대략 11개의 범주로 어휘들을 나눠볼 수 있었다.

  • PDF

단어의 의미연상을 이용한 시소러스 설계 (Thesaurus Construction Using Word Association)

  • 한승희
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2006년도 제13회 학술대회 논문집
    • /
    • pp.233-238
    • /
    • 2006
  • 본 연구에서는 단어의 의미연상을 이용하여 시소러스를 작성해봄으로써 탐색 시소러스 구축에 있어 단어연상검사법의 적용가능성을 살펴보았다. 문헌정보학 분야를 대상으로 단어연상검사를 실시한 후 자극어와 반응어간의 의미관계를 파악하고 반응어와 통제어휘를 비교 분석하였다. 실험 및 분석결과, 단어연상검사를 이용하면 다양한 연관관계 용어들을 시소러스에 포함시킬 수 있으며, 통제어휘집에 나타난 하위관계와 동등관계 용어들을 어느 정도 반영할 수 있다는 것을 확인하였다. 단어의 의미연상을 이용하여 구축된 탐색 시소러스는 정보검색환경에서 질의확장에 응용될 수 있다.

  • PDF

초등 읽기 어휘 조사 도구의 설계 (Design of Investigating Tool of the Vocabulary of the Korean Language Reading Textbooks for the Elementry School)

  • 배진성;김갑수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.556-558
    • /
    • 2003
  • 초등학생들에게 읽기 교과서는 어휘 습득에 있어 의도적인 자료의 시작으로, 그 어휘를 조사, 계량화하는 일의 의미는 매우 크다고 할 수 있다. 어휘 조사 과정의 중요한 작업은 많은 양의 자료를 색인, 계량하는 일이다. 이러한 자료 처리에 컴퓨터를 이용하면, 많은 부분을 자동화 할 수 있으며. 분석된 자료를 이용하여 다양한 작업이 가능할 것이다. 많은 양의 자료를 원활하게 처리하기 위해서는 적절한 도구가 필수적이다 이에 어휘 조사 과정을 보다 편리하게 하고, 자동으로 처리할 수 있으며, 만들어진 자료를 재활용 할 수 있는 어휘 조사 도구를 설계하게 되었다.

  • PDF

온톨로지 검색에 있어서 사용자 질의어와 온톨로지 리소스와의 상이성 해소를 위한 질의어 변환 (Query Translation for Resolving the Difference between User Query Words and Ontology Resources)

  • 김태완
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.35-44
    • /
    • 2011
  • 차세대 웹 기술로 각광 받고 있는 시맨틱 웹에서 웹 리소스는 온톨로지에 기술된 다양한 메타데이타에 의해 가용하게 되며 이러한 온톨로지를 대상으로 한 검색을 위해 SPARQL과 같은 여러 시맨틱 질의 언어가 제안되었다. 그러나 이러한 시맨틱 질의 언어를 사용자가 습득하였다 하더라도 올바른 정보를 찾기 위해서는 사용자가 온톨로지의 구조와 어휘를 잘 파악하고 있어야 한다는 어려움이 있다. 특히 사용자가 질의 언어의 문법과 복잡한 형식 논리 이론에 익숙하더라도 온톨로지 리소스 표기에 사용된 어휘를 모를 경우에는 질의 언어 작성 시 전혀 다른 어휘를 사용할 수 있으며 그에 따라 원하는 정보를 찾지 못하는 어휘 상이성 문제를 해결하여야 한다. 본 논문은 이러한 어휘 상이성 문제의 해소에 주안점을 두고 질의어의 의미와 온톨로지 어휘 사이의 의미 유사도를 이용하여 사용자가 온톨로지에 없는 질의어를 사용하였을 경우 그와 의미가 가장 가까운 온톨로지 어휘로 변환하여 줌으로써 어휘 상이성 문제를 해결하는 방안을 제안한다.

의미 정보를 이용한 한국어 복합명사 분석 (Analysis of Korean Compound Noun using Semantic Information)

  • 김수남;원상현;권혁철;주종철;이상기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.195-197
    • /
    • 1998
  • 복합명사 분석은 조합이 자유롭고 제한이 없으므로 여러 가지 모호성을 발생시킨다. 이러한 모호성을 해결하는 기존 방법으로 사전을 이용하는 방법[2]과 통계적 정보를 이용하는 방법[3,4]이 있다. 본 논문에서는 하위 범주화된 어휘 정보를 가진 전자사전을 이용하여 복합명사를 분석한다. 그리고 어휘 정보만으로 처리했을 때 의미상으로 잘못된 분석이 발생할 수 있으므로 본 논문은 복합명사를 구성하는 어휘의 정보와 특정단어의 의미에 따른 복합명사 제약조건을 규칙베이스로 구축하여 분석에 이용한다. 또한 분석에 실패한 복합명사의 유형을 분석하여 각 유형에 따른 교정 방법도 제시한다. 실험 데이터는 부산일보, 교과서, 그리고 각종 문서에서 무작위로 추출한 27,945개의 복합명사를 사용하였다. 본 논문에서 제시한 의미적 제약조건을 이용하여 분석했을 때 복합명사로 잘못 쓴 어절의 검사율이 21% 향상되었다.

  • PDF

한국어 동사의 어휘의미망 구축을 위한 중립동사의 의미분할 (Word Sense Distinction of Middle Verbs for Korean Verb Wordnet)

  • 이은령;윤애선
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권2호
    • /
    • pp.23-48
    • /
    • 2005
  • This study aims to discuss the word sense distinction of Korean middle verbs for restructuring KorLexVerb 1.0. Despite the duality of its meaning and syntactic structure, the word senses of middle verb are not clearly distinguished in current dictionaries. The underspecification causes very often mismatches that a same Korean word sense is used for two different English verb senses. A close examination on the syntactic and semantic properties of middle verb shows us that the word sense distinction and the reconstruction of hierarchical structure are indispensable. Finally, by doing this fine grained word sense distinction, we propose an alternative way of classification and description of the verb polysemy for KorLexVerb 1.0 as well as for dictionary-like language resources.

  • PDF

반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템 (A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary)

  • 명재석;이동주;이상구
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.68-75
    • /
    • 2007
  • 웹 2.0 시대에 사용자가 작성한 리뷰는 다양한 활용성을 갖는 가치있는 데이터이다. 특히 온라인 쇼핑몰에서의 상품평은 사용자의 구매 결정에 직접적인 영향을 미치는 중요한 정보이다. 본 논문에서는 실제 쇼핑몰 사이트에 있는 상품평을 분석하여 각 상품의 특징과 이에 대한 사용자의 의견을 요약하는 상품평 분석 시스템을 설계하고 구현하였다. 각 상품평을 분석하는 과정에서는 자연언어처리 기법과 의미 사전을 사용한다. 의미 사전에는 상품의 특징을 표현하는 어휘와 각 어휘들의 극성(Polarity) 정보들을 반자동으로 정의할 수 있도록 구현하였다. 이에 더하여 문맥에 따라 다른 의미를 갖는 어휘에 대한 처리 방법에 대해서도 논의한다. 실험은 2개 상품 분류의 63개 실제 리뷰를 대상으로 수행하였으며 결과로 평균 88.94%의 정확률, 47.92%의 재현율을 나타냈다.

  • PDF

정치 도메인에서 신조어휘의 효과적인 추출 및 의미 분석에 대한 연구 (Study on Effective Extraction of New Coined Vocabulary from Political Domain Article and News Comment)

  • 이지현;김재홍;조예성;이민구;최혜봉
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.149-156
    • /
    • 2021
  • 정치적 사안에 대한 대중의 의견과 인식을 객관적으로 이해하기 위한 방법으로 텍스트 마이닝을 통한 빅데이터 분석을 수행할 수 있다. 기존 어휘 사전에 기반한 텍스트 마이닝 알고리즘은 신조어와 같이 사전에 수록되지 않은 어휘를 분석하는데 한계가 나타난다. SNS를 통해 나타나는 사용자들의 의견은 많은 경우 신조어와 비속어를 포함하는데, 이러한 어휘들을 효과적으로 분석하지 못한다면 정확한 대중의 인식과 의견을 파악하기 어렵게 된다. 본 논문은 정치 섹션의 뉴스 댓글로부터 정치적 의미성을 지니는 신조어와 비속어를 효과적으로 추출하는 방법을 제안하고, 추출한 신조어휘들의 의미와 맥락을 이해하기 위한 다양한 방법을 제시하였음.