• 제목/요약/키워드: 어휘의미분석

검색결과 255건 처리시간 0.025초

언어 장애인의 언어보조 시스템을 위한 아이콘 언어의 구현 (Implementation of Iconic Language for the Language Support System of the Language Disorders)

  • 추교남;우요섭;민홍기
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.479-488
    • /
    • 2006
  • 언어 장애인에게 기존의 키보드에 의한 문자입력 방법보다 원활하고 편리한 의사전달 환경을 제공하기 위한 아이콘 언어 인터페이스를 설계한다. 이를 위하여 활용성이 높은 대화 영역으로부터 구축한 원시 말뭉치를 대상으로 어휘 구사 경향과 특성을 분석하고 형태소, 구문, 의미 분석을 적용하여 아이콘에 부여되는 한국어의 어휘와 의미를 추출한다. 사용자가 직관적으로 인지하고 전달할 수 있는 아이콘 영역을 선별하고 추출한 한국어의 어휘와 의미를 정합시킨다. 이웃하는 아이콘간의 연결로부터 전달하고자 하는 의미적 상황을 만들어내기 위하여, 아이콘 언어의 어휘와 품사, 문법 규칙, 의미체계를 정의하여 아이콘 언어를 설계한다. 아이콘 언어에서 나타날 수 있는 언어적 애매성을 해결하기 위한 방법으로 범용의 한국어 의미사전과 술어 중심의 하위범주화사전으로부터 아이콘 언어에 대한 상황중심의 의미 데이터를 구축한다. 이를 바탕으로 아이콘 언어 인터페이스로부터 한국어를 의미적인 범주에서 생성한다.

난이도 자동제어가 구현된 객관식 문항 생성 시스템 (A Sentence Generation System for Multiple Choice Test with Automatic Control of Difficulty Degree)

  • 김용범;김유섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1404-1407
    • /
    • 2007
  • 본 논문에서는 객관식 문항을 난이도에 따라 자동으로 생성하는 방법을 고안하여, 학습자 수준에 적합하도록 다양하고 동적인 형태로 문항 제시를 할 수 있는 시스템을 제안하였다. 이를 위해서는 주어진 문장에서 형태소 분석을 통해 키워드를 추출하고, 각 키워드에 대하여 워드넷의 계층적 특성에 따라 의미가 유사한 후보 단어를 제시한다. 의미 유사 후보 단어를 제시할 때, 워드넷에서의 어휘간 유사도 측정 방법을 사용함으로써 생성된 문항의 난이도를 사용자가 원하는 수준으로 조정할 수 있도록 하였다. 단어의 의미 유사도는 동의어를 의미하는 수준 0에서 거의 유사도를 찾을 수 없는 수준 9 까지 다양하게 제시할 수 있으며, 이를 조절함으로써 문항의 전체 난이도를 조절할 수 있다. 후보 어휘들의 의미 유사도 측정을 위해서, 본 논문에서는 두 가지 방법을 사용하여 구현하였다. 첫째는 단순히 두 어휘의 워드넷 상에서의 거리만을 고려한 것이고 둘째는 두 어휘가 워드넷에서 차지하는 비중까지 추가적으로 고려한 것이다. 이러한 방법을 통하여 실제 출제자가 기존에 출제된 문제를 토대로 보다 다양한 내용과 난이도를 가진 문제 또는 문항을 보다 쉽게 출제하게 함으로써 출제에 소요되는 비용을 줄일 수 있었다.

  • PDF

명사류 의미망 구축을 위한 사전 뜻풀이의 어휘구조분석 (Lexical Analysis of Dictionary Definitions for Constructing Semantic Networks)

  • 한영균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.326-332
    • /
    • 1994
  • 본 연구에서는 중사전 규모의 현대국어사전에서 약 5,000 개의 표제항목의 뜻풀이 8,000여 항에 사용된 어휘를 분석한 결과를 제시하였다. 분석 결과 명사류의 의미구조에서 최상위계층에 속하는 것들이 사전의 뜻풀이에 자주 사용됨을 확인할 수 있었고, 아울러 뜻풀이에 사용되는 단어들이 어느 정도 통제된 상태임을 알 수 있었다. 그러나 표제항목과 뜻풀이에 사용된 단어들 사이의 관계만을 바탕으로 해서는 의미망을 구축하기 어려웠는데, 그것은 국어사전에서의 뜻풀이가 지니고 있는 구조적 문제에서 기인하는 것이다. 즉 일부 한자어의 경우에는 명사로 정의되지 않으며, 그 결과 표제명사와 뜻풀이에 사용된 명사 사이의 관계를 바탕으로 한 의미망의 구축에 포함되지 않는 것이다. 또한 순환적 뜻풀이의 경우 역시 의미망 구축에 장애요소로 작용함을 밝혔다.

  • PDF

아동영문어휘책에 제시된 그림과 문자의 사용에 대한 분석 (Analysis on the Use of Picture and Letter Used in the Books of English Vocabulary for Children)

  • 이미영
    • 한국콘텐츠학회논문지
    • /
    • 제14권1호
    • /
    • pp.150-157
    • /
    • 2014
  • 본 논문은 현재 출간된 아동영문어휘책의 현황분석을 통해 그림과 문자의 관계적 속성을 이해하고 사용자인 아동을 고려해 시각적 심상을 얼마나 잘 활용하고 있는가를 파악하고자 하였다. 이에 아동영문어휘책에 사용된 그림의 유형과 그림의 활용도, 그림과 문자의 결합 형태, 그림과 문자와의 의미일치도 정도를 살펴보았다. 분석결과 그림의 활용도는 일러스트, 만화, 일러스트와 만화의 혼용 순으로 전반적으로 높은 것으로 나타났다. 그림과 문자의 결합 형태에서는 그림+어휘형, 일러스트가 없는 문자형, 그림문자형 순으로 나타났다. 특히나 그림과 문자의 의미일치도가 높을수록 학습에 효과적인데 반해 의미일치도는 전반적으로 낮게 나타났다. 의미일치도가 높게 나타난 5개의 그룹 중 그림문자형이 가장 높은 결합형태 빈도를 보이고 있었다. 따라서 현재 출간된 아동영문어휘책에 나타난 그림과 문자의 제시형태는 비슷한 형태로 출판사별로 출간되고 있음을 알 수 있었고 아동의 다양한 수준을 바탕으로 한 효과적인 디자인연구가 필요하다고 보아진다.

반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템 (A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary)

  • 명재석;이동주;이상구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권6호
    • /
    • pp.392-403
    • /
    • 2008
  • 사용자가 작성한 리뷰는 다양한 활용성을 갖는 가치 있는 데이타이다. 특히 온라인 쇼핑몰에서의 상품평은 사용자의 구매 결정에 직접적인 영향을 미치는 중요한 정보이다. 본 논문에서는 실제 쇼핑몰 사이트에 있는 상품평을 분석하여 각 상품의 특징과 이에 대한 사용자의 의견을 요약하고 상품의 순위를 산정하는 상품평 분석 시스템을 설계하고 구현하였다. 상품평을 분석하는 과정에서는 자연언어처리 기법과 의미 사전을 사용한다. 의미 사전에는 상품의 특징을 표현하는 어휘와 각 어휘들의 극성(Polarity) 정보들을 반자동화된 도구들을 활용하여 정의할 수 있도록 구현하였다. 이에 더하여 문맥에 따라 다른 의미를 갖는 어휘를 의미 사전에서 정의하고 활용하는 방법에 대해서도 논의하였다. 실험은 2개 상품 분류의 20개 상품, 1796개의 실제 상품평을 수집하여 상품의 순위를 측정하고 주요 요소를 분석하는 방식으로 진행하였다. 그 중 2개 상품에 대한 63개의 상품평에 대하여 분석의 정확률과 재현율을 측정하였으며, 평균 88.94%의 정확률, 47.92%의 재현율을 나타내었다.

어휘의미망(U-WIN)을 이용한 동형이의어 접미사의 의미 중의성 해소 (Disambiguation of Homograph Suffixes using Lexical Semantic Network(U-WIN))

  • 배영준;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권1호
    • /
    • pp.31-42
    • /
    • 2012
  • 현재까지 대부분의 한국어처리시스템에서는 가급적 많은 접미파생명사를 사전에 등재하여 처리하였다. 그러나 접미사는 생산성이 높기 때문에 모든 접미파생명사를 사전에 등재하는 것은 한계가 있다. 따라서 접미파생명사의 의미 분석을 통해서 미등재 접미파생명사를 분석할 필요가 있다. 본 논문에서는 접미파생명사의 의미 분석의 일환으로 한국어 어휘의미망(U-WIN)을 이용한 동형이의어 접미사의 중의성 해소 방법을 제시한다. 형태 의미 주석 세종 말뭉치에서 동형이의어 접미사를 포함한 33,104개의 접미파생명사를 대상으로 실험하였다. 실험을 위해 먼저 동형이의어 접미사를 의미 태깅하였으며, 접미사 앞의 어근을 추출하여 U-WIN의 노드에 매핑시켰다. 또한 동형이의어 접미사와 결합되는 U-WIN 상의 노드들에 대해 거리 가중치를 부여하여 이를 동형이의어 접미사 중의성 해소에 사용하였다. 동형이의어 접미사 49종 중 세종말뭉치에 나타난 35개의 동형이의어 접미사를 대상으로 실험한 결과 91.01%의 정확률을 보였다.

음악감상에서의 음질 평가를 위한 한국어 어휘의 의미론적 속성 분석 (Analysis of Semantic Attributes of Korean Words for Sound Quality Evaluation in Music Listening)

  • 이은영;유가을;이영미
    • 인간행동과 음악연구
    • /
    • 제21권2호
    • /
    • pp.107-134
    • /
    • 2024
  • 본 연구는 음악감상 시 지각하는 음질(sound quality)을 평가할 때, 어휘를 통한 평가가 음악 유형에 따라 달라지는지 분석하여, 음질 평가 어휘의 의미론적 속성에 대한 기초 자료를 제공하고자 하였다. 평균 9.4년의 전문 훈련을 받은 20-30대의 음악 전공자 31명이 참여하였고, 각 참여자는 성부수와 악기의 소리 산출 방식(악기군)에 따라 구성된 9개 음악을 듣고 음질을 나타내는 18개 의미단어 쌍을 평가하였다. 요인 분석을 통해 동일 요인에 영향을 받는 단어들을 그룹화하였고, 다변량 분산 분석을 통해 각 요인 그룹별로 성부 수와 악기군에 따른 차이를 확인하였다. 또한, 유의한 차이를 보이는 의미 단어 세트를 사용해 레이더 차트를 그려 각 음악별 차이를 시각적으로 분석하였다. 연구 결과, 4개 요인이 추출되었으며, '부드러운-딱딱한', '둔한-날카로운', '지저분한-정돈된', '낮은- 높은'의 단어 쌍이 음악 유형에 따라 유의한 차이를 보였다. 이 4개 단어 쌍을 바탕으로 작성된 레이더 차트는 각 음악에 대한 음질 평가를 구분하는 데 효과적이었다. 이 결과는 한국어 기반 음질평가 어휘 개발 시, 국외 연구에서 보고된 범주와는 다른 구조의 체계가 필요하며, 언어적·문화적 요인의 반영이 중요함을 시사한다. 또한, 교차 감각 대응(cross-modal correspondence)에 기반한 어휘 범주 중에서도 음향적 속성에 민감한 범주가 존재함을 확인하였다. 본 연구는 언어적·문화적 속성과 더불어 음질에 영향을 미치는 음악 요인을 반영할 수 있는 음질 평가 어휘 개발에 필요한 기술자료를 제공할 것으로 기대된다.

동양 관상학을 적용한 성격별 얼굴 설계 시스템에 관한 연구 (A Study on Facial Visualization System based on one's Personality applied with the Oriental Physiognomy)

  • 강선희;김효동;이경원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 2부
    • /
    • pp.346-357
    • /
    • 2008
  • 관상학(Physiognomy)이란 사람의 얼굴을 보고 그의 운명, 성격, 수명 따위를 판단하는 방법을 연구하는 학문을 말한다. 이 논문에서 언급하는 관상학은 동양에서 말하는 관상학, 특히 얼굴의 부분적 특성이나 전체적인 조화를 통해 성격과 운영을 예측하는 학문을 의미한다. 이 연구는 동양 관상학을 적용한 성격별 얼굴 설계 시스템 구축에 관한 것으로, 첫째, 보편적인 성격 분류를 위해 MBTI에서 다루는 성격 어휘 161개를 군집분석을 통해 39개의 대표 어휘로 추출하였다. 추출된 대표 성격 어휘의 의미상 거리를 나타내기 위하여 서베이를 통해 얻은 데이터를 다차원 척도법을 통해 2차원 공간상에 성격 어휘의 관계를 분석하였다. 둘째, 얼굴 시각화를 위해 먼저 얼굴의 형태적 특성을 결정짓는 요소를 크게 얼굴형, 눈, 코, 입, 이마, 눈썹으로 분류하고, 분류된 6가지 얼굴 형태의 29가지 하위요소 별 성격을 한국인의 얼굴 특성을 기준으로 관상학적 정리 및 숫자형식 코드화를 하였다. 추출된 대표 성격 어휘별 얼굴 요소의 형태를 앞서 정리된 코드에 따라 하나의 얼굴 형태로 조합하여 39가지 얼굴을 시각화 하여 마지막으로, 성격별 얼굴 설계 시스템 'FACE'를 제작하였다. 이 연구는 사람의 성격 특성에 따라 그에 맞는 얼굴 형태를 구현하는 시스템을 제작하여 일반 사용자 뿐 아니라 애니메이션 캐릭터 개발자에게 객관적인 도움을 줄 수 있으며 또한 예로부터 내려오는 관상학의 적용 범위를 넓힐 수 있는 가능성을 보여주었다고 할 수 있다.

  • PDF

양방향 LSTM을 적용한 단어의미 중의성 해소 감정분석 (Emotion Analysis Using a Bidirectional LSTM for Word Sense Disambiguation)

  • 기호연;신경식
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.197-208
    • /
    • 2020
  • 어휘적 중의성이란 동음이의어, 다의어와 같이 단어를 2개 이상의 의미로 해석할 수 있는 경우를 의미하며, 감정을 나타내는 어휘에서도 어휘적 중의성을 띄는 경우가 다수 존재한다. 이러한 어휘들은 인간의 심리를 투영한다는 점에서 구체적이고, 풍부한 맥락을 전달하는 특징이 있다. 본 연구에서는 양방향 LSTM을 적용하여 중의성을 해소한 감정 분류 모델을 제안한다. 주변 문맥의 정보를 충분히 반영한다면, 어휘적 중의성 문제를 해결하고, 문장이 나타내려는 감정을 하나로 압축할 수 있다는 가정을 기반으로 한다. 양방향 LSTM은 문맥 정보를 필요로 하는 자연어 처리 연구 분야에서 자주 활용되는 알고리즘으로 본 연구에서도 문맥을 학습하기 위해 활용하고자 한다. GloVe 임베딩을 본 연구 모델의 임베딩 층으로 사용했으며, LSTM, RNN 알고리즘을 적용한 모델과 비교하여 본 연구 모델의 성능을 확인하였다. 이러한 프레임워크는 SNS 사용자들의 감정을 소비 욕구로 연결시킬 수 있는 마케팅 등 다양한 분야에 기여할 수 있을 것이다.

초등학교 3~4학년군 수학 교과서 및 익힘책의 어휘 적정성 분석 (Analysis of the Adequacy of Vocabulary in Elementary Mathematics Textbooks and Workbooks for Grades 3~4)

  • 방정숙;권미선
    • 대한수학교육학회지:학교수학
    • /
    • 제18권4호
    • /
    • pp.903-922
    • /
    • 2016
  • 본 연구는 초등학교 3~4학년군 수학 교과서 및 익힘책에 사용된 어휘의 적정성을 살펴보았다. 연구 대상은 3~4학년군 수학과 수학 익힘책으로, 수학의 본문 차시와 본문 이외의 차시, 수학 익힘책의 본문 차시로 구분하여 분석을 실시하였다. 어휘 적정성 분석은 9등급 어휘 체계에 따라 이루어졌으며, 빈도 분석도 함께 실시하였다. 연구 결과, 수학 교과서 및 익힘책에 제시된 어휘 중 3~4학년 수준보다 높은 등급의 어휘는 약 3~8%로 나타났다. 높은 등급의 어휘의 경우 학생들의 이해를 돕기 위해 그림과 함께 제시되기도 하였지만, 일부 어휘의 경우 그림이 제시되어 있지 않거나 그림에서 어휘의 의미를 제대로 파악하기 어려운 경우도 있었다. 빈도 분석 결과 3~4학년군 수학 교과서의 본문 차시에 공통적으로 알아보다, 나타내다, 수, 몇, 방법 등의 어휘가 많이 사용된 것으로 나타났다. 이러한 연구 결과를 토대로 수학 교과서 개발과 관련하여 학생들의 수준에 적합한 어휘 사용에 관한 시사점을 제공하고자 한다.