• 제목/요약/키워드: 의미분석

검색결과 12,909건 처리시간 0.04초

의존 문법과 대조 의미론을 이용한 한국어의 어휘적 중의성 해결 시스템 (Lexical Ambiguity Resolution System of Korean Language using Dependency Grammar and Collative Semantics)

  • 윤근수;권혁철
    • 인지과학
    • /
    • 제3권1호
    • /
    • pp.1-24
    • /
    • 1991
  • 본 논문은 한국어의 어휘적 중의성을 해결하는 시스템을 보여준다. 이 시스템은 의존 문법과 대조 의미론을 이용하고 있다. 의존 문법은 두 형태소 사이의 의존관계에 의하여 문장을 분석한다. 대조 의미론은 어휘적 중의성과 의미관계의 상호작용을 조사한다. 대조 의미론은 의미 프레임,의미 백터,대조,분류의 4개의 구성요소로 이루어진다. 본 시스템은 C 언어로 구성되었으며, 문자을 분석 학과 두 단어간의 의미 관계를 조사하며 어휘적 중의성을 해결한다.

뉴럴 전이 기반 한국어 의존 파싱 & 의미역 결정 통합 모델 (Neural transition-based joint models for dependency Parsing and semantic role labeling of Korean)

  • 민진우;나승훈;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.343-346
    • /
    • 2018
  • 기존의 의미역 결정은 먼저 구문 분석을 수행한 후에 해당 구문 분석 결과를 이용해 의미역 결정 테스크에 적용하는 파이프라인 방식으로 진행한다. 이러한 방식의 학습을 두 번 연이어 진행하기 때문에 시간이 오래 걸리고 또한 구문 파싱과 의미 파싱에 대해 서로 영향을 주지 못하는 단점이 존재하였다. 본 논문에서는 의존 파싱과 의미역 파싱을 동시에 진행하도록 전이 액션을 확장한 의존 파싱 & 의미역 결정 통합 모델을 제안하고 실험 결과, Korean Prop Bank 의미역 결정 데이터 셋에서 파이프라인 방식 전이 기반 방식을 사용한 모델보다 논항 인식 및 분류(AIC) 성능에서 F1 기준 0.14% 높은 결과을 보인다.

  • PDF

ARGUMENT STRUCTURE ALTERNATIONS IN ENGLISH AND KOREAN

  • 김미숙
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.59-73
    • /
    • 2001
  • 이 논문은 영어와 한국어에서 논 항구조의 교체를 허용하는 처소격 동사들의 통사구조와 의미를 비교 분석해 보려고 한다. 지금까지 연구가 논항구조의 교체를 허용하는 이런 동사들이 통사적 유사성에만 국한되어 연구가 되었을 뿐 여러 다른 통사적 형식에서 보여지는 차이점이나 논항 교체 동사들의 의미적 차이점과 같은 중요한 현상들에 대한 많은 연구가 되어지지 않았다. 따라서 첫 번째로 이 논문에서는 Pinker (1989)에 제시한 논항 교체 동사들의 의미적 분석을 구체적으로 소개하고, 이런 교체 동사들의 의미적 유사성과 차이점으로 구분한 Pinker의 의미분류들을 자세히 알아본다. 또한 Pinker가 교체동사들의 의미적 분류를 위해 사용한 통사적 기준인 논항 생략 (PP-omission test)을 소개한다. 두 번째로 영어의 논항 교체 동사들에 해당하는 한국어 동사들의 통사적 형태를 알아봄으로써 영어와 한국어에서의 통사적 유사성과 차이점을 알아본다. 세 번째로 영어와 한국어에서 나타나는 통사적 차이점의 설명을 위해 Pinker가제시한 의미 분류들을 수정한 새로운 분류를 제시한다 마지막으로 Jackendoff (1996)에서 제시된 의미적 설명이 영어의 논항 교체 동사에 해당하는 한국어 동사들의 통사적 형태들의 다양성을 설명할 수 있음을 보여준다

  • PDF

초등 수학 교과서와 국어사전에서 부여하는 수학 용어의 의미에 대한 비교 분석 (A Comparative Analysis of the Meaning of Mathematical Terms in Elementary Mathematics Textbooks used in Korea and a Korean Dictionary)

  • 강윤지
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제26권1호
    • /
    • pp.15-28
    • /
    • 2023
  • 학교 수학에서 수학 용어의 의미를 통해 수학적 개념이 학습되기 때문에 학습자는 수학 용어를 정확하게 이해하고 알맞게 사용해야 한다. 그러나 초등 수학 교과서와 실생활에서 사용하는 수학 용어의 의미가 다르게 인식될 수 있으며 이러한 불일치는 학습자의 수학 용어 이해에 혼란을 야기할 수 있다. 따라서 학교 수학에서의 의미와 실생활에서의 의미를 살펴보기 위하여 초등 수학 교과서와 국어사전에서 서술하는 수학 용어의 의미를 비교 분석하여 수학 용어를 학습하는 과정에 대한 교수학적 시사점을 제공하고자 하였다. 분석 결과, 교과서의 의미와 국어사전의 의미가 유사하게 나타나는 경우도 있으나 각각의 의미가 일치하지 않는 경우, 각각의 의미가 가리키는 대상이 다른 경우가 나타났다. 이러한 경우 학습자의 혼란을 막기 위하여 교과서의 의미와 국어사전의 의미 간 차이를 인식하고 각각의 의미를 보완하여 지도할 필요가 있다.

대규모 말뭉치와 전산 언어 사전을 이용한 의미역 결정 규칙의 구축 (Rule Construction for Determination of Thematic Roles by Using Large Corpora and Computational Dictionaries)

  • 강신재;박정혜
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.219-228
    • /
    • 2003
  • 본 논문은 한국어정보처리 과정에서 구문 관계를 의미역으로 사상시키기 위한 규칙을 효과적으로 구축하는 방법을 제시하고 있다. 의미역의 결정은 의미 분석의 핵심 작업 중 하나이며 자연어처리에서 해결해야 하는 매우 중요한 문제 중 하나이다. 일반적인 언어학 지식과 경험만 가지고 의미역 결정 규칙을 기술하는 것은 작업자의 주관에 따라 결과가 많이 달라질 수 있으며, 또 모든 경우를 다룰 수 있는 규칙의 구축은 불가능하다. 하지만 본 논문에서 제시하는 방법은 대량의 원시 말뭉치를 분석하여 실제 언어의 다양한 사용례를 반영하며, 또 수십 명의 한국어 학자들이 심도 있게 구축하고 있는 세종전자사전의 격틀 정보도 함께 고려하기 때문에 보다 객관적이고 효율적인 방법이라 할 수 있다. 의미역을 보다 정확하게 결정하기 위해 구문관계, 의미부류, 형태소 정보, 이중주어의 위치정보 등의 자질 정보를 사용하였으며, 특히 의미부류의 사용으로 인해 규칙의 적용률이 향상되는 효과를 가져올 수 있었다.

의미 분석 (Meaning Analysis)

  • 이건원
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.419-423
    • /
    • 2000
  • 성공적인 의사소통의 경우에 성(性)이, 이(理)와 명(命)으로 나타난 것이 같다. 진리(aletheia)가, 언어(logos)와 운명(moira)으로 나타난 것들이 일치하는 것이 성공적인 언화행위가 된다. 측정대상(melos)과 본체(ousia)가 구분되는 것은 언어와 운명의 괴리가 있을 수 있기 때문이다. 체계적인 언어처리의 지식기반을 측정대상에 한정한다. (1) 철학의 시작은 더 옳은 언어표현의 정의(definition)로 이전의 잘못 사용된 언어처리를 대체시키는 것으로 소크라테스는 보았다. [R. Crossman] (2)잘못을 지적하는 등에(Tabanidae)의 역할과 옳은 지식의 상기를 돕는 산파법(maieutics)이 소크라테스의 의미분석의 방법이다. [R. Crossman] (3) 언어를 통하여 진리를 추구한다는 입장(via language)에서 한 언어표현이 그 진리의 운명으로 나타남과 어긋날 때, 운명을 택하는 것은 조화 보다 더 안정의 우위를 인정하는 논리적인 입장으로 합리성 보다 실용(pragma)의 우위를 인정하는 것이다. [W. Quine] (4) 공동체의 공통규범의 추구는 그 언어 속의 공통의 형식 또는 법칙의 추구에 기초하는 것이 자연스럽다. 여기에서 그 언어사용은 그 기저의 법칙(underlying rule)에 개입한다는 입장에 기초한다. [J. Searle] (5) 진리의 언어표현과 운명적인 사태들 사이의 괴리를 처리하기 위하여 체계적인 언어표현의 대상(The Young Tableaux)과 실제(The continuum)의 구분을 수용한다. [AMS(2000)]언어표현의 대상은 나타난 것(顯)이고 실제에는 나타나지 않은 것도 있다. [伊川, 明道] (6) 이 나타난 것과 나타나지 않은 것에 간격이 없다는 것(顯微無間)은 그 의사소통이 성공적인 것이라는 것을 말한다. 따라서 그 언어의 표현완전성(functional completeness)은 언화행위가 성공적이라는 것이다. [J. Searle] (7) 수로 쓰인 것(象數)과 시로 쓰인 것(義理)이 하나인 것은 그 나타난 것과 나타나지 않은 것들 사이에 어떠한 틈도 없음을 말한다. [成中英] (8) 공통의 규범의 공통성 속에 규범적인 측면이 벌써 있다. 공통성에서 개인적이 아닌 공적인 규범으로의 전이는 규범, 가치, 규칙, 과정, 제도로의 전이라고 본다. [C. Morrison] (9) 우리의 언어사용에 신비적인 요소를 부인할 수가 없다. 넓은 의미의 발화의미(utterance meaning) 속에 신비적인 요소나 애정표시도 수용된다. 의미분석은 지금 한글을 연구하고, 그 결과에 의존하여서 우리의 실제의 생활에 사용하는 $\boxDr$한국어사전$\boxUl$등을 만드는 과정에서, 어떤 의미에서 실험되었다고 말할 수가 있는 언어과학의 연구의 결과에 의존하여서 수행되는 철학적인 작업이다. 여기에서는 하나의 철학적인 연구의 시작으로 받아들여지는 이 의미분석의 문제를 반성하여 본다.

  • PDF

구문의미트리 비교기를 이용한 유사문서 판별기 (Discriminator of Similar Documents Using the Syntactic-Semantic Tree Comparator)

  • 강원석
    • 한국콘텐츠학회논문지
    • /
    • 제15권10호
    • /
    • pp.636-646
    • /
    • 2015
  • 정보사회에 문서 복제나 표절의 검출에 대한 필요성이 증대되고 있다. 그 필요성에 따라 많은 연구가 이루어지고 있으나 자연어 처리의 문제가 유사 문서 판별의 질 향상에 제약이 되었다. 최근 구문의미분석의 기술을 접목하여 유사문서 판별의 성능을 향상을 시도하였으나 구문의미분석의 결과인 구문의미트리를 비교하는 어려움이 있었다. 본 논문은 구문의미트리의 유사도를 계산하는 구문의미트리 비교기를 개발하고 이를 이용하여 유사문서를 판별하는 시스템을 설계, 구현한다. 본 시스템의 성능을 실험하기 위하여 휴먼 판별과 제안한 시스템의 판별과의 상관계수를 분석하였다. 실험결과, 구문의미트리 비교기를 이용한 유사문서 판별기의 성능을 검증할 수 있었다. 앞으로 문서 유형을 정의하고 각 유형에 맞는 판별 기법을 개발할 필요가 있다.

의미정보모델 구축을 위한 색채정보의 수집과 정량적 분석 (Collecting and Analyzing Color Information for Constructing Semantic Information Model)

  • 류기곤;선동언;김현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.232-235
    • /
    • 2011
  • 지식표현은 일반적으로 논리, 규칙, 프레임 또는 의미망 형태로 표현되며, 최근에는 의미망을 이용한 온톨로지 형태로 표현되고 있다. 이러한 지식표현 방법은 개념을 설명하는 문맥적인 정보나 개념들 간의 구조적인 정보를 이용하여 개념에 대한 지식을 논리적으로 표현하는데 중점을 두었다. 하지만, 지식표현에 사용되는 의미정보는 사람에 의해 수집되고 정제되기 때문에 많은 시간, 비용 및 인력이 필요하다는 한계가 있고, 새로운 의미를 추가하거나 기존의 의미를 수정하는 것이 매우 어렵다는 한계가 있다. 색채는 특정 대상이나 개념에 대한 의미, 연상, 상징 등 객관적인 특징 뿐 아니라 시대, 나라, 문화와 같은 사회적 배경을 반영하기 때문에, 정보를 제공하고 감성을 전달하는 효과적인 수단으로 사용되고 있다. 이에 본 논문은, 색채를 이용한 의미정보모델 구축을 위해, 색채정보를 수집하고 정량적으로 분석하는 방법을 제안한다. 긍정/부정/불안/중립으로 구성된 감성어휘 273개를 이용하여 이미지를 수집한 결과 총 130,944개의 이미지를 수집하였다. 이미지에는 여러 가지 사물, 행동, 배경, 색채 등 다양한 정보가 혼재되어 있어 감성어휘와 연관된 색채를 구별하기 어렵기 때문에 이미지를 직관적으로 설명할 수 있는 사용자 태그를 별도로 수집하였다. 태그는 총 2,836,395개를 수집하였고 각 이미지와 그룹에서의 가중치를 구하였다. 태그의 가중치를 통해 이미지가 그룹 내에서 갖는 중요도를 판별하였고, 각 그룹 별로 상위 30%의 이미지를 추출하여 대표 색채를 분석하였다.

상수도시스템 수질사고의 전개양상을 고려한 비정형정보 의미분석 (Semantic analysis of unstructured information considering the step in progress of water quality accidents in the water supply systems)

  • 홍성진;문기훈;양성훈;유도근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.378-378
    • /
    • 2022
  • 상수도시스템의 과정 중 최종 단계인 급수단계에서 지역전반에 수질문제가 발생할 경우, 직간접적인 피해의 해결은 장기간 지속될 수 있다. 본 연구에서는 실시간 비정형정보의 빅데이터 분석을 통해 상수도시스템에서 수질사고 문제의 파급력과 2차 피해 등의 연결 관계 변화 추적을 위한 기초적 분석을 수행하였다. 과거 대규모 수질사고가 발생된 바 있는 인천광역시 유충발생 사고를 대상으로 뉴스 기사 웹크롤링 절차를 정립하고, 그 결과를 분석하였다. '인천 유충'이 최초 보도되었던 2020년 7월 13일 부터 이후 1년을 대상으로 네이버 통합검색에 의해 표출되는 뉴스기사를 웹크롤링하였으며, 프로그래밍을 통한 불용어 제거 및 관련성 검토를 통해 총 920건의 기사를 분석하였다. 수질사고의 전개양상에 따라 사고발생, 확산, 수습, 그리고 보상의 4단계로 임의 구분하여 분석하였다. 의미분석을 위한 토픽모델링 기법은 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 방법을 적용하였으며, 긍부정 감정분석은 KNU 한국어 감성사전(KNU sentiment lexicon)을 활용하여 수행하였다. 토픽 모델링 결과, 사고 발생에서부터 확산, 수습, 보상의 단계에 맞춰 적절한 주제어의 조합에 따른 기사들이 도출되었으며, 단계별 긍부정 기사 비율역시 사고의 전개단계에 따라 적절히 나타남을 확인하였다. 제시된 수질사고 관련 비정형정보 분석 방법론과 결과는 과거 사고 사례 분석을 통한 검색 및 긍부정 키워드 확정, 키워드 발생 비율 변동(사고전과 후)에 따른 상황판단 기준설정 등에 활용이 가능하다.

  • PDF

한글 감정단어의 의미적 관계와 범주 분석에 관한 연구 (A Study on the Analysis of Semantic Relation and Category of the Korean Emotion Words)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권2호
    • /
    • pp.51-70
    • /
    • 2016
  • 이 연구의 목적은 한글로 된 주요감정단어들의 리스트를 대상으로 의미적 관계의 네트워크와 극성과 각성의 범주를 분석하는데 있다. 분석결과는 다음과 같다. 첫째, 감정단어 네트워크에서 각 감정단어들은 의미적으로 연결되어 있었다. 이것은 의미적 유사성에 따라 감정단어들의 유형을 구분하는 것을 어렵게 하는 특징이다. 대신에 의미적 관계의 감정단어 네트워크에서 중심적인 역할을 수행하는 감정단어들을 확인할 수 있었다. 둘째, 극성과 각성의 차원을 혼합한 범주에서, 많은 감정단어들은 부정적인 극성과 높은 각성의 단어들 집단과 부정적인 극성과 중간수준 각성의 단어들 집단으로 분류되었다. 이러한 한글감정단어의 특성들은 도서관이나 문헌정보에 나타나는 각종 텍스트 데이터의 감정분석에 유용하게 활용될 것이다.