• Title/Summary/Keyword: 의미부류

검색결과 56건 처리시간 0.024초

의미 중의성을 고려한 온톨로지 기반 메타데이타의 자동 생성 (Ontology-based Automated Metadata Generation Considering Semantic Ambiguity)

  • 최정화;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.986-998
    • /
    • 2006
  • 인터넷의 발전으로 방대해진 정보를 컴퓨터가 이해하고 효율적으로 관리하기 위해서는 시맨틱 웹 기반의 메타데이타가 반드시 필요하다. 그러나 메타데이타 생성 시 의미 중의성을 가진 정보가 존재하며 이 문제의 해결책이 필요하다. 본 논문에서는 순차적으로 존재할 수 있는 단어들의 확률 모델을 이용하여 문서와 같은 정보에 포함된 의미가 애매한 단어를 관련성이 높은 모델의 개념으로 메타데이타를 생성하는 방법을 제안한다. 제안한 방법에서 메타데이타를 생성 할 때, 온톨로지에 정의된 개념들 간의 중의성을 고려하고 명칭(named entity)의 일부 단어에 대한 인식을 위해 은닉 마르코프 모델(Hidden Markov Model)을 사용한다. 먼저 온톨로지에 정의된 각 클래스(class)의 인스턴스(instance)를 인식하기 위한 마르코프 모델을 생성한다. 다음으로 문서로부터 의미가 애매한 단어의 의미를 파악할 수 있는 상황정보(Context)를 생성하고, 상황정보에 포함된 단어들의 순서에 대응하는 최적의 마르코프 모델을 찾아 메타데이타 생성시의 중의성 문제를 해결한다. 제안한 방법으로 전산학관련 논문에 대해 의미가 애매한 7개의 단어를 추출하여 실험하였다. 그 결과 상황정보에 존재하는 개체(entity)의 의미부류들 중 가장 빈번한 의미 부류로 애매한 단어의 의미를 선정한 SemTag보다 정확도 면에서 38%정도의 나은 성능을 나타내었다.

논항 정보 기반 "요리 동사"의 어휘의미망 구축 방안 (The Construction of Semantic Networks for Korean "Cooking Verb" Based on the Argument Information.)

  • 이숙의
    • 한국어학
    • /
    • 제48권
    • /
    • pp.223-268
    • /
    • 2010
  • The purpose of this paper is to build a semantic networks of the 'cooking class' verb (based on 'CoreNet' of KAIST). This proceedings needs to adjust the concept classification. Then sub-categories of [Cooking] and [Foodstuff] hierarchy of CoreNet was adjusted for the construction of verb semantic networks. For the building a semantic networks, each meaning of 'Cooking verbs' of Korean has to be analyzed. This paper focused on the Korean 'heating' verbs and 'non-heating'verbs. Case frame structure and argument information were inserted for the describing verb information. This paper use a Propege 3.3 as a tool for building "cooking verb" semantic networks. Each verb and noun was inserted into it's class, and connected by property relation marker 'HasThemeAs', 'IsMaterialOf'.

인간언어공학에의 활용을 위한 이종 개념체계 간 사상 - 세종의미부류와 KorLexNoun 1.5 - (Mapping Heterogenous Ontologies for the HLP Applications - Sejong Semantic Classes and KorLexNoun 1.5 -)

  • 배선미;임경업;윤애선
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.95-126
    • /
    • 2010
  • 본 연구에서는 인간언어공학에서의 활용을 위해 매우 이질적인 세종전자사전의 의미부류(SJSC)와 KorLexNoun 1.5(KLN)의 상위노드 간의 사상을 목표로, '의미 입자(sense grain)가 작은 개념체계(fine-grained ontology)' 간 귀납적이며 상향적인 수동 사상 방법론을 제안하였다. 동시에 이종 자원 간의 사상에 있어 각 의미체계의 이질성 때문에 발생하는 여러 가지 문제점을 살펴보고, 그 해결방안도 제안하였다. 두 이종 개념체계 간의 사상 방법은 SJSC의 단말 노드와 KLN의 Least Upper Bound(LUB)를 기본단위로 하여, 첫째, 어휘 분포를 이용하여 사상 후보군을 결정하고, 둘째, 계층 관계와 정의문과 용례를 이용하여 후보군들 간의 정확한 의미구분을 하며, 셋째, 상 하위-자매노드에 SJSC의 적정술어 및 정의문을 적용하여 LUB의 단계를 결정하고, 넷째, 양 의미체계의 계층관계를 비교함으로써 SJSC의 단말 노드와의 사상 여부를 판단하며, 마지막으로 KLN의 오류 및 전문용어 후보군은 사상에서 제외하였다. 이와같이 본 연구에서는 단계별 사상 준거의 설정에 있어 각 의미체계에 기술되어 있는 다양한 언어정보를 적극 이용하였는데, 이는 세밀한 수동 사상의 장점이라 할 수 있다. 본 연구에서 제안한 방법으로 사상한 결과, SJSC의 474개의 단말 및 비단말 노드와 KLN의 신셋(synset) 간에는 중복을 제외하고 6,487개의 LUB가 사상되었으며, 각 LUB의 하위노드를 포함해서는 모두 88,255개의 KLN 신셋이 사상되어 전체적으로는 97.91%가 사상되었다. 본 연구의 결과는 정교한 한국어 통사 및 의미 분석에 활용될 수 있을 것이다.

  • PDF

세종전자사전을 활용한 한국어 구문분석 (Korean Parsing using Sejong Dictionary)

  • 성열원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.261-268
    • /
    • 2007
  • 본 논문에서는 세종전자사전의 정보를 활용하여 논항 결합의 정확도를 향상시키는 한국어 구문분석 모델을 제안한다. 구문분석 과정에서 노드간의 결합 가능성을 계산할 때, 세종전자사전 동사사전의 격틀 정보, 논항 제약 정보와 명사사전의 의미부류 정보를 활용하여 가산점을 부여하여 사전의 내용과 일치하는 결합이 선호되도록 하였다. 이 과정에서 구조적 오류를 해결할 수 있었고, 결합에 참여하는 동사와 명사의 의미 중의성도 해소할 수 있었다. 평균 13어절 길이의 실험용 문장 50개를 대상으로 실험한 결과, 35% 정도의 오류 감소 효과를 볼 수 있었다. 또한 구문분석 결과 정보를, 전자 사전에 기술된 정보의 완결성을 시험하고 보완하는 데에도 활용하였다.

  • PDF

분류사와 명사 의미 부류

  • 최민우;강범모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.395-401
    • /
    • 2000
  • 국어에서는 어떠한 대상 의 수량을 표현할 때 수사와 함께 분류사(classifier)를 사용한다. 따라서 분류사는 그 특성상 수량 표현 구문을 형성하는 대상 명사와 의미적으로 밀접한 관련을 지니게 되는데, 단순히 명사를 셈하는 것 뿐 아니라 명사의 의미적 특성을 명세(specify)해 준다고 할 수 있다. 본 연구에서는 이러한 명사와 분류사의 연관성에 초점을 맞추어 분류사의 사용에 따른 명사의 범주화 및 계층 구조를 보이고, 컴퓨터 말뭉치 자료를 이용하여 그 관계를 좀더 명확히 밝히는 것을 목적으로 한다. 이러한 연구는 언어를 전산적으로 처리하는데 필수적인 전산어휘부(computational lexicon)의 구축에 필요한 기초 작업이 될 수 있다.

  • PDF

변이의 통사ㆍ의미론적 고찰 (A Syntactic and Semantic Analysis of Alternations)

  • 김현효
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.134-138
    • /
    • 2003
  • 본 연구는 언어학의 학파를 떠나 주목받고 있는 논항변이의 현상을 통사 ㆍ 의미론적으로 분석하고자 하였다. 논항변이의 현상을 동사의 특성에 따라 분류한 Levin(1993)을 기초로 Dowty의 의미론적인 해석을 시도하였다. 통사적으로 동일한 구조를 보이는 문장에서 동사의 논항이 바뀌면 의미의 변화가 있는 경우가 연구의 초점이 되고 있다. 의미변화가 초래됨을 기초로 각 동사의 유형을 통사적으로 분류하는데 그치지 않고, 그 부류의 문장들의 의미가 어떠한 영향을 받게 되는가를 고찰하였다. 우선 논항변이 현상을 보이는 동사를 Touch형, Hit형 Cut형, 그리고 Break형 동사로 분류하고 각 동사가 보이는 논항변이 현상에 따라 Middle alternation, Body-part possessor Ascension, Conative Alternation에 각각 어떻게 나타나는지를 점검한다. 이러한 분류에 기초하여 각각의 alternation에 의미론적인 해석을 하고자 시도한 것이다.

  • PDF

데이터마트 전달구조

  • 한국데이터베이스진흥센터
    • 디지털콘텐츠
    • /
    • 7호통권62호
    • /
    • pp.72-75
    • /
    • 1998
  • 오늘날 EIS는 한정된 자원을 가지고 최종 사용자에게 강건하며 동시에 유연한 상업적 데이터 마트 배급 구조를 짧은 시간안에 제공해야 한다는 어려움에 봉착해 있다. 마트 배급 구조에서 요구되는 것은 SQL에 관한 상당한 지식을 가지고 있는 전문가들로부터 항상 동일한 형식의 보고서들이나 OLAP 쿼리를 행하고자 하는 순수한 의미의 최종 사용자들에 이르는 다양한 부류의 사용자들을 지원해야 한다. 덧붙여서 이러한 구조는 ROLAP, DOLAP, 엑셀, 스프레드시트 등 모든 파일 형식상에서의 데이터 배급을 지원할 수 있을 만큼 유연해야 한다.

  • PDF

상표지로서의 부사 '거의' (Adverbs as Aspectual Markers)

  • 송현석;이정민
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.150-154
    • /
    • 2000
  • 동사의 종류와 곡용, 논항의 종류와 격 등 문장의 상을 결정하는 요인들은 여러 가지이다(Tenny 1994). 그러나 실제 자연언어처리에서 상 결정 요소들의 복잡한 조합은 기계가 문장의 상을 파악하는 작업을 더욱 어렵게 만들뿐이다. 본 논문에서는 다양한 상 결정 요인을 참조하지 않고 특정 부류의 부사에 의존하여 문장의 상을 결정하는 방법을 제안하고자 한다. 부사는 이른바 불변화사로 분류하는 품사 중의 하나로 통사적 혹은 형태소적 규칙의 적용을 받아 변형하지 않는다. 따라서 기계는 복잡한 형태소 분석을 통하지 않는 부사를 포착하기가 쉽다. 이와 같은 이점을 지닌 부사가 통사적 분석을 토대로 파악할 수 있는 문장의 의미인 상에 대한 표지임을 증명하여 자연언어처리의 간결함을 확보하고자 하는 것이 본 논문의 목적이다.

  • PDF

이상치 억제를 통한 얼굴의 표정 조작 (Facial Expression Manipulation with Outlier Suppression)

  • 김성호;송병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.129-131
    • /
    • 2022
  • 얼굴 표정 데이터셋에는 특정 감정 부류로 분류하기 어려운 이상치들이 존재한다. 이러한 이상치들은 얼굴 표정 인식과 더불어 얼굴 표정 조작의 성능을 저하시키는 원인 중 하나이다. 따라서, 본 논문에서는 이상치 억제를 통한 개선된 얼굴 표정 조작 프레임워크를 제안한다. 우리는 이상치 억제를 위해 의미론적 속성 분류 측면에서 우수한 성능을 보여주는 CLIP 을 활용하였다. 우리는 정성적인 비교를 통해 기존의 얼굴 표정 조작 기법보다 개선된 성능을 제시한다.

  • PDF

하이퍼-토러스 : 3차원 하이퍼큐브 기반의 새로운 토러스 네트워크 (Hyper-Torus : A New Torus Network based on 3-dimensional Hypercube)

  • 기우서;김정섭;이형옥;오재철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권3호
    • /
    • pp.158-170
    • /
    • 2009
  • 본 논문에서는 3차원 하이퍼큐브 Q3를 기본모듈로 갖는 새로운 토러스 네트워크를 제안한다. 제안한 하이퍼-토러스는 분지수 4를 갖고, 확장성, 지름이 좋은 연결망이다. 토러스 부류를 망비용 관점에서 비교하면 하이퍼-토러스는 $1.4{\sqrt{N}}$+16으로 토러스의 망비응 $4{\sqrt{N}}$보다 대략 65% 개선되었고, 허니컴 토러스의 망비용$ 2.45{\sqrt{N}}$보다 대략 50% 개선된 값이다. 이러한 결과는 하이퍼-토러스가 기존의 메시 부류보다 망비용 관점에서 우수함을 의미한다.