• Title/Summary/Keyword: 의미제약

검색결과 547건 처리시간 0.028초

세종 말뭉치를 이용한 '-느라고' 의미 제약 연구 (Research on Meaning Constraints of '-Neulago' Using the Sejong Row Corpus)

  • 안성민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.477-480
    • /
    • 2020
  • '-느라고'의 후행절 부정 의미 제약에 대하여 연구자들마다 의견을 달리하고 있지만 대부분의 교육 교재는 다수의 연구 내용을 반영하여 '-느라고'의 후행절에 부정 의미 제약이 있다고 제시하고 있다. 하지만 교육 교재에서 후행절에 부정 의미의 제약이 없다는 연구 내용이 배제되어야 한다면 이를 위한 심층적인 논의가 필요하며 타당한 근거가 있음을 밝혀야 한다. 본 연구는 '-느라고'의 후행절 부정 의미 제약에 대해 상반된 주장이 나오게 된 것에 주목하여 실제로 '-느라고'가 후행절 부정 의미 제약을 갖는지, 만약 제약을 갖지 않는다면 그 이유는 무엇인지 밝히고자 하였다. 이를 위해 세종 문어 원시 말뭉치에서 '-느라고'의 문장 1,601개를 추출하고 혹시 있을지 모를 통시적 변화를 제거하기 위해 교육 교재들이 집필된 2000년대의 문장만 선별하여 후행절의 의미를 확인하였다. 그 결과 323개의 문장 중 98개 문장, 33.3%가 후행절에 부정적인 의미를 갖지 않고 있는 것을 확인되었다. 이는 '-느라고'가 단순히 후행절 부정 의미 제약을 갖는다고 할 수 있는 수치가 아니었다. 부정 제약의 범위를 파악하기 위해 문장의 의미를 살펴 목적의 의미를 갖는 '-느라고'와 이유의 의미를 갖는 '-느라고'로 분류하였다. 이렇게 분류한 '-느라고'의 후행절을 다시 분석한 결과 이유의 '-느라고'에서는 후행절 부정 제약이 실현되고 있었지만 목적의 '-느라고'에서는 부정 제약이 발견되지 않았다. 따라서 '-느라고'가 이유와 목적의 의미를 가지며 이유의 '-느라고'로 실현될 때에만 부정 의미 제약을 갖는다는 보다 심층적이고 구체적인 연구 결과 얻어 냈다.

  • PDF

나이브 베이즈 분류기를 이용한 의미제약이 강화된 한국어 복합명사 의미 분석 (A Semantic Analysis of Korean Compound Nouns with Enforced Semantic Constraints using a Na${\ddot{i}}$ve Bayes Classifier)

  • 이용훈;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.102-106
    • /
    • 2011
  • 본 논문에서는 사전 원어정보를 이용한 기존 방법에 나이브 베이즈 분류기를 추가로 이용하는 의미제약 기술에 대하여 소개한다. 의미제약은 의미 분석의 전처리 단계로서 부분적으로 중의성을 해소하여 입력된 복합명사의 분석 정확도 뿐만 아니라 전체적인 분석시간의 단축에도 큰 도움을 준다. 나이브 베이즈 분류기를 이용하는 방법은 사전의 의존성으로 인해 제약할 수 없는 2-gram을 대상으로 제약을 시도한다. 분류기를 위한 학습데이터는 의미 태깅된 기분석 2-gram사전을 이용하여 U-WIN의 관계정보와 사전 그리고 패턴들에 의해 생성된다. 원어정보로 해결하지 못하는 34.63%의 2-gram중 2.83%에 대해 추가로 제약에 성공 하였다.

  • PDF

XBRL 서비스 품질 향상을 위한 의미제약 표현 방법 분석 (Analysis of Representation Methods for Semantic Constraints to Enhance the Quality of XBRL Services)

  • 김형도
    • 한국콘텐츠학회논문지
    • /
    • 제8권8호
    • /
    • pp.274-284
    • /
    • 2008
  • XBRL은 재무 보고를 비롯한 다양한 비즈니스 보고에서 활용되고 있는 XML 기반 언어로서, 응용 분야의 개념들과 이들간의 관계를 정의하여 유연하게 활용할 수 있다. 이러한 비즈니스 보고 프로세스에서, 보고 내용의 일치성과 완전성을 문법적이고 의미적인 수준에서 검증하는 것은 XBRL 문서를 제출하는 측이나, 제출받아 이용하는 측 모두에게 매우 중요하다. 이와 같은 의미제약을 응용 프로그램 코드로 직접 표현하고 검증하는 것이 기본적인 방법이지만, 이것은 의미제약의 표현과 변경, 그리고 공유를 어렵게 한다. XML 문서의 의미제약을 일반적으로 표현할 수 있는 XSLT, Schematron 등의 언어는 XML을 이용한 의미제약의 명시적인 표현과 공유가 가능하나, XBRL 의미제약을 효율적이고 효과적으로 표현하기 어렵다. 이 논문에서는 현재 활발히 논의가 진행되고 있는 XBRL Formula의 의미제약 표현 방법에 대하여 검토하고, 사례 분석을 통해서 표현 능력과 문제점을 토의하고자 한다. 구체적인 분석 사례로서는 재무보고 분야의 재무제표를 이용한다.

한국어 문법검사기에서 의미정보를 이용한 복합명사의 분석제약 (To Constrain Korean Compound Nouns using Semantic Information for Korean Grammar Checker)

  • 원상연;김수남;김광영;남현숙;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.288-293
    • /
    • 1999
  • 일반적으로 두 개의 명사가 결합하여 하나의 명사 기능을 하는 어구를 복합명사라고 한다. 한국어는 복합명사 내의 명사를 붙여볼 수도 있고 띄어쓸 수도 있으므로 복합명사의 형태적 분석에 많은 어려움이 있다. 이 연구에서는 각 명사의 복합명사 결합을 최대한 제약하여 문법검사기에서 복합명사와 관련된 오류의 발생을 최소화할 수 있는 방범을 개발했다. 이 논문에서 복합명사 분석 기능을 제약하는 방법으로 형태적 제약 방법과 의미정보에 따라 복합명사의 결합관계를 제약하는 방법을 이용했다. 어휘 정보만으로 복합명사를 분석하면 의미관계에 의한 오류는 찾기 어려우므로 복합명사의 구조적 결합관계와 의미 결합관계를 밝혀 복합명사를 잘못 분석하는 문제점을 극복한다. 복합명사의 결합제약은 명사의 왼쪽과 오른쪽에 올 수 있거나 올 수 없는 명사를 의미, 형태적 특성과 명사가 나타나는 분포(distribution)에 따라 분류하여 규칙베이스화하였다. 의미정보를 이용한 복합명사 결합제약 알고리즘도 구현하였다.

  • PDF

XML 데이터의 제약조건 보존을 위한 변환 기법 (A Transformation Technique for Constraints-preserving of XML Data)

  • 조정길;금영욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.1-9
    • /
    • 2009
  • XML 데이터를 효율적으로 저장하고 질의하기 위하며 많은 기법들이 제안되었다. 이러한 목표를 위한 한 가지 방법은 XML 데이터를 관계형 형식으로 변환하여 관계형 데이터베이스를 사용하는 것이다. 그러나 대부분의 연구가 XML의 내용과 구조만 변환하고 숨겨진 의미적 제약조건을 간과하거나 일부만 적용하였다. 따라서 이 논문에서는 XML Schema로부터 의미적 제약조건의 체계적인 추출 방법과 추출된 의미적 제약조건을 관계형 스키마로 변환할 때에 보존하는 방법을 제안한다. 변환 알고리즘은 XML Schema로부터 의미적 제약조건을 추출하고 보존하는데 이용되며, 추출된 의미적 정보들을 스키마표기법에 따라 재작성하여 어떻게 의미적 제약조건을 보존하는지를 보여준다. 또한 변환하는 동안에 올바른 관계형 스키마를 보증하기 위하여 제약조건 확인에 필요한 의미적 지식을 제공한다. 이 방법에서는 내용, 구조와 함께 무결성 제약조건들은 동시에 유지되며, 또한 저장 중복성을 줄일 수 있다.

U-WIN을 이용한 한국어 복합명사 분해 및 의미태깅 시스템 (Korean Compound Noun Decomposition and Semantic Tagging System using User-Word Intelligent Network)

  • 이용훈;옥철영;이응봉
    • 정보처리학회논문지B
    • /
    • 제19B권1호
    • /
    • pp.63-76
    • /
    • 2012
  • 본 논문에서는 통계기반의 복합명사 분해 방법과 어휘의미망(U-WIN)과 사전 뜻풀이에서 추출한 의미관계 정보를 이용하는 한국어 복합명사 의미 태깅 시스템을 제안한다. 본 시스템은 크게 복합명사 분해, 의미제약, 그리고 의미 태깅의 세 가지 부분으로 이루어진다. 분해과정은 세종말뭉치에서 추출한 위치별명사 빈도를 사용하여 최적의 구성 명사 분해 후보를 선정하고 의미제약을 위한 구성 명사 재분해와 외래어 복원의 과정을 수행한다. 의미범위 제약과정은 유사도 비교의 계산량을 줄이고 정확도를 높이기 위해 원어 정보와 Naive Bayes Classifier를 이용해 가능한 경우 구성 명사의 의미를 선 제약한다. 의미 분석 및 태깅 과정에서는 bigram 구성 명사의 각 의미 유사도를 구하고 하나의 체인을 만들어가며 태깅을 수행한다. 본 시스템의 성능 평가를 위해 표준국어대사전에서 추출한 3음절 이상의 40,717개의 복합명사를 대상으로 의미 태깅된 테스트 셋을 구축하였다. 이를 이용한 실험에서 99.26%의 분해 정확도를 보였으며, 95.38%의 의미 분석 정확도를 보였다.

A Sketch of an Optimality Theoretic Account of Anaphora Resolution in Korean

  • Hong, Minpyo
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 학술대회 발표논문집
    • /
    • pp.10-38
    • /
    • 2002
  • 본고는 한국어 영형 대명사의 적절한 해석을 위해 개념적으로 전혀 새로운 이론을 제안한다. 일련의 다양한 제약들이 서로 연관되어 있음을 보인 후, 그러한 규칙의 다양성을 적절히 포착하기 위해 적절성 이론 (Optimality Theory)을 도입할 것을 제안하고, 그 토대 위에 다양한 제약들을 형식화한 후, 그 규칙들의 위계관계를 설정한다. 가장 우선순위를 갖는 제약으로 인접 요소간 어휘의미자질들이 일치해야 한다는 어휘의미제약(*Feature Mismatch)과 통사적 결속규칙을 의미론적으로 재해석한 결속원리 B(Principle B)를 선정한다. 그 다음 순위를 갖는 제약으로, 가능한 한 선행명사를 지칭하도록 요구하는 대용존중제약(DOAP: Don't Overlook Anaphoric Possibilities)과, 센터링 이론의 전이방식 개념을 도입하여 정의한 계속선호제약 (CONTINUE)을 제안한다

  • PDF

한국어 부사어의 분류와 분포 제약

  • 채희락
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2001년도 학술대회 논문집
    • /
    • pp.95-96
    • /
    • 2001
  • 문장에서 술어를 수식하는 대표적인 표현은 부사어이다. 부사어는 일반적으로 문장 구성에서 핵심적 역할을 하지 않는 첨가어(adjuncts)이기 때문에 핵심적인 역할을 하는 보충어(complements)에 비해 상대적으로 연구가 덜 이루어진 분야이다. 그렇지만 부사어는 피수식어의 의미를 구체화/한정하는 기능을 하기 때문에 정확한 의사소통을 위해서는 반드시 필요한 요소이며 어순, 호응(concord)등의 통사적 현상과도 밀접한 관련이 있다. 이 연구의 일차적 목적은 이러한 부사어를 통사적, 의미적 기준에 의해 정확하게 분류하고 그들의 분포제약을 밝히는 것이다. 그 다음으로, 부사어와 관련된 통사 현상으로, 부사어와 피수식어의 공 기(co-occurrence)관계 및 부사어와 술어 어미의 호응 관계에 대한 분석을 제공하려고 한다. 부사어는 통사적인 기준과 의미적인 기준으로 분류할 수 있다 (손남익 1995, 김경훈 1996, 임유종 1998). 통사적 기준으로는 단어나 구를 수식하는 성분부사와 문장을 수식하는 문장 부사로 나누는 방법과 위치에 대한 제약이 있느냐 없느냐에 따라 제약부사와 자유부사로 나 누는 방법이 있다. 이 두 통사론적 기준에 의해 분류되는 부사들은 서로 어떤 상관관계를 보이고 있는지 살펴 볼 것이다. 일반적으로 문장부사는 문두에 놓여야 한다는 위치적 제 약 이 있기 때문에 제약부사로 분류된다. 의미적 기준으로 부사어를 분류할 수도 있는데, 시간/ 공간 부사어, 양태/정도 부사어 등으로 나눌 수 있다. 의미적 기준에 의해 분류된 부사어는 통사적 기준에 의해 분류된 것들과는 어떤 상호 관련성을 맺고 있는지 살펴 볼 것이다. 일 반적으로 시간부사와 장소부사는 자유부사에 속하며 양태부사와 정도부사는 제약부사에 속 한다. 부사어와 피수식 요소와의 통사적 공기 관계 및 의미적 관계 그리고 그와 관련된 문 법 현상도 연구의 대상이 된다. 예를 들어, 자유로운 어순을 가진 부사들이지만 “*순이는 빨리 과연 달린다”에서 볼 수 있는 종류의 분포적 특성을 알아 볼것이다 (심재기 1982, 송 철의 1989). 또한 “길이/*길게 빛나다”와 “*길이/길게 드리워졌다”와 같은 대조에서 나타나는 통사, 의미적 기능의 상관 관계 및 제약들의 상호 작용도 살펴 볼 것이다.

  • PDF

한국어 어휘의미망을 활용한 의미 오류 검사 규칙 일반화 연구 (A Study on Generalization of Semantic Error Detection Rules in a Grammar Checker for Korean Using Korean WordNet 『KorLex』)

  • 소길자;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.640-643
    • /
    • 2010
  • 영어권에서는 통계적 기반 의미 오류 검사기에 대한 연구가 활발하게 진행되었으나 한국어에서는 자주 나타나는 오류를 중심으로 오류 단어를 검사할 문맥이나 공기정보를 갖는 규칙 기반의 연구가 이루어져왔다. 본 논문에서는 표제어나 사전 기반 범주화 정보로 표현되고 있는 기존 문법 검사기의 성능을 개선하는 방안으로 한국어 명사 어휘 의미망인 KorLex를 활용하는 방법을 연구한다. 특히, 용언은 목적어나 주어에 사용되는 명사의 표제어가 의미 제약 조건으로 사용되는 예가 많다. 본 논문에서는 용언의 의미 제약 조건을 명사 표제어 단위에서 명사 의미 그룹(class) 단위로 확대하여 문법 검사기의 의미 오류 검사 규칙의 의미 오류 제약 조건을 일반화 하는 방안을 연구한다.

의미적 제약조건을 고려한 XML 스키마의 변환 (XML Schema Transformation Considering Semantic Constraint)

  • 조정길
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.53-63
    • /
    • 2011
  • XML 데이터를 효율적으로 저장하고 질의하기 위하여 많은 기법들이 제안되었다. 이러한 목표를 위한 한 가지 방법은 XML 데이터를 관계형 형식으로 변환하여 관계형 데이터베이스를 사용하는 것이다. XML 문서의 내용, 구조, 의미 정보인 제약조건 보존은 스키마를 변환하는 과정에서 매우 중요하다. 특히 키 제약조건은 데이터베이스 이론의 중요한 부분을 차지한다. 따라서 제안된 기법은 주키와 외래키를 표현함으로써 XML의 의미를 반영하며, 변환하는 데에 XML 데이터의 키 제약조건뿐만 아니라 데이터의 내용과 구조와 의미도 보존한다. 변환 정보는 문서의 내용, 문서의 구조(부모-자식 관계), 함수적 종속성, XML key와 keyref 제약조건에 의해 포착한 문서의 의미이다. 제안된 기법은 XML 스키마를 변환할 때에 의미적 제약조건들의 보존을 보장함으로써 관계형 데이터베이스에서 데이터 무결성을 보장하기 위한 저장 프로시저나 트리거를 사용할 필요가 없는 이점이 있다. 이러한 변환은 산업체에서 필요한 데이터 관리의 한 부분으로, 이미 웹에 저장되어있는 데이터를 데이터베이스에 저장하여 다른 업무에 활용할 수가 있을 것이다. 본 논문에서는 DTD에서 지원하는 ID/IDREF 키, 상속 관계, 묵시적 참조 무결성은 반영하지 못하였다.