• 제목/요약/키워드: 다의어

검색결과 61건 처리시간 0.02초

온톨로지 기반의 지능형 번역 에이전트를 이용한 실시간 번역 연구 (Using Machine Translation Agent Based on Ontology Study of Real Translation)

  • 김수경;김경아;안기홍
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.229-233
    • /
    • 2006
  • 기계번역(Machine Translaton, MT), 다국어 정보 검색, 의미 정보 검색 등에 대한 연구는 시소러스, 지식베이스, 사전 검색, 의미망, 코퍼스등과 같은 다양한 방법으로 이루어지고 있다. 시맨틱 웹이 등장과 시맨틱 웹 기반 기술의 발전에 따라 위 연구들을 시맨틱 웹에 적용시킬 필요성도 제안되었다. 특히 한국어 시소러스, 워드넷(WordNet), 전자 세종 사전, 가도까와(Kadokawa) 시소러스와 같은 지식베이스가 개발되었으나 활용 분야에 따라 그 구축 방법론이 다르게 적용되어, 위 연구에 효과적으로 통용될 수 있는 지식베이스는 실질적으로 구축되지 못한 실정이다. 따라서 본 연구에서는 세종 사전과 가도까와 시소러스, 한/일 기계 번역 사전 그리고 전문 용어 사전을 기반으로 한국어와 일본어 지식베이스를 위한 사전 온톨로지 서버를 정의하여 의미 정보를 구성하고, Semantic Web Rule Markup Language (이하 SWRL)을 이용해 구문 정보 규칙을 정의한다. 그리고 SWRL 기반 정방향 추론 엔진을 이용하여 번역에 필요한 추론 엔진을 구성하고 문장 구문형성 규칙 추론 엔진을 통해 사용자에게 한국어와 일본어의 문장 구성 변환을 제공한다. 본 연구는 현재 기계 번역이 갖고 있는 다의성, 술부 어순의 차이, 경어체 등 아직 해결해야 할 많은 부분들에 대한 해결 방안으로서 시맨틱 웹 기반 기술과의 활용방안을 제시하고자 한다.

  • PDF

‘맞다’의 분석 (Toward a Definition of Fitting)

  • 정대현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.302-306
    • /
    • 1989
  • 이 연구는 '맞다'가 의미론적 기본개념으로서의 진리에 대한 대체후보가 될 수 있는가의 물음을 배경으로 삼고 이 논문에서는 맞음의 개념이란 무엇인가라는 문제에 초점을 두고 다음의 다섯가지를 일차적으로 고찰한다. (1) '맞다'에 대한 일상언어분석을 통하여 이것은 두자 리 관계술어라는 점을 보이고 (2) 단어의 표면적 다의성은 그 반대어인 '틀이다'의 분석을 통하여 궁극적으로는 동일한 뿌리를 가지고 잇다는 것을 주장한다. (3) 맞음은 대칭적 논리구조를 일반적으로 가지지만 화자의 관심에 의해 비대칭적 구조를 가질 수도 있을 것이다. (4) '맞다'라는 단어를 해명할 수 있는 세가지 후보를 필요충분조건적 해석, 의미론적 접근, 표준론적 고찰에서 탐구하여 보지만 (5) '맞다'에 대한 진화론적 해석이 의미론적 기초개념일 수 있다고 생각하게 되었다.

  • PDF

다언어주의와 언어교육정책 (Mutilingualism and Language Education Policy)

  • 김양순
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.321-326
    • /
    • 2020
  • 우리는 이 연구에서 다언어주의 맥락에서의 지속가능한 언어교육정책을 고찰하고자 한다. 인구의 다수가 다언어적이므로 다언어구사자들이 기준이 되는 다언어정책이 교육에서 우리가 채택할 수 있는 최선의 방법이다. 전통적으로 다언어사회였던 미국의 언어교육정책을 분석하여 한국사회의 언어교육정책에 관한 시사점을 모색하고자 한다. 다언어교육정책의 채택 동기와 정당성을 지속가능성, 정체성, 공정성, 세계영어, 기계번역, 그리고 보편문법이라는 6 가지 다른 관점에서 분석한다. 언어정책의 모델로 미국에서는 영어플러스(영어+n) 정책을 제안하며, 유사하게 한국에서는 한국어플러스(한국어+n) 정책을 언어교육현장에서의 최선의 언어정책모델로 제안한다. 이러한 플러스(+n)정책은 모국어와 해당국가의 다언어주의를 형성하는 다른 외래어 둘 다의 유창성을 목표로 하며 이때 다언어정책은 이중언어정책도 포함한다. 특히 4차 산업혁명시대의 맥락인 다양성과 융합의 시대에 언어다양성과 다언어정책은 해결해야할 문제가 아니라 보호되고 유지되어야할 권리이며 자산으로 간주되어야하고 언어교육정책 또한 다언어주의의 관점에서 다루어져야 한다.

U-WIN의 구문관계 자동구축 방법 (Automatic Construction of Syntactic Relation in U-WIN)

  • 임지희;김동명;최호섭;윤화묵;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.84-90
    • /
    • 2007
  • 일반적인 어휘망이 의미 관계에 의한 연결 구조를 중심으로 연구 개발된 것과는 달리, U-WIN은 의미관계를 비롯하여 개념 관계, 형태 관계, 구문 관계 등과 같이 의미 관계의 범위를 확장한 어휘 관계를 적용하여 구축하고 있다. 본 연구에서는 U-WIN의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 용언의 용례에서 문형정보를 기준으로 구문관계를 형성할 수 있는 후보명사를 추출하였으며, 추출한 후보명사는 용언의 세분화된 의미별로 정확하고 다양하게 추출할 수 있었다. 그러나 U-WIN은 다의어의 뜻풀이 하나하나를 개별적인 어휘로 구분하여 구축하였으므로, 어휘 간의 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 하나의 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문패턴, 의미 유사도 등을 차례로 적용하여 후보명사의 의미를 분별하였으며, 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미 분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

  • PDF

믿음, 실용적 수용, 그리고 인식적 수용 (Belief, Pragmatic Acceptance, and Epistemic Acceptance)

  • 이병덕
    • 논리연구
    • /
    • 제21권2호
    • /
    • pp.269-300
    • /
    • 2018
  • 이주한 박사는 최근 세 논문들에서 다음 논제들을 옹호한다. 첫째, 일상적 표현 '믿음'은 세 가지 다른 종류의 심적 태도들을 가리키는 다의어이다. 즉 '믿음'은 불수의적 심적 성향으로서의 믿음, 수의적 심적 행위로서의 실용적 수용, 또는 수의적 심적 행위로서의 인식적 수용을 가리킨다. 둘째, 실용적 수용은 증거가 없음에도 실용적 이유에서 특정 명제를 참으로 간주하는 수의적 심적 태도인 반면 인식적 수용은 자신이 믿고 있는 명제를 그것을 거부해야 하는 비인식적 이유를 거스르면서 인식적 이유에서 증거에 따라 참으로 간주하는 수의적 심적 태도이다. 셋째, 의무론적인 인식규범이 적용되는 태도는 불수의적인 심적 성향으로서의 믿음이 아니라, 수의적인 심적 행위로서의 인식적 수용이다. 이 세 논제들은 만약 옳다면, 현대 인식론에 큰 함축을 가지는 독창적인 주장들이다. 그러나 이 논문에서 필자는 이주한 박사가 자신의 논제들을 정당화하는 데 성공적이지 않음을 주장한다.

양방향 LSTM을 적용한 단어의미 중의성 해소 감정분석 (Emotion Analysis Using a Bidirectional LSTM for Word Sense Disambiguation)

  • 기호연;신경식
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.197-208
    • /
    • 2020
  • 어휘적 중의성이란 동음이의어, 다의어와 같이 단어를 2개 이상의 의미로 해석할 수 있는 경우를 의미하며, 감정을 나타내는 어휘에서도 어휘적 중의성을 띄는 경우가 다수 존재한다. 이러한 어휘들은 인간의 심리를 투영한다는 점에서 구체적이고, 풍부한 맥락을 전달하는 특징이 있다. 본 연구에서는 양방향 LSTM을 적용하여 중의성을 해소한 감정 분류 모델을 제안한다. 주변 문맥의 정보를 충분히 반영한다면, 어휘적 중의성 문제를 해결하고, 문장이 나타내려는 감정을 하나로 압축할 수 있다는 가정을 기반으로 한다. 양방향 LSTM은 문맥 정보를 필요로 하는 자연어 처리 연구 분야에서 자주 활용되는 알고리즘으로 본 연구에서도 문맥을 학습하기 위해 활용하고자 한다. GloVe 임베딩을 본 연구 모델의 임베딩 층으로 사용했으며, LSTM, RNN 알고리즘을 적용한 모델과 비교하여 본 연구 모델의 성능을 확인하였다. 이러한 프레임워크는 SNS 사용자들의 감정을 소비 욕구로 연결시킬 수 있는 마케팅 등 다양한 분야에 기여할 수 있을 것이다.

Legal search method using S-BERT

  • Park, Gil-sik;Kim, Jun-tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권11호
    • /
    • pp.57-66
    • /
    • 2022
  • 본 논문에서는 Sentence-BERT 모델을 활용한 법률 문서 검색 방법을 제안한다. 법률 검색 서비스를 이용하고자 하는 일반인들은 법률 용어 및 구조에 대한 이해가 부족함에 따라 관련 판례 검색 등에 있어 어려움을 겪고 있다. 기존의 키워드 및 텍스트마이닝 기반 법률 검색 방법은 판결문의 문맥에 대한 정보가 없으며, 동음이의어 및 다의어에 대해 구분하기 어려워 성능을 높이는 데 한계가 있었다. 그로 인해 법률 문서 검색 결과에 대한 정확도가 낮아 신뢰하기가 어려웠다. 이를 위해, 대법원 판례 및 법률구조공단 상담사례 데이터에서 일반인의 법률 검색 문장에 대한 성능을 개선하고자 한다. Sentence-BERT 모델은 판례 및 상담 데이터에 대한 문맥 정보가 임베딩 되므로, 문장의 의미 손실이 적어 TF-IDF 및 Doc2Vec 검색 방법과 비교했을 때보다 검색 정확도가 개선된 것을 확인할 수 있었다.

프랑스어 전치사 de의 의미 구조와 문법화 (The Semantic Structure and Grammaticalization of the French Preposition de)

  • 박정준
    • 비교문화연구
    • /
    • 제50권
    • /
    • pp.453-482
    • /
    • 2018
  • 프랑스어의 de와 같은 전치사는 의미를 가지고 있지 않으며 문법적 기능만 가지고 있을 뿐이라는 기존 연구의 입장에 대한 의구심에서 시작된 이 연구는 전치사 de의 쓰임에 대한 일반적인 기술을 분류하여 정리하고, 그 쓰임들을 '출발점을 표현', '특성을 부여', '문법 기능을 수행'이라는 세 개의 부류로 나누어 인지언어학의 관점에서 분석하였다. 출발점을 표현하는 경우에는 공간의 영역과 시간의 영역에서 탄도체가 출발점을 떠나 도착점을 향하는 여정의 개념이 상정되어 있기 때문에 동태적 개념을 갖는다. 반면에, 특성을 부여하는 전치사 de의 보어는 어떤 특정 부류에 대하여 그 부류의 특징을 규정하는 속성을 부여함으로써 해당 특정 부류의 외연을 한정한다. 이 보어는 한정된 부류와 연결된 것으로 인식됨으로써 해당 부류와 공존하는 것으로 여겨지므로 전치사 de가 이 경우에는 정태적 개념을 갖는다. 이러한 동태적 개념과 정태적 개념이 모두 퇴색되고 극도로 문법화가 되어 내재적 관계의 개념만 있는 경우가 전치사 de에 의해 동사 원형이 보어로 도입되는 경우이다.

인접 단어들의 접속정보를 이용한 일한 기계번역 시스템 (Japanese-Korean Machine Translation System Using Connection Forms of Neighboring Words)

  • 김정인
    • 한국멀티미디어학회논문지
    • /
    • 제7권7호
    • /
    • pp.998-1008
    • /
    • 2004
  • 일본어와 한국어는 문법적으로 많은 유사점을 가지고 있다. 이러한 유사점을 잘 이용한다면 일한 기계번역 시스템에서 구문해석이나 의미해석의 상당한 부분을 생략할 수 있다. 몇 년 전부터 우리는 유사성을 이용하여 번역율을 높이는 방법으로 번역테이블을 이용한 일한기계번역 시스템을 연구해 왔다. 그러나 이 시스템은 활용어미의 번역, 다의성 단어의 처리 등 몇 가지 문제점을 가지고 있었다. 본 논문에서는 번역테이블을 이용하는 시스템을 개선하여 이웃 하는 단어들과의 관계 정보를 이용한 일한 기계번역 시스템을 제안한다. 현재 시스템의 문제점들을 해결하기 위하여 우선 조사, 조동사의 접속 정보를 최대한 이용한다. 또한, 번역 테이블을 엔트리테이블과 접속정보 테이블로 나누어 설계하여 번역의 효율을 높인다. 즉, 하나의 역어만 가지는 단어인 경우, 우리는 일한 직접 대응 방법을 이용하여 바로 번역하고 2개 이상의 역어로 번역되어야 할 경우만 접속 정보 값을 평가하여 가장 가능성이 높은 번역어를 선택하도록 한다.

  • PDF

한글 시소러스에서 저자와 저작에 대한 관계 설정과 동형 이의어의 기술 (A Study on the Description of Relationships and Homographs in Terms of Creator and Work in the Korean Thesaurus)

  • 한상길;최석두
    • 한국문헌정보학회지
    • /
    • 제45권4호
    • /
    • pp.139-155
    • /
    • 2011
  • 개인 저자 집합과 저작 집합 간의 관계를 기술할 때 두 집합 내에서 동형 이의어(즉, 동명이인과 동일 저작명)를 구별하지 못하면 두 집합 간에 전단사(全單射) 관계가 형성되지 않으므로 정확한 정보 검색을 위한 정보로는 사용하기가 어렵다. 실제로 저자명과 저작명을 다루는 도서관 시스템, 문헌, 포털사이트 등에서 동형 이의어를 명확하게 구별하고 있지 않아 색인과 검색 시 다의성에 의한 혼란과 불편을 초래하고 있다. 이에 대한 필요성은 일찍이 전거 데이터의 구축 시 대두된 문제였으나 우리나라에서는 일부 기관이 개별적으로 구축하였을 뿐 국가 차원의 전거 데이터가 없어서 이들의 동형 이의어를 구별하기 위한 기준이 없다. 이에 본 연구자는 개체명 인식을 위한 작업의 일환으로 주제어뿐만 아니라 고유 명사류도 포함되는 한글 통합 시소러스 구축 작업에서 얻은 결과를 바탕으로 저자와 저작의 용어 관계 설정 방법과 두 집합 내에서 그리고 두 집합이 기타 용어와의 관계에서 발생하는 동형 이의어의 기술 방법을 대중 문화 예술 분야를 중심으로 제시하였다.