• Title/Summary/Keyword: 존재의 언어

Search Result 711, Processing Time 0.03 seconds

Automatic WordNet mapping using word sense disambiguation (의미 애매성 해소를 이용한 WordNet 자동 매핑)

  • Lee, Chang-Ki;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.262-268
    • /
    • 2000
  • 본 논문에서는 어휘 의미 애매성 해소와 영어 대역어 사전 그리고 외국언어에 존재하는 개념체계를 이용하여 한국어 개념체계를 자동으로 구축하는 방법을 기술한다. 본 논문에서 사용하는 방법은 기존의 개념체계 구축 방법들에 비해 적은 노력과 시간을 필요로 한다. 또한 상기한 자동 구축 방법에서 사용하는 어휘 의미 애매성 해소를 위한 6가지 feature도 함께 설명한다.

  • PDF

Qualitative Evaluation of Quality with Hierarchical Structure Using Fuzzy Inference (퍼지추론에 의한 계층구조를 가진 품질의 정성적 평가)

  • Kim, Jeong Man
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.20 no.43
    • /
    • pp.37-46
    • /
    • 1997
  • 제품의 정성적 품질평가에서, 제품의 최종품질을 구성하는 다수의 특성에 대한 만족도가 언어로써 표현되어 소비자의 구매행동이란 의사결정으로 표출되는데, 이러한 주관적 평가에는 평가의 애매함(fuzziness)이 수반되므로 품질의 평가구조를 합리적으로 파악하기 위해서는 애매함의 존재를 고려에 넣지 않으면 안된다. 다수의 품질특성이 계층적(hierarchical)인 구조로 연결되어 최상위 품질특성으로 구성되며, 특성간의 중요도(relative importances)가 계층별로 결정되는 경우, 이들 개개의 특성에 대한 만족도의 평가로부터 어떤 구조적인 관계를 통해 그 제품에 대한 종합평가가 이루어지나, 개개의 특성에 대한 평가가 애매한 이상 최종 결과인 종합적 만족도도 애매한 것으로 된다. 즉, 평가모델의 구조도 평가의 패턴도 퍼지화되므로 이러한 평가에서 퍼지이론의 응용에 따른 효과를 가장 크게 기대할 수 있는 퍼지추론모델을 이용하여 계층간, 품질특성간의 퍼지관계와 특성의 중요도 및 언어변수(linguistic variables)의 형태로 주어지는 입력정보로써 품질구조를 명확히 하고, 패턴인식(pattern recognition)의 개념을 이용하여 평가자의 제품에 대한 평가결과를 언어로써 표현한다.

  • PDF

Development of the DAML-S Document Management System enabling Semantic Web Services (시맨틱 웹 서비스를 위한 DAML-S 문서 관리 시스템 개발)

  • 김학수;손진현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.73-75
    • /
    • 2004
  • 기존의 WSDL이 갖고 있던 문제정올 개선하고 좀더 의미있는 서비스 기술이 가능한 시맨틱 웹 서비스는. 현재의 뜬 서비스와 유사하지만 웹 서비스를 기술하던 WSDL 대신 시맨틱 웹 기술언어를 기반으로 한 새로운 기술 언어(DAML-S)를 사용한다. 이런 상황 속에서 만일 수많은 회사에서 자신들의 서비스를 제공하고. 그 사실을 알리기 위해서 시맨틱 엠 서비스 문서를 발간했을 때, 자연히 사용자는 검색 엔진을 사용하여 그런 비즈니스 정보를 검색하게 되고 사용자가 원하는 서비스, 사용자가 만족할 수 있는 서비스를 찾고 결합시켜주는 검색 엔진이 필요하게 될 것이다. 따라서, 시맨틱 웹 정보 검색은 기존의 정보 검색과는 다른 형태의 검색이 된다. 기존의 문서 내 단어의 존재 유무나 빈도수와 같은 휴리스틱한 방법을 적용하기는 매우 어려우며, 시맨틱 웹 기술 언어네 알맞은 새로운 검색 방법과 저장 시스템이 필요하다. 이 논문에서는 시맨틱 웹 정보 중 특별히 시맨틱 웹 비즈니스 정보에 대한 효율적인 저장 시스템의 모델을 제시하고자 한다. 이 모델을 통해서 시맨틱 웹 비즈니스 정보를 구조화하고 효율적으로 저장할 수 있다.

  • PDF

Information Retrieval Using Images (영상을 이용한 정보검색)

  • 최윤경;이은애;하석운
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.37-39
    • /
    • 2002
  • 정보 검색 시스템은 인터넷에 존재하는 수많은 정보 중에서 사용자가 필요한 특정 정보만을 포함하는 문서를 검색할 수 있다. 현재 정보 검색 시스템은 텍스트를 입력하는 방식을 이용한다. 검색어를 이용하게 되면 몇 개의 키워드를 통하여 원하는 정보를 신속하게 찾을 수 있지만 언어를 기반으로 하기 때문에 각 나라의 언어와 키워드를 알아야 사용할 수 있다는 단점이 있다. 이런 문제점을 해결하기 위해 본 시스템은 언어와 키워드를 알지 못하더라도 정보 검색이 가능하도록 누구나 쉽게 의미를 알 수 있는 영상을 질의로 하는 시스템을 제안한다. 본 시스템은 데이터베이스 내에 200개의 비교 대상 영상들을 5개의 대분류로 나눈 후 각각 3개의 소분류로 나누어 영상의 특징 및 키워드를 추출하여 영상특징키워드 데이터베이스(IFKDB, Image Feature Keyword DataBase)에 저장하였다. 사용자 인터페이스를 통해 새로운 영상을 만들거나 흑은 기존에 만들어진 영상을 선택하여 질의로 사용하면 질의 영상의 특징 중 에지를 추출하여 IFKDB와 비교하여 유사도가 높은 영상의 키워드 중 적정 개수를 선택하여 정보 검색의 키워드로 사용할 수 있게 하였다. 사용자가 그린 단순한 영상으로 검색이 가능하고 사용자가 원하는 영상과 비슷한 영상을 찾을 수 있으며 영상으로 정보 검색이 가능하므로 검색의 편의성을 제공한다.

  • PDF

Implementation of the Java Compiler for the Smart Cross Platform (스마트 크로스 플랫폼을 위한 Java 컴파일러의 구현)

  • Son, YunSik;Lee, YangSun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.383-384
    • /
    • 2013
  • 현재 스마트 디바이스 콘텐츠는 각 플랫폼별로 독립적인 프로그래밍 언어와 개발 환경이 존재하기 때문에 다양한 플랫폼에 동일한 콘텐츠를 제공하기위해서는 각 플랫폼에 적합한 방식으로 중복 개발되어야 한다. 스마트 크로스 플랫폼은 이러한 문제점을 해결하기 위한 가상기계 기반 솔루션으로 다양한 개발 언어를 지원하고, 탑재된 모든 플랫폼에 동일한 실행환경을 제공하여 콘텐츠 개발을 용이하게 하고 다른 플랫폼으로의 이식 비용을 절감할 수 있는 장점을 가진다. 본 논문에서는 스마트 크로스 플랫폼에서 Java 프로그래밍언어를 지원하기 위한 컴파일러를 소개한다. 구현된 Java 컴파일러는 Java 콘텐츠를 입력으로 받아 스마트 크로스 플랫폼에서 실행하기 위한 플랫폼 독립적인 스택 기반 가상기계 코드인 SIL을 생성한다.

$\mathcal{K}o$-ATOMIC: Korean Commonsense Knowledge Graph ($\mathcal{K}o$-ATOMIC: 일반 상식 기반의 한국어 지식 그래프)

  • Jaewook Lee;Jaehyung Seo;Seungjun Lee;Chanjun Park;Aiyanyo Imatitikua Danielle;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.412-417
    • /
    • 2022
  • 일반 상식 기반의 지식 그래프는 대규모 코퍼스에 포함되어 있는 일반 상식을 그래프로 표현하여, 자연어 처리의 하위 작업들에 적용할 수 있도록 하는 구조화된 지식 표현 방법이다. 현재 가장 잘 알려진 일반 상식 기반의 지식 그래프로는 ATOMIC [1]이 있다. 하지만 한국어를 주요 언어로 하는 일반 상식 기반의 지식 그래프에 대한 연구는 아직 활발하지 않다. 따라서 본 연구에서는 기존에 존재하는 영어 기반의 지식 그래프와 일반 상식 기반의 한국어 데이터셋을 활용해서 한국어 일반 상식 기반 지식 그래프를 구축하는 방법론을 제시한다. 또한, 제작한 지식 그래프를 평가하여 구축하는 방법론에 대한 타당성을 검증한다.

  • PDF

Scenario Generation Assistance System Using GPT-3 (GPT-3를 활용한 시나리오 생성 보조 시스템)

  • Jo, Dongha;Jeon, Isle;Moon, Mikyeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.503-504
    • /
    • 2022
  • 최근 자연어 처리 분야에서 언어 모델을 활용하여 문장 생성에 관한 연구가 이루어지고 있다. 기존 언어 모델을 활용하여 생성된 시나리오는 텍스트를 학습하여 활용하는 것 외에는 작가의 의도를 반영하는 것에 한계가 존재했고 문맥에 일관성 없는 모습을 보여주었다. 시나리오를 작성하는 것은 작가가 흐름을 주도하며 작업해야 하는 내용이다. 본 논문에서는 GPT-3 기반 언어 모델을 기반으로 다양한 시나리오 문장을 생성하여 작가가 선택하거나 원하는 문장을 직접 입력하는 등 작가의 의도에 부합하는 시나리오를 생성하는 보조 시스템을 제안한다. 본 연구를 통해 시나리오 생성을 포함한 문장 생성 분야의 보조 도구로 활용하여 작가의 의도를 반영하는 결과물을 생성하는 것을 목표로 한다.

  • PDF

Applications of XML based Object Model for flexible binary data processing (데이터 변경에 유연한 이진 데이터 처리를 위한 XML 기반 객체 모델의 적용 방법)

  • Lee, Yong-Heon;Shim, Jun-Yong;Kim, Sae-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1426-1428
    • /
    • 2011
  • 컴퓨터에서 사용하는 데이터의 기본 단위는 2진수 형식으로 표현되는 이진(binary) 데이터이며 이는 CPU 연산에서부터 이기종간 네트워크 통신에 이르기까지 폭넓은 영역에서 사용되고 있다. 이진데이터를 처리하는 소프트웨어를 개발하기 위하여 다양한 원시타입(Primitive Type)을 사용하는 프로그래밍 언어가 사용되는데, 일반적으로 이러한 프로그래밍 언어를 통한 개발은 소스코드에 구조체, 공용체 및 클래스로 이진 데이터를 정적으로 정의함으로써 추후 데이터 변경에 대한 유연성이 떨어지는 문제가 존재한다. XML 기반의 객체 모델은 프로그래밍 언어에서 사용되는 모든 타입 및 이진 데이터 구성 형식을 제공하고 이를 통해 이진 데이터를 동적으로 관리함으로써 이러한 유연성의 문제를 해결하고 있으며 실제 이진 데이터를 사용하는 분야에 적용할 수 있다.

Optimization of Data Augmentation Techniques in Neural Machine Translation (신경망 기계번역에서 최적화된 데이터 증강기법 고찰)

  • Park, Chanjun;Kim, Kuekyeng;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.258-261
    • /
    • 2019
  • 딥러닝을 이용한 Sequence to Sequence 모델의 등장과 Multi head Attention을 이용한 Transformer의 등장으로 기계번역에 많은 발전이 있었다. Transformer와 같은 성능이 좋은 모델들은 대량의 병렬 코퍼스를 가지고 학습을 진행하였는데 대량의 병렬 코퍼스를 구축하는 것은 시간과 비용이 많이 드는 작업이다. 이러한 단점을 극복하기 위하여 합성 코퍼스를 만드는 기법들이 연구되고 있으며 대표적으로 Back Translation 기법이 존재한다. Back Translation을 이용할 시 단일 언어 데이터를 가상 병렬 데이터로 변환하여 학습데이터의 양을 증가 시킨다. 즉 말뭉치 확장기법의 일종이다. 본 논문은 Back Translation 뿐만 아니라 Copied Translation 방식을 통한 다양한 실험을 통하여 데이터 증강기법이 기계번역 성능에 미치는 영향에 대해서 살펴본다. 실험결과 Back Translation과 Copied Translation과 같은 데이터 증강기법이 기계번역 성능향상에 도움을 줌을 확인 할 수 있었으며 Batch를 구성할 때 상대적 가중치를 두는 것이 성능향상에 도움이 됨을 알 수 있었다.

  • PDF

Detecting Errors in Dependency Treebank through XGBoost and Cross Validation (XGBoost와 교차 검증을 이용한 구문분석 말뭉치에서의 오류 탐지)

  • Choi, Min-Seok;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Hyuk-Ro;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.103-107
    • /
    • 2020
  • 의존구조 말뭉치는 자연언어처리 분야에서 문장의 의존관계를 파악하는데 널리 사용된다. 이러한 말뭉치는 일반적으로 오류가 없다고 가정하지만, 현실적으로는 다양한 오류를 포함하고 있다. 이러한 오류들은 성능 저하의 요인이 된다. 이러한 문제를 완화하려고 본 논문에서는 XGBoost와 교차검증을 이용하여 이미 구축된 구문분석 말뭉치로부터 오류를 탐지하는 방법을 제안한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로, 일반적인 분류기로서 오류를 검출할 수 없다. 본 논문에서는 분류기의 결과를 분석하여 오류를 검출하는 방법을 제안한다. 성능을 분석하려고 표본집단과 모집단의 오류 분포의 차이를 분석하였고 표본집단과 모집단의 오류 분포의 차이가 거의 없는 것으로 보아 제안된 방법이 타당함을 알 수 있었다. 앞으로 의미역 부착 말뭉치에 적용할 계획이다.

  • PDF