• Title/Summary/Keyword: 정의 언어

Search Result 1,570, Processing Time 0.036 seconds

Query Normalization Using P-tuning of Large Pre-trained Language Model (Large Pre-trained Language Model의 P-tuning을 이용한 질의 정규화)

  • Suh, Soo-Bin;In, Soo-Kyo;Park, Jin-Seong;Nam, Kyeong-Min;Kim, Hyeon-Wook;Moon, Ki-Yoon;Hwang, Won-Yo;Kim, Kyung-Duk;Kang, In-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.396-401
    • /
    • 2021
  • 초거대 언어모델를 활용한 퓨샷(few shot) 학습법은 여러 자연어 처리 문제에서 좋은 성능을 보였다. 하지만 데이터를 활용한 추가 학습으로 문제를 추론하는 것이 아니라, 이산적인 공간에서 퓨샷 구성을 통해 문제를 정의하는 방식은 성능 향상에 한계가 존재한다. 이를 해결하기 위해 초거대 언어모델의 모수 전체가 아닌 일부를 추가 학습하거나 다른 신경망을 덧붙여 연속적인 공간에서 추론하는 P-tuning과 같은 데이터 기반 추가 학습 방법들이 등장하였다. 본 논문에서는 문맥에 따른 질의 정규화 문제를 대화형 음성 검색 서비스에 맞게 직접 정의하였고, 초거대 언어모델을 P-tuning으로 추가 학습한 경우 퓨샷 학습법 대비 정확도가 상승함을 보였다.

  • PDF

Generating Code for Distributed Environment (분산 환경을 위한 코드 생성)

  • 박찬모;정성옥;이준
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.58-63
    • /
    • 2002
  • 본 논문에서는 분산 환경을 위해 OMG에서 발표한 CORBA의 표준에 따라 하는 컴파일러의 전반부를 위해 OMG IDL 컴파일러를 사용하였다. CORBA에서 클라이언트와 서버간의 상호 동작을 위해 인터페이스를 정의한다. CORBA에서 인터페이스는 IDL(Interface Definition Language)를 통해 정의를 할 수 있다. IDL은 CORBA의 인터페이스를 기술하기 위한 추상 표기법이므로 개발에 사용되는 언어와는 연관성이 없다. 이를 개발에 사용하기 위해서 해당 언어로 맵핑을 하여야 한다. 본 논문은 IDL로 정의된 인터페이스를 C++로 맵핑하도록 하여 분산 객체 환경을 지원하도록 하기 위한 것이다. IDL 컴파일러는 IDL 정의를 입력 받아 어휘 및 구문 분석을 한 후 AST 트리를 생성하며, 생성된 각 노드를 통해 맵핑된 C++ 코드를 생성토록 한다.

  • PDF

User-defined types Based Consistent Query Language for Metadata Registry (사용자 정의 타입에 기반한 메타데이터 레지스트리를 위한 일관성 있는 질의 언어)

  • Kim, Jang-Won;Jeong, Dongw-Won;Baik, Doo-Kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2009.01a
    • /
    • pp.1-4
    • /
    • 2009
  • 이 논문에서는 메타데이터 레지스트리(ISO/IEC 11179: Metadata Registry)들이 가지고 있는 메타데이터 정보를 검색하고, 공유하기 위해 일관성 있는 질의 언어를 제안한다 메타데이터 레지스트리는 국제 표준으로서 메타데이터들을 정의하고 이들을 관리 및 공유를 하기 위해 만들어졌다. 이와 같은 국제 표준을 기반으로 한 메타데이터 레지스트리들이 서지, 환경, 의료 분야 등의 다양한 영역에서 사용되고 있다. 이와 함께 메타데이터 레지스트리를 기반으로 하여 기존에 저장된 메타데이터들을 검색하고, 공유하고, 관리하고자 하는 이슈에 대한 연구가 진행되고 있다. 하지만 현재까지 다양한 분야에 있는 메타데이터 레지스트리가 가지고 있는 정보를 가져오기 위한 표준 인터페이스가 제공되고 있지 않다. 이러한 문제를 해결하기 위한 연구로 SQL에 메타데이터 레지스트리를 위한 공통 연산자들을 추가하여 메타데이터 레지스트리에 존재하는 데이터들을 활용하는 연구가 있다. 하지만 이런 연산자들을 이용하기 위해서는 상용 DBMS 엔진에 추가되어야 하며, 연산자들이 없는 경우 일관된 질의어를 수행할 수 없다는 문제를 가지고 있다. 따라서 이 논문에서는 이와 같은 문제를 해결하기 위해서 국제 표준인 SQL(ISO/IEC 9075) 에서 정의하고 있는 사용자 정의 타입(User-defined types) 을 기반으로 한 일관성 질의 언어를 제안한다.

  • PDF

Defining Semantics of Live Sequence Chart Specification (Live Sequence Chart 명세언어의 의미론적 정의)

  • Lee, Eun-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.6 s.44
    • /
    • pp.49-57
    • /
    • 2006
  • While developing a complex reactive software system. it is very important to analyze the user requirement and reflect it to the developed system. Therefore understanding the need of users precisely and promptly is the key to the successful software system development. Among several requirement specification languages, message sequence charts (MSCs), also known as sequence diagrams in UML are the most widely used scenario notation. Live Sequence Charts (LSCs) are a variant ot MSCs, characterized by its message abstraction facility and the modality of scenarios. In this paper, I define the formal semantics of LSC specification including the essential language constructs such as pre-charts, variables, assignment and conditions. The range of the formalized LSC language has been broadened, and the scope of the formalized semantics is much closer to the complete LSC specification.

  • PDF

An Information Extraction Approach for Spoken Language Understanding in a Hostile Environment. (열악한 환경의 음성 언어 이해를 위한 정보 추출 접근 방식)

  • Eun, Ji-Hyun;Lee, Chang-Ki;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.20-24
    • /
    • 2004
  • 본 논문에서는 환경 잡음과 원거리 음성 입력 그리고 노인 발화 등의 열악한 음성 인식 환경에서의 음성 언어이해(spoken language understanding)를 위한 정보 추출 접근 방식에 대해 논하고 있다. 정보 추출의 목적은 미리 정의된 slot에 적절한 값을 찾는 것이다. 음성 언어 이해를 위한 정보 추출은 필수적인 요소만을 추출하는 것을 목적으로 하는 개념 집어내기(concept spotting) 접근 방식을 사용한다. 이러한 방식은 미리 정의된 개념 구조 slot에만 관심을 가지기 때문에. 음성 언어 이해에서 사용되는 정보 추출은 언어를 완전히 이해한다기보다는 부분적으로 이해하는 방식을 취하고 있다. 음성 입력 언어는 주로 열등한 인식 환경에서 이루어지기 때문에 많은 인식 오류를 가지고 이로 인해 텍스트 입력에 비해 이해하기 어렵다. 이러한 점을 고려하여, 특정 정보에 집중함으로써 음성 언어를 이해하고자 시도하였다. 도로 정보 안내 영역을 대상으로 한 실험에서 텍스트 입력(WER 0%)과 음성 입력(WER 39.0%)이 주어졌을 때, 개념 집어내기 방식의 F-measure 값은 각각 0.945, 0.823을 나타내었다.

  • PDF

Algorithmic approach for handling linguistic values (언어 값을 다루기 위한 알고리즘적인 접근법)

  • Choi Dae Young
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.203-208
    • /
    • 2005
  • We propose an algorithmic approach for handling linguistic values defined in the same linguistic variable. Using the proposed approach, we can explicitly capture the differences of individuals' subjectivity with respect to linguistic values defined in the same linguistic variable. The proposed approach can be employed as a useful tool for discovering hidden relationship among linguistic values defined in the same linguistic variable. Consequently, it provides a basis for improving the precision of knowledge acquisition in the development of fuzzy systems including fuzzy expert systems, fuzzy decision tree, fuzzy cognitive map, ok. In this paper, we apply the proposed approach to a collective linguistic assessment among multiple experts.

A Study on Automatic Generation of Fuzzy Controller by Genetic Algorithm (진화적 방법을 이용한 퍼지제어기의 자동 생성에 관한 연구)

  • 이지형;이광형
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1995.10b
    • /
    • pp.203-210
    • /
    • 1995
  • 본 논문에서는 주어진 입출력 데이터로부터 유전자 알고리즘을 이용하여 퍼지제어 기를 자동 생성하는 방법에 대하여 기술한다. 주어진 입출력 데이터를 표현하는 퍼지제어기 는 각 유전자에 암호화되고, 퍼지제어기를 표현하는 각 유전자들은 서로 정보를 교환함으로 써 주어진 데이터를 적절히 표현하는 퍼지제어기를 탐색하게 된다. 유전자는 각 입력 변수 의 언어항을 정의하고, 퍼지제어규칙은 정의된 언어항과 주어진 데이터로부터 생성된다. 탐 색과정에서 퍼지제어기의 제어규칙과 각 입력변수의 언어항의 개수와 위치는 계속 변화하여 주어진 입출력 데이터를 잘 설명하는 퍼지제어기를 찾는다.

  • PDF

Structure Searching of Biological Sequence using DCG in Constraint Logic Programming Language (제한 논리 프로그래밍 언어에서 DCG를 이용한 생물학적 서열의 구조 검색)

  • 이근우;이수현;이명준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.352-354
    • /
    • 2001
  • 생물학적 서열의 구조 검색은 생물학적 특성을 예측하는데 많은 도움을 주며, 서열에서 나타나는 구조의 패턴은 촘스키의 형식 언어로 기술 가능하다. 본 논문에서는 문맥무관문법의 확장된 표기법인 DCG를 이용하여 구조 검색을 위한 구조 패턴의 생성 규칙을 정의하였다. 또한 구조 검색의 효율향상을 위하여 구조와 관련한 제한(constraint)을 정의하였고 이를 제한 논리 프로그래밍 언어로 구현하였다. 구현된 구조 검색 엔진은 웹 인터페이스를 통하여 접근할 수 있다.

  • PDF

Definition and Application of a Layered Avatar Behavior Script Language for Reusability and Simplicity (재사용성 및 용이성을 위한 계층적 아바타 행위 스크립트 언어의 정의)

  • Kim Jae-Kyung;Choi Seung-Hyuk;Sohn Won-Sung;Lim Soon-Bum;Choy Yoon-Chul
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.33 no.8
    • /
    • pp.455-476
    • /
    • 2006
  • An avatar script language consists of commands set which is used to control avatar behaviors in cyberspace. The script language should be abstract from complex low-level concepts, so that a user can write down a scenario script easily without concerning about physical motion parameters. Also, the script should be defined in a standard format and structure to allow reusing in various implementation tools. In this paper, a layered script language is proposed for avatar behavior representation and control, which consists of task-level behavior, high-level motion and primitive motion script language. The script language of each layer represents behavior elements for a scenario scripting interface, an avatar motion sequence, and geometric information of implementation environment, respectively. Therefore, a user can create a scenario script by abstract behavior interface and a script can be applied to various implementations by the proposed translating process. A presentation domain is chosen for applying the proposed script language and the implementation result shows that the script is flexibly applied in several applications.