• 제목/요약/키워드: language representation model

검색결과 142건 처리시간 0.022초

Prosodic Annotation in a Thai Text-to-speech System

  • Potisuk, Siripong
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.405-414
    • /
    • 2007
  • This paper describes a preliminary work on prosody modeling aspect of a text-to-speech system for Thai. Specifically, the model is designed to predict symbolic markers from text (i.e., prosodic phrase boundaries, accent, and intonation boundaries), and then using these markers to generate pitch, intensity, and durational patterns for the synthesis module of the system. In this paper, a novel method for annotating the prosodic structure of Thai sentences based on dependency representation of syntax is presented. The goal of the annotation process is to predict from text the rhythm of the input sentence when spoken according to its intended meaning. The encoding of the prosodic structure is established by minimizing speech disrhythmy while maintaining the congruency with syntax. That is, each word in the sentence is assigned a prosodic feature called strength dynamic which is based on the dependency representation of syntax. The strength dynamics assigned are then used to obtain rhythmic groupings in terms of a phonological unit called foot. Finally, the foot structure is used to predict the durational pattern of the input sentence. The aforementioned process has been tested on a set of ambiguous sentences, which represents various structural ambiguities involving five types of compounds in Thai.

  • PDF

Self-Supervised Document Representation Method

  • Yun, Yeoil;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.187-197
    • /
    • 2020
  • 최근 신경망 기반의 학습 알고리즘인 딥 러닝 기술의 발전으로 인해 텍스트의 문맥을 고려한 문서 임베딩 모델이 다양하게 고안되었으며, 특히 대량의 텍스트 데이터를 사용하여 학습을 수행한 사전 학습 언어 모델을 사용하여 분석 문서의 벡터를 추론하는 방식의 임베딩이 활발하게 연구되고 있다. 하지만 기존의 사전 학습 언어 모델을 사용하여 새로운 텍스트에 대한 임베딩을 수행할 경우 해당 텍스트가 가진 고유한 정보를 충분히 활용하지 못한다는 한계를 가지며, 이는 특히 텍스트가 가진 토큰의 수에 큰 영향을 받는 것으로 알려져 있다. 이에 본 연구에서는 다수의 토큰을 포함한 장문 텍스트의 정보를 최대한 활용하여 해당 텍스트의 벡터를 도출할 수 있는 자기 지도 학습 기반의 사전 학습 언어 모델 미세 조정 방법을 제안한다. 또한, 제안 방법론을 실제 뉴스 기사에 적용하여 문서 벡터를 도출하고 이를 활용하여 뉴스의 카테고리 분류 실험을 수행하는 외부적인 임베딩 평가를 수행함으로써, 제안 방법론과 기존 문서 임베딩 모델과의 성능을 평가하였다. 그 결과 제안 방법론을 통해 도출된 벡터가 텍스트의 고유 정보를 충분히 활용함으로써, 문서의 특성을 더욱 정확하게 표현할 수 있음을 확인하였다.

UML 다이아그램간의 일관성과 완전성을 위한 검증 규칙 생성에 관한 연구 (The Study on the Generation of Verifying Rules for Consistency and Completeness of the Unified Modeling Language Diagrams)

  • 김재웅;김진수;김치수;황선명
    • 한국멀티미디어학회논문지
    • /
    • 제3권3호
    • /
    • pp.290-297
    • /
    • 2000
  • 객체지향 설계에 많이 사용되고 있는 UML의 일부 다이아그램들의 일관성과 완전성을 검증하기 위하여 UML다이아그램들을 분석하여 ER모델에 적용하고, 일련의 집합과 함수들을 사용하여 정형적으로 명세한 다음 이러한 함수들의 의미에 따라 UML 다이아그램들의 일관성과 완전성을 보장하는 일련의 규칙들을 유도한다. 이러한 규칙들은 추후에 다이아그램을 생성하는 능력과 일관성과 완전성을 검사하는 능력을 함에 가진 CASE 도구에 포함될 수 있다.

  • PDF

A Text Similarity Measurement Method Based on Singular Value Decomposition and Semantic Relevance

  • Li, Xu;Yao, Chunlong;Fan, Fenglong;Yu, Xiaoqiang
    • Journal of Information Processing Systems
    • /
    • 제13권4호
    • /
    • pp.863-875
    • /
    • 2017
  • The traditional text similarity measurement methods based on word frequency vector ignore the semantic relationships between words, which has become the obstacle to text similarity calculation, together with the high-dimensionality and sparsity of document vector. To address the problems, the improved singular value decomposition is used to reduce dimensionality and remove noises of the text representation model. The optimal number of singular values is analyzed and the semantic relevance between words can be calculated in constructed semantic space. An inverted index construction algorithm and the similarity definitions between vectors are proposed to calculate the similarity between two documents on the semantic level. The experimental results on benchmark corpus demonstrate that the proposed method promotes the evaluation metrics of F-measure.

오픈 월드 객체 감지의 현재 트렌드에 대한 리뷰 (Unveiling the Unseen: A Review on current trends in Open-World Object Detection)

  • 이크발 무하마드 알리;김수균
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.335-337
    • /
    • 2024
  • This paper presents a new open-world object detection method emphasizing uncertainty representation in machine learning models. The focus is on adapting to real-world uncertainties, incrementally updating the model's knowledge repository for dynamic scenarios. Applications like autonomous vehicles benefit from improved multi-class classification accuracy. The paper reviews challenges in existing methodologies, stressing the need for universal detectors capable of handling unknown classes. Future directions propose collaboration, integration of language models, to improve the adaptability and applicability of open-world object detection.

  • PDF

감정표현어를 이용한 스마트TV의 사용자경험 평가 (Evaluating User Experience of Smart Television Using Emotional Representation Language)

  • 변대호
    • 한국콘텐츠학회논문지
    • /
    • 제15권5호
    • /
    • pp.132-141
    • /
    • 2015
  • 스마트TV는 일반TV를 대체할 차세대 TV로 사용자경험(user experience: UX)의 중요성이 높아지고 있다. UX는 사용자의 감정 상태인 몰입, 기쁨, 흥미 정도를 평가하는 것으로 사용성과 함께 스마트TV 설계에서 고려되어야 할 중요한 원칙이며 사용만족도를 증진시켜 지속적인 구매를 유도하게 된다. 그러나 UX는 사용성보다 측정이 어렵고 생리적 또는 심리적 평가방법은 실험 비용과 실험환경의 제약이 많다는 것이 단점이 있다. 본 연구에서는 기존의 스마트TV의 UX 평가방법을 고찰한 후 새로운 UX 측정방법으로 텍스트로부터 감정을 평가하는 방법을 제안한다. 텍스트는 인터넷 쇼핑몰에서 스마트TV를 구매한 사람들이 남긴 상품후기를 사용한다. 이 방법은 설문조사 방법보다 적은 비용으로 감정을 파악할 수 있다는 것이 장점이다.

An Approach to Composing a Structured Model from Validated Submodels

  • Suh, Chang-Kyo;Suh, Eui-Ho
    • 한국경영과학회지
    • /
    • 제15권2호
    • /
    • pp.85-95
    • /
    • 1990
  • Structured modeling provides a formal mathematical framework, language, and computer-based environment for conceiving, representing, and manipulating a wide variety of model. It provides a natural framework for integrated modeling owing to its explicit representation power for computational dependencies among submodles. Nevertheless, it doesn't seem to offer a systematic way of composing a structured model from submodels. In order to develop a systematic way, this paper discusses three key issues : (1) Genus structure for model composition, (2) Storage of structured models, and (3) Integration of structured models. To formalize and visualize the approach, a programming module is developed to implemented the step-by-step integration.

  • PDF

방공교전모델(DADSim) 개발 및 활용사례 (Distributed Air Defense Simulation Model and its Applications)

  • 최상영;김의환
    • 한국국방경영분석학회지
    • /
    • 제27권2호
    • /
    • pp.134-148
    • /
    • 2001
  • In this paper, air-defense simulation model, called "DADSim", will be introduced. DADSim(Distributed Air Defense Simulation Model) was developed by Modeling&Simulation Lab of K.N.D.U.(Korea National Defence Univ) Weapon Systems Department. This model is an analysis-purpose model in the engagement-level. DADSim can simulate not only the global air-defense or Korean Peninsula but also the local air-defense or a battle field. DADSim uses the DTED(digital terrain elevation data) LeveII it for the representation of peninsula terrain characteristics. The weapon systems cooperated in the model are low/medium-range missile systems such as HAWK, NIKE, SAM. DADSim was designed in the way of object-oriented development method, implemented by C++ language. The simulation view is an event-sequenced object-orientation. For the convenience of input, output analysis, GUI(Graphic User Interface) of menu, window, dialog box, etc. are provided to the user, For the execution of DADSim, Silicon Graphic IRIX 6.3 or high version is required. DADSim can be used for the effectiveness analysis of­defence systems. Some illustrative examples will be shown in this paper.

  • PDF

Composing a structured model from validated submodels for effective model management

  • Suh, Chang-Kyo;Suh, Eui-Ho
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1990년도 춘계공동학술대회논문집; 한국과학기술원; 28 Apr. 1990
    • /
    • pp.49-60
    • /
    • 1990
  • Structured modeling provides a formal mathematical framework, language, and computer-based environment for conceiving, representing, and manipulating a wide variety of models. It provides a natural framework for integrated modeling owing to its explicit representation power for computational dependencies among submodels. Nevertheless, it doesn't seem to offer a systematic way of composing a structured model from submodels. In order to develop a systematic way, this paper discusses three key issues; (1) Genus structure of validated submodel, (2) Storing method of genus structure, and (3) Integration of genus structures to generate a new genus structure. To visualize the approach, a programming module is developed to implement the step-by-step integration.

  • PDF

OCL로 기술된 객체지향 설계 명세의 테스트 케이스 생성 (Generating Test Cases for Object-Oriented Design Specification)

  • 최은만
    • 정보처리학회논문지D
    • /
    • 제8D권6호
    • /
    • pp.843-852
    • /
    • 2001
  • 소프트웨어의 오류에 대한 통계를 보면 구현단계보다 분석과 설계 단계에 더 중요하고 많은 오류가 유입된다. 따라서 소프트웨어의 분석 및 설계 작업의 결과인 디자인 모델이 요구에 맞게 설계되었는지, 또는 구조적으로 적합한지 잘 점검할 필요가 있다. 이 논문에서는 객체지향 설계 방법으로 사용되고 있는 UML로 표현된 설계 모델을 효과적으로 테스트할 수 있는 방법에 대해 논의하였다. UML 모델을 이루는 각 요소들에 대한 제약조건을 OCL(Object Constraint Language)로 기술하고 카테고리 분할 방법을 이용하여 UML모델을 테스트하기 위한 데이터를 생성하는 방법을 제안하였다. 생성된 테스트 데이터를 이용하여 객체지향으로 설계된 모델뿐만 아니라 개발된 시스템의 기능 테스트를 수행할 수 있다.

  • PDF