• Title/Summary/Keyword: 합성 DB

Search Result 87, Processing Time 0.022 seconds

Construction of facial database for a facial expression-inner states correlation model (표정-내적상태 상관모형을 위한 얼굴 DB 구축)

  • 반세범;한재현;정찬섭
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1997.11a
    • /
    • pp.215-219
    • /
    • 1997
  • 내적 감성상태와 표정을 연결하는 상관모형을 개발하기 위\ulcorner 기초자료로서 광범위한 얼굴표정자료를 수집하였다. 다양한 얼굴유형의 표정자료를 DB화하기 위해서는 궁극적으로 50명 이상의 인물표정 자료수집이 필요하다고 보고, 우선 영화배우 10면분의 표정자료를 수집하였다. 이를 위해 표정연기가 자연스럽다고 평가된 영화배우 10명을 선정하고, 이들이 출연한 50여편의 영화비디오에서 표정자료를 수집하였다. 한사람의 인물당 50개의 표정을 한세트로 하여 총 10명분 500가지의 표정자료수집을 완료하였다. 한사람의 인물당 50개의 표정을 한 세트로 하여 총 10명분 500가지의 표정자료수집을 완료하였다. 각각의 표정은 시작-상승-절정-하강-종료의 연속 5단계를 비율적으로 표집하여 동적정보를 포함하고 있다. 이들 자료들은 등자인물의 출연맥락이나 상황별로 분류하여 표정관련 맥락단서를 기록하였고, 후속연구를 통해 각 표정에 대응되는 내적상태를 기록할 수 있도록 DB화 하였다. 이와같이 구조화된 자료들은 표정인식과 합성의 입출력모형을 위한 기초자료로 활용될 뿐 아니라, 한국인의 얼굴 프로토타입 DB구축 및 향후 표정관련 연구의 타당성을 검증할 수 있는 Benchmarking 정보를 제공할 수 있다.

  • PDF

A Study on Generation Method of Intonation using Peak Parameter and Pitch Lookup-Table (Peak 파라미터와 피치 검색테이블을 이용한 억양 생성방식 연구)

  • Jang, Seok-Bok;Kim, Hyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.184-190
    • /
    • 1999
  • 본 논문에서는 Text-to-Speech 시스템에서 사용할 억양 모델을 위해 음성 DB에서 모델 파라미터와 피치 검색테이블(lookup-table)을 추출하여 미리 구성하고, 합성시에는 이를 추정하여 최종 F0 값을 생성하는 자료기반 접근방식(data-driven approach)을 사용한다. 어절 경계강도(break-index)는 경계강도의 특성에 따라 고정적 경계강도와 가변적 경계강도로 세분화하여 사용하였고, 예측된 경계강도를 기준으로 억양구(Intonation Phrase)와 액센트구(Accentual Phrase)를 설정하였다. 특히, 액센트구 모델은 인지적, 음향적으로 중요한 정점(peak)을 정확하게 모델링하는 것에 주안점을 두어 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞뒤 기울기를 추정하여 4개의 파라미터로 설정하였고, 이 파라미터들은 CART(Classification and Regression Tree)를 이용하여 예측규칙을 만들었다. 경계음조가 나타나는 조사, 어미는 정규화된(normalized) 피치값과 key-index로 구성되는 검색테이블을 만들어 보다 정교하게 피치값을 예측하였다. 본 논문에서 제안한 억양 모델을 본 연구실에서 제작한 음성합성기를 통해 합성하여 청취실험을 거친 결과, 기존의 상용 Text-to-Speech 시스템에 비해 자연스러운 합성음을 얻을 수 있었다.

  • PDF

Characteristics of controlled drug release using conductive polymer electrochemically polymerized on multi-electrodes (다중 전극에 전기 중합한 전도성 고분자를 이용한 선택적 약물방출 특성)

  • Song, Tae-Eun;Chang, Jong-Hyeon;Son, Ji-Hee;Yang, Sang-Sik;Pak, Jung-Ho
    • Proceedings of the KIEE Conference
    • /
    • 2004.11a
    • /
    • pp.278-280
    • /
    • 2004
  • 본 논문의 내용은 다중전극에 전기 중합한 전도성 고분자를 이용하여 약물을 결합한 후 전압 인가에 의한 선택적인 약물방출을 구현하는 것이다. Glass wafer에 anode와 cathode 전극을 제작하고 4개의 anode 전극면에 각각 전기중합으로 전도성 고분자막을 합성하였다. 양이온성 약물인 lidocaine을 결합할 수 있도록 피롤과 함께 도펀트로써 분자량이 큰 DBS를 사용하였으며 고분자막의 이온출입원리를 이용하여 약물을 결합하고 방출하였다. Cyclic voltammogram로부터 PPy(DBS) Polypyrrole (dodecylbenzene sulfonate) 전극의 산화 환원특성 및 전극면에 PPy(DBS) 막이 생성되기 위한 조건을 확인하였고, 그 결과를 토대로 PPy(DBS)막을 3전극 시스템과 Coulometry를 이용하여 전압을 인가하여 합성하였고, 합성전하량으로 부터 PPy(DBS)막의 두께를 알 수 있었다. Lidocaine의 결합 및 방출 시에도 정전압을 이용하였으며 약물의 방출 유무를 확인하기 위하여 UV spectrometer를 사용하였다. 다중전극에 PPy(DBS)막을 1.5um 두께로 합성한 후 lidocaine을 결합시키고 선택적으로 약물을 방출한 결과 각각의 PPy(DBS)막으로부터 $1.4{\sim}1.7mg$의 약물이 방출됨을 확인 할 수 있었다.

  • PDF

Analysis of Target Identification Performances Using Bistatic ISAR Images (바이스태틱 ISAR 영상을 이용한 표적식별 성능 분석)

  • Lee, Seung-Jae;Lee, Seong-Hyeon;Kang, Min-Seok;Yang, Eunjung;Kim, Kyung-Tae
    • The Journal of Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.27 no.6
    • /
    • pp.566-576
    • /
    • 2016
  • Inverse synthetic aperture radar(ISAR) image generated from bistatic radar(Bi-ISAR) represents two-dimensional scattering distribution of a target, and the Bi-ISAR can be used for bistatic target identification. However, Bi-ISAR has large variability in scattering mechanisms depending on bistatic configurations and do not represent exact range-Doppler information of a target due to inherent distortion. Thus, an efficient training DB construction is the most important factor in target identification using Bi-ISARs. Recently, a database construction method based on realistic flight scenarios of a target, which provides a reliable identification performance for the monostatic target identification, was applied to target identification using high resolution range profiles(HRRPs) generated from bistatic radar(Bi-HRRPs), to construct efficient training DB under bistatic configurations. Consequently, high identification performance was achieved using only small amount of training Bi-HRRPs, when the target is a considerable distance away from the bistatic radar. Thus, flight scenarios based training DB construction is applied to target identification using Bi-ISARs. Then, the capability and efficiency of the method is analyzed.

Implementation of text to speech terminal system by distributed database (데이터베이스 분산을 통한 소용량 문자-음성 합성 단말기 구현)

  • 김영길;박창현;양윤기
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2431-2434
    • /
    • 2003
  • In this research, our goal is to realize Korean Distribute TTS system with server/client function in wireless network. The speech databases and some routines of TTS system is stuck with the server which has strong functions and we made Korean speech databases and accomplished research about DB which is suitable for distributed TTS. We designed a terminal has the minimum setting which operate this TTS and designed proper protocol so we will check action of Distributed TTS.

  • PDF

Design of Linguistic Contents of Speech Copora for Speech Recognition and Synthesis for Common Use (공동 이용을 위한 음성 인식 및 합성용 음성코퍼스의 발성 목록 설계)

  • Kim Yoen-Whoa;Kim Hyoung-Ju;Kim Bong-Wan;Lee Yong-Ju
    • MALSORI
    • /
    • no.43
    • /
    • pp.89-99
    • /
    • 2002
  • Recently, researches into ways of improving large vocabulary continuous speech recognition and speech synthesis are being carried out intensively as the field of speech information technology is progressing rapidly. In the field of speech recognition, developments of stochastic methods such as HMM require large amount of speech data for training, and also in the field of speech synthesis, recent practices show that synthesis of better quality can be produced by selecting and connecting only the variable size of speech data from the large amount of speech data. In this paper we design and discuss linguistic contents for speech copora for speech recognition and synthesis to be shared in common.

  • PDF

Speech Database Design and Structuring for High Quality TTS (고품질 음성합성을 위한 합성 DB 구축)

  • Kang Dong-Gyu;Yi Sionghun;Ryu Won-Ho
    • Proceedings of the KSPS conference
    • /
    • 2002.11a
    • /
    • pp.33-36
    • /
    • 2002
  • As the telematics service that is the integration of information technology approaches commercialization, the necessity and gravity of speech technology is rapidly growing. The speech technology occupies important position in the telematics service because it informs the starting of service and the retrieved result. This service must provide high accuracy of speech recognition and natural synthesis of human speech in a driving environment and it is especially true for the fee-for-service. For high quality TTS, the speech synthesis technique that makes optimal synthesis database and uses efficiently this database is required. In this paper, we describe the design of phonetically balanced sentences used for speech database, the selection of service-suitable-speaker, the extraction methods of accurate phoneme boundary, and the factors which are taken into consideration in the extraction stage of prosody. Finally we show the real case that has commercially implemented.

  • PDF

Development of Virtual Reality Contents for Korean Sign Language Interpretation (수화 통역을 위한 VR 콘텐츠 개발)

  • Na, Kil-Hang;Lee, Byung-Ho;Kim, Jong-Hun;Kim, Jong-Nam;Jung, Young-Kee
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.690-695
    • /
    • 2009
  • 본 논문은 영화, 방송, 애니메이션 등의 다양한 동영상 콘텐츠에 수화 애니메이션을 합성하여 동영상 콘텐츠를 청각 및 언어장애인들에게 이해시키기 위한 수화 통역 VR 콘텐츠 시스템을 제안하고자 한다. 제안된 시스템은 수화 사전에 있는 수화들을 3D 애니메이션으로 DB화하기 위해, 모션 캡처 시스템과 데이터 글러브를 사용하여 실제 사람처럼 자연스러운 애니메이션을 생성하였다. 최종적으로 동영상 콘텐츠의 자막이나 대본의 구문분석을 한 후, 이를 수화용 단어자막을 통해 수화 애니메이션을 DB에서 검색한 후, 실시간적으로 기존 동영상 콘텐츠와 동기합성을 하여 수화 통역 콘텐츠를 제공하는 VR 콘텐츠 시스템을 구현하였고 이 시스템을 동화용 애니메이션에 적용하였다.

  • PDF

Multi-view Stereoscopic Image and Synthesis and Interpolation Methods for Progressive Image Retrieval (점진적 영상 검색을 위한 다시점 입체 영상의 합성과 보간 기법)

  • 최미란;박대철
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1997.11a
    • /
    • pp.135-138
    • /
    • 1997
  • Multi-view 영상 DB의 surround view 입체 화상을 재현하기 위해서는 영상 정보를 효과적으로 합성, 보간하는 방법이 필연적으로 요구된다. 다시점 입체 영상의 표시 기능을 구현하기 위해서 이론적으로는 충분한 개수의 카메라를 상하 좌우로 배치하여 영상을 획득하고 보는 이의 위치에 가장 적합한 영상을 선택하여 표현하면 된다. 이 경우 많은 수의 카메라로부터 입력되는 방대한 영상 데이터의 저장, 처리, 전송, 설치 문제 등 현실적으로 많은 제약점이 존재한다. 이러한 문제점을 해결하기 위해 기존의 블록 매칭과 같은 3D 구조 추정에 기초하여 블록 단위의 깊이 정보와 텍스쳐 정보의 추출, 다시점 영상 set의 가장 왼쪽 영상으로부터 시작하여 차례로 한 줄씩 쌓아서 얻어진 EPI(Epipolar Plane Image)에 기초한 유사 영상 값의 자취선 탐색 방법에 의한 시차와 텍스쳐 정보 추출로 전체 다안화상을 다해상도로 표현하여 전송하는 방식을 제안한다. 다해상도의 영상 표현과 점진적 전송 방법을 통해 다시점 영상 검색 시스템의 성능향상을 위한 네트워크 모델링을 제안하고자 한다.

  • PDF

Design Comparison of Composite Girder Bridges Designed by ASD and LRFD Methods (허용응력설계법 및 하중저항계수설계법에 의한 강합성 거더교 설계결과 비교)

  • Cho, Eun-Young;Shin, Dong-Ku
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.29 no.5A
    • /
    • pp.447-456
    • /
    • 2009
  • The design comparison and flexural reliability analysis of continuous span composite plate girder bridges are performed. The girders are designed by the methods of allowable stress design (ASD) and load and resistance factor design (LRFD). For the LRFD design, the design specification under development mainly by KBRC, based on AASHTO-LRFD specification in case of steel structures, is applied with the newly proposed design live load which has been developed by analyzing domestic traffic statistics from highways and local roads. For the ASD based design, the current KHBDC code with DB-24 and DL-24 live loads is used. The longest span length for the 3-span continuous bridges with span arrangement ratio of 4:5:4 is assumed to be from 30 m to 80 m. The amount of steel, performance ratios, and governing design factors for the sections designed by the ASD and LRFD methods are compared. In the reliability analysis for the flexural failure of the sections designed by two methods, the statistical properties on flexural resistance based on the yield strength statistics for over 16,000 domestic structural steel samples are applied.