• 제목/요약/키워드: pitch sequence

검색결과 42건 처리시간 0.023초

우리말 연속음성의 음절 분할법 (A Syllabic Segmentation Method for the Korean Continuous Speech)

  • 한학용;고시영;허강인
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.70-75
    • /
    • 2001
  • 본 논문은 우리말 연속음성에 대한 음절단위 분할법을 제안한다. 이 방법은 다음 3단계로 이루어진다: (1) 음성의 시간영역 분할 파라메터인 피치, 에너지, ZCR, PVR을 이용하여 음성데이터를 자음, 자음. 묵음 단위로 라벨링하여 토큰 (Token)을 형성, (2) 형성된 토큰을 유한상태오토마타를 이용하여 한국어 음절구조로 파서 (Parser)를 설계하여 스캐닝 (Scanning), (3) 의사 음절핵 정보를 이용하여 두개 혹은 여러 개의 음절을 가지는 음성부분에 대한 재분할을 통하여 음절단위 분할 완성. 제안된 방법에 대한 성능 평가를 위해서 문장과 단어단위 연속음성에 대한 분할 실험결과 각각 73.7%와 85.9%의 분할률을 얻었다.

  • PDF

인공 와우를 위한 신호 처리 및 전달부의 구현 (Signal Processing and Implementation of Transmitter for Cochlear Implant)

  • 채대곤;최두일;변정근;백승화;공형호;박상희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1993년도 하계학술대회 논문집 A
    • /
    • pp.284-286
    • /
    • 1993
  • Software and hardware for cochlear implant system have been developed to create a speech signal processing system which, in real-time, extracts model parameter including formants, pitch, amplitude information. The system is based on the Texas Instruments TMS320 family. In hardware, computer interface has been desisted and implemented that allows presentation of biphasic pulse stimuli to patients with the hearing handicapped. The host computer sends a stream of bytes to the parallel port. Upon receipt of the data the interface generates the appropriate burst sequence that is delivered to the patient's external transmitter coil. The coded information is interpreted by the Nucleus-22 internal receiver that delivers the pulse to the specified electrodes at the specified amplitude and pulse width.

  • PDF

A Framework for Real Time Vehicle Pose Estimation based on synthetic method of obtaining 2D-to-3D Point Correspondence

  • Yun, Sergey;Jeon, Moongu
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.904-907
    • /
    • 2014
  • In this work we present a robust and fast approach to estimate 3D vehicle pose that can provide results under a specific traffic surveillance conditions. Such limitations are expressed by single fixed CCTV camera that is located relatively high above the ground, its pitch axes is parallel to the reference plane and the camera focus assumed to be known. The benefit of our framework that it does not require prior training, camera calibration and does not heavily rely on 3D model shape as most common technics do. Also it deals with a bad shape condition of the objects as we focused on low resolution surveillance scenes. Pose estimation task is presented as PnP problem to solve it we use well known "POSIT" algorithm [1]. In order to use this algorithm at least 4 non coplanar point's correspondence is required. To find such we propose a set of techniques based on model and scene geometry. Our framework can be applied in real time video sequence. Results for estimated vehicle pose are shown in real image scene.

Integration Technologies for 3D Systems

  • Ramm, P.;Klumpp, A.;Wieland, R.;Merkel, R.
    • 한국마이크로전자및패키징학회:학술대회논문집
    • /
    • 한국마이크로전자및패키징학회 2003년도 International Symposium
    • /
    • pp.261-278
    • /
    • 2003
  • Concepts.Wafer-Level Chip-Scale Concept with Handling Substrate.Low Accuracy Placement Layout with Isolation Trench.Possible Pitch of Interconnections down to $10{\mu}{\textrm}{m}$ (Sn-Grains).Wafer-to-Wafer Equipment Adjustment Accuracy meets this Request of Alignment Accuracy (+/-1.5 ${\mu}{\textrm}{m}$).Adjustment Accuracy of High-Speed Chip-to-Wafer Placement Equipment starts to meet this request.Face-to-Face Modular / SLID with Flipped Device Orientation.interchip Via / SLID with Non-Flipped Orientation SLID Technology Features.Demonstration with Copper / Tin-Alloy (SLID) and W-InterChip Vias (ICV).Combination of reliable processes for advanced concept - Filling of vias with W as standard wafer process sequence.No plug filling on stack level necessary.Simultanious formation of electrical and mechanical connection.No need for underfiller: large area contacts replace underfiller.Cu / Sn SLID layers $\leq$ $10{\mu}{\textrm}{m}$ in total are possible Electrical Results.Measurements of Three Layer Stacks on Daisy Chains with 240 Elements.2.5 Ohms per Chain Element.Contribution of Soldering Metal only in the Range of Milliohms.Soldering Contact Resistance ($0.43\Omega$) dominated by Contact Resistance of Barrier and Seed Layer.Tungsten Pin Contribution in the Range of 1 Ohm

  • PDF

정밀한 선형 횡변위 측정용 elongated circular 격자의 자체결상을 이용한 무아레 무늬의 신호처리법 (The signal processing of moire fringes obtained by the superposition of a fixed self-imaging elongated circular(EC) grating and a moved EC grating for the precise measurement of linear transverse displacements)

  • 이상일;백승선;조재흥
    • 한국광학회지
    • /
    • 제15권5호
    • /
    • pp.435-442
    • /
    • 2004
  • 직선격자와 원형격자의 혼합형태인 EC(Elongated circular) 격자의 무아레 무늬로 수 $\mu\textrm{m}$의 선형 횡변위를 보기 위하여 자체결상법으로 무아레 무늬를 형성하고 이를 신호처리하여 횡변위를 정밀하게 측정하였다. CCD 카메라로 측정한 무아레 무늬의 직선격자 부분을 고주파 필터링(filtering)과 스무딩(smooothing) 및 2차함수 피팅(fitting)하고, 이 결과의 1차 미분으로부터 영점교차의 위치를 세어서 직선격자 부분의 밝은 무늬의 위치를 측정하였다. 그리고 EC격자의 원형격자 부분에 의한 무아레 무늬는 고주파 필터링과 스무딩으로 구한 결과의 1차 미분에서 나온 영점교차 개수로부터 원형격자의 밝은 부분의 개수를 셈으로써 선형 횡변위의 EC격자 피치에 대한 정수배의 선형이동량을 정확히 계측하였다. 이 결과 80 $\mu\textrm{m}$ 이하의 횡변위에 대해서 지금까지 무아레 무늬로부터 가시적으로 구한 선형 횡변위량보다 훨씬 정확한 3% 이하의 정확도로 횡변위를 구할 수 있었다.

영상 평활화를 위한 화소-병렬 영상처리 시스템에 관한 연구 (A Study on the Pixel-Paralled Image Processing System for Image Smoothing)

  • 김현기;이천희
    • 대한전자공학회논문지SD
    • /
    • 제39권11호
    • /
    • pp.24-32
    • /
    • 2002
  • 본 논문에서는 포맷 변환기를 사용하여 여러 가지 영상처리 필터링을 구현하였다. 이러한 설계 기법은 집적회로를 이용한 대규모 화소처리배열을 근거로 하여 실현하였다. 집적구조의 두가지 형태는 연산병렬프로세서와 병렬 프로세스 DRAM(또는 SRAM) 셀로 분류할 수 있다. 1비트 논리의 설게 피치는 집적 구조에서의 고밀도 PE를 배열하기 위한 메모리 셀 피치와 동일하다. 이러한 포맷 변환기 설계는 효율적인 제어 경로 수행을 능력을 가지고 있으며 하드웨어를 복잡하게 할 필요 없이 고급 기술로 사용 될 수 있다. 배열 명령어의 순차는 프로세스가 시작되기 전에 호스트 컴퓨터에 의해 생성이 되며 명령은 유니트 제어기에 저장이 된다. 호스트 컴퓨터는 프로세싱이 시작된 후에 저장된 명령어위치에서 시작하여 화소-병렬 동작을 처리하게 된다. 실험 결과 1)단순한 평활화는 더 높은 공간의 주파수를 억제하면서 잡음을 감소시킬 뿐 아니라 에지를 흐리게 할 수 있으며, 2) 평활화와 분할 과정은 날카로운 에지를 보존하면서 잡음을 감소시키고, 3) 평활화와 분할과 같은 메디안 필터링기법은 영상 잡음을 줄이기 위해 적용될 수 있고 날카로운 에지는 유지하면서 스파이크 성분을 제거하고 화소 값에서 단조로운 변화를 유지 할 수 있었다.

Prosodic Boundary Effects on the V-to-V Lingual Movement in Korean

  • Cho, Tae-Hong;Yoon, Yeo-Min;Kim, Sa-Hyang
    • 말소리와 음성과학
    • /
    • 제2권3호
    • /
    • pp.101-113
    • /
    • 2010
  • The present study investigated how the kinematics of the /a/-to-/i/ tongue movement in Korean would be influenced by prosodic boundary. The /a/-to-/i/ sequence was used as 'transboundary' test materials which occurred across a prosodic boundary as in /ilnjəʃ$^h$a/ # / minsakwae/ ('일년차#민사과에' 'the first year worker' # 'dept. of civil affairs'). It also tested whether the V-to-V tongue movement would be further influenced by its syllable structure with /m/ which was placed either in the coda condition (/am#i/) or in the onset condition (/a#mi). Results of an EMA (Electromagnetic Articulagraphy) study showed that kinematical parameters such as the movement distance (displacement), the movement duration, and the movement velocity (speed) all varied as a function of the boundary strength, showing an articulatory strengthening pattern of a "larger, longer and faster" movement. Interestingly, however, the larger, longer and faster pattern associated with boundary marking in Korean has often been observed with stress (prominence) marking in English. It was proposed that language-specific prosodic systems induce different ways in which phonetics and prosody interact: Korean, as a language without lexical stress and pitch accent, has more degree of freedom to express prosodic strengthening, while languages such as English have constraints, so that some strengthening patterns are reserved for lexical stress. The V-to-V tongue movement was also found to be influenced by the intervening consonant /m/'s syllable affiliation, showing a more preboundary lengthening of the tongue movement when /m/ was part of the preboundary syllable (/am#i/). The results, together, show that the fine-grained phonetic details do not simply arise as low-level physical phenomena, but reflect higher-level linguistic structures, such as syllable and prosodic structures. It was also discussed how the boundary-induced kinematic patterns could be accounted for in terms of the task dynamic model and the theory of the prosodic gesture ($\pi$-gesture).

  • PDF

리듬기반 인터액티브 음악 플레이어를 위한 음표 위치 추적 알고리즘 (Note Tracking and Localization Algorithm for Interactive Rhythm-based Music Player)

  • 김재홍;박재성;이준성;차동훈;김정현
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.482-486
    • /
    • 2009
  • 기존의 음악 플레이어들은 녹음 되거나 디지털적으로 캡쳐 된 음악정보를 재생 하여 사용자들이 "한 방향"으로의 수동적인 감상을 가능하게 하였다. 본 논문에서는 mp3나 wav 로 형태로 실제로 연주 되고 녹음 된 음악에서의 특정 음표의 시간적인 위치를 찾아내는 알고리즘을 소개 하도록 한다. 찾아내고자 하는 음표의 악보를 이용하면, 우선 주어진 녹음 된 음악 파일에서의 해당 음표의 위치를 시간적인 순서대로 예측 할 수 있다. 그러나, 연주/녹음된 음악은 악보에 나와 있는 대로 연주 되지 않고 대부분 시간적으로 혹은 심지어 내용적으로 변화가 있게 마련이다. 따라서 추가적인 분석을 통하여 음표의 정확한 위치를 찾아나가게 되고, 그 위치로부터 이러한 예측 및 교정작업 (prediction/correction)을 계속적으로 수행하게 된다. 이러한 부가적인 정보를 이용하여 사용자가 음표의 위치에 (즉 리듬에) 기반한 인터액션을 통하여 실제 음악을 연주하는 듯 한 사용자 경험을 줄 수 있다.

  • PDF

인자화된 최대 공산선형회귀 적응기법을 적용한 해양IT융합기술을 위한 HMM기반 음성합성 시스템 (Factored MLLR Adaptation for HMM-Based Speech Synthesis in Naval-IT Fusion Technology)

  • 성준식;홍두화;정민아;이연우;이성로;김남수
    • 한국통신학회논문지
    • /
    • 제38C권2호
    • /
    • pp.213-218
    • /
    • 2013
  • 은닉 마코프 모델 (hidden Markov Model, HMM) 기반 음성 합성 시스템에서 파라미터 적응을 위해 널리 쓰이는 기법으로 최대 공산 선형 회귀 (maximum likelihood linear regression, MLLR)이 있다. 이전 연구에서 우리는 각 MLLR 파라미터를 인자화된 MLLR (Factored MLLR, FMLLR) 형태로 확장하는 형태를 제안하였다. FMLLR 파라미터를 기존의 EM 알고리즘 형태로 구하는 기법 역시 제안하였고, 이를 통해 보완 정보를 활용하여 적응 학습을 수행할 수 있게 하였다. 본 논문에서는, FMLLR 기법을 스펙트럼 파라미터에 사용하는 것뿐 아니라 피치에도 적용하여 그 성능을 향상시키는 것에 대한 탐구를 수행하였다. 감정 음성을 생성하는 여러 실험을 통해, 우리는 제안하는 기법이 피치 및 스펙트럼에 대해 효과적으로 작용하는 것을 확인하였다.

소아 망진을 위한 얼굴 특징 추출 및 영아 산통 진단을 위한 울음소리 분석 (Face Feature Extraction for Child Ocular Inspection and Diagnosis of Colics by Crying Analysis)

  • 조동욱;김봉현
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.97-104
    • /
    • 2006
  • 의사 표현 능력이 떨어지는 소아들은 질병 발생시 이를 효과적으로 자신의 불편함을 표현할 방법이 없다. 따라서 임상의들은 소아 환자의 부모들로부터 문진(inquiring)을 통해 질병 진단을 하고 있는 것이 현 실정이며 이는 잘못된 진단 결과를 초래 할 수 있는 문제점을 가지고 있다. 이를 위해 본 연구에서는 인체 오장 육부의 생체 신호가 안면과 음성에 반영되어 나타난다는 한방 원리를 이용하여 소아 망진, 소아 청진 기기를 개발한다. 그 결과 진단시 임상의들의 직관을 시각화, 객관화, 정량화하여 소아 질병 진단의 정확성을 기하고자 한다. 본 논문은 전체 개발 시스템 중 그 첫 번째 작업 수행 결과로서 소아 망진의 경우 색상 보정, YCbCr 적용과 살색 영역 선정 그리고 오관 및 명당 추출 방법 등을 개발한다. 또한 소아 청진의 경우 피치, 강도, 포먼트 분석을 통해 영아 산통 질병의 울음소리 특성을 수치화하였으며 이를 통해 임상의들의 직관을 객관화한다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증한다.