• 제목/요약/키워드: LPC

검색결과 384건 처리시간 0.029초

한국어와 일본어의 음성 인식을 위한 알고리즘 개발에 관한 연구 (A Study on the Algorithm Development for Speech Recognition of Korean and Japanese)

  • 이성화;김병래
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.61-67
    • /
    • 1998
  • 본 연구에서는 다층 순방향 신경망(MFNN) 모델을 이용해서 한국어 및 일본어 숫자음 인식 실험을 수행하였다. 각각 5명의 한국인 남성 및 여성 화자가 0부터 9까지의 10개의 숫자를 7회 발음토록 하였고, 그중 2회 발음한 것을 인식 실험에 사용하였다. 이들 음성 데이터로부터 각각 추출된 피치 계수, 선형 예측 계수, 선형 예측 켑스트럼 계수들을 신경망의 입력 패턴으로 입력시켜 인식 성능을 측정하였다. 한국어를 사용한 실험과 일본어를 사용한 실험 모두에서 피치 계수를 사용하는 것이 다른 계수를 사용하는 것보다 약 4% 정도 우수한 성능을 나타내었다.

  • PDF

인지 LPC cepstrum의 새로운 구현 및 음성인식에의 적용 (A new Implementation of Perceptual LPC Cepstrum and its Application to Speech Recognition)

  • 김진영;최승호
    • 한국음향학회지
    • /
    • 제15권5호
    • /
    • pp.61-64
    • /
    • 1996
  • 본 논문에서는 귀의 주요한 특징인 주파수가중특성과 Bark-scale이라는 비선형주파수특성을 선형주파수축상에서 고려한 거리함수를 정의하고, 이 거리함수로부터 새로운 LPC cepstrum 계수를 제안한다. 귀의 특성은 선형주파수축에서 로그 스펙트럼에 대한 가증함수로서 표현되며, 이 가중함수는 cepstrum 영역에서 콘볼루션으로 표현되어 콘볼루션적으로 가중되는 LPC cepstrum을 정의하게 된다. 제안된 cepstrum 계수에서 정의된 가중함수는 A-weighting의 영향과 비선형주파수축의 영향을 하나의 가중함수로 통합하여 사용된 것이다. 제안된 파라미터의 성능을 음성인식 실험을 통하여 검증하였다.

  • PDF

Choline-Lipid Release from Normal and Transformed Cells

  • Hong, Seong-Tshool;Jang, Yong-Suk;Park, Kie-In
    • BMB Reports
    • /
    • 제29권1호
    • /
    • pp.73-80
    • /
    • 1996
  • The effect of albumin on phosphatidylcholine (PC) metabolism in Hep-G2, 3T3-H.ras, and 3T3 cells pre-labelled with [Me-$^3H$]choline was studied. The [$^3H$]choline was more efficiently taken up and incorporated into cellular phospholipids in 3T3-H.ras cells than in Hep-G2 and 3T3 cells. In each of the three cell lines, most of the [$^3H$]choline metabolized into the phospholipids was incorporated into PC and only minor was incorporated into lysophosphatidylcholine (LPC). Bovine serum albumin stimulated the release of [$^3H$]LPC and [$^3H$]PC from each of the three cell lines pre-labelled with [$^3H$]choline. [$^3H$]PC was also released in the absence of albumin but [$^3H$]LPC was not. The efficiency of LPC secretion represented as the proportion of medium [$^3H$]LPC to cellular [$^3H$]choline lipid during a chase period is approximately 9 to 14 times greater in 3T3 cells compared with the transformed 3T3-H.ras and Hep-G2 cells. A similar comparison of published data for rat hepatocytes with Hep-G2 shows secretion to be 35~75 times greater from the rat hepatocytes than from Hep-G2. Also, PC secretion from 3T3 cells was 1.6 times more effective than from 3T3-H.ras, whereas rat hepatocytes secrete PC 2.8~3.8 times more effectively than does Hep-G2. The measurement of specific radioactivity of cellular PC in pre-labelled 3T3 cells showed it to be similar to that of the secreted PC. However, the specific radioactivity of secreted LPC was markedly lower than that of the cellular PC, which suggests that LPC is being secreted from a PC pool distinct from that used for PC secretion.

  • PDF

Multi-frame AR model을 이용한 LPC 계수 양자화 (Quantization of LPC Coefficients Using a Multi-frame AR-model)

  • 정원진;김무영
    • 한국음향학회지
    • /
    • 제31권2호
    • /
    • pp.93-99
    • /
    • 2012
  • 음성코딩 시 성도는 Linear Predictive Coding (LPC) 계수를 이용해서 모델링 한다. 일반적으로 LPC 계수는 양자화와 선형보간 관점에서 유리한 Line Spectral Frequency (LSF) 파라미터로 변경하여 사용한다. 10차 이상의 다차원 LSF 데이터를 벡터 양자화를 이용하여 직접 코딩하게 되면 벡터 내 상관관계 (intra-frame correlation)를 모두 이용할 수 있으므로 rate-distortion 관점에서는 높은 효율을 기대할 수 있다. 하지만, 계산량과 메모리 요구량이 높아져서 실제 코딩 시스템에서는 사용할 수 없게 되므로, 차원을 나누어 압축하는 Split Vector Quantization (SVQ)이 이용된다. 또한, LSF 데이터는 과거 벡터와의 벡터 간 상관관계 (inter-frame correlation)가 높으므로, 이를 이용한 Predictive Split Vector Quantization (PSVQ)이 사용되고 있다. PSVQ는 SVQ 보다 높은 rate-distortion 성능을 보인다. 본 논문에서는 음성 저장 장치를 위한 최적의 PSVQ를 구현하기 위해서 다수의 과거 프레임 정보와의 벡터 간상관관계 (inter-frame correlation)를 고려한 Multi-Frame AR-model 기반 SVQ (MF-AR-SVQ)를 제안하였다. 기존 PSVQ와 비교해 보았을 때, MF-AR-SVQ는 계산량과 메모리 요구량의 큰 증가 없이, 평균 spectral distortion 관점에서 약 1비트의 성능 향상을 보였다.

선형예측계수에 기초한 퍼지추론 단어 인식 (Word Recognition using Fuzzy Inference based on LPC)

  • 최승호;김형근
    • 한국음향학회지
    • /
    • 제13권1호
    • /
    • pp.32-41
    • /
    • 1994
  • LPC열로 구성된 음성패턴의 주파수변동을 해결하기위해 LPC와 스펙트럼, LPC차수와 스펙트럼의 관계를 고찰하여 새로운 형태의 멤버쉽함수를 제안하였다. 또한, 시간변동을 해결하기위해서는 음성구간을 여러구간으로 등간격분할하는 다구간 등분할법을 사용하였으며, 이때 오인식은 주로 동일음절이 같은 발성위치에 있을때 발생되었다. 이러한 오인식을 줄이기위해 제안된 멤버쉽함수로 퍼지추론한뒤 구간별 확신도에 가중치를 부여하고, 세번째후보까지를 인식대상으로 하는 판정알고리즘을 제안하였다. 본 방법의 타당성을 검증하기위해, DDD지역명 28개를 대상으로 인식실험한결과, 삼각형멤버쉽함수에 의한 퍼지추론은 $92.0\%$, 삼각형멤버쉽함수에의한 퍼지추론과 판정알고리즘은 $92.9\%$, 제안된 멤버쉽함수에의한 퍼지추론과 판정알고리즘은 $93.8\%$의 인식률을 보였다.

  • PDF

확률적 방법을 이용한 음성 개성 변환 (Voice Personality Transformation Using a Probabilistic Method)

  • 이기승
    • 한국음향학회지
    • /
    • 제24권3호
    • /
    • pp.150-159
    • /
    • 2005
  • 본 논문에서는 임의의 음성을 특정 화자가 발성한 것처럼 들리도록 변환하는 음성 개성 변환 알고리즘에 대해 연구하였다. 제안된 기법은 화자의 음성을 LPC 켑스트럼, 피치, 발성 속도를 사용하여 표현하였으며 각각에 대한 변환 규칙을 생성하여 변환을 수행하였다. LPC 켑스트럼은 혼합 가우시안 모델을 이용한 확률적으로 모델링하고, 두 화자간의 대응관계를 조건 확률로 나타내었다. 확률적인 모델링에 필요한 각종 파라메터들을 얻기 위해 최대 가능도 기법이 사용되었으며, 변환 LPC 켑스트럼은 최소 자승 오차 방법에 근거하여 얻어지도록 하였다. 운율 변환을 위한 변수로 본 논문에서는 피치와 발성 속도를 사용하였으며, 두 음성간의 평균값 비율을 사용하여 운율 변환을 수행하였다. 제안된 기법은 기존 벡터 양자화 기반의 기법과 비교에서, 객관적인 척도로 사용한 평균 켑스트럼 거리 감소율, 가능도 증가율 면에서 우수한 성능을 나타내었다. 주관적인 테스트에서도 기존의 방법과 유사한 인식율을 얻었으며 특히 완만하게 변화하는 스펙트럼 궤적에 따른 고음질이 얻어짐을 확인할 수 있었다.

주입력신호의 LPC 필터 이득을 이용한 반향제거기의 수렴전 동시통화검출 성능 개선 (Performance Improvement of Double Talk Detection before Convergence of the Echo Canceller by Using Linear Predictive Coding Filter Gain of the Primary Input Signal)

  • 유재하
    • 한국지능시스템학회논문지
    • /
    • 제24권6호
    • /
    • pp.628-633
    • /
    • 2014
  • 본 논문에서는 반향제거기가 수렴하기 전에 동작할 수 있는 기존 동시통화검출법의 성능을 개선하기 위한 방법을 제안하였다. 제안된 방법은 LPC 필터 계수를 주입력신호로부터 추정하게 된다. 동시통화검출을 위한 문턱치는 주입력신호의 크기별로 기대되는 LPC 필터 이득치를 사용하여 가변적으로 설정하게 된다. 제안한 방법은 기존의 방법이 갖고 있는 단일통화를 동시통화로 잘못 판단하는 오검출률을 개선할 수 있을 뿐만 아니라 동시통화 검출 지연 시간도 단축시킬 수 있다. 장시간의 음성신호를 사용한 모의실험을 수행하였다. 제안한 방법이 기존 방법의 오검출률을 감소시키고 동시통화 검출 지연시간을 단축시킴을 확인할 수 있었다.

저압식 진공 침탄(LPC) 열처리 공정 기술 개발 (Development of Process Technology for Low Pressure Vaccum Carburizing)

  • 동상근;양제복
    • 한국연소학회:학술대회논문집
    • /
    • 한국연소학회 2004년도 제29회 KOSCI SYMPOSIUM 논문집
    • /
    • pp.231-237
    • /
    • 2004
  • Vacuum carburizing continues to gain acceptance as an alternative to atmosphere carburizing particularly in the car industry. The advantages of low-pressure carburization over atmospheric gas carburization is not only the creation of a surface entirely free of oxide and the environmentally friendly nature of these methods but also an improvement in deformation behaviour achieved by combining carburization with gas quenching, a reduction in batch times by increasing the carburization temperature, low gas and energy consumption and the prevention of soot to a large extent. In present study, an improved vacuum carburizing method is provided which is effective to deposit carbon in the surface of materials and to reduce cycle time. Also LPC process simulator was made to optimize to process controls parameters such as pulse/pause cycles of pressure pattern, temperature, carburizing time, diffusion time. The carburizing process was simulated by a diffusion calculation program, where as the model parameters are proposed with help the experimental results and allows the control of the carburizing process with good accordance to the practical results. Thus it can be concluded that LPC process control method based on the theoretical simulation and experimental datas appears to provide a reasonable tool for prototype LPC system.

  • PDF

난청인의 주파수 선택도 둔화현상이 음질에 미치는 영향 평가 (The Assessment on the Sound Quality of Reduced Frequency Selectivity of Hearing Impaired People)

  • 안홍섭;박규석;전유용;송영록;이상민
    • 전기학회논문지
    • /
    • 제60권6호
    • /
    • pp.1196-1203
    • /
    • 2011
  • The reduced frequency selectivity is a typical phenomenon of sensorineural hearing loss. In this paper, we compared two modeling methods for reduced frequency selectivity of hearing impaired people. The two models of reduced frequency selectivity were made using LPC(linear prediction coding) algorithm and bandwidth control algorithm based on ERB(equivalent rectangular bandwidth) of auditory filter, respectively. To compare the effectiveness of two models, we compared the result of PESQ (perceptual evaluation of speech quality) and LLR(log likelihood ratio) using 36 Korean words of two syllables. To verify the effect on noise condition, we mixed white and babble noise with 0dB and -3dB SNR to speech words. As the result, it is confirmed that the PESQ score of bandwidth control algorithm is higher than the score of LPC algorithm, on the other hands, and the LLR score of LPC algorithm is lower than the score of bandwidth control algorithm. It means that both non-linearity and widen auditory filter characteristics caused by reduced frequency selectivity could be more reflected in bandwidth control algorithm than in LPC algorithm.

Enhanced Ex Vivo Buccal Transport of Propranolol: Evaluation of Phospholipids as Permeation Enhancers

  • Lee, Jae-Hwi;Choi, Young-Wook
    • Archives of Pharmacal Research
    • /
    • 제26권5호
    • /
    • pp.421-425
    • /
    • 2003
  • The aim of the present study was to evaluate the effects of two phospholipid permeation enhancers, lysophosphatidylcholine (LPC) and didecanoylphosphatidylcholine (DDPC), along with a fusidic acid derivative, sodium taurodihydrofusidate (STDHF) and ethanol (EtOH) on the buccal transport of propranolol hydrochloride (PPL) using an ex vivo buccal diffusion model. The permeation rate of [$^3 H$]PPL as measured by steady-state fluxes increased with increasing EtOH concentration. A significant flux enhancement (P<0.05) was achieved by EtOH at 20 and 30 %v/v concentrations. At a 0.5 %w/v permeation enhancer concentration, the buccal permeation of [$^3 H$]PPL was significantly enhanced by all the enhancers studied (i.e., LPC, DDPC and STDHF) compared to the control (phosphate-buffered saline pH 7.4, PBS). LPC and DDPC displayed a greater degree of permeation enhancement compared with STDHF and EtOH-PBS mixtures with an enhancement ratio of 3.2 and 2.9 for LPC and DDPC, respectively compared with 2.0 and 1.5 for STDHF and EtOH:PBS 30:70 %v/v mixture, respectively. There was no significant difference between LPC and DDPC for the flux values and apparent permeability coefficients of [$^3$H]PPL. These results suggest that phospholipids are suitable as permeation enhancers for the buccal delivery of drugs.