• 제목/요약/키워드: 정규오차회귀모델

검색결과 10건 처리시간 0.035초

음운지속시간의 정규화와 모델링 (A Normalization and Modeling of Segmental Duration)

  • 김인영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.99-104
    • /
    • 1998
  • 한국어의 자연스러운 음성합성을 위해 280문장에 대하여 남성화자 1명이 발성한 문음성 데이터를 음운 세그먼트, 음운 라벨링, 음운별 품사 태깅하여 음성 코퍼스를 구축하였다. 이 문 음성 코퍼스를 사용하여 음운환경, 품사 뿐만 아니라 구문 구조에 이하여 음운으 lwlthrtlrks이 어떻게 변화하는가에 대하여 xhdrPwjrdfmh 분석하였다. 음운 지속시간을 보다 정교하게 예측하기 위하여, 각 음운의 고유 지속시간의 영향이 배제된 정규화 음운지속시간을 회귀트리를 이용하여 모델화하였다. 평가결과, 기존의 회귀트리를 이용한 음운지속시간 모델에 의한 예측오차는 87%정도가 20ms 이내 이었지만, 정규화 음운 지속시간 모델에 의한 예측 오차는 89% 정도가 20ms 이내로 더욱 정교하게 예측되었다.

  • PDF

결측 데이터 보정법에 의한 의사 데이터로 조정된 예측 최적화 방법 (Predictive Optimization Adjusted With Pseudo Data From A Missing Data Imputation Technique)

  • 김정우
    • 한국산학기술학회논문지
    • /
    • 제20권2호
    • /
    • pp.200-209
    • /
    • 2019
  • 미래 값을 예측할 때, 학습 오차(training error)를 최소화하여 추정된 모형은 보통 많은 테스트 오차(test error)를 야기할 수 있다. 이것은 추정 모델이 주어진 데이터 집합에만 집중하여 발생하는 모델 복잡성에 따른 과적합(overfitting) 문제이다. 일부 정규화 및 리샘플링 방법은 이 문제를 완화하여 테스트 오차를 줄이기 위해 도입되었지만, 이 방법들 또한 주어진 데이터 집합에서만 국한 되도록 설계되었다. 본 논문에서는 테스트 오차 최소화 문제를 학습 오차 최소화 문제로 변환하여 테스트 오차를 줄이기 위한 새로운 최적화 방법을 제안한다. 이 변환을 수행하기 위해 주어진 데이터 집합에 대해 의사(pseudo) 데이터라고 하는 새로운 데이터를 추가하였다. 그리고 적절한 의사 데이터를 만들기 위해 결측 데이터 보정법의 세 가지 유형을 사용하였다. 예측 모델로서 선형회귀모형, 자기회귀모형, ridge 회귀모형을 사용하고 이 모형들에 의사 데이터 방법을 적용하였다. 또한, 의사 데이터로 조정된 최적화 방법을 활용하여 환경 데이터 및 금융 데이터에 적용한 사례를 제시하였다. 결과적으로 이 논문에서 제시된 방법은 원래의 예측 모형보다 테스트 오차를 감소시키는 것으로 나타났다.

한국어 문음성 변환기의 음운지속시간 제어에 관한 연구 (A Study on Segmental Duratio Control for the Kroean TTS)

  • 김인영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.143-146
    • /
    • 1998
  • 자연스러운 한국어의 음성합성을 위해서는 음운의 지속시간의 제어가 매우 중요하다. 본 연구에서는 POW3848 어절에 대한 음성 데이터에 대해 음운 세그먼트, 음운 라벨링, 품사 태깅을 행한 음성 데이터베이스를 구축하여 한국어 음운의 지속시간을 변화시키는 시간 특징을 통계적으로 분석하였다. 이 시간 특징들 중 변화 폭이 큰 요인들을 제어요소로 각 음운의 고유길이를 최대한 배제하고 단지 음운 발성 환경의 영향에 의한 지속시간 변화만을 고려하는 정규화 지속시간에 대한 회귀트리로 한국어 음운 지속시간을 모델화 하였다. 제안된 음운 지속시간 모델을 실시간 제어 알고리즘으로 구현하여 평가한 결과, 음운 지속시간 예측오차의 88% 정도가 25ms이내 이었고 예측치와 관측치 간의 다중 상관관계수는 0.92 정도로 평가되어, 제안된 모델의 타당성이 입증되었다.

  • PDF

절충의사결정방법을 이용한 선박용 3/2WAY 공압밸브의 다목적 최적설계 (Multi-objective Optimization of Marine 3/2WAY Pneumatic Valve using Compromise Decision-Making Method)

  • 김준오;백석흠;김태우;강상모
    • 한국기계가공학회지
    • /
    • 제12권2호
    • /
    • pp.81-90
    • /
    • 2013
  • A study on the flow-structure characteristics of marine 3/2WAY pneumatic valve is essential for optimizing the performance of ship engines. It is important that the valve has desirable safety factor and reduced weight from safety and economic point of view. In this paper, flow-structure characteristics of pneumatic valve is obtained by being optimized based on the proper design criteria. The air with the pressure of 30 bar is the working fluid which is made to fill in the tack in short time. This time is defined as the filling time. On optimum design by considering the flow-structure characteristics, the approach is based on (1) the mathematical formulation of design decisions using the compromise decision-making method, and (2) the approximation technique of response surfaces. The methodology is demonstrated as the multi-objective optimization tool to improve the performance of marine 3/2WAY pneumatic valve.

추석 연휴 전력수요 특성 분석을 통한 단기수요 예측 모형 개발 (Short-Term Load Forecasting Model Development Through Analysis on Power Demand during Chuseok Holiday)

  • 권오성;박래준;송경빈;주성관;박정도;조범섭;신기준;이익종
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.608-609
    • /
    • 2011
  • 전력수요 예측 오차가 큰 추석 연휴 및 전, 후일 전력수요 예측의 정확성을 향상시키기 위해 과거 추석 연휴 및 전, 후일에 대한 전력수요 특성을 분석하고 최대/최소 전력 예측을 위한 퍼지 입력데이터 선정 방법과 24시간 예측을 위한 정규화에 필요한 입력 데이터 선정방법을 개발하여 퍼지 선형회귀분석 모델을 사용하여 2006년에서 2010년까지 5개년의 사례연구를 통해 알고리즘의 우수성을 검증하였다.

  • PDF

주행거리별 운행차 배출가스 분포 추정 모델에 관한 연구 (A Study on the Inference Model of In-use Vehicles Emission Distribution according to the Vehicle Mileage)

  • 김현우
    • 한국자동차공학회논문집
    • /
    • 제10권4호
    • /
    • pp.85-92
    • /
    • 2002
  • To investigate the safety of the in-use vehicles emission against the tail-pipe emission regulation, in-use vehicles emission trend according to vehicle mileage should be known. But it is impossible to collect all vehicles emission data In order to know that. Therefore, it is necessary to establish a statistically meaningful inference method that can be used generally to estimate in-use vehicles emissions distribution according to the vehicle mileage with relatively less in-use vehicles emission data. To do this, a linear regression model that solved the problems of data normality and common variance of error was studied. As a way that can secure the data normality, In(emission) instead of emission itself was used as a sampled data. And a reciprocal of mileage was suggested as a factor to secure common variance of error. As an example, 36 data of FTP-75 test were handled in this study. As a result, using average value and standard deviation at each mileage which were inferred from a linear regression model, probability density distribution and cumulative distribution of emissions according to the vehicle mileage were obtained and it was possible to predict the deterioration factor through full useful life mileage and also possible to decide whether those in-use vehicles will meet the tail-pipe emission regulations or not.

쇄석다짐말뚝으로 개량된 지반의 극한한계상태에 대한 저항편향계수 산정 (Estimation of Resistance Bias Factors for the Ultimate Limit State of Aggregate Pier Reinforced Soil)

  • 봉태호;김병일;김성렬
    • 한국지반공학회논문집
    • /
    • 제35권6호
    • /
    • pp.17-26
    • /
    • 2019
  • 이 연구에서는 쇄석말뚝공법의 한계상태설계법 적용을 위하여 양질의 현장재하시험 자료로부터 저항편향계수의 통계적 특성을 분석하고 지반 불확실성 및 시공 오차를 고려한 총 저항편향계수를 산정하였다. 저항편향계수 산정을 위한 예측모델은 기존 모델들에 비하여 높은 예측성능을 보인 Bong and Kim(2017)의 MLR 모형을 활용하였으며 그 적합성을 평가하였다. 저항편향계수의 확률분포를 산정하기 위하여 카이제곱 적합도 검정을 수행하였으며 정규분포가 가장 적합한 것으로 나타났다. 공칭저항의 총 변동성은 점토의 비배수전단강도 및 쇄석말뚝 시공 시 발생할 수 있는 시공 오차에 대한 불확실성을 포함하여 산정하였다. 최종적으로 총 저항편향계수의 확률분포는 로그정규분포를 따르는 것으로 나타났다. 총 저항편향계수의 변동성에 따른 확률분포의 매개변수는 Monte Carlo 시뮬레이션을 통하여 산정하였으며, 간편한 적용을 위하여 이에 대한 회귀식을 제안하였다.

가시광선-근적외선 분광법을 이용한 유성분 측정 기술 개발 (Development of Measuring Technique for Milk Composition by Using Visible-Near Infrared Spectroscopy)

  • 최창현;윤현웅;김용주
    • 한국식품저장유통학회지
    • /
    • 제19권1호
    • /
    • pp.95-103
    • /
    • 2012
  • 본 연구는 원유의 실시간 휴대용품질측정 시스템 개발을 위한 기초 연구로서 원유 시료의 온도에 따른 가시광선-근적외선 스펙트럼을 측정하였으며, 다양한 수학적 전처리방법을 적용하여 유성분 예측모델을 개발하였다. 스펙트럼 측정은 원유 시료 180개에 대해 스펙트럼의 수학적 전처리 방법으로 평활화, 정규화, MSC, 1차 및 2차 미분을 사용하였고 예측모델은 부분최소자승법을 이용하였다. 유성분을 분석한 결과 함량 범위와 평균은 지방이 각각 2.44~6.42%, 4.05%, 단백질은 각각 2.44~4.28%, 3.35%, 무지고형분은 각각 7.85~9.57%, 8.76%로 나타났다. 또한 유당의 함량 범위와 평균은 각각 3.93~5.24%, 4.74%였으며 요소태질소의 경우에는 각각 4.6~15.1 mg/dl, 10.27 mg/dl로 대부분 권장 기준을 만족하였다. 원유 시료의 온도에 따른 스펙트럼은 1,400~2,500 nm에서 큰 차이를 보였으며 온도가 상승함에 따라 흡광도가 높아지는 것을 알 수 있었다. 원유 시료의 온도에 따른 유성분 예측모델을 400~2,500 nm의 영역에서 개발하였으며 예측성능은 지방과 무지고형분의 경우 온도변화와 무관하였다. 단백질과 유당, 요소태질소의 예측성능은 온도가 낮을수록 급격히 감소하여 스펙트럼 측정 시 원유 시료의 온도를 $40^{\circ}C$로 유지하는 것이 필요함을 알 수 있다. $40^{\circ}C$의 원유 스펙트럼에 대해 수학적 전처리를 수행한 결과 평활화를 수행하여 측정 장치 자체의 노이즈를 감소시킬 수 있었고 정규화를 수행하여 기준선을 일치시킬 수 있었다. 또한 MSC를 수행하여 빛의 산란에 의한 영향을 제거하여 스펙트럼간의 차이를 감소시킬 수 있었고 1차 및 2차 미분을 수행한 결과 기준선 일치와 기존 스펙트럼에서 나타나지 않았던 파장영역에 대한 분석이 가능함을 알수 있다. 다중회귀분석의 stepwise 방법을 이용하여 최적 파장영역을 선정하고 유성분 예측모델을 개발한 결과 요소태질소를 제외하고 대부분 근적외선 영역에서 우수한 상관관계를 보여주었다. 지방과 단백질은 원시 스펙트럼의 검증부 결정계수가 각각 0.93, 0.92에서 정규화를 수행한 결과 각각 0.98, 0.92로 원시 스펙트럼의 결과가 우수하여 큰 개선이 없었으나 RPD는 각각 4.10, 3.41에서 5.47, 3.73으로 높아져 정밀도가 향상됨을 알 수 있다. 무지고형분과 유당의 예측모델은 원시 스펙트럼의 경우 각각 0.82, 0.75로 예측모델로 사용하기에는 어려웠으나 각각 평활화와 MSC를 수행하였을 때 검증부 결정계수가 0.90, 0.80으로 크게 개선되어 유성분 예측모델의 신뢰성 향상에 기여할 수 있을 것으로 판단된다. 요소태질소의 경우 가시광선 영역에서 가장 우수한 상관관계를 보여주었으나 검증부 결정계수, 오차, RPD가 각각 0.61, 1.56%, 1.58로 다른 성분에 비해 매우 낮게 나타났다. 이를 개선하기 위해 수학적 전처리를 수행하였으나 크게 개선되지 않았으므로 요소태질소의 신뢰성 있는 모델을 개발하기 위해서는 부분최소자승법 외에 다양한 알고리즘의 적용이 필요할 것으로 판단된다.

COMS 위성의 가시 및 적외 영상 채널로부터 복원된 대류운의 강우강도 향상과 검증 (Improvement and Validation of Convective Rainfall Rate Retrieved from Visible and Infrared Image Bands of the COMS Satellite)

  • 문윤섭;이강열
    • 한국지구과학회지
    • /
    • 제37권7호
    • /
    • pp.420-433
    • /
    • 2016
  • 본 연구의 목적은 2011년 4월 22일부터 10월 22일까지 우리나라에서 강수가 있는 총 75일 동안 COMS 위성의 적외 채널 $10.8{\mu}m$ 휘도 온도(IR), 적외 채널 $10.8{\mu}m$와 수증기 채널 $6.7{\mu}m$의 휘도 온도차(IR-WV), 정규화 된 가시반사도(VIS)와 기상 레이더의 강우강도를 이용하여 2-D와 3-D 대류운의 강우강도 (CRR) 조견표를 향상시키는 것이다. 특별히 한국형 2-D와 3-D CRR 조견표를 검증하기 위해 2011년 강수가 있는 24일 동안의 기상 레이더 강우강도 자료가 사용된다. 2-D와 3-D CRR 조견표는 각 채널의 등급 범주별 강우 총수와 비강우 총수의 행렬을 이용하여 구한 강우 확률에 평균 누적강우강도와 최대 강우강도를 각각 곱함으로써 2-D (IR, IR-WV)와 3-D (IR, IR-WV, VIS) 조견표의 기본과 최대 행렬을 얻을 수 있다. 최종적으로 새로운 2-D와 3-D의 CRR 조견표는 경험적으로 기본과 최대 강우강도 행렬의 회귀 분석으로 얻어진다. 그 결과 새로운 CRR 조견표는 기존보다 낮은 IR 휘도 온도, 낮은 IR-WV 휘도 온도차일 때에도 비교적 많은 강우 현상을 나타내며, $10mm\;h^{-1}$ 이상의 강우강도 영역이 확대되어 나타난다. 정확도와 범주별 통계가 주어진 기간 동안 발생했던 CRR 자료에 대해 계산된다. 새로운 2-D와 3-D CRR 조견표의 평균 오차, 평균절대 오차, 제곱근평균 오차가 기존 조견표보다 작게 나타나며, 예측 거짓경고비율은 감소하고, 탐지확률은 증가하며, 임계성공지수는 개선된다. 태풍과 뇌우와 같은 기상 이변에서의 강한 호우를 고려하기 위해서 습윤 보정 계수를 교정한다. 이 인자는 수치모델이나 COMS에서 복원한 지면에서 500 hPa까지 평균한 총가강수량과 상대습도의 곱 (PW RH)으로 정의된다. 이 연구에서는 PW RH에 근거하여 IR 운정 휘도 온도가 210 K 이하일 때, 상대습도가 40% 이상일 때 1에서 2사이를 경험적으로 정한다. 새로운 2-D와 3-D CRR 조견표를 적용한 결과 평균 오차, 평균 절대 오차, 제곱근 평균 오차가 줄어든다.

GMS-5 Split Window 자료를 이용한 가강수량 산출 (Estimation of Precipitable Water from the GMS-5 Split Window Data)

  • 손승희;정효상;김금란;이정환
    • 대한원격탐사학회지
    • /
    • 제14권1호
    • /
    • pp.53-68
    • /
    • 1998
  • 대기중에 존재하는 수증기의 관측은 일기와 기후의 이해에 있어서 매우 중요한데, 기존의 관측체계로는 지구상의 극히 제한된 지역의 수증기 분포만을 관측할 수 있다. 이 연구에서는 일본 정지기상위성인 GMS-5의 적외 split window 채널 관측자료로부터 대기중에 함유되어 있는 수증기 총량 즉 가강수량(precipitable water)을 산출하였다. 가강수량 산출에는 라디오존데 관측 가강수량과 split window 관측자료 사이의 회귀분석에 기초한 Chesters et al.(1983)의 알고리즘을 사용하였 다. 가강수량 산출을 위하여 센서의 필터 함수와 관련된 수증기 흡수 파라미터는 우리 나라 고층 관측소인 오산, 광주,포항,제주에서 관측한 '76년 8월부터 11월가지의 4개월간 관측한 라디오존데 자료와 위성 관측자료의 회귀분석을 통하여 산출하였다. 한편 기상청 전구 스펙트랄 모델의 700 hPa온도를 1층 복사 모델의 대기 평균 온도로 사용하였다. 1996년 7월부터 12월까지의 기간에 대하여 산출한 GMS-5 가강수량 자료를 같은 기간 관측된 라디오존데 관측자료와 비교한 결과 0.46의 상관계수와 0.65 g/$cm^2$~1.09 g/$cm^2$의 RMS 오차를 나타내었다. GMS-5로부터 산출된 월평균 가강수량 분포는 계절에 따른 전지구 규모의 수증기 분포변화를 잘 나타내었다. 이번 연구에서 산출된 위성 가강수량은 0.5$^{\circ}$격자 간격으로 6시간마다 기상청에서 정규적으로 산출된다. 이 자료는 수치예보의 객관분석 초기 자료로 이용되어, 특히 청천 조건하에서의 습도 분석의 정확도 향상에 기여하며 기후 연구에 있어서도 현존하는 자료 세트에 대한 유용한 보완 자료가 될 것이다. 그러나 연구 결과의 실용화를 위하여는 좀더 높은 상관계수와 산출절차 등의 개선이 필요하다.용성을 고찰하였다.산마와 재배와 점질다당류가 각각 219~332$^{\circ}C$, 229~341$^{\circ}C$ 범위였다.TEX> 범위였다. 사면의 풍화와 침식에 대한 대책연구도 수행되어야 한다. 15ng/$\textrm{cm}^2$로서 90분간 조사로 27ng/$\textrm{cm}^2$량이 생성되었다. 7-DHC은 당초의 123ng/$\textrm{cm}^2$으로부터 계속 감소되어 150분간 조사시 53ng/$\textrm{cm}^2$량까지 내려갔다.하였으며, 그 외의 항목간에는 대동소이하였다.ckarti 와 E. serrulatus가 스파르가눔의 중간숙주가 될 수 있음을 확인하였다. 충란의 배양에서부터 종숙주의 충란 배출까지 약 2개월 정도의 기간이 소요되었고, 우리 나라 자연환경에서는 5일에서 7월에 주로 이 충체의 유충이 발육되고 전파되는 것으로 추측되었다.러 가지 방법들을 적극 적용하여 금후 검토해볼 필요가 있을 것이다.잡은 전혀 삭과가 형성되지 않았다. 이 결과는 종간 교잡종을 자방친으로 하고 그 자방친의 화분친을 사용할 때만 교잡이 이루어지고 있음을 나타내고 있다. 따라서 여교잡을 통한 종간잡종 품종육성 활용방안을 금후 적극 확대 검토해야 할 것이다하였다.함을 보이고 있다.X> , ZnCl$_{3}$$^{-}$같은 이온과 MgCl$^{+}$, MgCl$_{2}$같은 이온종을 형성하기 때문인것 같다. 한편 어떠한 용리액에서던지 NH$_{4}$$^{+}$의 경우 Dv값이 제일 작았다. 바. 본 연구의 목적중의 하나인 인체유해 중금속이온인 Hg(II), Cd(II)등이 NaCl같은 염화물이 함유된 시료용액에