• 제목/요약/키워드: linear probability model

검색결과 225건 처리시간 0.032초

분산커널 기반의 퍼지 c-평균을 이용한 음악 데이터의 장르 분류 (Classification of Music Data using Fuzzy c-Means with Divergence Kernel)

  • 박동철
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.1-7
    • /
    • 2009
  • 본 논문은 효율적인 음악 데이터의 분류를 위한 방법으로 분산커널 기반의 퍼지 c-평균을 이용한 분류기 모델을 제안한다. 분산 커널 기반의 퍼지 c-평균은 주어진 오디오 데이터에서 추출된 특징벡터의 평균과 공분산 정보를 동시에 이용하여 기존의 평균값만을 사용하는 방식에 비해 성능을 월등히 향상시킬 수 있는 장점이 있다. 사용된 방식은 확률적 분포로 주어지는 데이터 사이의 거리를 분산거리척도로 측정하고, 복잡한 분류 경계를 단순화 시키는데 효율적인 커널 개념을 사용함으로서 분류의 정확도를 극대화 시킬 수 있는 장점이 있다. 제안하는 분류기의 성능을 평가하기 위하여 고전음악, 컨트리음악, 힙합, 재즈의 4개의 장르 음악데이터를 총 1200개 수집하여 실험을 진행하였다. 실험의 결과 제안된 분산커널 기반의 퍼지 c-평균을 이용하는 분류기는 기존의 방식과 비교하여 분류정확도에서 평균적으로 17.73%-21.84%의 성능향상을 보여준다.

SVM과 로짓회귀분석을 이용한 흥미있는 웹페이지 예측 (Predicting Interesting Web Pages by SVM and Logit-regression)

  • 전도홍;김형래
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.47-56
    • /
    • 2015
  • 흥미 있는 웹페이지의 자동화된 탐색은 다양한 응용 분야에 활용될 수 있다. 웹페이지에 대한 사용자의 흥미는 판단하는 것은 사용자의 행동을 관찰함으로 자동화가 가능하다. 흥미 있는 웹페이지를 구분하는 작업은 판별 문제에 속하며, 우리는 실증을 위해 화이트 박스의 학습 방법(로짓회귀분석, 지지기반학습)을 선택한다. 실험 결과는 다음을 나타내었다. (1) 고정효과 로짓회귀분석, polynomial 과 radial 커널을 이용한 고정효과 지지기반학습은 선형 커널보다 높은 성능을 보였다. (2) 개인화가 모델 성능을 향상시킴에 있어 주요한 이슈이다. (3) 사용자에게 웹페이지에 대항 흥미를 물을 때, 구간은 단순히 예/아니 도 충분할 수 있다. (4) 웹페이지에 머문 기간이 매초 증가할 때마다 성공확률은 1.004배 증가하며, 하지만 스크롤바 클릭 수 (p=0.56) 와 마우스 클릭 수 (p=0.36) 지표는 흥미와 통계적으로 유의한 관계를 가지지 않았다.

소규모 농업용 저수지의 저류량-용수공급능력 결정에 관한 연구 (A Study on the Determination of Water Storage-Supply Capacity of Agricultural Reservoir)

  • 안승섭;정순돌;이증석;윤경덕;장인수
    • 한국환경과학회지
    • /
    • 제11권12호
    • /
    • pp.1217-1226
    • /
    • 2002
  • This study aims at the effective estimation of water supply capacity of small scale reservoir and the proposal of the data which is necessary to establish the water resources management plan of down stream area of the reservoir in the future by comparison and examination about reservoir operation technique for the security of agricultural water in small scale reservoir. The result of flow calculation by Tank model is used for the input data as the inflow data which is needed for the analysis of water supply capacity. Stochastic method, simulation method, and optimization method are used to examine the water supply capacity, and water security amount is compared with each method. From the analyses of water supply capacities by each method, slightly different results are shown in spite of the effort to compare them equally using input data such as inflow data under equal conditions, and the comparison of water supply capacities by each method are as follows; linear planning method, simulation method, and transition probability matrix method in the order of amount from the largest. It is thought that the simulation method in which comparatively reasonable application of the inflow data is possible and is simulated in successive time series dam operation of the three methods used in this study thus, simulation model is proper to estimate the water supply capacity of agricultural small scale reservoir. And it is judged that the heightening of efficiency of water resources utilization according to the development of downstream area of dam may be possible using the upward readjusted water supply amount of $55.18{\tiems}10^6ton$ and $63.7{\times}10^6ton$ at 95% and 90% supply reliability respectively which are above the planning water supply amount of $50.0{\times}10^6$ton when the simulation method is introduced as the standard.

기계학습을 활용한 모바일 반도체 제조 공정에서 동작 전압 예측 (Operating Voltage Prediction in Mobile Semiconductor Manufacturing Process Using Machine Learning)

  • 백인환;장승우;김광수
    • 반도체디스플레이기술학회지
    • /
    • 제22권1호
    • /
    • pp.124-128
    • /
    • 2023
  • 반도체 양산을 진행하며 얻어지는 여러 공정 데이터들로 사용 전압을 예측하여 에너지 효율적인 제품을 위한 목적으로 연구를 시작했다. 각각의 feature들 단독으로 전압을 예측하기 어려웠던 문제를 머신 러닝을 통해, 특히 Ensemble model을 이용함으로써 단일 모델보다 정확한 예측을 할 수 있었다. 더욱 중요한 시사점으로는 feature importance 분석을 통해 모델 예측에 영향이 큰 feature와 작은 feature에 대한 분석이다. 영향도가 높은 feature를 통해 비슷한 계열의 측정값을 늘리고, 낮은 feature 들의 문제점을 개선함으로써 차세대 제품에서 더욱 정확도 높은 모델을 위한 발판을 마련할 수 있었다.

  • PDF

다변량 형질의 유전연관성에 대한 주성분을 이용한 회귀방법와 다변량 비모수 추세검정법의 비교 (Comparison of Principal Component Regression and Nonparametric Multivariate Trend Test for Multivariate Linkage)

  • 김수영;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.19-33
    • /
    • 2008
  • 연속 형질(quantitative trait)에 영향을 미치는 유전자를 알아내기 위해 형제 쌍의 자료를 수집하여, 주로 이용되는 Haseman과 Elston (1972)의 최소제곱 회귀검정법으로 분석하는데 이는 단일 형질에 대한 분석법이다. 현실적으로 여러 형질들이 복잡하게 단일유전자 좌위(single locus)와 연관되어 있어 함께 수집하게 되는 경우에는, 이러한 연관된 여러 형질을 동시에 분석하는 유전연관성 검정법(linkage test)이 절실히 필요한 실정이다. Amos 등 (1990)은 주성분(principal component) 선형모형을 이용하여 Haseman과 Elston (1972)방법을 둘 이상의 형질의 다변량 분석법으로 확장시켰다. 그러나 이 검정방법은 통계량의 분포를 알 수 없기에 아직 제 1종 오류가 제대로 통제되지 못하는 문제를 가지고 있다. 본 논문에서는 이러한 다변량 형질 자료의 연관성검정에 있어 단일변량에 대한 비모수 추세검정법을 다변량 자료에 대한 분석법으로 확장시킨 통계량을 사용할 것을 제안한다. Amos 등 (1990)이 제안한 방법과 다변량 추세검정 통계량을 모의실험으로 생성한 연속형 형질자료에 적용하였을 때, 다변량 추세검정 통계량은 Amos 등 (1990) 방법에서의 여러 문제점이 발생되지 않을 뿐만 아니라 모의실험에서 제 1종 오류가 정해진 유의수준에 가까운 것을 확인하였고, 검정적이 더 높음을 볼 수 있었다.

무 잼 재료 혼합비율의 최적화 (Optimization of Ingredient Mixing Ratio for Preparation of Chinese Radish (Raphanus sativus L.) Jam)

  • 박정은;김미정;장명숙
    • 한국식품영양과학회지
    • /
    • 제38권2호
    • /
    • pp.235-243
    • /
    • 2009
  • 본 연구는 무의 저장성을 높이고 무를 이용한 가공식품 개발의 일환으로 반응표면분석법(RSM: Response Surface Methodology)을 이용하여 무 잼 제조 시 최적의 재료 혼합 비율을 찾고자 하였다. 잼의 품질에 가장 영향을 미치는 설탕, 펙틴과 구연산 첨가율을 독립변수로 설정하였고, 범위는 예비실험을 거쳐 각각 $45{\sim}70%$, $0.5{\sim}2.0%$, $0.2{\sim}0.5%$로 하였다. 실험 결과를 모델링하여 유의성을 검증한 결과 당도, 명도, 적색도, 황색도, 견고성은 linear 모델이, 관능검사 모든 항목에서는 quadratic 모델이 설정되었다. 모델의 적합성을 분석한 결과 적색도와 관능검사 항목 중 냄새를 제외한 모든 항목에서 probability가 모두 5% 이내에서 유의성을 보이고, 적합결여검증의 결과에서도 적색도와 관능검사 중 냄새를 제외한 모든 항목에서 5% 이내의 유의성을 보여 모델의 적합함이 인정되었다. 반응표면과 trace plot의 결과 설탕과 펙틴 첨가율이 많아질수록 색은 어둡고 노랗게 되었고 견고성은 증가하였다. 관능검사 결과에서도 설탕 첨가율에 의하여 많은 영향을 받았으며, 적정 수준 이상의 설탕, 펙틴과 구연산을 첨가할 경우에는 좋아하지 않음을 알 수 있었다. 무 잼의 최적 재료 혼합비율을 설정한 결과 설탕 53.7%, 펙틴 1.0%, 구연산 0.3%로 설정되었고, 이 조건으로 직접 무 잼을 만들어 물리적 특성을 측정해 본 결과와 예측한 결과와 유사한 값을 보였다. 본 실험의 최적 조건으로 만든 무 잼의 경우 시판하고 있는 잼의 당도와 견고성의 중 간 값 정도의 범위에 포함되어 잼으로서의 상태가 양호한 것을 알 수 있었다. 이상의 결과를 종합해 볼 때 무를 이용한 잼 가공이 가능한 것을 알 수 있었고 무 잼의 최적의 상태를 만들기 위한 조건도 설정되어 이를 이용한 무 잼의 산업화도 가능할 것으로 기대된다.

선형계획법과 허프확률모형을 이용한 농촌마을 중심지와 배후지 분석 (Analysis of Central Place and Hinterland using Linear programming and Probability Model of Huff)

  • 전정배;박미정;김은자;최진아;임창수
    • 농촌계획
    • /
    • 제23권1호
    • /
    • pp.53-63
    • /
    • 2017
  • Although some indicators for evaluating rural settlement conditions have been offered, these indicators could not reflect unique characteristics that rural has its own peculiarities. The rural area is identified with central districts functioned as service provision and hinterlands used its service. The aim of this study is to find a central district of rural villages and define range of its hinterlands using various physical characteristics of rural areas. Targeting areas are Yongsan and Hwanggan in Yeongdong-gun. The physical characteristics are represented by building density, number of shops among secondary and tertiary industries, official land price, and density of bus line. The rural central district is estimated by linear programming using defined the physical characteristics. Also its hinterlands used Huff model and social accessibility. The results of this study are as follows; (1) The physical characteristics in Hwanggan myeon is higher than Yongsan myeon because Hwanggan area has a large floating population for using Hwanggan station and ticket office; (2) The central district in Hwanggan has wider regional range than Yongsan. When central district estimate in rural areas, we suggest a grid diameter of Hexagon for controlling errors; (3) Considering accessibility, the life zone of 4 districts defined legally in Hwanggan use Yongsan and 2 legal districts in Hwanggan are possible to take advantage of Yongsan's life zone; (4) The results of survey targeting boundary villages between Yongsan and Hwanggan, individual drivers use central districts both Yongsan and Hwanggan, however users by public transportation (especially bus) go more to Hwanggan because bus lines to Hwanggan have many routes than to Yongsan. Evaluating the rural settlement conditions by national unit through grasping central districts and its hinterlands, these results can use as base line data and the evidence for regional development projects.

반응수정계수와 주기의 영향에 대한 철골모멘트저항골조 건물의 내진성능평가 (Seismic Evaluation of Steel Moment Frame Buildings based on Different Response Modification Factors and Fundamental Periods)

  • 신지욱;이기학;이도형
    • 한국지진공학회논문집
    • /
    • 제12권5호
    • /
    • pp.47-56
    • /
    • 2008
  • 본 연구는 높은 지진의 위험이 내재된 지역에 위치한 3층, 9층 그리고 20층 철골 모멘트저항골조에 대한 반응수정계수와 주기의 영향을 평가하기 위한 것이다. 각 구조물들은 IBC 2000과 KBC 2005에서 제시하고 있는 8의 반응수정계수로 설계되었고 건물에 기대되는 최소의 성능과 최대의 성능을 평가하기 위해서 상한범위와 하한범위의 설계가 고려되었다. 또한 반응수정계수에 대한 영향을 조사하기 위하여 4개의 다른 반응수정계수들이(9, 10, 11, 12) 각 구조물에 대하여 적용되었고 각 구조물의 고유주기 값 외의 4개의 다른 주기를 추가로 적용하여 구조물의 동적거동시 주기에 대한 영향을 조사하였다. 총 150개의 해석모델들은 50년 동안 2%의 초과확률(재현 주기 2500년)을 가진 20개의 지반운동에 대하여 평가되었다. 구조물의 성능평가를 위하여 정적 Pushover와 비선형 시간이력해석이 수행되었으며 구조물의 연성능력을 평가하기 위해서 변위연성요구가 고려되었다. 3층과 9층 구조물은 변위연성요구 값이 비교적 안정적인 거동을 보인 반면 20층 구조물은 동적 불안정성을 야기하는 요소에 의해 민감하게 나타나는 것으로 조사되었다.

복분자(Rubus coreanum Miquel) 즙을 이용한 드레싱 제조의 재료 혼합 비율의 최적화 (Formulation Optimization of Salad Dressing Added with Bokbunja (Rubus coreanum Miquel) Juice)

  • 정수지;김나영;장명숙
    • 한국식품영양과학회지
    • /
    • 제37권4호
    • /
    • pp.497-504
    • /
    • 2008
  • 본 연구는 새로운 드레싱을 개발하기 위하여 복분자를 이용한 샐러드드레싱을 만들었을 때 최적의 혼합비를 찾기 위하여 혼합물 실험계획법(mixture design) 중 D-optimal design을 이용하였다. 샐러드드레싱의 품질에 가장 영향을 미치는 복분자즙, 기름, 식초의 첨가율을 독립변수로 설정하였고, 범위는 예비실험을 거쳐 각각 $15.70\sim47.10%$, $23.50\sim39.20%$, $3.90\sim19.60%$로 하였다. 실험 결과를 모델링하여 유의성을 검증한 결과, 점도, 적색도, 황색도, 총색차, 유화안정성과 관능검사 항목 중 색이 linear 모델로, 명도와 관능검사 항목 중 냄새, 맛과 전반적인 기호도는 quadratic 모델로 결정되었다. 모델의 적합성을 분석한 결과 모든 항목에서 probability가 모두 0.05% 이내에서 유의성을 보여 모델로서 적합함이 인정되었다. 복분자즙을 이용한 샐러드드레싱의 최적 재료 혼합비율은 수치 최적화에서는 복분자즙 36.02%, 기름 26.48%, 식초 12.00%이었고, 모형적 최적화에서는 desirability가 0.577에 해당하는 복분자즙 36.00%, 기름 26.44%, 식초 12.06%로 수치 최적화 점과 거의 일치하는 수치를 보였다. 이는 드레싱을 만들 때 복분자의 활용 가능성을 제시하여 새로운 드레싱 제품 개발의 기초자료를 제공하고, 새로운 것을 추구하는 소비자들의 욕구를 충족시킬 수 있을 것으로 기대된다.

Water Quality Assessment and Turbidity Prediction Using Multivariate Statistical Techniques: A Case Study of the Cheurfa Dam in Northwestern Algeria

  • ADDOUCHE, Amina;RIGHI, Ali;HAMRI, Mehdi Mohamed;BENGHAREZ, Zohra;ZIZI, Zahia
    • 공업화학
    • /
    • 제33권6호
    • /
    • pp.563-573
    • /
    • 2022
  • This work aimed to develop a new equation for turbidity (Turb) simulation and prediction using statistical methods based on principal component analysis (PCA) and multiple linear regression (MLR). For this purpose, water samples were collected monthly over a five year period from Cheurfa dam, an important reservoir in Northwestern Algeria, and analyzed for 12 parameters, including temperature (T°), pH, electrical conductivity (EC), turbidity (Turb), dissolved oxygen (DO), ammonium (NH4+), nitrate (NO3-), nitrite (NO2-), phosphate (PO43-), total suspended solids (TSS), biochemical oxygen demand (BOD5) and chemical oxygen demand (COD). The results revealed a strong mineralization of the water and low dissolved oxygen (DO) content during the summer period. High levels of TSS and Turb were recorded during rainy periods. In addition, water was charged with phosphate (PO43-) in the whole period of study. The PCA results revealed ten factors, three of which were significant (eigenvalues >1) and explained 75.5% of the total variance. The F1 and F2 factors explained 36.5% and 26.7% of the total variance, respectively and indicated anthropogenic pollution of domestic agricultural and industrial origin. The MLR turbidity simulation model exhibited a high coefficient of determination (R2 = 92.20%), indicating that 92.20% of the data variability can be explained by the model. TSS, DO, EC, NO3-, NO2-, and COD were the most significant contributing parameters (p values << 0.05) in turbidity prediction. The present study can help with decision-making on the management and monitoring of the water quality of the dam, which is the primary source of drinking water in this region.