• Title/Summary/Keyword: Log-linear models

검색결과 104건 처리시간 0.032초

The skew-t censored regression model: parameter estimation via an EM-type algorithm

  • Lachos, Victor H.;Bazan, Jorge L.;Castro, Luis M.;Park, Jiwon
    • Communications for Statistical Applications and Methods
    • /
    • 제29권3호
    • /
    • pp.333-351
    • /
    • 2022
  • The skew-t distribution is an attractive family of asymmetrical heavy-tailed densities that includes the normal, skew-normal and Student's-t distributions as special cases. In this work, we propose an EM-type algorithm for computing the maximum likelihood estimates for skew-t linear regression models with censored response. In contrast with previous proposals, this algorithm uses analytical expressions at the E-step, as opposed to Monte Carlo simulations. These expressions rely on formulas for the mean and variance of a truncated skew-t distribution, and can be computed using the R library MomTrunc. The standard errors, the prediction of unobserved values of the response and the log-likelihood function are obtained as a by-product. The proposed methodology is illustrated through the analyses of simulated and a real data application on Letter-Name Fluency test in Peruvian students.

An Attempt to Measure the Familiarity of Specialized Japanese in the Nursing Care Field

  • Haihong Huang;Hiroyuki Muto;Toshiyuki Kanamaru
    • 아시아태평양코퍼스연구
    • /
    • 제4권2호
    • /
    • pp.57-74
    • /
    • 2023
  • Having a firm grasp of technical terms is essential for learners of Japanese for Specific Purposes (JSP). This research aims to analyze Japanese nursing care vocabulary based on objective corpus-based frequency and subjectively rated word familiarity. For this purpose, we constructed a text corpus centered on the National Examination for Certified Care Workers to extract nursing care keywords. The Log-Likelihood Ratio (LLR) was used as the statistical criterion for keyword identification, giving a list of 300 keywords as target words for a further word recognition survey. The survey involved 115 participants of whom 51 were certified care workers (CW group) and 64 were individuals from the general public (GP group). These participants rated the familiarity of the target keywords through crowdsourcing. Given the limited sample size, Bayesian linear mixed models were utilized to determine word familiarity rates. Our study conducted a comparative analysis of word familiarity between the CW group and the GP group, revealing key terms that are crucial for professionals but potentially unfamiliar to the general public. By focusing on these terms, instructors can bridge the knowledge gap more efficiently.

분할표 분석을 위한 절사 LAD 추정량과 최적 절사율 결정 (Trimmed LAD Estimators for Multidimensional Contingency Tables)

  • 최현집
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1235-1243
    • /
    • 2010
  • 다차원 분할표를 구성하는 범주형 변수들의 연관관계를 식별하기 위하여 널리 이용되는 로그선형모형을 위한 절사 LAD(least absolute deviations) 추정방법을 제안하였다. 제안된 방법은 가중 LAD 추정을 반복하여 계산이 수행되므로 분할표 분석을 위해 적용할 수 있는 여러 연관성 모형(association models)에 직접 적용할 수 있다. 또한 붓스트랩을 이용한 최적절사율을 결정하는 방법이 갖는 공분산행렬을 과소추정하는 문제를 해결하기위한 절사율 결정 방법을 제안하였다. 모의실험을 통해 제안된 방법이 붓스트랩 방법에 비하여 항상 우수한 절사율을 보인다는 것을 설명하였으며, 제안된 방법들의 실제 자료분석 결과를 제시하였다.

난청인의 주파수 선택도 둔화현상이 음질에 미치는 영향 평가 (The Assessment on the Sound Quality of Reduced Frequency Selectivity of Hearing Impaired People)

  • 안홍섭;박규석;전유용;송영록;이상민
    • 전기학회논문지
    • /
    • 제60권6호
    • /
    • pp.1196-1203
    • /
    • 2011
  • The reduced frequency selectivity is a typical phenomenon of sensorineural hearing loss. In this paper, we compared two modeling methods for reduced frequency selectivity of hearing impaired people. The two models of reduced frequency selectivity were made using LPC(linear prediction coding) algorithm and bandwidth control algorithm based on ERB(equivalent rectangular bandwidth) of auditory filter, respectively. To compare the effectiveness of two models, we compared the result of PESQ (perceptual evaluation of speech quality) and LLR(log likelihood ratio) using 36 Korean words of two syllables. To verify the effect on noise condition, we mixed white and babble noise with 0dB and -3dB SNR to speech words. As the result, it is confirmed that the PESQ score of bandwidth control algorithm is higher than the score of LPC algorithm, on the other hands, and the LLR score of LPC algorithm is lower than the score of bandwidth control algorithm. It means that both non-linearity and widen auditory filter characteristics caused by reduced frequency selectivity could be more reflected in bandwidth control algorithm than in LPC algorithm.

Application of UAV-based RGB Images for the Growth Estimation of Vegetable Crops

  • Kim, Dong-Wook;Jung, Sang-Jin;Kwon, Young-Seok;Kim, Hak-Jin
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.45-45
    • /
    • 2017
  • On-site monitoring of vegetable growth parameters, such as leaf length, leaf area, and fresh weight, in an agricultural field can provide useful information for farmers to establish farm management strategies suitable for optimum production of vegetables. Unmanned Aerial Vehicles (UAVs) are currently gaining a growing interest for agricultural applications. This study reports on validation testing of previously developed vegetable growth estimation models based on UAV-based RGB images for white radish and Chinese cabbage. Specific objective was to investigate the potential of the UAV-based RGB camera system for effectively quantifying temporal and spatial variability in the growth status of white radish and Chinese cabbage in a field. RGB images were acquired based on an automated flight mission with a multi-rotor UAV equipped with a low-cost RGB camera while automatically tracking on a predefined path. The acquired images were initially geo-located based on the log data of flight information saved into the UAV, and then mosaicked using a commerical image processing software. Otsu threshold-based crop coverage and DSM-based crop height were used as two predictor variables of the previously developed multiple linear regression models to estimate growth parameters of vegetables. The predictive capabilities of the UAV sensing system for estimating the growth parameters of the two vegetables were evaluated quantitatively by comparing to ground truth data. There were highly linear relationships between the actual and estimated leaf lengths, widths, and fresh weights, showing coefficients of determination up to 0.7. However, there were differences in slope between the ground truth and estimated values lower than 0.5, thereby requiring the use of a site-specific normalization method.

  • PDF

다층 대공방어 체계의 신뢰도 향상을 위한 네트워크 모델 기반의 최적 투자 계획 모델 (An Optimal Investment Planning Model for Improving the Reliability of Layered Air Defense System based on a Network Model)

  • 이진호;정석문
    • 한국시뮬레이션학회논문지
    • /
    • 제26권3호
    • /
    • pp.105-113
    • /
    • 2017
  • 본 연구는 대공위협에 대한 생존성 향상을 위한 다층 대공방어 체계의 최적 투자 계획 모델을 고려한다. 최적화 모델 수립을 위해 다층 대공방어 체계를 네트워크 모델로 표현하고, 가용 예산이 제한되어 있는 상황 하에서 대응실패 확률을 최소화하기 위해 각 방어무기에 대하여 투자여부를 결정하는 모델과 연속적인 투자가 가능한 모델을 각각 제시한다. 비선형 형태의 목적함수를 로그함수를 통해 선형화하였으며, 제시된 최종 모델의 해법으로서 동적계획법 알고리즘과 선형계획법을 제안한다. 가상의 다층 대공 방어 상황을 설정한 후, 두 가지의 최적화 모델에 대한 최적해를 도출하고 그 결과를 분석하였다. 이는 다층 대공방어 체계의 신뢰도 향상을 위한 효과적인 투자 계획 수립의 필요성 및 접근방법을 제시한다.

가시광선-근적외선 반사스펙트럼을 이용한 쇠고기의 신선도 평가 (Evaluation of Beef Freshness Using Visible-near Infrared Reflectance Spectra)

  • 최창현;김종훈;김용주
    • 한국축산식품학회지
    • /
    • 제31권1호
    • /
    • pp.115-121
    • /
    • 2011
  • 본 연구에서는 유통현장에서 실시간으로 쇠고기 신선도를 측정하기 위해 가시광선-근적외선 반사 스펙트럼을 이용하여 쇠고기 신선도에 영향을 미치는 인자와 설정된 저장기간에 대하여 예측 모델을 개발하고 검증하였다. 쇠고기 시료는 총 216개를 사용하였으며 0-14일의 기간 동안 2일 간격으로 가시광선-근적외선 반사 스펙트럼을 측정한 후, 쇠고기의 신선도에 영향을 미치는 인자인 총균수, pH, VBN, TMA, TBA값을 공인된 방법을 이용하여 측정하였다. 예측모델은 다중회귀분석 방법과 최적 변수 선택이 가능한 stepwise 방법을 이용하여 개발하였으며, 예측모델의 선정은 결정계수, 오차, RPD를 이용하였다. 예측모델의 검증은 미지의 시료를 이용하였으며 그 결과 결정계수, 오차, RPD는 총균수에서 각각 0.74, 0.64, 2.75 Log CFU/$cm^2$, VBN은 각각 0.73, 1.45, 2.00 mg%, TMA는 각각 0.70, 0.19, 2.58 mg%, TBA값은 각각 0.73, 0.13, 2.77 mg MA/kg로 비교적 안정된 예측성능을 보여 주었다. 저장기간에 따른 예측모델의 검증결과는 결정계수, 오차, RPD가 각각 0.77, 1.94일, 2.53으로 실험 시 저장기간이 2일 간격인 점을 고려할 때, 비교적 높은 정밀도를 보이고 있음을 알 수 있다. pH의 예측성능은 결정계수, 오차, RPD가 각각 0.43, 0.10, 1.10로 다른 신선도 인자에 비해 낮은 결과를 보여 주었다. 본 연구에서는 가시광선-근적외선 분광분석법을 이용하여 쇠고기 신선도의 비파괴 평가에 대한 가능성을 제시하였으나 유통현장에서 적용을 위해서는 보다 많은 시료의 확보를 통한 예측모델의 신뢰성 향상과 stepwise방법으로 선정된 파장 영역을 기본으로 하는 부분최소자승법, 인공지능 등의 다양한 알고리즘의 적용을 통한 성능개선이 필요할 것으로 판단된다.

넙치(Paralichthys olivaceus)의 성장형질 연관 유전자 변이 탐색을 위한 전장유전체연관분석(GWAS) 알고리즘 비교 분석 연구 (Comparison of Genome-wide Association Study (GWAS) Algorithms for Detecting Genetic Variants Associated with Growth Traits in Olive Flounder Paralichthys olivaceus)

  • 윤상원;이희건;박종원;정민환;이다인;정효선;김주란;양혜림;이승환;이정호
    • 한국수산과학회지
    • /
    • 제56권4호
    • /
    • pp.411-418
    • /
    • 2023
  • Genome wide association studies (GWAS) identify genetic loci associated with quantitative traits in genomic selection. Although several studies have compared performance of various algorithms, no study compares them in olive flounder Paralichthys olivaceus. This study compared the GWAS results of four mixed linear model (MLM) algorithms and one Fixed and random model Circulating Probability Unification (FarmCPU) algorithm in olive flounder. Considering gender and genetic association matrices as fixed and random effects, the MLM had stable performance without inflation for λGC (genomic inflation factor) of -log10P. The FarmCPU algorithm had some appropriate λGC of -log10P, and an upward tail was identified in quantile-quantile plots. Therefore, the models were suitable for detecting genetic variants associated with olive flounder growth traits. Moreover, significant genotypes appeared several times at chromosome 22, around which quantitative trait loci are expected to exist. Finally, in both models, some of the most genetic variants were found in genes related to growth traits, confirming their reliability. These results will be helpful when applied to the genomic selection of olive flounder growth traits in the future.

Inclusion of bioclimatic variables in genetic evaluations of dairy cattle

  • Negri, Renata;Aguilar, Ignacio;Feltes, Giovani Luis;Machado, Juliana Dementshuk;Neto, Jose Braccini;Costa-Maia, Fabiana Martins;Cobuci, Jaime Araujo
    • Animal Bioscience
    • /
    • 제34권2호
    • /
    • pp.163-171
    • /
    • 2021
  • Objective: Considering the importance of dairy farming and the negative effects of heat stress, more tolerant genotypes need to be identified. The objective of this study was to investigate the effect of heat stress via temperature-humidity index (THI) and diurnal temperature variation (DTV) in the genetic evaluations for daily milk yield of Holstein dairy cattle, using random regression models. Methods: The data comprised 94,549 test-day records of 11,294 first parity Holstein cows from Brazil, collected from 1997 to 2013, and bioclimatic data (THI and DTV) from 18 weather stations. Least square linear regression models were used to determine the THI and DTV thresholds for milk yield losses caused by heat stress. In addition to the standard model (SM, without bioclimatic variables), THI and DTV were combined in various ways and tested for different days, totaling 41 models. Results: The THI and DTV thresholds for milk yield losses was THI = 74 (-0.106 kg/d/THI) and DTV = 13 (-0.045 kg/d/DTV). The model that included THI and DTV as fixed effects, considering the two-day average, presented better fit (-2logL, Akaike information criterion, and Bayesian information criterion). The estimated breeding values (EBVs) and the reliabilities of the EBVs improved when using this model. Conclusion: Sires are re-ranking when heat stress indicators are included in the model. Genetic evaluation using the mean of two days of THI and DTV as fixed effect, improved EBVs and EBVs reliability.

개별관로 정의 방법을 이용한 상수관로 파손율 모형화 및 경제적 교체시기의 산정 (Modeling of the Failure Rates and Estimation of the Economical Replacement Time of Water Mains Based on an Individual Pipe Identification Method)

  • 박수완;이형석;배철호;김규리
    • 한국수자원학회논문집
    • /
    • 제42권7호
    • /
    • pp.525-535
    • /
    • 2009
  • 본 연구에서는 상수관망에서 개별적으로 노후도가 심하여 개량이 필요한 구간을 보다 정확하게 구분하기 위해 새로운 개별관로 정의 방법이 개발되었다. 적절한 관로 최소구성성분 길이를 결정하기 위하여 여러 가지 관로 최소구성성분 길이에 대한 평균 누적파손횟수경사선의 분산값을 비교하여 가장 큰 분산값을 나타내는 관로 최소구성성분 길이인 4 m 를 연구대상 지역의 상수관망에 적용하였으며 관로 ID는 39개로 구분되어졌다. 관로의 경제적 최적교체 시기는 한계파손율과 관로의 파손경향모형을 이용하여 결정되었는데, 각 관로 ID에 대하여 관로의 선형적 파손경향, 지수적 파손경향 또는 선형과 지수형 사이에 있는 파손경향 모두에 적용될 수 있는 General Pipe Break Prediction Model(Park and Loganathan, 2002)과 수정된 시간척도를 이용한 ROCOF(Park et al., 2007)를 적용하여 연구대상 상수관망의 최적교체시기를 산정 및 분석하였다. ROCOF 모형화 과정에서 대수-선형과 와이블 ROCOF를 적용 후 최대로그우도 추정값을 비교하여 최대로그우도가 큰 값을 가지는 ROCOF를 각 관로 ID의 ROCOF로 사용하였다. 관로파손으로 인한 사회적 비용이 관로의 최적교체시기에 미치는 영향도 분석되었다.