The objectives of the study were to estimate genetic parameters for milk production traits of Holstein cattle using random regression models (RRMs), and to compare the goodness of fit of various RRMs with homogeneous and heterogeneous residual variances. A total of 126,980 test-day milk production records of the first parity Holstein cows between 2007 and 2014 from the Dairy Cattle Improvement Center of National Agricultural Cooperative Federation in South Korea were used. These records included milk yield (MILK), fat yield (FAT), protein yield (PROT), and solids-not-fat yield (SNF). The statistical models included random effects of genetic and permanent environments using Legendre polynomials (LP) of the third to fifth order (L3-L5), fixed effects of herd-test day, year-season at calving, and a fixed regression for the test-day record (third to fifth order). The residual variances in the models were either homogeneous (HOM) or heterogeneous (15 classes, HET15; 60 classes, HET60). A total of nine models (3 orders of $polynomials{\times}3$ types of residual variance) including L3-HOM, L3-HET15, L3-HET60, L4-HOM, L4-HET15, L4-HET60, L5-HOM, L5-HET15, and L5-HET60 were compared using Akaike information criteria (AIC) and/or Schwarz Bayesian information criteria (BIC) statistics to identify the model(s) of best fit for their respective traits. The lowest BIC value was observed for the models L5-HET15 (MILK; PROT; SNF) and L4-HET15 (FAT), which fit the best. In general, the BIC values of HET15 models for a particular polynomial order was lower than that of the HET60 model in most cases. This implies that the orders of LP and types of residual variances affect the goodness of models. Also, the heterogeneity of residual variances should be considered for the test-day analysis. The heritability estimates of from the best fitted models ranged from 0.08 to 0.15 for MILK, 0.06 to 0.14 for FAT, 0.08 to 0.12 for PROT, and 0.07 to 0.13 for SNF according to days in milk of first lactation. Genetic variances for studied traits tended to decrease during the earlier stages of lactation, which were followed by increases in the middle and decreases further at the end of lactation. With regards to the fitness of the models and the differential genetic parameters across the lactation stages, we could estimate genetic parameters more accurately from RRMs than from lactation models. Therefore, we suggest using RRMs in place of lactation models to make national dairy cattle genetic evaluations for milk production traits in Korea.
65세 이상 고령운전자의 경우 지난 10년 새 교통사고건수는 3만 7,000건에서 27만 4,000건으로 무려 640.5% 증가되었다. 이는 전체사고에서 차지하는 비율이 1.2%에서 3.1배 증가한 3.7%를 차지하고 있는 것으로 교통안전 관련기관에서는 여러 대책을 강구하고 있다. 무엇보다 고령운전자의 행동특성 및 신체특성에 대한 심층연구를 통해 안전대책과 연계하는 방안이 중요하다 할 수 있다. 본 연구에서는 고령운전자의 행동특성을 측정할 수 있는 운전자 적성검사(Driving Aptitude) 항목과 교통사고 자료를 토대로 고령운전자 운전특성과 사고특성을 연결한 실증연구를 수행하였다. 영향모형 개발을 위해 활용한 방법론은 영과잉 회귀모형을 적용하였고, ZIP 회귀모형과 ZINB 회귀모형에 대하여 베이지안 추론을 이용한 사고예측 모형을 선택하였다. AAE분석결과 ZIP 회귀모형이 적합하며, 3가지 변수속도예측, 주의전환, 인지능력이 고령자사고와 영향관계에 있음을 확인할 수 있었다.
한국노동패널조사에서 제공하는 2015년 한국 생산가능인구의 월평균 소득분포를 보면 0 관측치의 비율이 과도하게 높은 형태를 보여 기존의 소득분포에 주로 사용되는 토빗모형으로는 설명에 한계가 있다. 본 연구에서는 영과잉 특성을 반영하여 영과잉 토빗모형을 사용하여 한국인의 소득 자료를 분석한다. 영과잉 토빗모형은 2단계 모형으로 1단계에서는 소득이 0인 그룹을 두 그룹으로 나누는데, 첫 번째 그룹은 노동시장 참여의지가 없어 시장에 참여하지 않으므로 0이 관측되는 그룹(genuine zero)이고 두 번째 그룹은 노동시장 참여의지는 있으나 낮은 임금으로 인하여 절단되어 0이 관측되는 그룹(random zero)으로 가정하였다. 두 번째 random zero 그룹은 0 이상의 연속 자료와 결합하여 토빗모형을 적용한다. 1단계와 2단계 모형에 관심 있는 설명변수를 가진 회귀모형을 적용하여 노동시장 참여여부와 임금 수준에 영향을 미치는 요인을 알아본다. 마코브 체인 몬테칼로 기법을 사용하여 모수를 추정하고 기존의 토빗모형과 비교한 결과 영과잉 토빗모형이 0의 빈도추정과 모형 적합도 면에서 우수한 결과를 보였다. 분석결과 나이가 많을수록, 남자가 여자보다, 학력이 낮을수록, 노동시장에 참여할 가능성이 매우 유의하게 높으며, 사회경제적 지위가 높을수록 그리고 유보임금이 낮을수록 노동시장에 참여하지 않을 확률이 높은 것으로 나타났다. 임금수준을 보면, 남자가 여자보다, 학력이 높을수록, 기혼이 미혼 보다 매우 유의하게 더 높은 임금을 받는 것으로 나타났다.
본 연구에서는 건강에 대한 공간적 연구에서 통상적으로 사용되는 센서스에 기반한 지역 박탈지수의 대안으로 지역 주택가격이 사용될 수 있는지 평가하였다. 평가를 위해 개인을 1수준으로, 수도권의 보건소 구역을 2수준으로 하는 다수준 로지스틱 모델이 추정되었다. 다수준 모델에는 개인의 점심식사후 칫솔질과 치간실 사용을 설명하기 위한 개인수준의 변수들과 보건소 구역을 대표하는 사회적 박탈지수 및 지역주택가격 수준이 포함되었다. 추정된 모델들의 설명력은 Akaike Information Criterion (AIC)와 Bayesian Information Criterion (BIC)를 이용하여 평가되었다. 모델의 추정결과는 사회적 박탈지수 및 지역 주택가격이 모두 개인의 치아관리 행동을 설명하는 데 기여하나 지역 주택가격을 사용한 모델의 AIC 및 BIC가 통상적인 센서스 기반 지역 박탈지수를 사용한 경우 보다 낮은 것을 보여 주었다. 본 연구결과는 센서스에 기반한 박탈지수를 생성하는 데 사용된 센서스 변수가 시점의 차이 등의 이유로 적절하지 않을 경우 지역 주택가격이 지역의 사회경제적 수준을 대표하기 위해 대안적으로 사용될 수 있음을 보여준다.
범죄는 장소나 건축물 용도에 따라 발생빈도와 유형이 다르고, 그 장소를 이용하는 사람들의 특성 및 공간 구조 차이에 의해 다양하게 발생한다. 따라서 공간 및 지역특성을 포함한 공간 빅데이터를 활용하여 지역을 분석해 보면 범죄예방 전략을 마련할 수 있다. 아울러 빅데이터와 지능 정보화시대의 도래에 따라 예측적 경찰활동이 새로운 경찰활동의 패러다임으로 등장하고 있다. 이에 보편적인 지방도시 J시를 대상으로 3개년 동안의 7,420건의 실제 범죄사례를 바탕으로 도시공간의 물리 환경적인 특성을 분석하여 범죄발생공간을 규명하고, 위험지역을 예측해 보고자 하였다. 분석에는 다양한 빅데이터 중 범죄를 유발하는 도시 공간 내 물리 환경적 요소에 한하여 공간 빅데이터를 구축하여 공간회귀분석을 실시하였다. 다음으로 분석결과 도출된 가로폭, 평균 층수, 용적율, 1층 사용용도(제2종 근린생활시설, 상업시설, 유흥시설, 주거시설)을 변수로 베이지안확률 기반 범죄발생 위험성 예측 모형(CIPM: Crime Incident Prediction Model)을 개발하였다. 개발된 모델은 실제 범죄발생 지역과의 중첩분석 및 모델의 정확도를 판단하는 Roc curve 분석을 통해 AUC 값이 0.8로 모델이 적합한 것으로 나타났다. 개발된 모델을 토대로 사례지역의 범죄 위험도를 분석한 결과 범죄발생은 상업 및 유흥시설이 밀집된 지역과 건물층수가 높은 지역, 그리고 상업 및 유흥시설과 주거가 혼재해 있는 블록이 범죄발생 확률이 높은 것으로 나타났다. 본 연구는 단순히 범죄의 공간적 분포와 범죄발생 영향요인을 탐색하는 기존의 연구와 달리 범죄발생 예측모델을 확률론적 관점에서 개발하는 영역으로 한 단계 진전되었다는 점에 의의가 있다.
The aim of this study was to examine the trend of ovary cancer incidence from 1999 to 2010 in China and predict the burden up to 2020. Crude incidence, age specific incidence and age-adjusted incidence rates were calculated. Joinpoint regression was performed to obtain estimated annual percentages and Bayesian age-period-cohort modeling was used to predict the incidence rate until the year 2020. In China, the crude rate of ovary cancer was 7.91/100,000 and the age-adjusted rate was 5.35/100,000 overall during period 1999-2010. The rates in urban regions were higher than in rural regions. A significant rising trend during 1999-2006 was followed by a drop during 2006-2010 in age-adjusted rates for urban females. In contrast, constant rise was observed in rural women. The decrease in ovary cancer of urban areas tended to be restricted to women aged 50 years and younger. In contrast, increases of ovary cancer in rural areas appeared in virtually all age groups. Although the age-adjusted incidence rate for ovary cancer was predicted to be reduced after year 2011, the crude rate was likely to be relative stable up to 2020. The burden of ovary cancer in China will continue to be relative stable due to the aging population.
본 저자는 앞선 연구에서 제안한 SSVS 방법을 이용하여 한 양적형질에 대한 연관분석에 있어, QTL에 가까이 있는 관련된 표지유전자들의 위치를 정하고자 한다. 본 논문에서는 QTL에 연관되어 있고 동시에 서로 연관되어 있는 몇 가지 표지유전자들을 대상으로 하는데, 이 유전자 좌위들의 i.b.d. 값들을 상호 상관이 있는 예측변수로서 고려하여, SSVS 방법으로 분석한다. 두개의 QTL에 강하게 연관되어 있는 표지유전자들 만을 동시에 고려한 분석의 결과, QTL에 가장 가까이 위치한 표지 유전자가 다른 유전자들보다 더 분명하게 양적형질과의 관련성을 보여주었다. SSVS를 이용한 상호 상관이 있는 표지 유전자들의 분석의 결과는 전통적인 다중회귀분석을 이용한 결과와 거의 일치했다. 본 모의실험을 바탕으로, 복합 양적형질에 대하여 서로 연관된 다중의 표지유전자들을 동시에 연관분석을 수행하는 데에 SSVS 방법이 상당히 유용하다고 결론 내린다.
공간자료분석에서 공간적 상관성을 배제한 일반적인 회귀모형을 통한 모수 추정값들은 신뢰성의 문제가 지적 되어 오고 있다. 본 연구에서는 공간자료의 상관성을 고려한 모형을 구축하기 위하여 일변량 조건부자기회귀모형을 이용하였으며 베이지안 기법을 통하여 모수를 추정하고 공간상관성이 고려된 공간 가산자료모형과 고려되지 않은 일반 가산자료모형을 비교하였다. 연구 대상으로는 서울시의 25개 행정자치구별 총범죄 자료를 이용하였으며 자료분석을 통하여 도시계획과 같은 국가 정책의 수립에 참고자료로 활용될 수 있으리라 판단된다.
Journal of the Korean Data and Information Science Society
/
제25권2호
/
pp.373-384
/
2014
데이터 마이닝이란 대량의 데이터나 복잡한 구조의 데이터들을 정교한 통계분석과 모델링 테크닉을 이용하여 정확히 식별되지 않는 패턴이나 자료간의 상관관계를 밝혀내어 여러 가지 결과를 예측해 내는 통계적 기법이다. 이러한 데이터 마이닝 기법은 금융, 통신, 유통, 의학 등 다양한 분야에 활용되는데, 본 연구에서는 의학 분야에 적용하여 호흡기질환에 영향을 끼치는 요인을 선별하였다. 분석은 2012년도 경상북도 지역사회건강조사에 참여한 사람 중 의사에게서 폐결핵, 천식, 알레르기성 비염을 진단받은 경험이 있는 호흡기질환군과 건강군으로 정리한 자료를 대상으로 하였다. 호흡기질환이 영향을 끼치는 주요인을 선별하기 위해 인공신경망, 로지스틱 회귀모형, 베이지안 네트워크, C5.0, CART 기법을 이용하였다. 공정한 모형 평가를 위해 전체 데이터를 훈련용 데이터와 검증용 데이터로 나누었고, 훈련용 데이터에서 설정된 모형을 검증용 데이터에 적용하여 정확도를 비교하였다. 그 결과 CART가 최적 모형으로 선정되었으며 CART의 의사결정나무를 통하여 우울감 인지 여부, 현재 흡연여부, 스트레스 인지 여부 순으로 호흡기질환에 영향을 주는 것으로 나타났다. 그리고 호흡기질환의 주요인들에 대한 오즈비를 구하여 개별적인 영향력에 대해서도 밝혔다.
본 논문에서는 보행-차량 충돌사고 시 보행자 사망 여부를 확률적으로 예측할 수 있는 모형을 개발하였다. 베이지안 신경망을 적용하여 보행자 사망확률모형을 개발하고, 로지스틱 회귀분석 기법 기반의 모형과 예측력을 비교하였다. 본 연구를 위하여 개별 교통사고 자료를 수집하였으며, 교통사고 재현을 통해 사고 당시의 충돌속도를 추정하여 보행자 연령, 차종과 함께 모형의 독립변수로 사용하였다. 보다 정확하고 신뢰성 있는 모형개발을 위해 반복적 샘플링기법을 적용하여, 다양한 학습자료 및 테스트 자료를 구성하고 모형의 성능을 평가하였다 본 연구를 통해 개발된 모형은 보행자 보호를 위한 첨단차량기술 개발, 제한속도의 설정 등 다양한 정책 및 관련기술의 개발을 지원하는 유용한 도구로 사용될 것으로 기대된다.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.