• 제목/요약/키워드: 자료분석

검색결과 45,869건 처리시간 0.066초

짝을 이룬 자료분석시 야기되는 Estimation Bias의 Control Methods (Comparison of Control Methods for Estimation Bias in Unmatched Analysis of Matched Data)

  • 유근영
    • Journal of Preventive Medicine and Public Health
    • /
    • 제23권3호
    • /
    • pp.247-254
    • /
    • 1990
  • 짝짓기 방법은 교란변수를 통제하기 가장 좋은 방법으로 알려져 있으나, 모수추정시 그 계산방법이 복잡하고, 포함된 모든 정보를 이용할 수 없다는 단점을 갖고 있다. 그럼에도 불구하고, conditional 모델을 이용한 matched 분석법은 짝지은 자료 분석시 가장 좋은 방법으로 인정되고 있다. 그러나 명확한 confounding 현상을 통제할 목적이 아닌 상태에서 짝지워진 자료를 matched 분석법으로 모수추정하는 경우나, 올바로 짝지워진 자료를 분석법의 편이성 때문에 unmatched 분석을 시도하는 경우, 오히려 estimation bias가 야기될 수 있다. 이러한 estimation bias의 통제능력을 몇 가지 분석방법을 이용하여 비교하고자, 1:2로 대응된 한 환자-대조군 자료를 이용하여 Mantel-Haenszel 분석법, 두가지의 unconditional model을 이용한 다변량분석법의 결과를 conditional model을 이용한 matched 분석법의 결과와 비교하였다. 1. Matched 분석법의 대용방법으로 사용된 세 가지 방법들은 모수추정면에서나 가설검정능력면에서 차이를 서로 보이지 않았다. 2. 짝짓기에 사용된 변수가 분석자료내에서 confounder나 effect modifier로 작용되지 않았음이 명백한 경우에는 이들 세 가지 통제 방법과 matched 분석법간에 차이가 없었다. 3. 짝짓기에 사용된 변수가 분석자료내에서 effect modifier로 작용하지는 않았으나, Confounder로 작용한 것으로 추정되는 경우, unmatched 분석법으로 인해 야기된 estimation bias의 통제능력이 이들 세 가지 대용방안 모두에서 인정되었다. 4. 짝짓기에 사용된 변수가 분석자료내에서 effect modifier로 작용하고 있음을 직접 확인할 수 있는 경우에는, overmatching에 의한 estimation bias를 의심할 수 있었으며, 이들 세 가지 통제방법은 오히려 unmatched 분석 방법에 가까운 모수를 추정하였다.

  • PDF

베이지안 네트워크를 이용한 다차원 범주형 분석 (Multi-dimension Categorical Data with Bayesian Network)

  • 김용철
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.169-174
    • /
    • 2018
  • 일반적으로 자료의 효과 연속형인 경우 분산분석과 이산형인 경우 분할표 카이제곱 검정을 통계적 분석방법으로 사용한다. 다차원의 자료에서는 계층적 구조의 분석이 요구되어지며 자료간의 인과관계를 나타내기 위해 통계적 선형모형을 채택하여 분석한다. 선형모형의 구조에서는 자료의 정규성이 요구되어지며 일부 자료에서는 비 선형모형을 채택할 수도 있다. 특히, 설문조사 자료 구조는 문항의 특성상 이산형 자료의 형태가 많아 모형의 조건에 만족하지 않는 경우가 종종 발생한다. 자료구조의 차원이 높아질수록 인과관계, 교호작용, 연관성분석 등에 다차원 범주형 자료 분석 방법을 사용한다. 본 논문에서는 확률분포의 계산을 이용한 베이지안 네트워크 모형이 범주형 자료 분석에서 분석절차를 줄이고 교호작용 및 인과관계를 분석할 수 있다는 것을 제시하였다.

경험적 모드분해법을 활용한 경향성 분석의 적용성 평가 (Assessment for Detecting Trend using Empirical Mode Decomposition Method)

  • 김태림;최원영;서정호;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.232-232
    • /
    • 2016
  • 주어진 시계열 자료의 경향성을 분석하고 판별하는 것은 수문 자료의 분석에서 가장 우선적으로 수행되어야 할 절차이며 경향성의 유무에 따라 자료를 분석하는 방법이 달라지게 되므로 매우 중요한 부분이다. 일반적으로 국내에서 주로 사용되는 수문 시계열 자료의 경향성 분석 방법으로는 비매개변수적인 방법인 Mann-Kendall test, Spearman's rho test, Hotelling Pabst test, Sentest 등이 있으며 그 중에서도 국내외 수문 자료의 경향성 분석에는 비교적 높은 기각력을 보이는 Mann-Kendall test가 주된 방법으로 활용되어 오고 있다. Mann-Kendall test는 통계적 유의성을 바탕으로 한 경향성 판별 방법으로 시계열 자료 내에 존재하는 경향성의 형태를 분석하여 경향성 유무를 판별하는 것에는 한계가 있다. 경험적 모드분해법을 활용한 경향성 분석 방법은 체거름 과정을 통하여 주어진 시계열 자료를 내재모드함수로 분해한 후, 추출된 모든 요소를 제거하고 남은 잔여값의 형태를 이용하여 경향성 유무를 판별하는 방법으로 자료에 내재된 경향성의 형태를 확인할 수 있는 장점을 가지고 있다. 본 연구에서는 이러한 경험적 모드분해법을 이용한 경향성 분석 방법을 소개하고, 모의를 통한 시계열 자료를 이용하여 경향성 분석에 적용한 후 기존에 사용되어온 Mann-Kendall test와의 비교를 통해 적용성을 평가하였다.

  • PDF

2005년 설마천 시험유역의 관측 자료를 이용한 물수지 분석 (Water Balance Analysis using Observation Data of the Seolma-Cheon Experimental Catchment of the 2005 Year)

  • 김동필;정성원;김성훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.688-692
    • /
    • 2006
  • 산지 소하천 유역을 대상으로 물순환 과정을 규명하기란 대단히 어려운 실정이다. 1차적으로는 수문자료의 부재가 제일 크며, 자료가 있다 하더라도 홍수기 중심 및 단기간 자료의 축적에 불과하다. 이중 설마천 시험유역은 한국건설기술연구원의 11년간 운영경험을 바탕으로 비교적 장기간의 수문자료를 축적하고 있다. 최근 6년간은 신뢰할 만한 양질의 수문자료를 구축하였으며, 현재는 신뢰도의 완성을 높이는 연구가 활발히 진행 중에 있다. 설마천 시험유역의 유역의 물순환 구조는 자연계의 유입과 유출이 지배적이며, 이들의 수문성분을 규명하기 위해서는 각각의 수문성분들의 관측 및 해석이 필요하며, 각 수문성분들의 물수지 분석을 통하여 정량적인 합의 결과를 가시적으로 확보함이 매우 중요하다. 신뢰도와 정확성에 근거한 관측자료를 이용한 물수지 분석결과는 수문성분들의 총체적 표현이라 할 수 있는 모형(model)의 중요 입력자료이며, 모형의 분석결과를 검증할 수 있는 중요한 기준이 된다. 모형의 결과와의 비교 검토를 통해 산지 소하천 유역의 물순환 관계를 규명하는 기반을 확보하게 될 것이다. 본 연구에서는 신뢰성 있는 수문관측 자료를 이용하여 물수지 분석을 수행하였다. 물수지 분석의 대상유역인 설마천 시험유역의 신뢰할 만한 관측자료에는 강우량, 유출량, 지하수이용량이며, 증발산량 산정을 위한 기상관측 및 대형증발계를 통한 실제 증발량 관측은 이루어지나 유역을 대표하는 증발산량의 관측이 연속적으로 이루어지지 못하는 실정이다. 그러나, 설마천 시험유역은 소규모이며, 대체로 동질성 있는 유역이라고 가정하여 1개 기상관측소에서 운영하는 기상자료를 이용하여 증발산량을 산정하고 물수지에 적용하였다. 또한, 그 동안 관측하지 못했던 지하수위 관측을 실시함으로써 정확한 물순환 해석을 할 수 있는 기반을 확보 하였으며, 가용한 장 단기간의 관측자료와 물수지 분석 연산식의 추정치를 바탕으로 관측자료에 의한 물수지 분석을 수행하였다. 분석 결과로 산지 소하천 유역인 설마천 시험유역의 각 수문요소의 물이동간의 정량적인 값을 알 수가 있었으며, 앞으로 추가적이고 지속적인 수문모니터링이 운영되고 물순환 해석 모형에 의한 검증이 수행된다면 정량적인 물순환 관계를 규명할 수 있을 뿐만 아니라 이와 관련된 수문요소기술을 확보할 수 있을 것이다.

  • PDF

2006년 설마천 시험유역의 관측 자료를 이용한 물수지 분석 (Water Balance Analysis using Observation Data of the Seolma-Cheon Experimental Catchment)

  • 김동필;김성훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1493-1497
    • /
    • 2007
  • 산지 소하천 유역을 대상으로 물순환 과정을 규명하기란 대단히 어려운 실정이다. 1차적으로는 수문자료의 부재가 제일 크며, 자료가 있다 하더라도 홍수기 중심 및 단기간 자료의 축적에 불과하다. 이중 설마천 시험유역은 한국건설기술연구원의 12년간 운영경험을 바탕으로 비교적 장기간의 수문자료를 축적하고 있다. 최근 7년간은 신뢰할 만한 양질의 수문자료를 구축하였으며, 현재는 신뢰도의 완성을 높이는 연구가 활발히 진행 중에 있다. 설마천 시험유역의 유역의 물순환 구조는 자연계의 유입과 유출이 지배적이며, 이들의 수문성분을 규명하기 위해서는 각각의 수문성분들의 관측 및 해석이 필요하며, 각 수문성분들의 물수지 분석을 통하여 정량적인 합의 결과를 가시적으로 확보함이 매우 중요하다. 신뢰도와 정확성에 근거한 관측자료를 이용한 물수지 분석결과는 수문성분들의 총체적 표현이라 할 수 있는 모형(model)의 중요 입력자료이며, 모형의 분석결과를 검증할 수 있는 중요한 기준이 된다. 모형의 결과와의 비교 검토를 통해 산지 소하천 유역의 물순환 관계를 규명하는 기반을 확보하게 될 것이다. 본 연구에서는 신뢰성 있는 수문관측 자료를 이용하여 물수지 분석을 수행하였다. 물수지 분석의 대상유역인 설마천 시험유역의 신뢰할 만한 관측자료에는 강우량, 유출량, 지하수이용량이며, 증발산량 산정을 위한 기상관측 및 대형증발계를 통한 실제 증발량 관측은 이루어지나 유역을 대표하는 증발산량의 관측이 연속적으로 이루어지지 못하는 실정이다. 그러나, 설마천 시험유역은 소규모이며, 대체로 동질성 있는 유역이라고 가정하여 1개 기상관측소에서 운영하는 기상자료를 이용하여 증발산량을 산정하고 물수지에 적용하였다. 또한, 그 동안 관측하지 못했던 지하수위 관측을 실시함으로써 정확한 물순환 해석을 할 수 있는 기반을 확보 하였으며, 가용한 장 단기간의 관측자료와 물수지 분석 연산식의 추정치를 바탕으로 관측자료에 의한 물수지 분석을 수행하였다. 분석 결과로 산지 소하천 유역인 설마천 시험유역의 각 수문요소의 물이동간의 정량적인 값을 알 수가 있었으며, 앞으로 추가적이고 지속적인 수문모니터링이 운영되고 물순환 해석 모형에 의한 검증이 수행된다면 정량적인 물순환 관계를 규명할 수 있을 뿐만 아니라 이와 관련된 수문요소기술을 확보할 수 있을 것이다.

  • PDF

환경분야를 위한 공간정보 분석 기술의 동향과 전망 - 지구통계학을 중심으로

  • 박노욱
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 춘계학술대회
    • /
    • pp.187-187
    • /
    • 2010
  • 공간자료를 다루는 일반적인 과정은 연구자의 정의에 따라 달라질 수 있지만, 일반적으로 자료 수집, 자료 구축, 분석 및 결과 도출의 일반적인 과학/공학적 분석 절차와 유사하다. 산업체의 관점에서 볼 때, 1990년대 초기 국가GIS 사업이 시작될때부터 현재까지는 공인된 자료 구축에 많은 주안점을 두어서 기존 아날로그 자료의 디지털화, 자료 가공, 데이터베이스 구축, 자료의 시각화 등의 일반적인 자료 구축 및 도시에 주안점을 두어왔다. 또한 다양한 공간해상도의 원격탐사 자료와 같이 다중 근원 자료의 이용이 빈번해짐에 따라 공간자료의 갱신 또한 중요한 부분을 차지하고 있다. 그러나, 공간자료를 다루는 일련의 과정이 궁극적으로는 특정 분야에서의 의사 결정보조자료의 제공 등을 지향한다고 간주할 때, "from data to information to knowledge"의 중간 혹은 최종 단계의 결과물을 산출하기 위한 적절한 분석 기술의 개발 및 적용 또한 중요한 부분을 차지한다. 공간분석을 별도의 학문분야로 간주하느냐 아니냐의 문제와는 상관없이, 최근 20년간 공간분석은 GIS 및 원격탐사 분야뿐만 아니라 기본적으로 공간자료를 다루는 많은 응용분야에서 공간자료의 이해와 부가정보의 생산을 위한 중요한 기술 분야로 간주되어 왔다. 공간분석의 여러 응용 분야중에서 환경분야에의 적용 연구는 또한 환경과학이라는 별도의 분야 뿐만 아니라, 기존 학문들인 지리학, 생태학, 지구과학, 사회학, 경제학, 도시 계획 등의 하위분야에서 중요한 방법론으로 자리 잡고 있다. 이 기술 세미나에서는 환경분야에 직간접적으로 활용이 가능한 공간정보 분석 기술의 동향을 지구통계학을 중심으로 소개하고자 한다. 국내에서 크리깅으로 대표되어온 지구통계학은 적용하는 학문 분야에 따라 보다 넓은 의미를 가지는 공간 통계학이라는 용어로 사용되고 있지만, 보다 학문적/기술적 의미로 살펴보면 공간분석의 특화된 분야로 간주할 수 있다. 1950년대 알려진 광상의 위치 정보를 이용하여 은둔 광상의 위치를 추정하기 위해 기본 개념이 소개된 이후에 수학적으로 이론이 1960년대 정립된 지구통계학은 많은 발전을 이루어 현재 다양한 분야에서 적용되고 있다. 그러나 외국과 달리 국내에서는 크리깅을 고급 내삽 기법으로만 간주하여 단순 주제도 작성에 제한적으로 사용하고 있다. 이 기술 세미나에서는 특정 학문분야에서 적용되기 보다는 일반적으로 통용될 수 있는 지구통계학의 기본 개념을 우선 소개한 후에, 국내외 학계에서의 환경주제도 제작과 관련된 주요 응용분야를 소개하고자 한다. 이후에 지구통계학이 적용될 수 있으면서, 다학제적 관점에서의 이슈가 될 수 있는 분야를 제시하고자 한다.

  • PDF

농업용 저수지 이상거동 탐지를 위한 시계열 수위자료 특성 분석 (Time Series Analysis of Agricultural Reservoir Water Level Data for Abnormal Behavior Detection)

  • 이성학;이상현;홍민기;최진용
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.275-275
    • /
    • 2015
  • 최근 기후변화에 따른 극한 강우사상의 증가로 인하여 농업용 저수지의 재해 위험도가 증가하고 있는 추세이며, 사고가 발생할 때 마다 파손/붕괴된 시설물을 보수하는 대응형 유지관리체계에서 벗어나 기반시설의 성능과 생애주기 등을 고려하여 재해 발생을 사전에 예보 및 경보를 알릴 수 있는 예방적 관리체계로의 전환이 필요하다. 한국농어촌공사는 전국 1,500개 저수지에서 10분 단위 수위자료를 측정하고 있으며, 이를 분석하여 재해예방에 활용할 수 있는 기반이 조성되어 있으나 이에 대한 관리가 이루어지지 않고 있고 수집된 자료를 활용하여 재해 징후를 분석할 수 있는 재해 예방적 분석기술이 마련되어 있지 않은 실정이다. 본 연구에서는 농업용 저수지 수위자료를 이용한 저수지 이상거동을 판별하기 위하여 전국 34개 한국농어촌공사 관할 저수의 시계열 수위자료의 특성(Feature)을 분석하고자 한다. 시계열 자료의 시계열 특성을 분석하기 위하여 한국농어촌공사 관할의 전국 34개 저수지를 선정하여 분석을 실시하였다. 대상저수지는 지역별, 저수용량, 안정등급, 붕괴발생, 1개 지사관할 저수지로 각각 구분하여 선정하였으며, 각 저수지의 수위 측정기간(최소 5개년)에 대한 자료를 수집하였다. 농업용 저수지의 시계열 수위 자료의 특성을 분석하기 위하여 자료의 전처리를 수행하였다. 자료의 전처리는 시계열 수위자료의 잡음 특성, 기상자료 관련 변동특성 등 분류(Classification)에 영향을 미치는 노이즈 요소를 제거하는 과정이다. 전처리과정을 거친 자료는 특징(Feature) 추출 과정을 거치게 되고, 추출된 특징의 적합성에 따라 분류 알고리듬 성능에 많은 영향을 미친다. 따라서 시계열 자료의 특성을 파악하고 특징을 추출하는 것은 이상치 탐지에 있어 매우 중요한 과정이다. 본 연구에서는 시계열 자료 특징 추출 방법으로 물리적인 한계치, 확률적인 문턱값(Threshold), 시계열 패턴, 주변 저수지와의 시계열 상관분석 등을 적용하였으며, 이를 데이터베이스로 구축하여 이후 분류알고리듬 학습에 적용하여 정상치와 이상치를 판별하는데 이용될 수 있도록 하였다. 따라서 본 연구에서 제시되는 농업용 저수지의 시계열 특성은 다양한 분류알고리듬에 적용할 수 있으며, 이를 통하여 저수지 이상거동 판별을 위한 최적을 분류알고리듬의 선택에 도움이 될 것이다.

  • PDF

신뢰성 시험자료의 통계적 분석 절차에 관한 연구

  • 이낙영;김종걸;권영일;홍연웅;전영록;나명환
    • 한국신뢰성학회:학술대회논문집
    • /
    • 한국신뢰성학회 2001년도 정기학술대회
    • /
    • pp.231-232
    • /
    • 2001
  • IEC 60300에서 규정한 신뢰성시험으로부터 얻은 시험자료(Test Data)의 형태와 자료분석에 쓰이는 통계적 도구와 자료분석도구와 분석과정에 대해서 수리가능한 제품과 불가능한 제품으로 구분하여 설명한다.

  • PDF

통합신뢰성(Dependability) 시험자료 분석 및 절차에 관한 연구

  • 이낙영;김종걸;홍연웅;권영일;전영록;나명환
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2001년도 춘계학술대회
    • /
    • pp.161-166
    • /
    • 2001
  • IEC 60300에서 규정한 신뢰성시험으로부터 얻은 시험자료(Test Data)의 형태와 자료분석에 쓰이는 통계적 도구와 자료분석도구와 분석과정에 대해서 수리가능한 제품과 불가능한 제품으로 구분하여 설명한다.

  • PDF

국가R&D 조사분석 검증자료의 장기적 보존 메타데이터 모델에 관한 연구 (A Study on Preservation Metadata Model for long-term Preservation of the R&D Information)

  • 안정은;윤종민;고준호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1385-1388
    • /
    • 2012
  • 국가R&D사업의 추진결과와 활동현황에 대한 종합적이고 다각적인 분석을 위해 1999년도부터 매년 모든 국가R&D사업에 대해 주요 연구 성과인 논문, 특허, 기술료 등에 대한 국가R&D 조사분석 자료 수집이 실시되고 있다. 국가R&D 표준정보 수집을 위해 2003년도에 '국가연구개발사업 종합관리시스템(CORDI, 현재 SIMS)'이 구축되었고, 매년 국가R&D 조사분석 자료들의 수집 분석이 실시되고 있으나, 전자기록의 속성을 갖는 국가R&D 조사분석 자료, 특히 조사분석의 검증자료에 대한 장기적 보존을 위한 관련 연구는 전무한 상태이다. 따라서 본 연구는 국가R&D 조사분석의 검증자료에 대한 장기적 보존과 나아가서는 평가의 활용 및 정보 시스템간의 상호운용성을 높이기 위한 국가R&D 조사분석 검증자료의 보존 메타데이터 모델을 제안한다.