• 제목/요약/키워드: 통계자료

검색결과 10,271건 처리시간 0.034초

Adaptive Nearest Neighbors를 활용한 결측치 대치

  • 전명식;정형철
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.185-190
    • /
    • 2004
  • 비모수적 결측치 대치 방법으로 널리 사용되는 k-nearest neighbors(KNN) 방법은 자료의 국소적(local) 특징을 고려하지 않고 전체 자료에 대해 균일한 이웃의 개수 k를 사용하는 단점이 있다. 본 연구에서는 KNN의 대안으로 자료의 국소적 특징을 고려하는 adaptive nearest neighbors(ANN) 방법을 제안하였다. 나아가 microarray 자료의 경우에 대하여 결측치 대치를 통해 KNN과 ANN의 성능을 비교하였다.

  • PDF

통계 패키지에서의 데이터 접근 방식 비교 (Comparing Data Access Methods in Statistical Packages)

  • 강근석
    • Communications for Statistical Applications and Methods
    • /
    • 제16권3호
    • /
    • pp.437-447
    • /
    • 2009
  • 최근에 산업현장에서의 통계전문가들에게는 여러 가지 통계분석기법을 사용한 자료 분석 외에 다양한 형태의 자료 저장장치에서 추출 또는 생성의 과정을 거쳐 분석 목적에 적합한 자료를 구성해야하는 문제에 많이 부닥치고 있다. 본 논문에서는 현재 일반적으로 사용되고 있는 여러 통계 패키지들에서 제공하고 있는 데이터 접근방식을 살펴보고 각 기능들을 비교 분석하고자 한다. 이들 방식에 대한 정확한 이해는 특히 데이터마이닝 등 대용량의 자료를 분석하고자 할 때 데이터 처리과정에서의 어려움으로 발생하는 비용과 시간을 감소시켜주어 통계전문가들이 통계분석에 더욱 많은 작업을 할애할 수 있도록 해줄 것이다.

웹 이용자를 위한 통계 메타데이터: 통계정보 제공사이트의 메타데이터 제공 수준 평가 사례 연구 (Statistical Metadata for Users: A Case Study on the Level of Metadata Provision on Statistical Agency Websites)

  • 오정선
    • 정보관리학회지
    • /
    • 제24권2호
    • /
    • pp.161-179
    • /
    • 2007
  • 디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다. 일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, http://www.bls.gov/) 및 the Energy Information Administration (EIA, http://eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어, 이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

공간통계분석에서 이상점 수정을 위한 방법비교

  • 이진희;신기일
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.275-280
    • /
    • 2003
  • 공간 자료에서 이상점이 존재할 경우 변이도(Variogram)를 추정함에 있어 그 효과를 줄이기 위한 방법으로 로버스트(robust) 변이도를 이용한다. 그러나 이상점이 존재하는 자료분석에서 로버스트 변이도를 사용하기에 앞서 이상점을 수정한 자료를 사용하였을 경우 그 효율성 또한 좋다고 알려져 있다. 본 논문에서는 이상점이 존재하는 자료를 분석함에 있어 기존의 이상점 수정법 및 새로운 이상점 수정법의 효율성을 비교하였다.

  • PDF

통계패키지와 Active Server Page를 이용한 통계 분석 웹 컨텐츠 개발 (Development of Web Contents for Statistical Analysis Using Statistical Package and Active Server Page)

  • 강태구;이재관;김미아;박찬근;허태영
    • 한국산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.109-114
    • /
    • 2010
  • 본 논문에서는 통계패키지와 Active Server Page(ASP)를 이용하여 통계분석을 위한 웹 컨텐츠를 개발하였다. 통계패키지는 통계비전공자에게 사용하기도 어렵고 배우기도 매우 어렵지만, 통계비전공자들은 SAS, S-plus, R 등과 같은 통계패키지에 대한 학습 없이 자료를 분석하기를 원하고 있다. 따라서 본 연구에서는 통계패키지로 많이 활용되고 있는 S-plus와 ASP를 이용하여 통계분석 웹 컨텐츠를 개발하였다. 실제 응용으로, 수질오염자료에 대하여 웹 상에서 탐색적 자료 분석, 분산분석, 시계열 분석 등과 같은 다양한 분석에 대한 웹 컨텐츠를 개발하였다. 개발된 웹 통계분석은 공무원, 연구원 등과 같은 통계 비전문가들에게 매우 유용한 도구이다. 결과적으로 웹 기반의 통계분석 컨텐츠를 통하여 인터넷으로 하여금 사용자들로 하여금 자료 분석을 쉽게 빠르게 할 수 있다.

중등학교에서의 통계 지도 방향 탐색 - 대표값과 분산, 표준편차를 중심으로-

  • 김창일;전영주
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제14권
    • /
    • pp.273-295
    • /
    • 2001
  • 통계는 연역적 사고를 강조하는 수학의 다른 영역과 달리 귀납적 추론과 직관적 사고를 요구한다. 따라서 학교 수업에서 학생들이 실제적인 상황을 모델링 할 수 있도록 하며, 주어진 상황에서 자료를 올바르게 산출하고 분석 할 수 있도록 적절한 지도 방법이 필요하다. 그렇지만 학교 수업은 대다수 알고리즘 연습 위주의 통계 학습-지도로 통계적 사고 교육이 제대로 이루어지지 못하고 있다. 이로 인해 학생들은 형식적인 통계 처리에는 익숙하지만 통계 교육의 궁극적 목적인 변이성과 자료를 현명하게 다루는 능력이 부족하다. 본고에서는 피상적인 기계적 계산위주의 통계교육에서 실제적인 자료를 수집하고, 이를 적절히 가공 처리하여 정보의 가치를 높일 수 있는 통계 지도 방향을 탐색해 보고자 한다.

  • PDF

통계자료의 수집 및 분석의 타당성에 관한 연구- 광주,전남지역을 중심으로 - (A Study on the Validity of the Statistical Collection and Analysis in Gwangju and Chonnam)

  • 이화영
    • 응용통계연구
    • /
    • 제6권2호
    • /
    • pp.443-452
    • /
    • 1993
  • 비학술단체에서 통계자료의 수집과 분석시에 반드시 고려해햐할 항목을 나열한 점검표를 개발하였다. 개발된 점검표를 활용하여 광주, 전남지역의 단체, 언론, 금융기관, 산업체에서 일년간(1991년 4월 5일부터 1992년 4월 4일까지) 통계조사결과 발표된 결과물에 대하여 자료수집과 분석의 타당성을 검토하였다.

  • PDF

임상시험정보의 효율적인 활용을 위한 통계모델링 구축 (The establishment of the statistics modeling for the effective utilization of the clinical trials information)

  • 김동선;조성제
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.161-164
    • /
    • 2010
  • 식품의약품안전청은 산발적으로 흩어져 있던 임상시험 관련 정보를 통합하여 서비스하기 위한 방안으로 임상시험정보방을 개설하게 되었다. 임상시험승인현황 등 원시자료는 종이형태로 생산, 관리된다. 이를 통계자료로 활용하기 위해서 식품의약품안전청의 관련 시스템인 KiFDA 시스템에 입력을 하게 된다. 이 시스템에 입력된 데이터는 실시간으로 임상시험관련 웹서비스 시스템에 구축된다. 이때에 실시간 통계정보의 정확성이 무엇보다 중요하다. KiFDA 시스템의 데이터베이스의 실시기관명과 임상시험계획승인제도(IND) 승인리스트 원본의 실시기관명이 틀린 것도 있었다. 이는 동일한 실시기관도 화면에서는 서로 다른 실시기관으로 보일 수 있다는 것을 의미한다. 결국 통계자료가 부정확하게 표출되는 데는 이런 원인들이 있었던 것이다. 본 논문에서는 기존의 문제점을 개선하기위해 임상시험정보방의 효율적인 통계모델링을 설계하여 물리적 데이터베이스를 구축하였다.

회귀모형에서 이변량 자료에 합산된 일변량 자료를 첨가시킬 때의 효과 (The effect of adding the summed univariate data to the bivariate data in regression model)

  • 박래현;이석훈;김노만
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.573-584
    • /
    • 1999
  • 본 연구는 이변량 회귀모형을 이변량 자료에 적용할 때 이변량 자료(분리형 자료) 이외에 이변량 자료를 합산한 일변량 자료(통합형 자료)를 동시에 사용하는 문제를 고찰하였다. 특징을 파악하기 위하여 설명변수가 하나인 경우를 다루었는데 통합형 자료의 첨가효과를 회귀계수의 추정량의 평균제곱오차의 크기로서 측정하면서 효과와 이변량 모형과의 관계를 조사하였다. 최대우도 추장량의 특성으로부터 대표본의 성질을 추출하고 또한 모의실험을 통하여 소표본에서도 대표본의 성질이 만족하는지 조사하였고 끝으로 실제 자료에 적용하여 보았다.

  • PDF

통계자료를 이용한 직접피해액 산정 (Direct damage cost estimation to use statistical data)

  • 한명선;김충수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.230-230
    • /
    • 2011
  • 2000년대 들어 가장 이슈화된 용어는 수십년 이상 사용해오고 있는 기상이변, 기후변화일 것이다. 이는 지구 온난화, 온실효과 등으로 인한 이산화탄소의 증가, 오존층 파괴, 해수온도 상승 등이 주요한 원인일 것이다. 수문학적 측면에서는 짧은 강우지속기간 동안 큰 강우강도를 갖는 집중 호우 및 국지성 호우와 해수온도 상승으로 강력한 규모의 태풍발생, 태풍지속기간을 연장하는 현상이 지속적으로 발생하고 있다. 이러한 극한 강우 발생사상으로 인해 홍수발생 위험요소가 증대하고, 홍수피해 규모가 커지고 있으며, 따라서 그동안 수립해오던 치수대책 방안에 기상변화, 홍수 피해 규모 증대 등을 고려해야 한다. 또한, 치수대책 수립의 적절한 판단기준을 수문학적 측면뿐만 아니라 사회, 경제적 요소를 고려하여 수립함으로써 정책 입안자나 설계자가 객관적인 지표를 통해 적절한 치수대책을 수립해야 할 것이다. 기존 인명손실 관련 연구결과 외에 다양한 국내 통계자료를 이용하여 직접피해액 산정이 가능하다. 본 연구는 치수대책 평가시스템 구축 연구의 한 부분으로 5개년으로 계획되어 있다. 연구 목표 : 통계자료를 이용한 직접피해액 산정 1. 지역별 다양한 자산 산정 - 건축물 자료 조사 - 내구재 및 농작물 등의 자료 조사 2. 자산별 피해율 산정 조사 - 건축물 자산의 피해율 조사 - 내구재 및 농작물 등의 침수심에 따른 피해율 조사

  • PDF