• Title/Summary/Keyword: 통계자료

Search Result 10,271, Processing Time 0.041 seconds

Adaptive Nearest Neighbors를 활용한 결측치 대치

  • 전명식;정형철
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.185-190
    • /
    • 2004
  • 비모수적 결측치 대치 방법으로 널리 사용되는 k-nearest neighbors(KNN) 방법은 자료의 국소적(local) 특징을 고려하지 않고 전체 자료에 대해 균일한 이웃의 개수 k를 사용하는 단점이 있다. 본 연구에서는 KNN의 대안으로 자료의 국소적 특징을 고려하는 adaptive nearest neighbors(ANN) 방법을 제안하였다. 나아가 microarray 자료의 경우에 대하여 결측치 대치를 통해 KNN과 ANN의 성능을 비교하였다.

  • PDF

Comparing Data Access Methods in Statistical Packages (통계 패키지에서의 데이터 접근 방식 비교)

  • Kang, Gun-Seog
    • Communications for Statistical Applications and Methods
    • /
    • v.16 no.3
    • /
    • pp.437-447
    • /
    • 2009
  • Recently, in addition to analyzing data with appropriate statistical methods, statistical analysts in the industrial fields face difficulties that they have to compose proper datasets for analysis objectives via extracting or generating processes from diverse data storage devices. In this paper we survey and compare many state-of-the-art data access technologies adopted by several commonly used statistical packages. More understanding of these technologies will help to reduce the costs occurring when analyzing large size of datasets in especially data mining works, and so to allow more time in applying statistical analysis methods.

Statistical Metadata for Users: A Case Study on the Level of Metadata Provision on Statistical Agency Websites (웹 이용자를 위한 통계 메타데이터: 통계정보 제공사이트의 메타데이터 제공 수준 평가 사례 연구)

  • Oh, Jung-Sun
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.2
    • /
    • pp.161-179
    • /
    • 2007
  • As increasingly diverse kinds of information materials are available on the Internet, it becomes a challenge to define an adequate level of metadata provision for each different type of material in the context of digital libraries. This study explores issues of metadata provision for a particular type of material, statistical tables. Statistical data always involves numbers and numeric values which should be interpreted with an understanding of underlying concepts and constructs. Because of the unique data characteristics, metadata in the statistical domain is essential not only for finding and discovering relevant data, but also for understanding and using the data found. However, in statistical metadata research, more emphasis has been put on the question of what metadata is necessary for processing the data and less on what metadata should be presented to users. In this study, a case study was conducted to gauge the status of metadata provision for statistical tables on the Internet. The websites of two federal statistical agencies in the United States were selected and a content analysis method was used for that purpose. The result showing insufficient and inconsistent provision of metadata demonstrate the need for more discussions on statistical metadata from the ordinary web users' perspective.

공간통계분석에서 이상점 수정을 위한 방법비교

  • Lee, Jin-Hui;Sin, Gi-Il
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.05a
    • /
    • pp.275-280
    • /
    • 2003
  • 공간 자료에서 이상점이 존재할 경우 변이도(Variogram)를 추정함에 있어 그 효과를 줄이기 위한 방법으로 로버스트(robust) 변이도를 이용한다. 그러나 이상점이 존재하는 자료분석에서 로버스트 변이도를 사용하기에 앞서 이상점을 수정한 자료를 사용하였을 경우 그 효율성 또한 좋다고 알려져 있다. 본 논문에서는 이상점이 존재하는 자료를 분석함에 있어 기존의 이상점 수정법 및 새로운 이상점 수정법의 효율성을 비교하였다.

  • PDF

Development of Web Contents for Statistical Analysis Using Statistical Package and Active Server Page (통계패키지와 Active Server Page를 이용한 통계 분석 웹 컨텐츠 개발)

  • Kang, Tae-Gu;Lee, Jae-Kwan;Kim, Mi-Ah;Park, Chan-Keun;Heo, Tae-Young
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.15 no.1
    • /
    • pp.109-114
    • /
    • 2010
  • In this paper, we developed the web content of statistical analysis using statistical package and Active Server Page (ASP). A statistical package is very difficult to learn and use for non-statisticians, however, non-statisticians want to do analyze the data without learning statistical packages such as SAS, S-plus, and R. Therefore, we developed the web based statistical analysis contents using S-plus which is the popular statistical package and ASP. In real application, we developed the web content for various statistical analyses such as exploratory data analysis, analysis of variance, and time series on the web using water quality data. The developed statistical analysis web content is very useful for non-statisticians such as public service person and researcher. Consequently, combining a web based contents with a statistical package, the users can access the site quickly and analyze data easily.

중등학교에서의 통계 지도 방향 탐색 - 대표값과 분산, 표준편차를 중심으로-

  • Kim, Chang-Il;Jeon, Yeong-Ju
    • Communications of Mathematical Education
    • /
    • v.14
    • /
    • pp.273-295
    • /
    • 2001
  • 통계는 연역적 사고를 강조하는 수학의 다른 영역과 달리 귀납적 추론과 직관적 사고를 요구한다. 따라서 학교 수업에서 학생들이 실제적인 상황을 모델링 할 수 있도록 하며, 주어진 상황에서 자료를 올바르게 산출하고 분석 할 수 있도록 적절한 지도 방법이 필요하다. 그렇지만 학교 수업은 대다수 알고리즘 연습 위주의 통계 학습-지도로 통계적 사고 교육이 제대로 이루어지지 못하고 있다. 이로 인해 학생들은 형식적인 통계 처리에는 익숙하지만 통계 교육의 궁극적 목적인 변이성과 자료를 현명하게 다루는 능력이 부족하다. 본고에서는 피상적인 기계적 계산위주의 통계교육에서 실제적인 자료를 수집하고, 이를 적절히 가공 처리하여 정보의 가치를 높일 수 있는 통계 지도 방향을 탐색해 보고자 한다.

  • PDF

A Study on the Validity of the Statistical Collection and Analysis in Gwangju and Chonnam (통계자료의 수집 및 분석의 타당성에 관한 연구- 광주,전남지역을 중심으로 -)

  • 이화영
    • The Korean Journal of Applied Statistics
    • /
    • v.6 no.2
    • /
    • pp.443-452
    • /
    • 1993
  • A check list which includes the items that are to be considered in the process of the statistical data collection and analysis by non-scientific organizations is proposed. Based on the suggested check list, the output resulting from the statistical survey conducted by private organizations, banks, organs of expression and enterprises in Gwangju and Chonnam are examined about the validity of data collection and statistical analysis.

  • PDF

The establishment of the statistics modeling for the effective utilization of the clinical trials information (임상시험정보의 효율적인 활용을 위한 통계모델링 구축)

  • Kim, Dong-seon;Cho, Sung-Je
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.161-164
    • /
    • 2010
  • 식품의약품안전청은 산발적으로 흩어져 있던 임상시험 관련 정보를 통합하여 서비스하기 위한 방안으로 임상시험정보방을 개설하게 되었다. 임상시험승인현황 등 원시자료는 종이형태로 생산, 관리된다. 이를 통계자료로 활용하기 위해서 식품의약품안전청의 관련 시스템인 KiFDA 시스템에 입력을 하게 된다. 이 시스템에 입력된 데이터는 실시간으로 임상시험관련 웹서비스 시스템에 구축된다. 이때에 실시간 통계정보의 정확성이 무엇보다 중요하다. KiFDA 시스템의 데이터베이스의 실시기관명과 임상시험계획승인제도(IND) 승인리스트 원본의 실시기관명이 틀린 것도 있었다. 이는 동일한 실시기관도 화면에서는 서로 다른 실시기관으로 보일 수 있다는 것을 의미한다. 결국 통계자료가 부정확하게 표출되는 데는 이런 원인들이 있었던 것이다. 본 논문에서는 기존의 문제점을 개선하기위해 임상시험정보방의 효율적인 통계모델링을 설계하여 물리적 데이터베이스를 구축하였다.

The effect of adding the summed univariate data to the bivariate data in regression model (회귀모형에서 이변량 자료에 합산된 일변량 자료를 첨가시킬 때의 효과)

  • 박래현;이석훈;김노만
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.2
    • /
    • pp.573-584
    • /
    • 1999
  • 본 연구는 이변량 회귀모형을 이변량 자료에 적용할 때 이변량 자료(분리형 자료) 이외에 이변량 자료를 합산한 일변량 자료(통합형 자료)를 동시에 사용하는 문제를 고찰하였다. 특징을 파악하기 위하여 설명변수가 하나인 경우를 다루었는데 통합형 자료의 첨가효과를 회귀계수의 추정량의 평균제곱오차의 크기로서 측정하면서 효과와 이변량 모형과의 관계를 조사하였다. 최대우도 추장량의 특성으로부터 대표본의 성질을 추출하고 또한 모의실험을 통하여 소표본에서도 대표본의 성질이 만족하는지 조사하였고 끝으로 실제 자료에 적용하여 보았다.

  • PDF

Direct damage cost estimation to use statistical data (통계자료를 이용한 직접피해액 산정)

  • Han, Myoung-Sun;Kim, Chung-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.230-230
    • /
    • 2011
  • 2000년대 들어 가장 이슈화된 용어는 수십년 이상 사용해오고 있는 기상이변, 기후변화일 것이다. 이는 지구 온난화, 온실효과 등으로 인한 이산화탄소의 증가, 오존층 파괴, 해수온도 상승 등이 주요한 원인일 것이다. 수문학적 측면에서는 짧은 강우지속기간 동안 큰 강우강도를 갖는 집중 호우 및 국지성 호우와 해수온도 상승으로 강력한 규모의 태풍발생, 태풍지속기간을 연장하는 현상이 지속적으로 발생하고 있다. 이러한 극한 강우 발생사상으로 인해 홍수발생 위험요소가 증대하고, 홍수피해 규모가 커지고 있으며, 따라서 그동안 수립해오던 치수대책 방안에 기상변화, 홍수 피해 규모 증대 등을 고려해야 한다. 또한, 치수대책 수립의 적절한 판단기준을 수문학적 측면뿐만 아니라 사회, 경제적 요소를 고려하여 수립함으로써 정책 입안자나 설계자가 객관적인 지표를 통해 적절한 치수대책을 수립해야 할 것이다. 기존 인명손실 관련 연구결과 외에 다양한 국내 통계자료를 이용하여 직접피해액 산정이 가능하다. 본 연구는 치수대책 평가시스템 구축 연구의 한 부분으로 5개년으로 계획되어 있다. 연구 목표 : 통계자료를 이용한 직접피해액 산정 1. 지역별 다양한 자산 산정 - 건축물 자료 조사 - 내구재 및 농작물 등의 자료 조사 2. 자산별 피해율 산정 조사 - 건축물 자산의 피해율 조사 - 내구재 및 농작물 등의 침수심에 따른 피해율 조사

  • PDF