• 제목/요약/키워드: sample selection

검색결과 685건 처리시간 0.03초

특이값 분해를 이용한 효율적인 백색가우시안 잡음대역 선정 방법 (An Effective Selection of white Gaussian Noise Sub-band using Singular Value Decomposition)

  • 신승민;김영수;김상태;석미경
    • 한국통신학회논문지
    • /
    • 제34권3A호
    • /
    • pp.272-280
    • /
    • 2009
  • 배경잡음 측정은 전파환경 조사 및 주파수 점유율의 비교기준인 임계레벨을 산출하는데 반드시 수행되어야 하는 매우 중요한 과정이다. 배경잡음 측정은 측정대상 대역에서 가급적 잡음만으로 구성된 부대역을 선정하고, 선정된 표본 부대역에 대하여 잡음전력을 측정하여 대상대역에 대한 대표값으로 사용하는 과정으로 이루어진다. 본 논문에서는 배경잡음으로 백색가우시안 잡음을 가정하고, 잡음 측정의 첫 번째 단계에서 신호가 적고 대부분 잡음으로만 구성된 대역을 선별하는데 적용될 수 있는 특이값 분해 (singular value decomposition, SVD)를 이용한 잡음대역 선정 방법을 제안한다. 기존에 널리 쓰여지는 방법인 신호강도확률분포 (amplitude probability distribution, APD) 방법과의 성능비교를 통하여 우수성을 확인하였다.

유한모집단에서 가중평균에 포함된 가중치의 효과 (Weighting Effect on the Weighted Mean in Finite Population)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제7권2호
    • /
    • pp.53-69
    • /
    • 2006
  • 표본조사에서 가중치는 설계 단계와 분석 단계에서 만들어지고 부여될 수 있다. 설계 단계의 가중치는 추출확률이나 응답률 등과 같은 표본 데이터 획득 지표에 관련되어 있고 분석 단계의 가중치는 모집단 수치나 다른 보조 변수정보 등과 같은 외적인 정보와 관련되어 있다. 그리고 최종가중치는 설계 단계의 가중치와 분석 단계의 가중치의 곱으로 만들어진다. 이 논문에서는 분석 단계에서 부여되는 가중치에 초점을 맞추어 가중평균으로 모평균을 추정할 때 가중평균에 포함된 가중치가 모평균 추론에 미치는 영향을 고찰하였다. 유한모집단에서 각 조사단위에 조사변수와 가중치가 쌍으로 있고 표본추출확률이 균등한 경우를 가정하였다. 이러한 조건에서 가중평균의 편향과 평균제곱오차를 구하여 가중평균은 모평균의 편향 추정량임을 보였고, 편향의 방향과 크기는 조사변수와 가중치의 상관관계로 설명할 수 있음을 보였다. 즉, 만일 가중치와 조사변수가 양의 상관관계가 있으면 가중평균은 모평균을 과대 추정하게 되고, 만일 음의 상관관계가 있으면 모평균을 과소 추정하게 된다. 그리고 두 변수의 상관계수가 크면 편향은 증가한다. 가중평균에 대한 이론적인 수식 유도와 함께 편향의 크기와 평균제곱오차의 크기를 수치적으로 검토하기 위하여 모의실험을 실시하였다. 모의실험에서는 상관계수가 -0.2과 0.6사이에 있는 9개의 가중치를 생성하였고, 표본수는 100부터 400까지 고려하여 편향의 크기와 평균제곱오차의 크기를 수치적으로 구하였다. 하나의 결과로써 상관계수가 0.55이고 표본수가 400인 경우에 가중평균의 편향의 제곱이 평균제곱오차에서 차지하는 비율은 무려 82%에 이르는 것으로 나타났는데, 이는 가중평균의 편향이 어떤 경우에는 매우 심각할 수도 있음을 보여주는 것이다.

  • PDF

중등학교 가정과교사 임용시험의 핵심 키워드 탐색: 내용 분석과 텍스트 네트워크 분석을 중심으로 (Exploring the Core Keywords of the Secondary School Home Economics Teacher Selection Test: A Mixed Method of Content and Text Network Analyses)

  • 박미정;한주
    • Human Ecology Research
    • /
    • 제60권4호
    • /
    • pp.625-643
    • /
    • 2022
  • The purpose of this study was to explore the trends and core keywords of the secondary school home economics teacher selection test using content analysis and text network analysis. The sample comprised texts of the secondary school home economics teacher 1st selection test for the 2017-2022 school years. Determination of frequency of occurrence, generation of word clouds, centrality analysis, and topic modeling were performed using NetMiner 4.4. The key results were as follows. First, content analysis revealed that the number of questions and scores for each subject (field) has remained constant since 2020, unlike before 2020. In terms of subjects, most questions focused on 'theory of home economics education', and among the evaluation content elements, the highest percentage of questions asked was for 'home economics teaching·learning methods and practice'. Second, the network of the secondary school home economics teacher selection test covering the 2017-2022 school years has an extremely weak density. For the 2017-2019 school years, 'learning', 'evaluation', 'instruction', and 'method' appeared as important keywords, and 7 topics were extracted. For the 2020-2022 school years, 'evaluation', 'class', 'learning', 'cycle', and 'model' were influential keywords, and five topics were extracted. This study is meaningful in that it attempted a new research method combining content analysis and text network analysis and prepared basic data for the revision of the evaluation area and evaluation content elements of the secondary school home economics teacher selection test.

평균 샘플 수 최소화를 통한 계량형 반복 샘플링 검사의 설계 (A Variables Repetitive Group Sampling Plan for Minimizing Average Sample Number)

  • 박희곤;문영건;전치혁;;이재욱
    • 대한산업공학회지
    • /
    • 제30권3호
    • /
    • pp.205-212
    • /
    • 2004
  • This paper proposes the variables repetitive group sampling plan where the quality characteristic following normal distribution has upper or lower specification limit. The problem is formulated as a non-linear programming problem where the objective function to minimize is the average sample number and the constraints are related to lot acceptance probabilities at acceptable quality level (AQL) and limiting quality level (LQL) under the operating characteristic curve. Sampling plan tables are constructed for the selection of parameters indexed by AQL and LQL in the cases of known standard deviation and unknown standard deviation. It is shown that the proposed sampling plan significantly reduces the average sample number as compared with the single or the double sampling plan.

Default Prediction for Real Estate Companies with Imbalanced Dataset

  • Dong, Yuan-Xiang;Xiao, Zhi;Xiao, Xue
    • Journal of Information Processing Systems
    • /
    • 제10권2호
    • /
    • pp.314-333
    • /
    • 2014
  • When analyzing default predictions in real estate companies, the number of non-defaulted cases always greatly exceeds the defaulted ones, which creates the two-class imbalance problem. This lowers the ability of prediction models to distinguish the default sample. In order to avoid this sample selection bias and to improve the prediction model, this paper applies a minority sample generation approach to create new minority samples. The logistic regression, support vector machine (SVM) classification, and neural network (NN) classification use an imbalanced dataset. They were used as benchmarks with a single prediction model that used a balanced dataset corrected by the minority samples generation approach. Instead of using prediction-oriented tests and the overall accuracy, the true positive rate (TPR), the true negative rate (TNR), G-mean, and F-score are used to measure the performance of default prediction models for imbalanced dataset. In this paper, we describe an empirical experiment that used a sampling of 14 default and 315 non-default listed real estate companies in China and report that most results using single prediction models with a balanced dataset generated better results than an imbalanced dataset.

실험계획법을 이용한 평문.암호문 식별방법의 표본크기 선택에 관한 연구 (On sample size selection for disernment of plain and cipher text using the design of experiments)

  • 차경준
    • 정보보호학회논문지
    • /
    • 제9권4호
    • /
    • pp.71-84
    • /
    • 1999
  • 암호알고리즘 출력 때문에 대한 난수성 검정은 평문과 암호문 식별에 중요한 역할 을 하고 있다. 따라서 현재 많이 사용되고 있는 나수성 검정 방법들의 비교 및 분석은 필수적이라 할수 있 다. 또한 하 나의 검정방법을 이용하고자 할 때 평문과 암호문을 식별할수 있는 최소한의 데이터 크기 는 실시간 검 정 측면에서 많은 도움을 줄수 있을 것이다. 본 논문에서는 대표적인 몇 개의 난수성 검정 방법들에 대 하여 평문과 암호문 식별에 대한 성공률을 실험을 통하여 분석하고 실험계획법을 이용하여 주어진 표본 크기들 중에서 각 난수성 검정방법에 따른 하나의 최적의 표본크기를 제안한다.

소 질병 검출을 위한 혈청학적 검사의 민감도 평가 (Sensitivity analysis of serological tests for detection of disease in cattle)

  • 이상진;문운경;박선일
    • 대한수의학회지
    • /
    • 제50권1호
    • /
    • pp.43-48
    • /
    • 2010
  • Animal disease surveillance system, defined as the continuous investigation of a given population to detect the occurrence of disease or infection for control purposes, has been key roles to assess the health status of an animal population and, more recently, in international trade of animal and animal products with regard to risk assessment. Especially, for a system aiming to determine whether or not a disease is present in a population sensitivity of the system should be maintained high enough not to miss an infected animal. Therefore, when planning the implementation of surveillance system a number of factors that affecting surveillance sensitivity should be taken into account. Of these parameters sample size is of important, and different approaches are used to calculate sample size, usually depending on the objective of surveillance systems. The purpose of this study was to evaluate the sensitivity of the current national serological surveillance programs for four selected bovine diseases assuming a specified sampling plan, to examine factors affecting the probability of detection, and to provide sample sizes required for achieving surveillance goal of detecting at least an infection in a given population. Our results showed that, for example, detecting low level of prevalence (0.2% for bovine tuberculosis) requires selection of all animals per typical Korean cattle farm (n = 17), and thus risk-based target surveillance for high risk groups can be an alternative strategy to increase sensitivity while not increasing overall sampling efforts. The minimum sample size required for detecting at least one positive animal was sharply increased as the disease prevalence is low. More importantly, high reliability of prevalence estimation was expected with increased sampling fraction even when zero-infected animal was identified. The effect of sample size is also discussed in terms of the maximum prevalence when zero-infected animals were identified and on the probability of failure to detect an infection. We suggest that for many serological surveillance systems, diagnostic performance of the testing method, sample size, prevalence, population size, and statistical confidence need to be considered to correctly interpret results of the system.

펀드투자 자금흐름의 결정요인: 유입자금과 유출자금은 대칭적인가? (Determinants of Fund Investment Flows: Asymmetry between Fund Inflows and Fund Outflows)

  • 신인석;조성빈
    • KDI Journal of Economic Policy
    • /
    • 제36권4호
    • /
    • pp.33-69
    • /
    • 2014
  • 본 논문은 펀드투자의 유입자금흐름과 유출자금흐름을 별도로 구분하여 결정요인을 실증분석하였다. 과거 성과, 펀드연령, 펀드규모, 판매보수 등 주요 요인의 자금흐름에 대한 효과는 유입자금과 유출자금 사이에 큰 차이가 있었다. 과거 성과와의 양(+)의 관계, 펀드연령과의 음(-)의 관계 등 순유입자금을 기반으로 한 기존 연구에서 확립된 실증 결과는 유출자금에 대해서는 반대로 나타났다. 특히 과거 성과의 유출자금과의 관계는 '처분효과(disposition effect)'의 존재를 시사하였다. 한편, '계열 펀드'와 '비계열 펀드'를 구분할 경우 판매보수의 유입자금과 유출자금에 대한 효과가 두 펀드그룹 사이에 상이하여, 판매사 간의 유인체계 차이가 펀드선택시장에서 중요한 요인인 것으로 나타났다. '처분효과'의 존재 등 본 논문에서 미국의 기존 연구와 다른 분석 결과가 얻어진 이유는 표본의 차이에 기인하였을 가능성이 있다.

  • PDF

미국 경찰관 모집·선발제도의 특징 및 함의 (Recruitment and Selection of Police Officials in the United States -the System and it's Implications-)

  • 박동균
    • 한국콘텐츠학회논문지
    • /
    • 제11권5호
    • /
    • pp.384-392
    • /
    • 2011
  • 경찰은 시민의 가장 가까운 곳에서 시민의 생명과 재산을 지키는 형사사법기관이다. 따라서, 다른 여타의 공무원들이나 직군에 비해서 높은 윤리성과 봉사성이 필요하다. 우리나라뿐만 아니라 세계 각국에서는 경찰공무원을 임용할 때, 무엇보다도 엄격하고 까다로운 기준과 절차를 통해서 선발한다. 이러한 맥락에서, 본 연구에서는 경찰 선진국인 미국 경찰관들의 모집 및 선발 실태를 분석하였다. 본 연구에서 제시한 미국 신임경찰관 채용 과정은 통상적으로 모집공고 및 활동, 지원서 접수, 필기 및 적성검사, 육체 민첩성 테스트, 심리 테스트, 구술고사, 신원조회, 거짓말 탐지기를 이용한 조사, 그리고 건강검진 등의 절차를 거치게 된다. 미국 경찰공무원 선발제도 중에서 가장 큰 특징은 많은 경찰조직에서 지원자의 정직성 및 도덕성을 검증하기 위하여 거짓말 탐지기를 활용한다는 점이다. 또한 미국은 불법적인 약물남용이 많기 때문에 지원자들은 반드시 약물 테스트를 위해 소변이나 머리카락을 제출해야 한다. 한국에서도 경찰관 선발시험은 지원자의 실력과 자격을 정확하게 파악할 수 있어야 하고, 아울러 현대사회가 요청하는 경찰공무원을 선발할 수 있도록 적성검사를 새롭게 구성해야 할 것이다. 또한 적성검사의 한계를 극복하는데 미국의 사례와 같이 거짓말탐지기 조사를 적극적으로 검토할 필요성이 제기된다.

Unbiasedness or Statistical Efficiency: Comparison between One-stage Tobit of MLE and Two-step Tobit of OLS

  • Park, Sun-Young
    • International Journal of Human Ecology
    • /
    • 제4권2호
    • /
    • pp.77-87
    • /
    • 2003
  • This paper tried to construct statistical and econometric models on the basis of economic theory in order to discuss the issue of statistical efficiency and unbiasedness including the sample selection bias correcting problem. Comparative analytical tool were one stage Tobit of Maximum Likelihood estimation and Heckman's two-step Tobit of Ordinary Least Squares. The results showed that the adequacy of model for the analysis on demand and choice, we believe that there is no big difference in explanatory variables between the first selection model and the second linear probability model. Since the Lambda, the self- selectivity correction factor, in the Type II Tobit is not statistically significant, there is no self-selectivity in the Type II Tobit model, indicating that Type I Tobit model would give us better explanation in the demand for and choice which is less complicated statistical method rather than type II model.