• 제목/요약/키워드: representativeness of samples

검색결과 17건 처리시간 0.033초

Active Learning on Sparse Graph for Image Annotation

  • Li, Minxian;Tang, Jinhui;Zhao, Chunxia
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권10호
    • /
    • pp.2650-2662
    • /
    • 2012
  • Due to the semantic gap issue, the performance of automatic image annotation is still far from satisfactory. Active learning approaches provide a possible solution to cope with this problem by selecting most effective samples to ask users to label for training. One of the key research points in active learning is how to select the most effective samples. In this paper, we propose a novel active learning approach based on sparse graph. Comparing with the existing active learning approaches, the proposed method selects the samples based on two criteria: uncertainty and representativeness. The representativeness indicates the contribution of a sample's label propagating to the other samples, while the existing approaches did not take the representativeness into consideration. Extensive experiments show that bringing the representativeness criterion into the sample selection process can significantly improve the active learning effectiveness.

표본 추출법에서 R-지수의 민감도에 관한 연구 (A study on sensitivity of representativeness indicator in survey sampling)

  • 이유진;신기일
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.69-82
    • /
    • 2017
  • R-지수(representativeness indicator)는 무응답이 발생했을 때 표본의 대표성을 나타내주는 지표이다. 표본의 대표성은 모수 추정의 정확성(accuracy)과 관계가 있으며 정확성은 편향(bias)와 관계가 있다. 따라서 표본의 대표성을 나타내는 R-지수가 높으면 대표성이 높아 편향이 없고 정확성이 높은 결과를 얻을 수 있다. R-지수는 일반화선형모형의 로짓 또는 프로빗 모형을 적합한 후 얻어진 경향 점수(propensity score)에 의해 계산된다. 본 논문에서는 R-지수와 이질적인 층별 응답률과의 관련성을 연구하였으며 편향, 제곱근 RMSE 등과 같은 비교통계량이 무응답에 얼마나 민감한지 등을 모의실험을 통하여 살펴보았다. 또한 변형된 2010년 경제총조사 자료를 이용하여 실제 자료분석도 실시하였다.

중등수학 예비교사들의 통계적 소양 : 표본 개념에 대한 이해를 중심으로 (Preservice Secondary Mathematics Teachers' Statistical Literacy in Understanding of Sample)

  • 탁병주;구나영;강현영;이경화
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제56권1호
    • /
    • pp.19-39
    • /
    • 2017
  • Taking samples of data and using samples to make inferences about unknown populations are at the core of statistical investigations. So, an understanding of the nature of sample as statistical thinking is involved in the area of statistical literacy, since the process of a statistical investigation can turn out to be totally useless if we don't appreciate the part sampling plays. However, the conception of sampling is a scheme of interrelated ideas entailing many statistical notions such as repeatability, representativeness, randomness, variability, and distribution. This complexity makes many people, teachers as well as students, reason about statistical inference relying on their incorrect intuitions without understanding sample comprehensively. Some research investigated how the concept of a sample is understood by not only students but also teachers or preservice teachers, but we want to identify preservice secondary mathematics teachers' understanding of sample as the statistical literacy by a qualitative analysis. We designed four items which asked preservice teachers to write their understanding for sampling tasks including representativeness and variability. Then, we categorized the similar responses and compared these categories with Watson's statistical literacy hierarchy. As a result, many preservice teachers turned out to be lie in the low level of statistical literacy as they ignore contexts and critical thinking, expecially about sampling variability rather than sample representativeness. Moreover, the experience of taking statistics courses in university did not seem to make a contribution to development of their statistical literacy. These findings should be considered when design preservice teacher education program to promote statistics education.

국가환경시료은행 생태계 대표시료의 채취 및 분석 표준운영절차에 대한 단계별 측정불확도 평가 연구 (Evaluation of the Measurement Uncertainty from the Standard Operating Procedures(SOP) of the National Environmental Specimen Bank)

  • 이종천;이장호;박종혁;이유진;심규영;김태규;한아름;김명진
    • 환경영향평가
    • /
    • 제24권6호
    • /
    • pp.607-618
    • /
    • 2015
  • 국가환경시료은행에서는 과거 환경 재현을 목적으로 다양한 생태계를 대표하는 시료를 채취 저장하고 있다. 지난 5년간 8종의 생태계 시료종이 엄격한 표준운영절차(SOP)에 따라 채취되어 왔으나 수행절차에 대한 비용효율성이나 시료의 대표성에 대한 논리적 통계적 검증은 이루어 진 바 없었다. 따라서 본 연구에서는 시료채취 및 분석과정으로 구성된 표준운영절차의 각 단계에서 비롯되는 불확도(uncertainty) 수준에 대한 평가를 실시하였다. 이를 위해 표준운영절차에서 규정된 채취방법에 의해 채취된 두 지역의 침엽수 시료를 대상으로 중복시료(duplicate sample)를 채취하였고, 이에 대한 중복분석결과를 대칭설계(balanced design)하여 분산분석을 실시하였다. 시료채취 및 분석의 각 단계에서 산출된 불확도 수준은 각 해당지역 대표시료에 대한 측정불확도로 통합되었다. 그 결과 시료채취단계와 분석단계 중 측정불확도의 대부분은 시료채취단계에서 비롯되고 있음이 확인되었다. 또한 측정불확도 수준을 저감하기 위해서는 표준운영절차에서 규정하고 있는 시료채취방법이 개선되어야 하는데, 본 연구에서 확인된 채취지역의 상대적으로 큰 국지적 이질성(small-scale heterogeneity)으로 말미암아 지역내에서의 채취대상 개체수를 확대하는 것보다 각 개체에서 채취되는 시료량을 늘리는 것이 비용효율적인 개선에 대한 기준이 되었다. 또한 채취방법이 채취지역에서 분포하는 개체들의 이질성을 충분히 극복하며 대표성을 확보할 수 있는가에 대한 검증으로서 분산분석을 적용한 결과, 지역전체의 변화량보다 국지적 변화량이 더 커야 하는 조건을 제시할 수 있었다.

표본 개념에 대한 고찰: 역사적 분석을 중심으로 (A Study on the Concept of Sample by a Historical Analysis)

  • 탁병주;구나영;강현영;이경화
    • 대한수학교육학회지:학교수학
    • /
    • 제16권4호
    • /
    • pp.727-743
    • /
    • 2014
  • 표본(sample)과 표집(sampling)은 통계적 사고의 핵심이며 통계적 소양의 기초로서 통계교육에서 매우 강조되어야 하는 개념이다. 그러나 표본에 관한 선행연구에서는 대개 교과서 분석과 학생의 반응 분석 등에 그치고 있다. 이에 본고에서는 표본 개념에 대한 교수학적 분석의 한 측면으로서 역사적 분석을 시행하였다. 특히, 통계적 소양의 관점에서 이루어진 선행연구를 토대로, 표본 개념을 이해하기 위한 두 핵심요소인 표본대표성과 표집변이성에 기반을 두고 표본 개념의 역사적 발달을 분석하였다. 연구 결과, 표본 개념의 역사적 발달 과정은 표본대표성(sample representativeness)의 이해, 표본 변이(sample variance)의 등장, 표집변이성(sampling variability)의 인식으로 분류할 수 있으며, 특히 표집변이성을 인식하고 이를 제어하는 과정의 중요성을 확인 할 수 있었다. 그러나 표본 개념의 이해 수준에 대한 기존의 선행연구에는 표집변이성 개념이 잘 반영되지 않고 있다. 이를 토대로, 표본 개념의 교수학습에서 표집변이성을 강조해야 하며, 통계적 소양의 함양을 위해 표집변이성의 인식과 해결의 과정을 포함해야 한다는 시사점을 도출하였다.

  • PDF

방사성 토양폐기물 시료의 통계적 대표성에 관한 연구 (A Study on the Statistical Representativeness of Samples taken from Radioactive Soil)

  • 조한석;김태국;이강무;안섬진;손종식
    • 한국방사성폐기물학회:학술대회논문집
    • /
    • 한국방사성폐기물학회 2005년도 춘계 학술대회
    • /
    • pp.151-157
    • /
    • 2005
  • 한국원자력연구소에서는 토양폐기물의 규제해제를 통한 처리를 위하여 토양의 핵종 및 방사능분석에 대한 절차를 개발하고 있다. 토양의 규제해제를 위한 기반작업으로 대표성 있는 시료를 추출하기 위하여 균질화, 평균화를 거쳐 임의추출(random sample)하는 시료추출의 방법론을 결정하였다. 통계학적인 관점에서의 대표성은 시료추출의 방법론 뿐 만 아니라 시료의 크기를 얼마로 할 것인가에 대한 설계가 선행 되어야 한다. 본 연구에서는 토양폐기물에서 시료를 채취하는 절차에 따라 예비시료를 추출한 후 핵종 및 방사능평가 작업을 수행한 결과를 사용하여 신뢰구간과 오차 한계에 따른 시료의 개수를 산정하였다.

  • PDF

예비교사들의 통계적 표집에 대한 이해 (Pre-service Teachers' Understanding of Statistical Sampling)

  • 고은성;이경화
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제21권1호
    • /
    • pp.17-32
    • /
    • 2011
  • 본 연구에서는 예비교사들의 통계적 표집에 대한 이해를 조사하였다. 먼저 선행 연구를 바탕으로 표집의 이해와 관련된 주요 주제를 표본의 대표성, 표집 변이성, 표집분포로 구분하고, 각각의 주요 주제에 대한 세부 개념 요소들을 선정하였다. 이에 대한 예비교사들의 이해를 조사한 결과 대부분의 예비교사들이 편의를 일으키지 않는 무작위 추출이 표집방법으로 적절함을 이해하고 있었으나 약 64%의 예비교사들만이 표본을 모집단의 준비례적 축소버전으로 인식하고 있었다. 표집에서 표본이 모집단에서 차지하는 비율보다 표본의 크기 자체가 중요함을 인식하는 예비교사는 극소수에 불과했으며, 조사 대상의 절반에 해당하는 예비교사들만이 신뢰할 수 있는 결과를 도출하기 위해 전체 표본의 크기가 아니라 표집 횟수가 중요함을 인식하였다. 그리고 표집분포는 모집단 분포의 형태와 무관하게 모집단의 평균을 중심으로 대칭적인 형태를 나타낸다는 것을 이해하는 예비교사는 매우 적었다.

  • PDF

중·고등학생들의 비형식적 통계적 추리의 수준 연구 (Study on the Levels of Informal Statistical Inference of the Middle and High School Students)

  • 이정연;이경화
    • 대한수학교육학회지:학교수학
    • /
    • 제19권3호
    • /
    • pp.533-551
    • /
    • 2017
  • 통계교육 연구자들은 형식적 추리 방법을 지도하기에 앞서 비형식적 추리를 지도할 것을 강조하며 통계적 추리의 발달 과정에 주목하고 있다. 본 연구는 표본 비교하기 과제와 모집단의 그래프 추측하기 과제를 해결하는 과정에서 나타나는 중 고등학생들의 비형식적 통계적 추리의 수준과 각 수준별 특징을 분석하였다. 연구 결과, 표본 비교하기 과제에서는 개인적인 의견에 기초하여 타당하지 않은 추리를 하는 수준, 자료에 대한 국소적 관점을 가진 수준, 자료에 대한 전체적 관점으로 전환되는 수준, 분포의 다각적인 측면에 주목하는 수준, 통계적 개념들을 통합하여 추리하는 수준이 확인되었다. 모집단의 그래프 추측하기 과제에서는 개인적인 의견에 기초하여 타당하지 않은 추리를 하는 수준, 표본대표성에만 주목하고 표집변이성을 고려하지 않는 수준, 표본대표성과 표집변이성을 모두 고려하며 분포의 한 측면에 주목하여 부분적으로 타당한 추리를 하는 수준, 분포의 다각적 측면에 주목하는 수준, 통계적 개념들을 통합하여 추리하는 수준이 확인되었다.

Surveillance Evaluation of the National Cancer Registry in Sabah, Malaysia

  • Jeffree, Saffree Mohammad;Mihat, Omar;Lukman, Khamisah Awang;Ibrahim, Mohd Yusof;Kamaludin, Fadzilah;Hassan, Mohd Rohaizat;Kaur, Nirmal;Myint, Than
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제17권7호
    • /
    • pp.3123-3129
    • /
    • 2016
  • Background: Cancer is the fourth leading cause of death in Sabah Malaysia with a reported age-standardized incidence rate was 104.9 per 100,000 in 2007. The incidence rate depends on non-mandatory notification in the registry. Under-reporting will provide the false picture of cancer control program effectiveness. The present study was to evaluate the performance of the cancer registry system in terms of representativeness, data quality, simplicity, acceptability and timeliness and provision of recommendations for improvement. Materials and Methods: The evaluation was conducted among key informants in the National Cancer Registry (NCR) and reporting facilities from Feb-May 2012 and was based on US CDC guidelines. Representativeness was assessed by matching cancer case in the Health Information System (HIS) and state pathology records with those in NCR. Data quality was measured through case finding and re-abstracting of medical records by independent auditors. The re-abstracting portion comprised 15 data items. Self-administered questionnaires were used to assess simplicity and acceptability. Timeliness was measured from date of diagnosis to date of notification received and data dissemination. Results: Of 4613 cancer cases reported in HIS, 83.3% were matched with cancer registry. In the state pathology centre, 99.8% was notified to registry. Duplication of notification was 3%. Data completeness calculated for 104 samples was 63.4%. Registrars perceived simplicity in coding diagnosis as moderate. Notification process was moderately acceptable. Median duration of interval 1 was 5.7 months. Conclusions: The performances of registry's attributes are fairly positive in terms of simplicity, case reporting sensitivity, and predictive value positive. It is moderately acceptable, data completeness and inflexible. The usefulness of registry is the area of concern to achieve registry objectives. Timeliness of reporting is within international standard, whereas timeliness to data dissemination was longer up to 4 years. Integration between existing HIS and national registration department will improve data quality.

부정적 정서와 우울의 관계에서 인스턴트 메시징(Instant Messaging)을 통한 감정 표출과 긍정적 정서의 매개효과 (Mediating Effects of Emotional Venting via Instant Messaging (IM) and Positive Emotion in the Relationship between Negative Emotion and Depression)

  • 이하나;안순태
    • 지역사회간호학회지
    • /
    • 제30권4호
    • /
    • pp.571-580
    • /
    • 2019
  • Purpose: The purpose of this study is to examine the mediating effects of emotional venting via instant messaging (IM) and positive emotion in the relationship between negative emotion and depression. Methods: Online survey was conducted in Korea between 2 April and 7 April 2019. To obtain samples with representativeness, data were gathered by the professional research firm. A total of 250 Koreans were participated in this study. The collected data were analyzed using descriptive statistics, Pearson's correlation coefficients, and SPSS PROCESS macro to test the mediating effects. Results: This study analyzed the direct/indirect effects of negative emotion on emotional venting via IM, in the relationship between positive emotion and depression. Negative emotion had indirect effects on depression through emotional venting via IM and positive emotion. Both emotional venting via IM and positive emotion had dual mediating effects in the influence of negative emotion on depression. Conclusion: These results suggest that it is important to manage negative emotion to prevent depression. Also, this study confirmed that emotional venting via IM is a powerful factor influencing emotional recovery.