• 제목/요약/키워드: The Poisson distribution series

검색결과 32건 처리시간 0.018초

반복적 부스팅 학습을 이용한 문서 여과 (Text Filtering using Iterative Boosting Algorithms)

  • 한상윤;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.270-277
    • /
    • 2002
  • 문서 여과 문제 (text filtering)는 어떤 문서가 특정한 주제에 속하는지의 여부를 판별하는 문제이다. 인터넷과 웹이 널리 퍼지고 이메일로 전송되는 문서의 양이 폭발적으로 증가함에 따라 문서 여과의 중요성도 따라서 증가하고 있는 추세이다. 이 논문에서는 새로운 학습 방법인 에이다부스트 학습 방법을 문서 여과 문제에 적용하여 기존의 방법들보다 우수한 분류 결과를 나타내는 문서 여과 시스템을 생성하고자 한다. 에이다 부스트는 간단한 가설의 집합을 생성하고 묶는 기법인데, 이 때 각각의 가설들은 문서가 특정 단어를 포함하고 있는지 검사하여 이에 따라 문서의 적합성을 판별한다. 먼저 최종 여과 시스템을 구성하는 각 가설의 출력이 1 또는 -1이 되는 이진 가설을 사용하는 기존의 에이다부스트 알고리즘에서 출발하여 좀 더 최근에 제안된 확신 정도 (실수값)를 출력하는 가설을 이용하는 에이다부스트 알고리즘을 적용함으로써 오류 감소 속도와 최종 오류율을 개선하고자 하였다. 또 각 데이타에 대한 초기 가중치를 연속 포아송 분포에 따라 임의로 부여하여 여러 번의 부스팅을 수행한 후 그 결과를 결합하는 방법을 사용함으로써 적은 학습 데이타로 인해 발생하는 과도학습의 문제를 완화하고자 하였다. 실험 데이터로는 TREC-8 필터링 트랙 데이타셋을 사용하였다. 이 데이타셋은 1992년도부터 1994년도 사이의 파이낸셜 타임스 기사로 이루어져 있다. 실험 결과, 실수값을 출력하는 가설을 사용했을 때 이진값을 갖는 가설을 사용했을 때 보다 좋은 결과를 보였고 임의 가중치를 사용하여 여러번 부스팅을 하는 방법이 더욱 향상된 성능을 나타내었다. 다른 TREC 참가자들과의 비교결과도 제시한다.

Short-term Effects of Ambient Air Pollution on Emergency Department Visits for Asthma: An Assessment of Effect Modification by Prior Allergic Disease History

  • Noh, Juhwan;Sohn, Jungwoo;Cho, Jaelim;Cho, Seong-Kyung;Choi, Yoon Jung;Kim, Changsoo;Shin, Dong Chun
    • Journal of Preventive Medicine and Public Health
    • /
    • 제49권5호
    • /
    • pp.329-341
    • /
    • 2016
  • Objectives: The goal of this study was to investigate the short-term effect of ambient air pollution on emergency department (ED) visits in Seoul for asthma according to patients' prior history of allergic diseases. Methods: Data on ED visits from 2005 to 2009 were obtained from the Health Insurance Review and Assessment Service. To evaluate the risk of ED visits for asthma related to ambient air pollutants (carbon monoxide [CO], nitrogen dioxide [$NO_2$], ozone [$O_3$], sulfur dioxide [$SO_2$], and particulate matter with an aerodynamic diameter <$10{\mu}m$ [$PM_{10}$]), a generalized additive model with a Poisson distribution was used; a single-lag model and a cumulative-effect model (average concentration over the previous 1-7 days) were also explored. The percent increase and 95% confidence interval (CI) were calculated for each interquartile range (IQR) increment in the concentration of each air pollutant. Subgroup analyses were done by age, gender, the presence of allergic disease, and season. Results: A total of 33 751 asthma attack cases were observed during the study period. The strongest association was a 9.6% increase (95% CI, 6.9% to 12.3%) in the risk of ED visits for asthma per IQR increase in $O_3$ concentration. IQR changes in $NO_2$ and $PM_{10}$ concentrations were also significantly associated with ED visits in the cumulative lag 7 model. Among patients with a prior history of allergic rhinitis or atopic dermatitis, the risk of ED visits for asthma per IQR increase in $PM_{10}$ concentration was higher (3.9%; 95% CI, 1.2% to 6.7%) than in patients with no such history. Conclusions: Ambient air pollutants were positively associated with ED visits for asthma, especially among subjects with a prior history of allergic rhinitis or atopic dermatitis.