• 제목/요약/키워드: 통계학과

검색결과 688건 처리시간 0.03초

Learning-to-rank 기법을 활용한 서울 경마경기 순위 예측 (Horse race rank prediction using learning-to-rank approaches)

  • 정준형;신동욱;황세용;박건웅
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.239-253
    • /
    • 2024
  • 본 연구는 learning-to-rank (LTR) 기법 중 point-wise와 pair-wise learning을 적용하여 서울 경마경기 순위 예측을 수행하였다. Point-wise learning으로는 선형 회귀와 랜덤 포레스트를 pair-wise learning으로는 RankNet, LambdaMART (XGBoost Ranker, LightGBM Ranker, CatBoost Ranker)을 활용하였다. 또한 데이터 불균형 문제를 해결하기 위해 전처리 과정에서 경주기록을 경주거리에 따라 표준화하는 방식을 채택하였으며, 모형의 예측 능력 향상을 위해 경기 정보, 기수 정보, 마필 정보, 조교사 정보 등의 다양한 데이터를 사용하였다. 그 결과 아이템 간의 순위관계를 학습할 수 있는 pair-wise learning이 point-wise learning보다 전반적으로 더 뛰어난 예측력을 보이는 것을 확인하였다. 특히 CatBoost Ranker는 제시된 모형들 중 가장 뛰어난 예측 성능을 보였다. 마지막으로 섀플리 값을 통해 CatBoost Ranker에서 경주마의 성적, 직전 경주기록, 경주마의 출발훈련 횟수, 누적 출발훈련 횟수, 질병 진단횟수 등이 상위 10개 중요 변수에 포함된 것을 확인하였다.

정보 관련 통계학과의 교과과정 (Undergraduate Curriculum of the Department of Information statistics)

  • 조신섭;신봉섭;이상복;한경수
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.683-703
    • /
    • 1999
  • 정보화 시대를 맞아 많은 통계학과들이 정보 관련 학과로 변신을 꾀하고 있다. 본 논문에서는 가칭 '정보' 통계학과의 교육에 적합하다고 생각되는 교과과정 시안을 제안하고 또한 관련된 교과목의 개요와 교육 사례를 소개하였다.

  • PDF

통계학 과목 교수 시 수학패키지의 활용에 대한 소고(小考)

  • 장대흥
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.235-237
    • /
    • 2002
  • 통계학 과목 교수 시 보조 수단으로 자주 사용하는 것이 통계패키지이다 이러한 통계패키지 외에 수학패키지를 통계학 과목 수업에 활용하면 학습효과를 높이는 데 효과적일 것이다.

  • PDF

기초통계학 교육 시 확률에 관한 몇 가지 유용한 사례들 (Useful Cases for the Probability Education in the Elementary Statistics Course)

  • 장대흥
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.829-854
    • /
    • 2009
  • 기초통계학 교육 시 확률 부분에 대한 강의는 추측통계학 영역의 시작 부분으로서 학생들이 통계학을 수강할 때 교수 강의를 따라가기 어려워하기 시작하는 부분이다. 기초 통계학 확률부분 강의 시 유용하게 사용할 수 있는 사례들을 제시하고 R을 이용하여 구현하여 보았다.

통계학과에서의 데이터베이스 교육 방안 (A Note on Database Education in Statistics Undergraduate Course)

  • 안정용;한경수;최숙희
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.595-603
    • /
    • 2004
  • 통계학과에서 데이터베이스 교육은 필요한가\ulcorner 데이터베이스 교육이 필요하다면 그 교육 방안은 무엇인가\ulcorner 본 연구에서는 통계학과에서 데이터베이스 교육의 필요성에 대해 논의하고 구체 적 인 교육 방안을 제안하고자 한다. 본 논문의 목적은 어떻게 통계학이라는 학문과 연관지어 데이터베이스를 교육할 수 있을 것인가에 대해 생각해보고자 하는데 있다.

80년대 한국 통계의 현황과 장래: 통계이론을 중심으로

  • 우정수
    • Journal of the Korean Statistical Society
    • /
    • 제20권
    • /
    • pp.10-18
    • /
    • 1991
  • 한국통계학회 창립 20주년을 맞아 80년대의 한국통계의 현황과 장래의 나아갈 방향에 대해 의견을 교환하는 것은 뜻깊은 일이라 할 것이다. 그러나 통계이론에 관해 깊이 있는 의견을 제시하는 것은 쉬운 일은 아닌 것 같다. 10주년 기념호 통계학연구에서 백운붕 박사께서 통계이론의 범위를 광의의 수리통계학으로 해석하였듯이 필자도 통계이론을 이론통계학과 같은 차원의 넓은 의미로 사용하기로 한다. 한국통계에서의 통계이론의 현황을 살펴보기 위해서는 국제적인 현황을 먼저 살펴보아야 한다고 생각된다. 여기에는 여러가지 이유가 있겠지만 자연과학이라는 학문이 그러하듯이 통계학이란 학문 자체가 외국에서 발생되어 우리나라에 도입된 학문으로 우리나라에서 독자적으로 연구 교육되어온 학문이 아니기 때문에 당연히 국제적인 현황가 깊은 관계가 있으리라고 짐작되기 때문이다. 그러한 이유에서 먼저 1980년대에 Annals of Statistics와 JASA에 게재된 논문의 내용을 분류하여, 1970년대 후반기의 경향과 비교하여 1980년대의 흐름을 간략히 살펴보고자 한다. 물론 한국 통계의 현황을 알아보기 위해서는 한국통계학회지인 통계학연구를 분석해 보는 것이 무엇보다 필요하리라 생각된다. 그리고 한국통계학자들의 연구 동향을 고찰하기 위해서는 학술발표회의 논문을 분류하는 것이 타당하다고 생각된다. 따라서 본고에서는 1981년부터 1990년까지의 통계학연구지 논문과 1985년부터 1990년까지의 춘계 및 추계 학술논문발표회의 발표 논문을 분류하여 비교해 보고자 한다.

  • PDF

교양 통계학 교재: 위기인가? 기회인가? (Introductory Statistics textbooks: crisis or opportunity?)

  • 최숙희;한경수
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.105-117
    • /
    • 2022
  • 최근 전국 대학에서 교양 통계학을 배우는 학생이 크게 늘고 있다. 2022년 대학수능에서 수학영역의 선택과목으로 확률과 통계를 선택한 학생은 53.2%를 차지했다. 통계를 한 학기만 배우고 졸업하는 통계 비전공 학생들은 미래에 데이터를 통계적으로 분석하는 생산자보다 소비자로 살아갈 가능성이 높다. 통계 소비자가 배워야 할 것은 요리법처럼 각종의 통계 분석 기법이 아닌 통계적 문해력과 사고력이다. 이 논문은 통계적 사고력을 함양하는 교양 통계학 교재를 개발하기 위해 고려해야 할 사항들을 논의한다.

생물측정학-멘델주의 논쟁에 대한 통계학사적 고찰 (The Biometry-Mendelian Controversy in the History of Statistics)

  • 조재근
    • Communications for Statistical Applications and Methods
    • /
    • 제15권3호
    • /
    • pp.303-324
    • /
    • 2008
  • 생물측정학-멘델주의 논쟁은 다윈이 주장한 생물 진화의 연속성과 자연선택을 두고 1890년대 중반부터 약 10여년간 치열하게 진행되었던 논쟁이다. 본 연구에서는 생물학이 아니라 통계학에 중점을 두고 논쟁의 진행과정을 살펴보았다. 특히 수학자이던 피어슨이 생물학 자료에 대해 통계학을 연구하게된 배경, The Grammar of science에 나타나는 그의 과학철학과 논쟁에서 나타나는 피어슨의 입장, 그리고 그의 입장과 1830년대 이후 영국 통계학 전통 사이의 관계도 살펴보았다. 결과적으로 이 논쟁을 계기로 피어슨의 많은 통계학 연구가 나오게 되었고 처음으로 연구자들이 결집하게 되었으며 새로운 학술지 Biometrka가 창간되었음을 알 수 있었다. 또한 이 논쟁은 우생학과 더불어 수학적인 통계학이 대학에 자리잡는 촉매제로 작용하였다.

설계기반 품질고도화에서 디자인 스페이스 구축을 위한 효율적인 실험계획 (Efficient Designs to Develop a Design Space in Quality by Design)

  • 정종희;김진영;임용빈
    • 품질경영학회지
    • /
    • 제47권3호
    • /
    • pp.523-535
    • /
    • 2019
  • Purpose: We research on the efficient response surface methodology(RSM) design to develop a design space in Quality by Design(QbD). We propose practical designs for the successful construction of the design space in QbD by allowing different number of replicates at the box points, star points, and the center point in the rotatable central composite design(CCD). Methods: The fraction of design space(FDS) plot is used to compare designs efficiency. The FDS plot shows the fraction of the design space over which the relative standard error of predicted mean response lies below a given value. We search for practical designs whose minimal half-width of the tolerance interval per a standard deviation is less than 4.5 at 0.8 fraction of the design space. Results: The practical designs for the number of factors between two and five are listed. One of the designs in the list could be chosen depending on the experimental budget restriction. Conclusion: The designs with box points replications are more efficient than those with the star points replication. The sequential method to establish a design space is illustrated with the simulated data based on the two examples in RSM.

비대칭-비정상 변동성 모형 평가를 위한 모수적-붓스트랩 (Asymmetric and non-stationary GARCH(1, 1) models: parametric bootstrap to evaluate forecasting performance)

  • 최선우;윤재은;이성덕;황선영
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.611-622
    • /
    • 2021
  • 본 논문에서는 변동성의 비대칭성과 비정상성을 동시에 고려하고 있다. 다양한 변동성 모형을 분석하고 있으며 모수적-붓스트랩을 통한 예측분포를 이용하여 변동성 모형의 예측 성능을 비교하고 있다. 오차항 분포로서 표준정규분포 및 표준화 t-분포를 고려하였으며 1-시차 후 예측과 2-시차 후 예측을 미국의 다우지수 사례를 통해 설명하였다.