• Title/Summary/Keyword: 통계학과

검색결과 688건 처리시간 0.025초

가계동향조사 지출부문 시계열 연계 방안에 관한 연구 (A study on time series linkage in the Household Income and Expenditure Survey)

  • 김시현;성병찬;최영근;여인권
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.553-568
    • /
    • 2022
  • 가계동향조사는 가구에 대한 가계수지 실태를 파악하여 국민 소득·소비 수준과 그 변화의 측정 및 분석 등을 목적으로 하는 통계청의 대표적인 조사이다. 최근 여러 기관들에서 2017년과 2018년의 가계동향 지출부문에서 발생한 시계열 단절에 대한 문제를 인식하고, 이 기간에 대한 시계열 연계를 위한 관련 연구를 진행하고 있다. 본 연구에서는 2016년까지의 가계동향 조사 시계열 특성을 파악하고, 이를 반영하여 2017년과 2018년의 지출액에 대한 시계열을 연계하는 예측값을 도출한다. 본 연구에서는 각 지출 항목들의 시계열적 특성을 골고루 반영하는 동시에 특정 예측 모형의 영향을 줄이기 위하여 총 8개의 회귀모형, 시계열모형, 머신러닝 기법을 합성하여 사용하였다. 특히 본 연구의 주목할 만한 특징은, Top-down 또는 Bottom-up 방식이 아닌, 정보의 손실없이 가계동향조사의 계층 구조를 반영할 수 있는 optimal combination 기법을 사용하여 예측력을 향상시켰다는 점이다. 2017년부터 2019년 자료에 대한 가계동향 지출 부문의 연계 분석 결과, 본 연구가 제안하는 연계 방식이 시계열 단절성 회복 및 예측력 향상에 기여하며, 또한 optimal combination 기법에 의한 계층 조정 후의 예측값이 조사자료에 보다 근접한 결과를 보여줌을 확인하였다.

다국어 사용자 후기에 대한 속성기반 감성분석 연구 (A study on the aspect-based sentiment analysis of multilingual customer reviews)

  • 지성영;이시윤;최대우;강기훈
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.515-528
    • /
    • 2023
  • 전자상거래 시장의 성장과 더불어 소비자들은 상품 및 서비스 구매 시 다른 사용자가 작성한 후기 정보에 기반하여 구매 의사를 결정하게 되며 이러한 후기를 효과적으로 분석하기 위한 연구가 활발히 이루어지고 있다. 특히, 사용자 후기에 대해 단순 긍/부정으로 감성분석하는 것이 아니라 다면적으로 분석하는 속성기반 감성분석 방법이 주목받고 있다. 속성기반 감성분석을 위한 다양한 방법론 중 최신 자연어 처리 기술인 트랜스포머 계열 모델을 활용한 분석 방법이 있다. 본 논문에서는 최신 자연어 처리 기술 모델에 두 가지 실제 데이터를 활용하여 다국어 사용자 후기에 대한 속성기반 감성분석을 진행하였다. 공개된 데이터 셋인 SemEval 2016의 Restaurant 데이터와 실제 화장품 도메인에서 작성된 다국어 사용자 후기 데이터를 활용하여 속성기반 감성분석을 위한 트랜스포머 계열 모델의 성능을 비교하였고 성능 향상을 위한 다양한 방법론도 적용하였다. 다국어 데이터를 활용한 모델을 통해 언어별로 별도의 모델을 구축하지 않고 한가지 모델로 다국어를 분석할 수 있다는 점에서 효용 가치가 클 것으로 예상된다.

통계적 형상분석을 이용한 엑셀 방사형 차트의 분류와 판별 (Classification and discrimination of excel radial charts using the statistical shape analysis)

  • 이승언;김준홍;최연석;최용석
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.73-86
    • /
    • 2024
  • 평가지표와 같은 수치형 자료의 경우 수치 형태보다 엑셀(Excel)의 방사형 차트 형태로 나타내 시각적으로 표현하면 정보 전달에 더욱 효과적일 것이다. 그러나 개체가 많은 경우 시각적으로 판별하거나 분류하는 것이 쉽지 않다. 이럴 경우 각 개체에 대해 방사형 차트를 이용하여 형상화 시킨 후, 형상의 정보를 대표할 수 있는 형상점을 찾고 형상좌표로 변환해 형상분석을 적용하여 분류 및 판별하는 방법을 알아보고자 한다. 형상분석을 이용하기 위해 주로 분석자의 주관으로 형상점을 얻고 임의의 좌표공간을 생성시켜 좌표를 얻곤 했다. 방사형 차트는 해당 개체의 특징을 나타내는 변수의 개수만큼 형상점이 생기게 되고 이를 선으로 이은 것은 하나의 형상으로 여겨진다. 따라서 중심을 원점으로 두고 2차원 공간으로 정의를 내린 후, X축과 각 특징을 나타내는 축이 이루는 각에 대해 삼각함수를 적용해 형상좌표를 추출해낸다. 변수의 개수가 많아 형상의 모양이 복잡해질 경우 방사형 차트를 이용해 시각화하더라도 쉽게 파악하기 어렵다. 독립성을 보장할 수 없는 변수들에 대해 주성분 분석(PCA)을 실시하여 시각적으로 효과적인 형상을 만든다. PCA를 실시하기 전과 후의 형상에 대해 전통적 판별분석, 서포트벡터머신(support vector machine; SVM), 인공신경망(artificial neural network; ANN)의 기법을 적용시켜 분류표와 분류율을 확인한다. 또한 GPA (generalized procrustes analysis) 적합좌표, 북스테인좌표 2가지 좌표에 대한 판별의 차이를 비교한다. 북스테인좌표의 경우 기저 형상점을 중심으로 형상의 위치와 회전, 척도를 변환한 좌표로써, 분류율에 대해 GPA 형상좌표보다 더 높은 결과를 보이고 있다. 북스테인좌표의 경우 여러 군집 간의 형상을 비교하는데 유용하게 활용된다.

한국 프로배구 연맹의 경기 예측 및 영향요인 분석 (Matching prediction on Korean professional volleyball league)

  • 김희숙;이나경;이지윤;송종우
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.323-338
    • /
    • 2024
  • 본 연구는 한국 프로배구 리그를 체계적으로 분석하고 대표적인 머신러닝 분류 방법을 활용하여 경기 결과를 예측하고자 한다. 이를 위해 2012/2013 시즌부터 2022/2023 시즌까지의 남자 프로배구와 여자 프로배구 리그 경기 데이터를 수집하였으며, 이 데이터는 경기 세부 내용을 상세하게 포함하고 있다. 데이터는 각 경기를 두 팀으로 분리한 경우와 홈팀을 기준으로 상대팀과의 성과 차이로 데이터를 가공한 경우로 두 가지 다른 데이터 구조를 모델에 적용했다. 이를 통해 남자 프로배구와 여자 프로배구 각각에 대해 총 4개의 예측 모형을 구축했다. 경기 종료 전에는 모형에서 사용하는 세부 변수 값들을 알 수 없기 때문에, 오늘 경기 직전까지의 3~4 경기의 결과를 전처리하여 이를 변수로 사용했다. 본 연구에서는 Decision Tree, Logistic Regression, Bagging, Random Forest, Xgboost, Adaboost, Light GBM 같은 다양한 머신러닝 기법을 분류에 활용하여, Random Forest를 사용한 모델이 가장 우수한 예측 성능을 보였다. 최종 선택한 모형에 대해 변수 중요도 그림과 부분 의존도 그림을 확인한 결과 성별과 데이터 구조에 따라 중요한 변수들이 다른 것으로 나타났지만, 공통적으로 세트 성공 수, 블로킹 득점, 범실 개수가 가장 중요한 변수임을 알 수 있었다. 본 승패 예측 모델은 사후적 예측이 아닌 경기 종료 전 사전 예측이 가능한 모형이라는 점에서 차별성을 가지며, 우리의 분석이 한국 프로배구 팀들에게 전략적 추론이 될 수 있을 것이라 기대한다.

ASP와 웹-메일을 활용한 통계학 실습의 원격구현

  • 이기원;이윤환
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.41-44
    • /
    • 2002
  • 통계학 및 실습 교과목의 원격학습에 필요한 제반요소의 구현방법, 특히 ASP와 웹-메일을 활용한 패키지 실습의 원격 운영에 대하여 설명한다.

  • PDF

통계학 교육을 위한 전자 교재의 활용 (On the practical use of electronic text for statistics education)

  • 한경수;안정용;강윤비
    • 응용통계연구
    • /
    • 제11권1호
    • /
    • pp.5-12
    • /
    • 1998
  • 최근의 교육 방식은 교수 중심에서 학습 중심으로 변화하고 있으며, 여러 매체의 교육적 활용이 강조되고 있다. 본 연구는 웹상에서 14면 주사위 모의실험을 통하여 통계학의 기본 개념들을 학습할 수 있는 전자교재 "CyberStat"을 소개한다.

  • PDF

SAS, $SPSS^x$, BMDP를 중심으로 한 대형통계 패케지

  • 김병천
    • 경영과학
    • /
    • 제2권
    • /
    • pp.53-58
    • /
    • 1985
  • 컴퓨터의 발전은 통계학 발전에 크게 공헌을 하여 왔다. 1960대 초부터 컴퓨터를 이용한 통계 프로그램들이 개발되고 이에따른 Algorithm들이 발전됨에 따라 통계학 이론에서 해결할 수 없는 문제들이 컴퓨터를 이용하여 하나 둘씩 풀어져 나갔다. 또한 최근 1980년부터 퍼스날 컴퓨터가 대중에 대량 보급됨에 따라, 연구소의 컴퓨터실에서 해결해야만 했던 데이터 분석들이 실험실과 가정으로 옮겨지기 시작하였다.(중략)

  • PDF

韓國統計의 現況과 將來 - 統計와 電算

  • 허문열
    • Journal of the Korean Statistical Society
    • /
    • 제10권
    • /
    • pp.77-80
    • /
    • 1981
  • 통계적 방법론이 실용성(적용성)을 상실할 때 수학과 다른 점이 없을 것이고 방법론이 실용성을 가진 훌륭한 이론이라 할지라도 계산이 불가능하다면 이는 호화로운 자동차를 가지고 있으면서 연료가 없어 운영치 못하는 것과 다를 바가 없겠다. 이제 한국통계학회가 창립 10주년을 맞아 발돋음 단계에 접어들 시점에서 그동안 특히 부진하고 미비했던 전산통계(혹은 계산통계 statistical computing) 분야에 대해 통계인들 사이에 과거, 현재와 그리고 미래의 나아갈 방향에 대해 의견을 교환하게 됨은 뜻깊은 의의가 있다고 하겠다.

  • PDF

R을 활용한 '대화형 통계학 입문 실습실' 개발과 활용 (Interactive Statistics Laboratory using R and Sage)

  • 이상구;이긍희;최용석;이재화;이지영
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제29권4호
    • /
    • pp.573-588
    • /
    • 2015
  • 본 연구에서는 최근 통계 분야에서 활용도가 급격히 높아지고 있는 중요한 컴퓨터 언어이자 오픈 소스 통계 프로그램인 R을 활용하는 '대화형(interactive) 통계학 입문 실습실'의 개발 과정과 내용 및 활용을 다룬다. 최근에 개발을 마치고 2014 서울 세계수학자대회에서 소개된 후, 통계 강좌 등에 실제 사용되는 웹상의 R을 활용한 본 대화형 통계학 입문 실습실의 특징은 웹상에서 본문과 예제의 설명 및 풀이과정과 함께 대응하는 R 명령어 코드들을 함께 박스안에 제공하여, 실습 때마다 일일이 컴퓨터 명령어 코드들을 입력해야하는 번거로움을 없앴다. 또한, 명령어의 실행을 위하여 프로그램을 설치하지 않고, 명령어 상자 아래 제공한 [클릭-실행] 버튼을 누르기만 하면, 클라우드 컴퓨팅으로 그 결과값과 그래픽을 동시에 바로 같은 화면에서 확인하면서, 시뮬레이션 및 실습을 할 수 있고, 더 나아가 그와 유사한 다른 문제에 함수와 조건만을 수정하여 바로 사용할 수 있는 편리함이 추가되었다. 그 결과 대화형 통계학 입문 실습실에서는 R 명령어를 이해하는 데 필요한 시간과 노력이 대폭 줄어들 뿐 아니라, 초보자에게 통계학 입문 과목을 지도하기에 적절하며, 그밖에 다양한 Java 시각화 도구와 이미지 및 통계 자료를 사용하여 사용자 맞춤형 강의실 개발이 가능하여 통계학입문 강의를 수강하는 학생들의 관심과 흥미를 유도할 수 있도록 하였다. 본 연구에서는 본 실습실을 통계입문 강좌의 효과적인 실습실 모델의 하나로 소개한다.

면대면 강의실 환경에서 전자교과서를 이용한 기초 통계학 수업 (Introductory statistics class using e-textbook in face-to-face classroom environment)

  • 최숙희;한경수
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.683-692
    • /
    • 2019
  • 최근에는 기술의 도움 없이 통계를 가르친다는 것은 상상조차 하기 어렵다. 기술의 발전은 기초 통계학을 가르치는 방식과 교과서의 형태를 바꾸고 있다. 거의 모든 학생들이 항상 모바일 기기를 가지고 다니기 때문에 통계학 교과서를 디지털 형태로 제공한다면 학습자는 언제 어디서든 배울 수 있을 것이다. 또한 스마트폰은 학생들이 강의에 더 집중할 수 있도록 수업시간에 질의응답에 사용될 수 있다. 본 논문은 면대면 강의실에서 전자교과서를 이용할 때 발생하는 데이터를 분석하고 향후 전자교과서의 연구 방향을 제안한다.