• 제목/요약/키워드: 범주형 자료분석

검색결과 176건 처리시간 0.02초

2007년 한국프로야구에서 도루성공모형 (Steal Success Model for 2007 Korean Professional Baseball Games)

  • 홍종선;최정민
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.455-468
    • /
    • 2008
  • 야구경기의 승패에 영향을 미치는 중요한 요인으로 간주되는 도루의 성공모형을 개발하기 위하여 2007년 한국프로야구 기록자료를 바탕으로 로지스틱 회귀모형들을 제안한다. 또한 한국프로야구의 도루성공과 실패에 대해 판별분석을 실시하고 분류 기준값을 결정하였으며, 판별분석 분류표를 이용해 로지스틱 회귀분석과 판별분석의 효율성을 비교한다. 전체적인 모형의 정확도는 로지스틱 회귀모형이 판별분석보다 더 좋은 것으로 나타났고, 연속형 자료를 범주형으로 변환한 자료에 대한 로지스틱 회귀모형도 유사한 효율성을 갖고있다.

분할법을 활용한 범주형자료의 다차원척도법 (Multidimensional scaling of categorical data using the partition method)

  • 신상민;천선경;최용석
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.67-75
    • /
    • 2018
  • 다차원척도법은 개체간의 비유사성을 저차원 공간에 기하적으로 표현하기 위한 다변량 자료의 탐색적 분석기법이다. 그러나 일반적인 다차원척도그림에서는 개체들의 유사성 정보만이 표현될 뿐 변수와 관련된 정보가 나타나지 않기 때문에 그림의 해석 상에 한계점이 존재한다. 본 연구에서는 범주형 자료를 다중표시행렬로 변환하고 Torgerson (1958)의 알고리즘에 의한 다차원척도법을 적용하여 개체들의 군집화 성향과 군집들의 상대적 크기를 다차원척도그림으로 시각화하였다. 그리고 Shin 등 (2015)의 분할법을 적용하여 범주형변수의 범주수준별 정보를 다차원척도그림 상에 투영하여 추가적인 정보를 표현하였다. 따라서 본 연구에서 제안하고자 하는 다차원척도그림을 이용하면 개체들의 유사성 정보와 함께 범주형변수들 사이의 연관성도 탐색할 수 있는 장점이 있다.

범주형 자료에서 연관성 측도들의 비교 분석

  • 홍종선;임한승
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.645-661
    • /
    • 1997
  • 연속형 변수들의 상관관계와 범주형 변수들의 연관성 측도들을 비교 연구하였다. 이 연구를 위하여 연속형 변수들이며 +1에서 -1까지 완벽한 상관관계를 갖고 있는 2 변량 정규분포를 이용하여 2$\times$2 분할표와 확장하여 일반적인 I$\times$J 분할표를 대신하는 3$\times$3 분할표를 생성하였다. 2 차원 분할표에서 정의된 연관성 측도들을 구하여 논의하였는데 2$\times$2 분할표에서는 교차적비 $\alpha$ 통계량과 교차적비의 함수로 표현되는 Yule [1912]의 Q와 Y의 통계량 그리고 상관계수 R 통계량과 R 통계량의 함수인 P 통계량을 설명하고 생성된 분할표에서 구한 통계량값을 분석하였으며, 3$\times$3 분할표에서는 Pearson의 독립성 검정통계량 $X^2$의 함수로 표현되는 P. T. V 통계량과 Goodman과 Kruskal [1954]의 $\lambda_{C/R}$통계량과 Light와 Margolin [1971]의 $\tau_{R/C}$ 통계량을 설명하고 그 값들을 Pearson의 상관계수와 비교 분석하였다.

  • PDF

Collapsibility Criteria using Raindrop Plots

  • 홍종선;김범준
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.175-178
    • /
    • 2004
  • 범주형 자료분석에서 차원축소(collapsibility)는 오즈비로 설명되었다. 실제의 $2\times2\timesK$ 분할표 자료를 이 이론에 적용시켰을 때 오즈비의 값으로 차원축소가 가능한지의 여부를 판단하기는 어렵다. 오즈비를 시각적으로 표현하는 방법 중에서 Doi, Nakamura와 Yamamoto(2001)가 제안한 Contour plot을 통해서 분할표 자료를 설명하는 것은 가능하지만 차원축소의 가능성을 결정하기에는 한계가 있다. 본 연구에서는 오즈비의 신뢰구간을 시각적으로 표현할 수 있는 방법으로 Barrowman과 Myers(2003)가 제안한 Raindrop plot을 이용하여 $P_{\lambda,;,T}^M-policy$ 분할표 자료를 설명할 수 있으며 동시에 차원축소의 가능성을 판단할 수 있는 방법을 제안하고자 한다.

  • PDF

순서범주형자료 분석을 위한 베이지안 분계점 모형 (A Bayesian Threshold Model for Ordered Categorical Traits)

  • 최병수;이승천
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.173-182
    • /
    • 2005
  • 순서를 갖는 범주형자료의 분석을 위한 중요한 통계적 방법인 순위로짓모형의 대안으로 무정보 사전분포에 의한 베이지안 분계점 모형을 정의하고, 실증 자료분석을 통해 베이지안 모형의 유용성을 살펴보았다.

$2{\times}2$ 분할표에서 동적 그래픽스로 구현된 겹쳐진 모자익 그림을 이용한 범주형 자료의 연관성 측정 (Measurement of Association of Categorical Data Using The Overlapped Mosaic Plot : Dynamic Graphics Approach for $2{\times}2$ Contingency Table)

  • 윤여창;오민권
    • Journal of the Korean Data and Information Science Society
    • /
    • 제10권2호
    • /
    • pp.457-464
    • /
    • 1999
  • Hartigan과 Kleiner(1981)는 분할표 자료에서 주변합의 비율에 대한 각 칸의 관측도수의 비율을 사각형의 면적으로 표현한 모자익 그림을 제안하였는데, 본 연구에서는 $2{\times}2$ 분할표에서 관측도수와 기대도수에 대한 두 개의 모자익 그림을 겹쳐서 나타낸 겹쳐진 모자익 그림을 이용한 범주형 자료의 연관성을 측정하고자 한다. 동적 그래픽스기법으로 개선시킨 겹쳐진 모자익 그림을 이용하면 범주형 변수의 연관성을 시각적으로 쉽게 파악할 수 있는데, 이러한 그림은 자료분석이나 통계 패키지에서 제공되고 있지 않다. 겹쳐진 모자익 그림은 변수들의 종속성 여부, 관측도수와 기대도수의 차이등을 제시된 통계량과 함께 시각적으로 파악할 수 있기 때문에 모형 설정시 매우 유용한 정보를 얻을 수 있다.

  • PDF

누적법에 관한 연구 (On Accumulation Analysis)

  • 백운봉;이우선
    • 응용통계연구
    • /
    • 제12권1호
    • /
    • pp.275-293
    • /
    • 1999
  • 다구찌의 누적법은 다구찌 품질공학에서 중요한 통계분석 방법이다. 그러나 이 방법이 복잡하고 비효율적일 뿐만 아니라 실험의 결과가 잘못 해석 될 수 있는 문제점을 가지고 이싿. 특히 순서 지어진 범주형에 관한 다요인(multificator) 실험에서는 이러한 가능성이 큰 것으로 지적되고 있다. 이에 대한 걱정과 비판이 Nair(1986) 그리고 Hamada and Wu(1990)에 의하여 심각하게 제기되어 왔다. 본 논문은 이러한 내용들을 정리하고 이들의 논란과 주장에 대한 평가와 이에대한 최선의 실천방안을 제안하고 있다. 아울러 실제 자료분석을 위하여 필요한 SAS/IML 프로그램을 제시하고 있다.

  • PDF

순서형 프로빗모형을 이용한 속도선택행태에 관한 연구 (Ordered Probit Model Of Speed Selection Behavior)

  • 강경우;백병성
    • 대한교통학회지
    • /
    • 제16권3호
    • /
    • pp.93-100
    • /
    • 1998
  • 지난 30여년간 운전자의 속도선택의 행태에 대하여 많은 연구가 이루어졌다. 그러 나, 과거 대부분의 연구는 운전자의 개별적인 특성과 제한속도에 대한 운전자의 인지 정도 를 고려하지 않고, 다만 운전자의 속도선택과 도로 및 차량간의 상호 관련성에 중점을 두고 있다. 본 연구는 운전자, 차량 및 통행특성 등의 요인을 고려하여 운전자의 속도 선택에 대 한 행태를 분석하고자 하였다. 이를 위하여 운전자의 속도 자료와 설문자료를 조사한 수, 두 가지 자료를 범주형 자료로 구분하여 Ordered Probit Model을 적용하여 분석하였다. 분 석결과 i) 고소득의 남성운전자가 고속의 주행 행태를 보였으며, 운전경력이 많은 운전자일 수록 높은 속도를 선택하는 것으로 나타났다. ii) 차량에 관해서는 배기량이 높은 차량일수 록 고속의 속도를 나타낸 반면에 안전장치가 많은 차량의 경우에는 저속의 주행속도를 보이 는 것으로 나타났다. iii) 통행 특성 면에서는 일일통행거리가 중요 변수인 것으로 나타났다. iv) 운전자의 심리적 측면에서는 운전자가 인식하고 있는 제한 속도가 또한 중요변수로 분 석되었다.

  • PDF

저해상도 비율 자료로부터 고해상도 범주형 주제도 생성을 위한 지구통계학적 블록 시뮬레이션 (A Geostatistical Block Simulation Approach for Generating Fine-scale Categorical Thematic Maps from Coarse-scale Fraction Data)

  • 박노욱;이기원
    • 한국지구과학회지
    • /
    • 제32권6호
    • /
    • pp.525-536
    • /
    • 2011
  • 다양한 형태의 공간 자료를 이용하는 응용 분야에서 이용가능한 자료간 해상도 차이를 반영하고, 원하는 타겟 해상도로의 변환은 매우 중요하다. 이 논문에서는 저해상도 비율 자료로부터 고해상도 범주형 주제도를 제작하기 위해 베리오그램 디컨볼루션과 블록 시뮬레이션을 이용하는 지구통계학적 다운스케일링 방법론을 제시하였다. 우선 블록 기반 베리오그램으로부터 점 기반 베리오그램 모델의 추정을 위해 반복 연산 기반 베리오그램 디컨볼루션 방법을 적용하였다. 그리고 영역-점 변환 크리깅과 추정된 점 기반 베리오그램 모델을 이용하는 직접 순차적 시뮬레이션을 적용하여 고해상도 비율 정보를 제작하였다. 최종적으로 최대 사후 확률 결정 규칙을 적용하여 대안적 고해상도 범주형 주제도를 제작하였다. 점 기반 자료 없이 저해상도 블록 비율자료만을 이용한 토지피복도 제작 사례 연구를 통해 제안 분석 과정을 예시하였다. 제안한 다운스케일링 기법의 적용을 통해 원 저해상도 블록 비율 자료값을 재생산하는 고해상도 비율 자료를 생성하였으며, 이로부터 기준 토지피복도의 전반적인 패턴을 반영하는 대안적 고해상도 토지피복도 제작이 가능함을 확인할 수 있었다. 이렇게 생성된 고해상도 자료들은 해상도 변환의 영향 분석에 유용한 입력 자료로 이용될 수 있을 것으로 생각된다.

실시간 망 관리를 위한 패킷 분석 시스템의 설계 및 구현실시간 망 관리를 위한 패킷 분석 시스템의 설계 및 구현 (Design and Implementation of Packet Analysis System for a Realtime Network Management)

  • 정상준;최혁수;이정협;김종근;권영헌
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.270-273
    • /
    • 2001
  • 본 논문에서는 실시간 성능 관리를 위해 패킷 분석 시스템을 설계하고 구현하였다. 기존의 MIB 정보를 이용한 망 관리에서는 관리국의 주기적인 요청으로 각 에이전트의 MIB 정보를 가져와 분석하는 방식으로, 실시간 감시에는 적합하지 않은 단점이 있다. 따라서, 본 논문에서는 실시간 트래픽 감시를 위해 시스템을 설계하고 구현하였다. 제안된 시스템은 트래픽 상태를 감시하는 모니터링 시스템과 관측된 트래픽을 보여주는 인터페이스 부분으로 나눌 수 있다. 모니터링 시스템은 각 노드의 트래픽을 감시하여 각 패킷별로 구분하여 사용자 인터페이스에 넘겨주게 되며, 이를 사용자 인터페이스에서는 수치형 자료로 표시하거나, 범주형 자료인 그래프로 나타내게 된다. 이 시스템은 각 노드의 부하 여부를 감시하여, 비정상적인 트래픽의 폭주를 발견하게 되면 분석 모듈의 작동에 의해 해킹을 비롯한 네트워크 장애를 감지할 수 있다. 이는 실시간 망 관리의 중요한 기본 기술로 여러 분야에 활용할 수 있다.

  • PDF