• 제목/요약/키워드: 불균형 집단

검색결과 76건 처리시간 0.03초

사이클 선수의 하지근력균형이 무산소성 페달링 기능에 미치는 영향 (The Effects of Muscle Balance in Lower Limb on Anaerobic Pedaling Capacity among Elite Cyclists)

  • 박현주;김정훈
    • 디지털융복합연구
    • /
    • 제17권6호
    • /
    • pp.389-399
    • /
    • 2019
  • 이 연구의 목적은 사이클 선수를 대상으로 슬관절 등속성 근기능의 좌 우측 불균형이 무산소성 페달링 파워 관련 변인에 미치는 영향을 조사하는 것이다. 슬관절 등속성 근력 기준으로 비주측과 주측의 근력균형지수가 매우 균형적인 집단(High Symmetry Group, HSG), 적정수준의 집단(Moderate Symmetry Group, MSG), 불균형이 존재하는 집단(Asymmetry Group, AG)으로 분류하여 페달링 기능을 비교하였다. 그 결과 신근력의 비주측과 주측의 근력 불균형은 페달링 기능의 집단 간 차이점이 없었다. 한편, 굴근력의 비주측과 주측 근력균형지수의 불균형은 무산소성 페달링 파워 관련 변인에서 집단 간 차이점이 미세하게 존재하였지만, 페달링 기능에 부정적인 영향을 미치는 수준은 아닌 것으로 판단된다. 그러므로 좌 우측 근기능이 거의 동일하게 적용되는 사이클 선수에게도 근력 불균형이 존재하였으나, 이러한 불균형이 페달링 기능에 부정적인 영향을 미치지 않는 것으로 판단된다.

불균형 자료의 분류분석을 위한 가중 L1-norm SVM (Weighted L1-Norm Support Vector Machine for the Classification of Highly Imbalanced Data)

  • 김은경;전명식;방성완
    • 응용통계연구
    • /
    • 제28권1호
    • /
    • pp.9-21
    • /
    • 2015
  • SVM은 높은 수준의 분류 정확도와 유연성을 바탕으로 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 집단별 개체수가 상이한 불균형 자료의 분류분석에서 SVM은 다수집단으로 편향되게 분류함수를 추정하므로 소수집단의 분류 정확도가 심각하게 감소하게 된다. 불균형 자료의 분류분석을 위하여 집단별 오분류 비용을 차등 적용하는 가중 $L_2$-norm SVM이 개발되었으나, 이는 릿지 형태의 벌칙함수를 사용하므로 분류함수의 추정에서 불필요한 잡음변수의 제거에는 효율적이지 못하다. 따라서 본 논문에서는 라소 형태의 별칙함수를 사용하고 훈련개체의 오분류 비용을 차등적으로 부여함으로서 불균형 자료의 분류분석에서 변수선택의 기능을 지니는 가중 $L_1$-norm SVM을 제안하였으며, 모의실험과 실제자료의 분석을 통하여 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신 (A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.177-188
    • /
    • 2022
  • 일반적으로 support vector machine (SVM)은 높은 수준의 분류 정확도를 제공함으로써 다양한 분야의 분류분석에서 널리 사용되고 있다. 그러나 SVM은 최적화 계산식이 이차계획법(quadratic programming)으로 공식화되어 많은 계산 비용이 필요하므로 대용량 자료의 분류분석에는 그 사용이 제한된다. 또한 불균형 자료(imbalanced data)의 분류분석에서는 다수집단에 편향된 분류함수를 추정함으로써 대부분의 자료를 다수집단으로 분류하여 소수집단의 분류 정확도를 현저히 감소시키게 된다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 다수집단을 분할(divide)하고, 소수집단을 과대추출(oversampling)하여 여러 분류함수들을 추정하고 이들을 통합(conquer)하는 DOC-SVM 분류기법을 제안한다. 제안한 DOC-SVM은 분할정복 알고리즘을 다수집단에 적용하여 SVM의 계산 효율을 향상시키고, 과대추출 알고리즘을 소수집단에 적용하여 SVM 분류함수의 편향을 줄이게 된다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DOC-SVM의 효율적인 성능과 활용 가능성을 확인하였다.

오차항이 이분산성을 가지는 일원분류 모형에서 일반 F-검정의 유의수준에 관한 고찰

  • 김기환;이준영
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2000년도 추계학술발표회 논문집
    • /
    • pp.165-171
    • /
    • 2000
  • 일원분류 모형에서 표준 F-검정을 하기 위해서는 오차항에 대한 등분산성을 가정한다. 그러나 실제로 이러한 가정은 지켜지기 힘들며, 이에 더불어 관찰치가 각 집단별로 일정하지 않고 불균형한 경우에는 F-검정의 유의수준이 지정된 값을 만족시키지 못하며, 따라서 검정력에 관한 분석은 의미가 없게 된다. 본 연구에서는 등분산성이 지켜지지 않고, 자료가 불균형한 경우, 현실적인 상황에서 일반적으로 사용되는 F-검정의 유의수준 유지라는 문제가 어 떤 변화를 겪게 되는지를 확인하고, 더 나아가 유의수준을 유지하기 위해서는 어떤 식의 조정이 가능한지를 살펴보았다.

  • PDF

불균형 자료에 대한 분류분석 (Classification Analysis for Unbalanced Data)

  • 김동아;강수연;송종우
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.495-509
    • /
    • 2015
  • 일반적인 2집단 분류(2-class classification)의 경우, 두 집단의 비율이 크게 차이나지 않는 경우가 많다. 본 논문에서는 두 집단의 비율이 크게 차이나는 불균형 데이터(unbalanced data)의 분류 문제에 대해서 다루고자 한다. 불균형 데이터의 분류방법은 균형이 맞는 데이터(balanced data)의 경우보다 분류하기 어려운 경우가 많다. 이런 자료에서 보통의 분류모형을 적용하게 되면 많은 경우에 대부분의 관측치가 큰 집단으로 분류 되는 경우가 많은데 실질적인 어플리케이션에서는 이런 오분류가 손해가 더 큰 경우가 대부분이다. 우리는 sampling 기법을 이용하여 다양한 분류 방법론의 성능을 비교 분석 하였다. 또한 비대칭 손실(asymmetric loss)을 가정한 경우에 어떤 방법론이 가장 작은 loss를 생성하는 지를 비교하였다. 성능 비교를 위해서는 오분류율(misclassification rate), G-mean, ROC, 그리고 AUC(Area under the curve) 등을 이용하였다.

불균형 일원랜덤효과모형에서 EQDGs를 이용한 MIVQUE 추정량 비교 (Comparison of MIVQUE Estimators Using EQDGs for the One-way Random Model with Unbalanced Data)

  • 정병철
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.411-420
    • /
    • 2005
  • 본 논문에서는 불균형 일원랜덤효과모형에서 분산성분에 대한 MIVQUE 추정량들의 효율에 대하여 연구하였다. MIVQUE 추정량에 대한 초기 추정치로 3가지 추정치가 사용되었으며 이들을 이용하여 얻어지는 MIVQUE 추정량의 효율성을 척도화된 추정량의 경험적 분위수를 이용하는 EQDGs 플롯을 이용하여 비교하였다. 모의실험 결과 집단간 분산의 초기치를 0으로 하고 집단내 분산의 초기치를 1로 사용한 MIVQUE 추정량의 효율이 추정량의 안정성 관점에서 다른 초기치를 사용한 MIVQUE 추정량에 비하여 약간 효율적인 것으로 나타났다.

그룹변수를 포함하는 불균형 자료의 분류분석을 위한 서포트 벡터 머신 (Hierarchically penalized support vector machine for the classication of imbalanced data with grouped variables)

  • 김은경;전명식;방성완
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.961-975
    • /
    • 2016
  • H-SVM은 입력변수들이 그룹화 되어 있는 경우 분류함수의 추정에서 그룹 및 그룹 내의 변수선택을 동시에 할 수 있는 방법론이다. 그러나 H-SVM은 입력변수들의 중요도에 상관없이 모든 변수들을 동일하게 축소 추정하기 때문에 추정의 효율성이 감소될 수 있다. 또한, 집단별 개체수가 상이한 불균형 자료의 분류분석에서는 분류함수가 편향되어 추정되므로 소수집단의 예측력이 하락할 수 있다. 이러한 문제점들을 보완하기 위해 본 논문에서는 적응적 조율모수를 사용하여 변수선택의 성능을 개선하고 집단별 오분류 비용을 차등적으로 부여하는 WAH-SVM을 제안하였다. 또한, 모의실험과 실제자료 분석을 통하여 제안한 모형과 기존 방법론들의 성능 비교하였으며, 제안한 모형의 유용성과 활용 가능성 확인하였다.

무릎 근력의 불균형이 백 스쿼트 동작에 미치는 영향 (The Effect of Knee Muscle Imbalance on Motion of Back Squat)

  • 손지훈
    • 디지털융복합연구
    • /
    • 제17권3호
    • /
    • pp.463-471
    • /
    • 2019
  • 본 연구는 무릎 근력의 불균형이 백 스쿼트 시 인체 움직임의 제한 요인으로 작용하는지를 확인하는 것에 목적이 있다. 백 스쿼트 유경험자로 최근 2년간 부상이 없는 서울시 소재 S대학교 학생 8명을 연구 대상자로 선정하였다. Cybex 770으로 무릎관절의 등속성 근력을 측정한 후, 동측 주작용근과 대항근의 근력 불균형 정도와 좌 우 같은 근 군의 결손율에 따라 그룹을 나눈 후, 개인별 몸무게의 25%, 50%, 100%, 125%의 중량과 같은 바벨을 백 스쿼트로 들게 하였다. 무릎 굽힘 각도, 신체중심의 수직 변위, V-COP의 측정 구간 내 평균 위치로부터 매 순간 V-COP 까지의 거리 합 변인들에 대한 집단별 차이를 검증하기 위해 독립표본 T 검정을 실시하였다. 125%BW 조건에서 무릎관절 근력의 동측 불균형은 쭈그려 앉는 자세의 제한 요인으로, 좌 우측 폄 근력의 불균형은 평형성 유지의 제한 요인으로 작용하였다. 근력의 불균형이 인체 움직임의 제한 요인으로 작용할 수 있음을 확인하였으므로, 차후 임상에서는 근력 불균형에 대한 검사법과 함께 교정 및 재활 운동 방법 또한 발전시켜 나갈 필요가 있다.

불균형적 상호의존성과 갈등간 비선형적 관계에 대한 연구 (A Study on the Non-linear Relationship between Asymmetric Interdependence and Conflict)

  • 김종근;김재욱
    • 한국유통학회지:유통연구
    • /
    • 제10권2호
    • /
    • pp.49-72
    • /
    • 2005
  • 상호의존성은 유통경로상에 존재하는 기본적 특성으로서 오랫동안 유통분야에서 관련연구들이 활발하게 진행되어 왔다. 특히 갈등은 유통경로상의 거래관계를 특징짓는 주요 특성으로서 상호의존성과 갈등 간 관계를 규명하는 것은 의미하는 바가 크다. 그러나 사회학 분야에서는 상호의존성과 갈등 간 관계를 설명하는 상반된 이론이 존재하며, 마케팅 분야에서도 상호의존성과 갈등 간 관계에 대해서 상반된 연구결과가 제시되었다. 이에 본 연구에서는 상호의존성과 갈등 간 관계에 대해 대립된 설명을 하고 있는 쌍무적 억제이론과 갈등나선형이론 등의 사회학 이론을 활용하여 붙균형적 상호의존성과 갈등간 비선형적 관계를 제안하고, 이를 위해 소방관련 전문공사업체들과 공급업체들로부터 설문데이타를 수집하여 불균형적 상호의존성과 갈등간 역U형태의 관계가 있음을 증명하고자 한다. 분석결과 구매업체집단과 공급업체집단 모두에서 상호의존성의 총합이 높을 때 불균형적 상호의전성과 갈등간 비선형적 관계가 통제적으로 유의미하게 도출되었다. 마지막으로 몇 가지 학문적 시사점들과 한계점 및 향후 연구 과제를 제시하였다.

  • PDF

단어선택과 SMOTE 알고리즘을 이용한 불균형 텍스트 데이터의 소수 범주 예측성능 향상 기법 (Improving minority prediction performance of support vector machine for imbalanced text data via feature selection and SMOTE)

  • 김종찬;장성준;손원
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.395-410
    • /
    • 2024
  • 텍스트 데이터는 일반적으로 많은 다양한 단어들로 구성되어 있다. 평범한 텍스트 데이터의 경우에도 수만 개의 서로 다른 단어들을 포함하고 있는 경우를 흔히 관찰할 수 있으며 방대한 양의 텍스트 데이터에서는 수십만 개에 이르는 고유한 단어들이 포함되어 있는 경우도 있다. 텍스트 데이터를 전처리하여 문서-단어 행렬을 만드는 경우 고유한 단어를 하나의 변수로 간주하게 되는데 이렇게 많은 단어들을 각각 하나의 변수로 간주한다면 텍스트 데이터는 매우 많은 변수를 가진 데이터로 볼 수 있다. 한편, 텍스트 데이터의 분류 문제에서는 분류의 목표변수가 되는 범주의 비중에 큰 차이가 나는 불균형 데이터 문제를 자주 접하게 된다. 이렇게 범주의 비중에 큰 차이가 있는 불균형 데이터의 경우에는 일반적인 분류모형의 성능이 크게 저하될 수 있다는 사실이 잘 알려져 있다. 따라서 불균형 데이터에서의 분류 성능을 개선하기 위해 소수집단의 관측값들을 합성하여 소수집단에 포함되는 새로운 관측값을 생성하는 합성과표집기법(synthetic over-sampling technique; SMOTE) 등의 알고리즘을 적용할 수 있다. SMOTE는 k-최근접이웃(k-nearset neighbor; kNN) 알고리즘을 이용하여 새로운 합성 데이터를 생성하는데 텍스트 데이터와 같이 많은 변수를 가진 데이터의 경우에는 오차가 누적되어 kNN의 성능에 문제가 생길 수 있다. 이 논문에서는 변수선택을 통해 변수가 많은 불균형 텍스트 데이터를 오차가 축소된 공간에 표현하고 이 공간에서 새로운 합성 관측값을 생성하여 불균형 텍스트 데이터에서 소수 범주에 대한 SVM 분류모형의 예측 성능을 향상시키는 방법을 제안한다.