• 제목/요약/키워드: 범주형

검색결과 550건 처리시간 0.024초

심리적 본질주의와 범주표상 (Psychological Essentialism and Category Representation)

  • 김신우;조준형;이형철
    • 인지과학
    • /
    • 제32권2호
    • /
    • pp.55-73
    • /
    • 2021
  • 심리적 본질주의에 따르면 사람들은 어떤 범주를 규정하는 숨겨진 본질 속성(essential properties)이 있으며 이것이 그 범주가 가지는 전형적 속성들의 인과적 원인이라는 믿음을 가진다(Gelman, 2003; Hirschfeld, 1996; Medin & Ortony, 1989). 이러한 본질주의적인 믿음은 범주가 단순히 상관을 가진 속성의 집합("clusters of correlated features")이라고 제안한 Rosch (1973, 1978)의 주장에 의문을 제기한다. 속성의 통계적 상관, 즉 가족 유사성만을 가진 범주와 달리 본질화된 범주는 범주간 경계가 매우 뚜렷하며 범주내 개체들이 동질적으로 여겨질 가능성이 높기 때문이다(Gelman, 2003; Prentice & Miller, 2007). 본질주의적 믿음이 범주 표상(범주간 경계, 범주내 응집성)에 미치는 영향을 확인하기 위해 두 개의 실험을 실시했다. 참가자들은 조건에 따라 가족 유사성 범주와 본질화된 범주를 학습한 다음 범주화 과제(실험 1)와 범주 예시들의 빈도 추정 과제(실험 2)를 실시했다. 그 결과 본질화된 범주에서 범주간 경계가 더 뚜렷해졌으며 범주내 응집성이 높아졌다. 이 결과는 범주 속성의 단서 타당도와 범주 타당도가 증가하여 발생한 것으로 본질주의적인 믿음이 범주구조의 거시적인 표상에 중요한 영향을 미친다는 것을 보여준다.

모자이크 플롯에서 변수와 범주의 순서화 (Ordering Variables and Categories on the Mosaic Plot)

  • 이문주;허명회
    • 응용통계연구
    • /
    • 제21권5호
    • /
    • pp.875-888
    • /
    • 2008
  • Hartigan과 Kleiner (1981, 1984)에 의해 제안된 모자이크 플롯은 범주형 자료의 탐색에 매우 유용한 시각화 도구이다. 모자이크 플롯은 범주 셀의 빈도를 사각형의 기에 비례하게 나타내므로 이해가 쉽고 데이터에 포함된 정보를 유지하지만 실제 모습은 변수 순서와 변수 내 범주의 순서에 따라 상당히 달라진다. 이에 우리는 본 연구에서 모자이크 플롯에서 크래머(Cramer)의 V 계수를 활용한 변수의 순서화 방법과 감마 계수를 활용한 범주의 순서화 방법을 제안하고 Titanic, Housing, PreSex 등 공개 자료에 적용한 결과를 제시한다.

확률화응답에 대한 대수선형모형

  • 최경호
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.725-734
    • /
    • 1997
  • 많은 사회과학 조사에서 분할표 형태로 얻어진 범주형 자료에는 오분류(misclassification)로 인한 오차가 내재되는 경우가 종종 있다. 질적속성 추정을 위한 확률화응답은 이러한 오분류 문제의 한 특수한 경우로 여겨지기도 한다. 그래서 확률화응답을 통한 범주형자료는 혼합된 분할표(mixed-up contingency table)로 여길 수 있는 바, 본 논문에서는 이에 대해 대수선형모형(log-linear model)을 설정하고 Chen과 Fienberg(1976)의 Iterative scaling procedure(ISP)에 의하여 얻어진 최우추정량의 극한을 이용하였다. 이 결과 Warner(1965) 형태의 대칭기법에 대해서는 Singh(1976)에 의하여 제안된 최우추정량과 같아지게 됨을 보임으로써 Warner에 의해서 제시된 추정량이 최우추정량으로 적절하지 않음을 확인해 보고, 무관질문기법에 대해서는 Greenberg, et al.(1969)에 의해서 제안된 추정량이 추정의 관점에서 최우추정량으로 적절하지 않음을 알아 보았다.

  • PDF

다이아몬드 그래프의 활용 방법 (Applications of Diamond Graph)

  • 홍종선;고용석
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.361-368
    • /
    • 2006
  • 이차원 범주형 자료를 시각적으로 표현하는 이차원과 삼차원 그래프는 많이 존재한다. 그중에서 Li등(2003)은 삼차원 그래프를 이차원 평면에 투영시키는 다이아몬드 그래프를 제안하였다. 여기서 세번째 차원은 면적과 높이 그리고 길이가 관찰값에 대응하는 다이아몬드 모양으로 대체하였다. 본 논문에 서는 이차원 자료에 대하여는 두 범주형 변수의 독립성을 검정하기 위하여 다이아몬드 그래프를 이용한다. 그리고 삼차원 이상의 자료에 대해서는 자료에 가장 적합한 로그선형모형을 설정하는데 활용할 수 있다.

범주형 자료분석을 위한 최대절사우도추정 (Maximum Trimmed Likelihood Estimator for Categorical Data Analysis)

  • 최현집
    • Communications for Statistical Applications and Methods
    • /
    • 제16권2호
    • /
    • pp.229-238
    • /
    • 2009
  • 범주형 자료분석을 위해 고려할 수 있는 모형들은 일반적으로 최우추정에 의하여 적합이 이루어지므로 이상값에 쉽게 영향을 받을 수 있다. 본 연구에서는 분할표 자료에 포함된 이상칸(outlying cell)에 영향을 받지 않는 최대 절삭우도 추정 값(maximum trimmed likelihood estimates)을 얻기 위한 추정 방법을 제안하였다. 제안된 방법은 우도에 의존하여 분할표에 포함된 칸을 제거해나가며 절사우도의 최대값을 찾기 때문에 완전탐색(complete enumeration)에 비해 계산의 양이 매우 적다. 따라서 일반적인 다차원 분할표 자료분석을 위해 쉽게 적용될 수 있다. 실제 자료분석 예를 통해 제안된 추정방법을 설명하였으며, 모의실험을 통해 문제점과 특징을 토론하였다.

mRMR과 수정된 입자군집화 방법을 이용한 다범주 분류를 위한 최적유전자집단 구성 (A hybrid method to compose an optimal gene set for multi-class classification using mRMR and modified particle swarm optimization)

  • 이선호
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.683-696
    • /
    • 2020
  • 표본의 다범주 표현형을 예측하는데 사용되는 최적의 유전자집단이란 적은 수의 유전자로 표현형을 정확히 예측할 수 있는 유전자들의 모임이다. 특이발현유전자를 검색하는 통계량은 이미 여러 가지가 있고, K-평균 군집화를 곁들여 중복성이 적은 특이발현유전자들을 선택 가능하다. 이들을 바탕으로 적은 수로 정확하게 다범주 분류가 가능한 유전자집단을 구성할 수 있도록 수정한 입자최적화 방법을 제안한다. 널리 알려진 ALL 248례와 SRBCT 83례를 이용하여 제안된 방법으로 최적유전자집단을 찾을 수 있음을 보였다.

지열 히트펌프 시스템의 데이터 마이닝 기반 성능 예측 기술 (Data Mining-Based Performance Prediction Technology of Geothermal Heat Pump System)

  • 황민혜;박명규;전인기;손병후
    • 대한기계학회논문집 C: 기술과 교육
    • /
    • 제4권1호
    • /
    • pp.27-34
    • /
    • 2016
  • 지열 시스템을 대상으로 데이터 마이닝 기반 성능 예측 모델을 구축하였다. 지열 시스템의 실시간 성능 분석과 예측에 필요한 데이터의 기본 조건을 검토한 후, 데이터베이스의 구조를 설계하였다. 먼저 시스템 성능계수(COP)와 전력 소비량을 분석 대상으로 설정한 후, 이들 물리량의 추출 주기(1분 5분 10분 30분 60분 간격)가 예측 결과에 미치는 영향을 분석하였다. 이어서 범주형과 수치형 의사결정나무 모델을 적용하여 시스템의 성능을 예측하였다. 범주형 의사결정나무 모델을 적용했을 때, 10분 주기의 예측 결과의 정확도는 97.7%로 가장 높았다. 또한 수치형 의사결정나무 분석 결과를 통해 COP가 변하는 순간의 임계값을 찾을 수 있었다. 본 논문에서 제안한 방법은 지열 시스템의 실시간 성능 분석과 운전 상태 등에 적용할 수 있을 것으로 판단된다.

농촌생활지표조사에서 무응답 대체 : 사례 (An Imputation for Nonresponses in the Survey on the Rural Living Indicators)

  • 조영숙;천영민;황대용
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.95-107
    • /
    • 2008
  • 농촌생활지표조사는 2000년부터 농촌자원개발연구소에서 매년 실시하는 조사로서 통계청 승인통계이다. 본 연구에서는 2005년 농촌생활지표조사에 사용된 원자료를 이용하였다. 원자료에 대한 에디팅 과정을 거친 후 무응답이 포함된 개체를 제거하여 얻어진 1,582 가구를 대 상으로 하였으며 총 146문항 중에서 최종 선택되어진 15문항을 증심으로 무응답 대체를 실시하였다. 실험에 사용된 대체법과 각 대체법의 효율성은 자료의 종류에 따라 다르게 적용되었다. 먼저 연속형 자료에 대해서는 평균대체, 회귀대체, 수정된 그레이 기반 k-NN 대체(DU, DW, WU, WW) 방법을 사용하여 무응답을 대체하고 RMSB를 이용하여 실험결과를 비교하였으며, 범주형 자료에 대해서는 최빈값 이용, 확률 대체, 조건부 최빈간 이용, 조건부 학률 대체, 단순 임의 핫덱 대체 방법을 사용하여 무응답을 대체하고 정확도(Accuracy)를 이용하여 실험 결과를 비교하였다. 실험 결과에 의하면 연속형 자료에 대해서는 회귀대체 또는 그레이 기반 k-NN 대체가 적절하고, 범주형 자료에 대해서는 핫덱 대체가 가장 적절한 것으로 나타났다.

광역규모 예측인자를 이용한 한반도 계절 강수량의 장기 예측 (Long-term Forecast of Seasonal Precipitation in Korea using the Large-scale Predictors)

  • 김화수;곽종흠;소선섭;서명석;박정규;김맹기
    • 한국지구과학회지
    • /
    • 제23권7호
    • /
    • pp.587-596
    • /
    • 2002
  • 경험적 직교함수(EOF)분석법과 다중회귀법에 기초하여 지연상관된 광역규모 예측인자로부터 3개월 이전에 계절 강수량을 예측할 수 있는 슈퍼앙상블 모델이 개발되었다. 이 모델의 예측성이 교차검증법에 의해 평가되었다. 관측값과 예측값사이의 상관계수는 봄철에 0.73, 여름철에 0.61, 가을철에 0.69, 겨울철에 0.75로 나타났다. 이러한 값은 유의수준 ${\alpha}$=0.00에서 유의한 값이다. 수퍼 앙상블 방법의 범주형 예측성이 3개 범주로 나누어진 사례에 대해서 평가되었다. 3개 범주는 계절 누적강수량의 상위 33.3%를 과우해, 하위 33.3%를 소우해, 그 나머지를 평년해로 구분하였다. 범주형 예측의 적중률은 계절에 따라 42%에서 74%로 나타났다.

확률론적 공간 자료 통합 모델을 이용한 산사태 취약성 분석

  • 박노욱;지광훈;권병두
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2005년도 춘계학술발표회 논문집
    • /
    • pp.254-260
    • /
    • 2005
  • 이 논문에서는 산사태 취약성 분석을 목적으로 확률론적 공간통합의 틀 안에서 범주형 자료와 연속형 자료를 효율적으로 처리할 수 있는 비모수적 우도비 추정 모델과 모수적 예측적 판별 분석 모델을 적용하였다. 적용 모델의 비교를 위해 1998년 여름철 산사태로 많은 피해를 입은 경기도 장흥 지역과 충청북도 보은 지역을 대상으로 사례연구를 수행하였다. 장흥 지역에서는 두 모델이 유사한 예측 능력을 나타내었으나, 보은 지역에서는 모수적 예측적 판별 분석 모델이 상대적으로 높은 예측 능력을 나타내었다. 결론적으로 제안한 두 모델은 산사태 취약성 분석을 위한 연속형 자료 표현에 효율적으로 적용될 수 있으며, 두 모델이 개별적인 연속형 자료 표현의 특성을 가지고 있기 때문에 다른 사례 연구를 통한 검증 작업이 병행되어야 할 것으로 생각된다.

  • PDF