• Title/Summary/Keyword: 통계적인 추론

Search Result 186, Processing Time 0.026 seconds

Undecided inference using bivariate probit models (이변량 프로빗모형을 이용한 미결정자 추론)

  • Hong, Chong-Sun;Jung, Mi-Yang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.6
    • /
    • pp.1017-1028
    • /
    • 2011
  • When it is not easy to decide the credit scoring for some loan applicants, credit evaluation is postponded and reserve to ask a specialist for further evaluation of undecided applicants. This undecided inference is one of problems that happen to most statistical models including the biostatistics and sportal statistics as well as credit evaluation area. In this work, the undecided inference is regarded as a missing data mechanism under the assumption of MNAR, and use the bivariate probit model which is one of sample selection models. Two undecided inference methods are proposed: one is to make use of characteristic variables to represent the state for decided applicants, and the other is that more accurate and additional informations are collected and apply these new variables. With an illustrated example, misclassification error rates for undecided and overall applicants are obtainded and compared according to various characteristic variables, undecided intervals, and thresholds. It is found that misclassification error rates could be reduced when the undecided interval is increased and more accurate information is put to model, since more accurate situation of decided applications are reflected in the bivariate probit model.

An Ensemble Method for Latent Interest Reasoning of Mobile Users (모바일 사용자의 잠재 관심 추론을 위한 앙상블 기법)

  • Choi, Yerim;Park, Jonghun;Shin, Dong Wan
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.11
    • /
    • pp.706-712
    • /
    • 2015
  • These days, much information is provided as a list of summaries through mobile services. In this regard, users consume information in which they are interested by observing the list and not by expressing their interest explicitly or implicitly through rating content or clicking links. Therefore, to appropriately model a user's interest, it is necessary to detect latent interest content. In this study, we propose a method for reasoning latent interest of a user by analyzing mobile content consumption logs of the user. Specifically, since erroneous reasoning will drastically degrade service quality, a unanimity ensemble method is adopted to maximize precision. In this method, an item is determined as the subject of latent interest only when multiple classifiers considering various aspects of the log unanimously agree. Accurate reasoning of latent interest will contribute to enhancing the quality of personalized services such as interest-based recommendation systems.

Saddlepoint Approximation to the Smooth Functions of Means Model (평균 벡터의 평활함수모형에 대한 안부점근사 -스튜던트화 분산을 중심으로-)

  • 나종화;김주성
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.333-344
    • /
    • 2001
  • 통계적 추론에 사용되는 많은 통계량들은 평균벡터의 평활함수의 형태로 표현이 가능하다. 본 연구에서는 이들 통계량들의 분포함수에 대한 안부점근사법을 제시하였다. 이 방법은 Na(1998)에서 제시된 일반적 통계량의 분포함수에 대한 안부점근사법이 평균벡터의 평활함수모형에 특히 유용하게 사용될 수 있음을 보인 것이다. 이 근사법은 정규근사에 비해 근사의 정도가 뛰어나며, 특히 통계량의 꼬리부분의 확률에 대해서도 정확도가 그대로 유지되는 장점이 있어 정밀한 추론이 요구되는 많은 문제에 효과적으로 사용될 수 있다. 모의 실험에 사용할 평균벡터의 평활함수 모형으로는 스튜던트화 분산을 고려하였다.

  • PDF

비례위험모형분석을 위한 한글멀콕스(HMULCOX)

  • Lee, Sang-Bok;Park, Eui-Jun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.7 no.1
    • /
    • pp.145-159
    • /
    • 1996
  • 다변량 발병시간자료는 각 개개 환자에게 있어 합병증이 발생되거나 혹은 유사 환자군(집락) 내의 발병시간이 상관되어진 생의학자료에서 흔히 볼 수 있다. HMULCOX는 그런 자료를 분석하기 위한 한글 통계 패키지 가운데 하나이다. 이 프로그램은 관련된 발병시간들이 독립이 아닐때에도 COX 비례 위험 모형의 주변확률분포를 계산해 준다. 주어진 조건으로는 주변확률모형의 기본위험율은 일정한 상수, 흑은 변수라도 관계없다. 또한 치료실패율의 치료변수들(공변량)의 효과에 대해 다양한 통계적 추론이 가능하다. 기본적으로 주변확률분포접근법으로 설계되었지만 HMULCOX는 여러 가지 추론 방법을 선택하는 데 일반적으로 충분하다. 이 프로그램으로 2개의 예를 들어 실행하겠다.

  • PDF

Semantic Inference System Using Backward Chaining (후방향 추론기법을 이용한 시멘틱 추론 시스템)

  • 함영경;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.97-99
    • /
    • 2003
  • 대부분의 웹 문서들은 HTML이나 XML로 표현된 웹의 정보들은 Syntactic 구조를 기반으로 표현되기 때문에, 소프트웨어가 정보를 처리하는데 한계가 있다. HTML은 문서의 display안을 위한 tag기반의 문서 표현 방식이고, XML은 문서의 구조를 사람이 이해하기 쉽도록 제안된 표현 방식이기 때문이다. 따라서, HTML 및 XML로 표현된 정보들을 가지고 서비스를 제공하는 웹 에이전트들은 사용자들에게 의미있는 서비스를 제공하기 위해 오프라인 상에서 많은 수작업을 수행해야만 했다. 이와 같은 문제점을 극복하기 위해서 미국과 유럽에서는 시멘틱 웹에 대한 연구를 활발히 진행하고 있다. 시멘틱 웹은 기존의 웹과는 달리 소프트웨어가 이해하고 처리 할 수 있는 형태(machine processable)로 정보를 표현하기 때문에 오프라인 상에서 수행되던 많은 작업들을 에이전트가 이해하고 처리할 수 있게 되었다. 그러나. 온톨로지를 구축하는 과정에서도 필연적으로 정보의 31(Incorrect, incomplete, Inconsistence)가 나타나고, 서비스의 결과 또한 온톨로지에 의해 좌우된다는 단점이 있다. 본 논문에서 제안하는 후방향 추론기법을 이용한 추론엔진은 다음과 같은 시스템을 제안한다. 첫째. 시멘틱 웹을 이용함으로써 소프트웨어 에이전트의 자동화 시스템을 제안한다. 둘째 은톨로지 정보의 한계성을 극복하기 위해 규칙기반의 후방향 추론 기법을 사용하는 시멘틱 추론엔진을 제안한다. 본 논문에서 제안하는 후방향 추론기법을 이용한 시멘틱 추론시스템은 사용자의 질의를 입력받아. 온톨로지와 시멘틱 웹 문서의 정보를 이용하여 후방향 추론을 수행함으로써 웹 정보의 불완전성을 완화하고, 온톨로지의 영향력를 감소시킴으로써 웹 서비스의 질을 향상시키는데 목적이 있다.RED에 비해 향상된 성능을 보여주었다.웍스 네트워크상의 다양한 디바이스들간의 네트워크 다양화와 분산화 기능을 얻을 수 있었고, 기존의 고가의 해외 솔루션인 Echelon사의 LonMaker 소프트웨어를 사용하지 않고도 국내의 순수 솔루션인 리눅스 기반의 LonWare 3.0 다중 바인딩 기능을 통해 저 비용으로 홈 네트워크 구성 관리 서버 시스템 개발에 대한 비용을 줄일 수 있다. 기대된다.e 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해 볼때 사산(死産)은 모성(母性)의 임신력(姙娠歷)과 매우 밀접한 관련이 있는 것으

  • PDF

Assessing Bioequivalence in $3\times3$ Cross-over Design with Unbalanced Data (불균형 자료의 $3\times3$ 교차설계법에서 생물학적 동등성 평가)

  • 임남규;박상규
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.345-355
    • /
    • 2001
  • 동일한 유효성분을 가지면서 용량 혹은 형식 만이 다른 제제의 개발이 증가되고 이에 따른 두 제제 이상의 생물학적 동등성시험의 필요성이 제기되었다. 이에 이용주 등(1998)은 온단세트론 제제에 대한 생물학적 동등시험에서 3$\times$3 교차설계법을 적용하였다. 그러나 3$\times$3 교차설계법에서 각 순서에 피험자의 수가 다르거나 실험중에 결락(dropout)되는 피험자가 발생하는 경우에는 일반적인 통계적 방법은 적용할 수 없었다. 본 연구에서는 이러한 경우에 제제효과의 추론에 대한 통계적 방법과 생물학적 동등성 시험 방법을 제안하고 모의실험을 통하여 생물학적 동등성평가의 정도를 측정하였다.

  • PDF

Subjective Evaluation of Fabric Tactile Properties Using Quad Analysis (Quad 분석법을 이용한 직물 촉감의 주관적 평가)

  • 김주용
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2003.05a
    • /
    • pp.5-7
    • /
    • 2003
  • 의류용 섬유제품의 쾌적성을 객관적으로 측정하려는 시도가 계속되고 있지만, 아직 소비자의 미묘한 차이를 검출하는 능력을 재현하기에는 거리가 있어 보인다. 객관적 측정법들은 재현성과 신뢰성 면에서 제각기 자신들의 우수한 성능을 자랑하지만, 검출능력의 민감성은 주관적 평가에 훨씬 못 미치고 있기 때문에 비현실적인 경우가 많다. 본 연구의 목적은 주관적 평가의 신뢰성을 높이고 통계적인 추론이 가능한 보다 진보된 형식의 주관적 평가법을 개발하고 의류용 직물의 촉감평가에 응용하는 것이다. 국내에서 생산되는 여름용 캐쥬얼 웨어를 대상으로 여러 형태의 주관적 평가법을 적용하여 그 촉감을 평가하였다. 평정척도법, 표준 비교법, 순위법, Thurstone일대 비교법, Quad 분석법 등을 순차적으로 적용하여 평가자 판단의 일관성 여부, 평가자간의 일치성 여부, 재현성 및 논리성 여부를 통계적으로 평가한 후 이를 통과한 평가자들을 대상으로 실험을 반복한 후, 직물 촉감과 관련된 물리적 속성들과의 관련성을 고찰하였다.

  • PDF

A study on the step stress life testing (계단적 충격 생명검사에 관한 연구)

  • 이석훈
    • The Korean Journal of Applied Statistics
    • /
    • v.2 no.2
    • /
    • pp.61-78
    • /
    • 1989
  • We consider the step stress life testing which has been developed in order to perform the life testing of the units whose normal life time is long within a reasonable amount of time. The models suggested for statistical analysis of the data obtained form the stress life testing are reviewed and a model which contains these models in some respect is suggested. The statistical inference based on the suggested model is done using maximum likelihood and weighted least square estimates. Finally we review the design of the simple step stress life testing and extend the result to the censoring case.

  • PDF

A Study on statistical inference on IL-2 titer (IL-2 역가의 통계적 추정에 관한 연구)

  • 박래현;박석영;이석훈
    • The Korean Journal of Applied Statistics
    • /
    • v.2 no.2
    • /
    • pp.27-35
    • /
    • 1989
  • This article deals with statistical inference on Interleukin-2 titer of which the clinical applications to cancer immunotherapy and some immunodeficiency diseases have been widely tried. A Linear model and the Bayesian approach are used to explain the bioassay which performs the measurements of IL-2 activity from an patient and an inference procedure including confidence intervals for the IL-2 titer of the patient through comparision with the Standard IL-2 is suggested and a real case of example is illustrated.

  • PDF

An Analysis of Factors Related with Software Process Capability Levels (소프트웨어 프로세스 능력수준의 관련 요인 분석)

  • Lim, Yi-Kyong;Jung, Ho-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.555-558
    • /
    • 2000
  • 소프트웨어 프로세스 능력 수준에 영향을 미치는 요인을 찾아내어, 강점은 격려하고 약점을 개선하는 프로세스 개선활동은 기업의 경쟁력 향상을 위하여 매우 중요한 일이다. 본 연구에서는 이러한 요인을 찾아내기 위하여 SPICE(ISO/IEC 15504) 프로젝트에서 국제적으로 실시된 소프트웨어 심사 결과를 이용하였다. 분석 요인으로 IT부서 사원수, ISO 9001 인증여부, 안정성, 경제적 손실도, 보안성, 환경 영향도를 사용하였으며, 본 자료가 범주형이므로 분석 방법으로 통계적인 방법론인 "수량화방법 II"를 이용하였다. 수량화방법 II에서는 요인의 중요도를 나타내는 지표로 범위와 편상관을 사용한다. "범위"를 지표로 할 경우, 보안성이 능력수준과 가장 높은 관련이 있는 것으로 나타났으며, "편상관"을 지표로 할 경우, ISO 9001 인증이 가장 관련이 높은 것으로 나타났다. 이는 보안성이 높게 요구되는 회사의 경우, 품질시스템이 잘 갖춰져 있고, ISO 9001 인증을 받는 둥의 품질관리를 하여 프로세스 능력수준 또한 높게 나왔다고 추론할 수 있다.

  • PDF