• 제목/요약/키워드: 통계적인 추론

검색결과 186건 처리시간 0.026초

이변량 프로빗모형을 이용한 미결정자 추론 (Undecided inference using bivariate probit models)

  • 홍종선;정미향
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1017-1028
    • /
    • 2011
  • 신용평가를 판단하기 어렵기 때문에 평가를 유보하고 특별한 전문가에게 재심사를 의뢰하기 위하여 결정이 보류된 미결정자에 대한 미결정자 추론은 신용평가 분야 이외에도 의학통계와 스포츠통계등 대부분의 통계적 모형에서 발생하는 문제이다. 본 연구에서는 미결정자 추론을 비임의결측 가정하에서의 결측자료 유형으로 간주하고, 표본선택모형 중의 하나인 이변량 프로빗모형을 이용한다. 결정된 차주의 특성을 나타내는 확률변수를 사용하여 미결정자를 추론하는 방법과 보다 정확한 정보를 수집한 후 추가적인 확률변수를 사용하여 추론하는 방법을 제안한다. 실증예제를 통하여 특성변수의 조합과 다양한 미결정 구간, 그리고 절단점의 변동에 따라 미결정자와 전체 오분류율을 비교한다. 미결정구간을 확대하거나 정확한 신용정보를 모형에 추가하여 사용하면 정상 집단과 부도 집단의 정보를 더욱 정확하게 반영할 수 있기 때문에 미결정자와 전체 오분류율의 큰 감소효과를 기대할 수 있다.

모바일 사용자의 잠재 관심 추론을 위한 앙상블 기법 (An Ensemble Method for Latent Interest Reasoning of Mobile Users)

  • 최예림;박종헌;신동완
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.706-712
    • /
    • 2015
  • 최근 모바일 서비스에서 콘텐트를 요약 정보가 담긴 리스트 형태로 제공하는 경우가 증가하고 있다. 이에 따라 사용자가 콘텐트에 관심이 있어도 별점이나 클릭과 같은 명시적 혹은 암묵적 관심을 표현하지 않고 요약 정보를 통해 콘텐트를 소비하는 잠재 관심 표현이 대다수를 차지하게 되었다. 따라서 사용자의 관심을 파악하기 위해서는 잠재 관심 콘텐트의 추론이 필수적이다. 본 연구에서는 사용자의 모바일 상의 콘텐트 소비 로그 패턴을 분석하여 잠재 관심 콘텐트를 추론하는 기법을 제안한다. 특히, 실제 서비스에 적용 시 잘못된 관심 추론은 치명적일 수 있다는 점에서 추론의 정밀도를 극대화시키기 위해 서로 다른 특성을 반영한 다수의 분류기가 모두 동의한 경우에 잠재 관심 콘텐트로 추론하는 만장일치 앙상블 방식을 도입한다. 자체 제작한 어플리케이션으로부터 콘텐트 소비 로그를 수집하였으며 이를 이용하여 제안 방법론의 우수한 성능을 확인하였다. 이러한 잠재 관심 아이템의 정확한 도출은 사용자의 관심에 기초한 추천 시스템과 같은 개인화 서비스의 질 향상에 기여할 것이다.

평균 벡터의 평활함수모형에 대한 안부점근사 -스튜던트화 분산을 중심으로- (Saddlepoint Approximation to the Smooth Functions of Means Model)

  • 나종화;김주성
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.333-344
    • /
    • 2001
  • 통계적 추론에 사용되는 많은 통계량들은 평균벡터의 평활함수의 형태로 표현이 가능하다. 본 연구에서는 이들 통계량들의 분포함수에 대한 안부점근사법을 제시하였다. 이 방법은 Na(1998)에서 제시된 일반적 통계량의 분포함수에 대한 안부점근사법이 평균벡터의 평활함수모형에 특히 유용하게 사용될 수 있음을 보인 것이다. 이 근사법은 정규근사에 비해 근사의 정도가 뛰어나며, 특히 통계량의 꼬리부분의 확률에 대해서도 정확도가 그대로 유지되는 장점이 있어 정밀한 추론이 요구되는 많은 문제에 효과적으로 사용될 수 있다. 모의 실험에 사용할 평균벡터의 평활함수 모형으로는 스튜던트화 분산을 고려하였다.

  • PDF

비례위험모형분석을 위한 한글멀콕스(HMULCOX)

  • 이상복;박의준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제7권1호
    • /
    • pp.145-159
    • /
    • 1996
  • 다변량 발병시간자료는 각 개개 환자에게 있어 합병증이 발생되거나 혹은 유사 환자군(집락) 내의 발병시간이 상관되어진 생의학자료에서 흔히 볼 수 있다. HMULCOX는 그런 자료를 분석하기 위한 한글 통계 패키지 가운데 하나이다. 이 프로그램은 관련된 발병시간들이 독립이 아닐때에도 COX 비례 위험 모형의 주변확률분포를 계산해 준다. 주어진 조건으로는 주변확률모형의 기본위험율은 일정한 상수, 흑은 변수라도 관계없다. 또한 치료실패율의 치료변수들(공변량)의 효과에 대해 다양한 통계적 추론이 가능하다. 기본적으로 주변확률분포접근법으로 설계되었지만 HMULCOX는 여러 가지 추론 방법을 선택하는 데 일반적으로 충분하다. 이 프로그램으로 2개의 예를 들어 실행하겠다.

  • PDF

후방향 추론기법을 이용한 시멘틱 추론 시스템 (Semantic Inference System Using Backward Chaining)

  • 함영경;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.97-99
    • /
    • 2003
  • 대부분의 웹 문서들은 HTML이나 XML로 표현된 웹의 정보들은 Syntactic 구조를 기반으로 표현되기 때문에, 소프트웨어가 정보를 처리하는데 한계가 있다. HTML은 문서의 display안을 위한 tag기반의 문서 표현 방식이고, XML은 문서의 구조를 사람이 이해하기 쉽도록 제안된 표현 방식이기 때문이다. 따라서, HTML 및 XML로 표현된 정보들을 가지고 서비스를 제공하는 웹 에이전트들은 사용자들에게 의미있는 서비스를 제공하기 위해 오프라인 상에서 많은 수작업을 수행해야만 했다. 이와 같은 문제점을 극복하기 위해서 미국과 유럽에서는 시멘틱 웹에 대한 연구를 활발히 진행하고 있다. 시멘틱 웹은 기존의 웹과는 달리 소프트웨어가 이해하고 처리 할 수 있는 형태(machine processable)로 정보를 표현하기 때문에 오프라인 상에서 수행되던 많은 작업들을 에이전트가 이해하고 처리할 수 있게 되었다. 그러나. 온톨로지를 구축하는 과정에서도 필연적으로 정보의 31(Incorrect, incomplete, Inconsistence)가 나타나고, 서비스의 결과 또한 온톨로지에 의해 좌우된다는 단점이 있다. 본 논문에서 제안하는 후방향 추론기법을 이용한 추론엔진은 다음과 같은 시스템을 제안한다. 첫째. 시멘틱 웹을 이용함으로써 소프트웨어 에이전트의 자동화 시스템을 제안한다. 둘째 은톨로지 정보의 한계성을 극복하기 위해 규칙기반의 후방향 추론 기법을 사용하는 시멘틱 추론엔진을 제안한다. 본 논문에서 제안하는 후방향 추론기법을 이용한 시멘틱 추론시스템은 사용자의 질의를 입력받아. 온톨로지와 시멘틱 웹 문서의 정보를 이용하여 후방향 추론을 수행함으로써 웹 정보의 불완전성을 완화하고, 온톨로지의 영향력를 감소시킴으로써 웹 서비스의 질을 향상시키는데 목적이 있다.RED에 비해 향상된 성능을 보여주었다.웍스 네트워크상의 다양한 디바이스들간의 네트워크 다양화와 분산화 기능을 얻을 수 있었고, 기존의 고가의 해외 솔루션인 Echelon사의 LonMaker 소프트웨어를 사용하지 않고도 국내의 순수 솔루션인 리눅스 기반의 LonWare 3.0 다중 바인딩 기능을 통해 저 비용으로 홈 네트워크 구성 관리 서버 시스템 개발에 대한 비용을 줄일 수 있다. 기대된다.e 함량이 대체로 높게 나타났다. 점미가 수가용성분에서 goucose대비 용출함량이 고르게 나타나는 경향을 보였고 흑미는 알칼리가용분에서 glucose가 상당량(0.68%) 포함되고 있음을 보여주었고 arabinose(0.68%), xylose(0.05%)도 다른 종류에 비해서 다량 함유한 것으로 나타났다. 흑미는 총식이섬유 함량이 높고 pectic substances, hemicellulose, uronic acid 함량이 높아서 콜레스테롤 저하 등의 효과가 기대되며 고섬유식품으로서 조리 특성 연구가 필요한 것으로 사료된다.리하였다. 얻어진 소견(所見)은 다음과 같았다. 1. 모년령(母年齡), 임신회수(姙娠回數), 임신기간(姙娠其間), 출산시체중등(出産時體重等)의 제요인(諸要因)은 주산기사망(周産基死亡)에 대(對)하여 통계적(統計的)으로 유의(有意)한 영향을 미치고 있어 $25{\sim}29$세(歲)의 연령군에서, 2번째 임신과 2번째의 출산에서 그리고 만삭의 임신 기간에, 출산시체중(出産時體重) $3.50{\sim}3.99kg$사이의 아이에서 그 주산기사망률(周産基死亡率)이 각각 가장 낮았다. 2. 사산(死産)과 초생아사망(初生兒死亡)을 구분(區分)하여 고려해 볼때 사산(死産)은 모성(母性)의 임신력(姙娠歷)과 매우 밀접한 관련이 있는 것으

  • PDF

불균형 자료의 $3\times3$ 교차설계법에서 생물학적 동등성 평가 (Assessing Bioequivalence in $3\times3$ Cross-over Design with Unbalanced Data)

  • 임남규;박상규
    • 응용통계연구
    • /
    • 제14권2호
    • /
    • pp.345-355
    • /
    • 2001
  • 동일한 유효성분을 가지면서 용량 혹은 형식 만이 다른 제제의 개발이 증가되고 이에 따른 두 제제 이상의 생물학적 동등성시험의 필요성이 제기되었다. 이에 이용주 등(1998)은 온단세트론 제제에 대한 생물학적 동등시험에서 3$\times$3 교차설계법을 적용하였다. 그러나 3$\times$3 교차설계법에서 각 순서에 피험자의 수가 다르거나 실험중에 결락(dropout)되는 피험자가 발생하는 경우에는 일반적인 통계적 방법은 적용할 수 없었다. 본 연구에서는 이러한 경우에 제제효과의 추론에 대한 통계적 방법과 생물학적 동등성 시험 방법을 제안하고 모의실험을 통하여 생물학적 동등성평가의 정도를 측정하였다.

  • PDF

Quad 분석법을 이용한 직물 촉감의 주관적 평가 (Subjective Evaluation of Fabric Tactile Properties Using Quad Analysis)

  • 김주용
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2003년도 춘계학술대회 논문집
    • /
    • pp.5-7
    • /
    • 2003
  • 의류용 섬유제품의 쾌적성을 객관적으로 측정하려는 시도가 계속되고 있지만, 아직 소비자의 미묘한 차이를 검출하는 능력을 재현하기에는 거리가 있어 보인다. 객관적 측정법들은 재현성과 신뢰성 면에서 제각기 자신들의 우수한 성능을 자랑하지만, 검출능력의 민감성은 주관적 평가에 훨씬 못 미치고 있기 때문에 비현실적인 경우가 많다. 본 연구의 목적은 주관적 평가의 신뢰성을 높이고 통계적인 추론이 가능한 보다 진보된 형식의 주관적 평가법을 개발하고 의류용 직물의 촉감평가에 응용하는 것이다. 국내에서 생산되는 여름용 캐쥬얼 웨어를 대상으로 여러 형태의 주관적 평가법을 적용하여 그 촉감을 평가하였다. 평정척도법, 표준 비교법, 순위법, Thurstone일대 비교법, Quad 분석법 등을 순차적으로 적용하여 평가자 판단의 일관성 여부, 평가자간의 일치성 여부, 재현성 및 논리성 여부를 통계적으로 평가한 후 이를 통과한 평가자들을 대상으로 실험을 반복한 후, 직물 촉감과 관련된 물리적 속성들과의 관련성을 고찰하였다.

  • PDF

계단적 충격 생명검사에 관한 연구 (A study on the step stress life testing)

  • 이석훈
    • 응용통계연구
    • /
    • 제2권2호
    • /
    • pp.61-78
    • /
    • 1989
  • 정상조건에서 수명이 상당히 긴 개체의 생명검사(Life Test)를 현실적으로 수행하기 위하여 제안된 충격생명검사에 관하여 고찰하였다. 생명검사의 결과로 얻는 자료의 통계적 분석을 위하여 이미 제안된 모형의 검토와 이들을 일면 포함하는 모형을 제시하고 그에 따르는 통계적 추론 과정을 최대우도추정법과 가중최소자승법을 사용하여 토의하였다. 한편 검사를 계획할 때 발생하는 실험설계의 문제를 검토하고 단순 계단적 충격검사에서 잘려진 자료(Consored Data)를 포함한 경우를 연구하였다.

  • PDF

IL-2 역가의 통계적 추정에 관한 연구 (A Study on statistical inference on IL-2 titer)

  • 박래현;박석영;이석훈
    • 응용통계연구
    • /
    • 제2권2호
    • /
    • pp.27-35
    • /
    • 1989
  • 최근 암의 면역치료 요법에 사용이 활발히 시도되고 있는 IL-2(Interleukin-2)의 역가를 측정하는 문제를 통계적 모형을 통하여 정립하고 그 모형하에서 모수의 함수로 표현되는 역가의 추론과정을 연구하였다. 표준시료와 비교하여, 환자로부터 얻은 미지의 시료의 역가를 구하기 위하여 선형모형을 제시하고 베이지안 기법을 사용하여 계수들의 함수로 나타내지는 역가의 신뢰구간을 구하였으며 실제 데이타에 적용하여 보았다.

  • PDF

소프트웨어 프로세스 능력수준의 관련 요인 분석 (An Analysis of Factors Related with Software Process Capability Levels)

  • 임이경;정호원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.555-558
    • /
    • 2000
  • 소프트웨어 프로세스 능력 수준에 영향을 미치는 요인을 찾아내어, 강점은 격려하고 약점을 개선하는 프로세스 개선활동은 기업의 경쟁력 향상을 위하여 매우 중요한 일이다. 본 연구에서는 이러한 요인을 찾아내기 위하여 SPICE(ISO/IEC 15504) 프로젝트에서 국제적으로 실시된 소프트웨어 심사 결과를 이용하였다. 분석 요인으로 IT부서 사원수, ISO 9001 인증여부, 안정성, 경제적 손실도, 보안성, 환경 영향도를 사용하였으며, 본 자료가 범주형이므로 분석 방법으로 통계적인 방법론인 "수량화방법 II"를 이용하였다. 수량화방법 II에서는 요인의 중요도를 나타내는 지표로 범위와 편상관을 사용한다. "범위"를 지표로 할 경우, 보안성이 능력수준과 가장 높은 관련이 있는 것으로 나타났으며, "편상관"을 지표로 할 경우, ISO 9001 인증이 가장 관련이 높은 것으로 나타났다. 이는 보안성이 높게 요구되는 회사의 경우, 품질시스템이 잘 갖춰져 있고, ISO 9001 인증을 받는 둥의 품질관리를 하여 프로세스 능력수준 또한 높게 나왔다고 추론할 수 있다.

  • PDF