• Title/Summary/Keyword: 확률 추론

Search Result 274, Processing Time 0.037 seconds

Undecided inference using logistic regression for credit evaluation (신용평가에서 로지스틱 회귀를 이용한 미결정자 추론)

  • Hong, Chong-Sun;Jung, Min-Sub
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.2
    • /
    • pp.149-157
    • /
    • 2011
  • Undecided inference could be regarded as a missing data problem such as MARand MNAR. Under the assumption of MAR, undecided inference make use of logistic regression model. The probability of default for the undecided group is obtained with regression coefficient vectors for the decided group and compare with the probability of default for the decided group. And under the assumption of MNAR, undecide dinference make use of logistic regression model with additional feature random vector. Simulation results based on two kinds of real data are obtained and compared. It is found that the misclassification rates are not much different from the rate of rawdata under the assumption of MAR. However the misclassification rates under the assumption of MNAR are less than those under the assumption of MAR, and as the ratio of the undecided group is increasing, the misclassification rates is decreasing.

A Method of Ontology Inference based on Bayesian Probability for Decision Making of Intelligent Home Agents (지능형 홈 에이전트의 의사결정을 위한 베이지안 확률기반 온톨로지 추론 방법)

  • Lim, Sung-Soo;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.357-361
    • /
    • 2007
  • 지능형 에이전트가 홈네트워크 환경 속에서 사용자에게 적절한 서비스를 제공하기 위해서는 에이전트가 속한 환경에 대한 모델이 필요하다. 온톨로지는 이러한 환경 모델을 표현하기 위한 유용한 도구로 복잡한 도메인의 조직적 구조 표현에 있어서 뛰어난 성능을 보여준다. 하지만 전통적 온톨로지는 크리스프 로직에 기반하기 때문에 현실세계의 불확실성을 표현하기에는 적합하지 않다. 본 논문에서는 온톨로지의 이러한 한계점을 보완하고, 불확실한 환경 속에서 지능형 홈 에이전트가 적절한 의사결정을 내릴 수 있도록 하는 베이지안 네트워크기반 온톨로지 추론 방법을 제안한다. 제안하는 방법에서는 온톨로지의 클래스 객체를 베이지안 네트워크의 노드로 나타내고, 객체 속성(object property)을 아크로 표현함으로써, 확률적 추론이 가능한 온톨로지를 제공한다. 몇 가지 시나리오와 설계 복잡도 분석을 통해서 제안하는 방법의 유용성을 평가한다.

  • PDF

Bayesian Inference Model for Landmark Detection on Mobile Device (모바일 디바이스 상에서의 특이성 탐지를 위한 베이지안 추론 모델)

  • Hwang Keum-Sung;Cho Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.127-129
    • /
    • 2006
  • 모바일 디바이스에서 얻을 수 있는 로그에는 다양한 개인정보가 풍부하게 포함되어 있으면서도 제약이 많아 활용이 어렵다. 그 동안은 모바일 장치의 용량, 파워의 제약과 정보 분석의 어려움으로 로그 정보를 무시해온 것이 일반적이었다. 본 논문에서는 모바일 디바이스의 다양한 로그 정보를 분석하여 사용자에게 의미 있는 상황(특이성)을 탐지해낼 수 있는 정보 분석 방법을 제안한다. 불확실한 상황에서의 정확성 향상을 위해 규칙/패턴 분석에 의한 특이성 추론뿐만 아니라 베이지안 네트워크를 활용한 확률적인 접근 방법을 활용한다. 이때, 복잡하지 않고 연산이 효율적으로 이루어질 수 있도록 BN을 모듈화하고 모듈화된 BN의 상호보완적인 확률 추론을 위한 BN 처리 과정을 제안한다. 그리고, 특이성 추출 모듈을 주기적으로 업데이트함으로써 성능을 향상시키기 위한 학습알고리즘을 소개한다.

  • PDF

Reduction of Approximate Rule based on Probabilistic Rough sets (확률적 러프 집합에 기반한 근사 규칙의 간결화)

  • Kwon, Eun-Ah;Kim, Hong-Gi
    • The KIPS Transactions:PartD
    • /
    • v.8D no.3
    • /
    • pp.203-210
    • /
    • 2001
  • These days data is being collected and accumulated in a wide variety of fields. Stored data itself is to be an information system which helps us to make decisions. An information system includes many kinds of necessary and unnecessary attribute. So many algorithms have been developed for finding useful patterns from the data and reasoning approximately new objects. We are interested in the simple and understandable rules that can represent useful patterns. In this paper we propose an algorithm which can reduce the information in the system to a minimum, based on a probabilistic rough set theory. The proposed algorithm uses a value that tolerates accuracy of classification. The tolerant value helps minimizing the necessary attribute which is needed to reason a new object by reducing conditional attributes. It has the advantage that it reduces the time of generalizing rules. We experiment a proposed algorithm with the IRIS data and Wisconsin Breast Cancer data. The experiment results show that this algorithm retrieves a small reduct, and minimizes the size of the rule under the tolerant classification rate.

  • PDF

Probability Inference Heuristic based Non-Periodic Transmission for the Wireless Sensor Network (무선센서네트워크를 위한 확률추론 휴리스틱기반 비주기적 전송)

  • Kim, Gang-Seok;Lee, Dong-Cheol
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.9
    • /
    • pp.1689-1695
    • /
    • 2008
  • The development of low-power wireless communication and low-cost multi-functional smart sensor has enabled the sensor network that can perceive the status information in remote distance. Sensor nodes are sending the collected data to the node in the base station through temporary communication path using the low-cost RF communication module. Sensor nodes get the energy supply from small batteries, however, they are installed in the locations that are not easy to replace batteries, in general, so it is necessary to minimize the average power consumption of the sensor nodes. It is known that the RF modules used for wireless communication are consuming 20-60% of the total power for sensor nodes. This study suggests the probability inference heuristic based non-periodic transmission to send the collected information to the base station node, when the calculated value by probability is bigger than an optional random value, adapting real-time to the variation characteristics of sensing datain order to improve the energy consumption used in the transmission of sensed data. In this transmission method suggested, transmitting is decided after evaluation of the data sensed by the probability inference heuristic algorithm and the directly sensed data, and the coefficient that is needed for its algorithm is decided through the reappearance rate of the algorithm verification data.

EVALUATION OF FREQUENTIST AND BAYESIAN INFERENCES BY RELEVANT SIMULATION (베이지안 방법을 포함한 일반적 통계 추론에 대한 상관모의를 이용한 평가방법)

  • 김윤태
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2000.11a
    • /
    • pp.41-62
    • /
    • 2000
  • 현실적으로 통계추론 방법의 적용시, 그 정당성이 보장되는 기본가정이외에도 추가적인 가정이 불가피하여, 본래의 정당성이 퇴색되는 경우가 흔히 발생한다. 따라서 이런 경우에는 통계추론의 평가가 필수적일 것이나, 많은 경우에 분석적 평가를 하기에는 너무 복잡하여, 특정상황을 상정한 모의분석 평가가 주류를 이루고 있다. 본 고에서는 보다 일반적 상황에서의 통계추론의 평가를 위해 브트스트랩방법과 같이 관찰값에 의존한 모의방법(observation-based simulation)을 이용한 평가방법을 제안한다. 우선 설득력 있는 평가요소로서 구간추정시 포함확률(coverage probability)와 같은 빈도성질(frequency property)를 선택하였다. 빈도성질은 고전적 통계추론은 물론 베이지안 통계추론을 대상으로도 의미있는 평가기준으로 판단되는 바, 이를 평가요소로서 선택하고, 이의 추정을 위한 방법과, 그 추정결과의 해석과 나아가 이를 기준으로 한 통계추론 결과의 조정 방법까지 일련의 절차에 대한 방법론을 제시하였다.

  • PDF

Saddlepoint Approximation to the Smooth Functions of Means Model (평균 벡터의 평활함수모형에 대한 안부점근사 -스튜던트화 분산을 중심으로-)

  • 나종화;김주성
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.333-344
    • /
    • 2001
  • 통계적 추론에 사용되는 많은 통계량들은 평균벡터의 평활함수의 형태로 표현이 가능하다. 본 연구에서는 이들 통계량들의 분포함수에 대한 안부점근사법을 제시하였다. 이 방법은 Na(1998)에서 제시된 일반적 통계량의 분포함수에 대한 안부점근사법이 평균벡터의 평활함수모형에 특히 유용하게 사용될 수 있음을 보인 것이다. 이 근사법은 정규근사에 비해 근사의 정도가 뛰어나며, 특히 통계량의 꼬리부분의 확률에 대해서도 정확도가 그대로 유지되는 장점이 있어 정밀한 추론이 요구되는 많은 문제에 효과적으로 사용될 수 있다. 모의 실험에 사용할 평균벡터의 평활함수 모형으로는 스튜던트화 분산을 고려하였다.

  • PDF

위험률의 변화점모형에 대한 추론

  • 정광모;한미혜
    • Communications for Statistical Applications and Methods
    • /
    • v.5 no.2
    • /
    • pp.477-489
    • /
    • 1998
  • 위험률 변화점모형에 대해 변화점의 최우추정을 고려하였다. 추정량의 점근분포 및 붓스트랩 분포의 성질을 알아보고 변화점의 신뢰구간을 제안한다. 변화점의 위치 및 변화점을 전후하여 위험률의 값에 따라 모의실험을 수행하고 포함확률을 조사하였다. 추정량의 점근분포가 매우 복잡하기 때문에 이를 직접 이용한 변화점의 통계적 추론이 매우 어려운 점을 감안할 때 제안된 방법은 바람직한 대안이 될 수 있다.

  • PDF

불균등확률표본에서 붓스트랩

  • 정주경;김규성
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2000.11a
    • /
    • pp.39-43
    • /
    • 2000
  • 분산 추정 및 신뢰구간 추정의 한 방법으로 널리 쓰이고 있는 붓스트랩 방법을 복합표본에 적용하는 방법에 대해 알아보았다. 복합 표본은 유한 모집단에서 추출되고 추출확률이 다르기 때문에 i.i.d. 표본에 기초하여 개발된 전통적인 붓스트랩 방법을 직접 적용하면 추론의 오류가 발생할 수 있다. 본 연구에서는 복원 확률비례표본과 랜덤그룹표본에 붓스트랩을 적용하는 방법을 알아보았다.

  • PDF

Probability and statistics in public secondary school teacher employment exam (확률 및 통계와 교원임용시험)

  • Oh, Kwangsik
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.6
    • /
    • pp.1539-1545
    • /
    • 2017
  • In this paper, we analyze and discuss the trend of the probability and statistics problems that have been made in the public secondary school teacher employment exam for mathematics teachers. In order to properly teach the national mathematics curriculum in 2015 in terms of content and function, we investigate the probability and statistics contents that a mathematics teachers should know. We also analyze the contents and trends of the items that have been submitted for 15 years in public secondary school teacher employment exam, and discuss the contents, scope, level and direction of the future contents. In conclusion, considering the significance of the Big Data in the 4th industrial revolution, the problems of statistical thinking of data and probability, exploratory data analysis, sample survey, and statistical inference are needed more.