• 제목/요약/키워드: discovering probability

검색결과 18건 처리시간 0.028초

신종발견확률의 경험적 베이지안 추정에 관한 연구 (Empirical Bayes Estimation of the Probability of Discovering a New Species)

  • Joo Ho Lee
    • 응용통계연구
    • /
    • 제7권1호
    • /
    • pp.159-172
    • /
    • 1994
  • 여러개의 종으로 구성된 모집단으로부터 일정 크기의 표본을 추출한 경우 다음에 관측된 종이 신종일 확률에 대한 추정량으로 가장 널리 사용되어 온 것은 Good의 추정량이다. 본 논문에서는 종의 총 수효에 관한 사전정보가 존재할 경우 Good의 추정량에 대한 대안으로서 새로운 경험적 베이지안 추정량을 제안하였다. 모집단이 절단 기하분포를 따를 경우의 소표본 시뮬레이션 결과는 새로운 추정량의 편의가 별로 크지 않으며 RMSE가 Good의 추정량보다 작음을 보여 주었다.

  • PDF

Structural damage identification based on modified Cuckoo Search algorithm

  • Xu, H.J.;Liu, J.K.;Lv, Z.R.
    • Structural Engineering and Mechanics
    • /
    • 제58권1호
    • /
    • pp.163-179
    • /
    • 2016
  • The Cuckoo search (CS) algorithm is a simple and efficient global optimization algorithm and it has been applied to figure out large range of real-world optimization problem. In this paper, a new formula is introduced to the discovering probability process to improve the convergence rate and the Tournament Selection Strategy is adopted to enhance global search ability of the certain algorithm. Then an approach for structural damage identification based on modified Cuckoo search (MCS) is presented. Meanwhile, we take frequency residual error and the modal assurance criterion (MAC) as indexes of damage detection in view of the crack damage, and the MCS algorithm is utilized to identifying the structural damage. A simply supported beam and a 31-bar truss are studied as numerical example to illustrate the correctness and efficiency of the propose method. Besides, a laboratory work is also conducted to further verification. Studies show that, the proposed method can judge the damage location and degree of structures more accurately than its counterpart even under measurement noise, which demonstrates the MCS algorithm has a higher damage diagnosis precision.

Development of PCR-Based Screening Methods for Macrolide Type Polyketides in Actinomycetes

  • Hyun, Chang-Gu;Suh, Joo-Won
    • Journal of Applied Biological Chemistry
    • /
    • 제42권3호
    • /
    • pp.119-124
    • /
    • 1999
  • About two thirds of the naturally occurring antibiotics have been discovered from actinomycetes. Therefore, the probability of discovering further new antibiotics from actinomycetes is declining as many known metabolites are isolated repeatedly. However, various efforts leave been made in order to enhance the probability of discovering novel compounds. In the present study, we have developed new screening strategies based on the antibiotic biosynthetic pathway, and the genetic information, utilizing polymerase chain reaction. We have selected macrolide type polyketides. In order to divide the ansamycin group antibotic of macrolide type polyketides, we have selected 3-amino-5-hydroxybenzoic acid (AHBA) moiety which contains a biosynthetically unique structural element in the group as a target molecules. Oligonucleotide primers were designed to amplify DNA fragments of macrolide type polyketide synthase and AHBA synthase genes from fourteen actinomycetes species. This method was successfully applied to all three of the known macrolide type polyketide produccing actinomycetes tested. In addition, it also identified the presence of potential macrolide type polyketide producing genes from seven actinomycetes that were known to produce none of macrolide type polyketides, and AHBA biosynthetic genes in one actinomycetes. This technique is potentially useful for the screening of new antibiotices and cloning of their biosynthetic genes.

  • PDF

링크확률과 개체명 인식을 이용한 영-한 교차언어 링크 탐색 (English-Korean Cross-lingual Link Discovery Using Link Probability and Named Entity Recognition)

  • 강신재
    • 한국지능시스템학회논문지
    • /
    • 제23권3호
    • /
    • pp.191-195
    • /
    • 2013
  • 본 논문에서는 방대한 웹 자원의 연결성을 더욱 증가시키기 위해 영어 위키피디아 문서로부터 한국어 위키피디아 문서로의 교차언어 링크를 자동으로 탐색하는 방법을 제안한다. 어구의 링크확률을 대략 추정하여 사용하던 기존의 방법에 비해, 본 연구에서는 위키피디아 문서 집합으로부터 추출한 제목 목록과 링크 확률과 같은 다양한 정보들과 개체명 인식 결과를 함께 사용하여 링크가 걸릴 앵커 후보를 선택한다. 앵커 후보를 한국어 대역어로 번역한 후, 대역어에 가장 적합한 한국어 웹문서를 찾아 교차언어 링크로 설정하게 된다. 실험한 결과 MAP 수치로 0.375를 얻었다.

신종발견확률의 편의보정 비모수 최우추정량에 관한 연구 (On asymptotics for a bias-corrected version of the NPMLE of the probability of discovering a new species)

  • 이주호
    • 응용통계연구
    • /
    • 제6권2호
    • /
    • pp.341-353
    • /
    • 1993
  • 여러 개의 종으로 구성된 모집단에서 일정 크기의 표본을 추출하였을 경우, 다음차례에 뽑힐 종이 새로운 종이 될 조건부확률의 추정량으로서 가장 널리 사용되어 온 것은 Good(1953)이 경험적 베이지안 접근법을 사용하여 제안한 비모수추정량이다. Clayton과 Frees(1987)는 Good의 추정량에 대한 대안으로서 비모수최우추정량을 제안하고, 시뮬레이션을 통해 모집단이 비교적 불균일할 경우 자신들이 제안한 추정량이 Good의 추정량보다 평균제곱오차가 작음을 보여 주었고, Lee(1989)는 모집단이 균등분포에 비교적 가깝지 않은 절단기하분포를 따를 때 이를 점근적으로 규명하였다. 그러나 비모수최우추정량은 상당한 편의를 지니고 있는데, 본 연구에서는 이 편의의 일부를 보정한 새로운 추정량이 대부분의 모집단분포 형태에 있어 비모수최우추정량보다 평균제곱오차가 작으며, 모집단이 균일분포에 아주 가까운 경우를 제외하고는 Good의 추정량보다도 평균제곱오차가 작음을 점근적으로 규명하고, 이를 소표본 시뮬레이션을 통하여 확인하였다.

  • PDF

실시간 프로젝트 위험관리를 위한 베이지안 네트워크 모형의 개발 (Developing a Bayesian Network Model for Real-time Project Risk Management)

  • 김지영;안선응
    • 산업공학
    • /
    • 제24권2호
    • /
    • pp.119-127
    • /
    • 2011
  • Most companies have been increasing temporary work projects to maximize the usage of their resources. They also have been developing the effective techniques for analyzing and managing the state of the projects. In order to monitor the state of a project in real-time and predict the project's future state more accurately, this paper suggests the Bayesian Network (BN) as a tool for discovering the causes of project risk and presenting the failure probability of the project. The proposed BN modeling method with consideration of the Earned Value Management (EVM) method shows how to induce the predictive and conditional probability of the risk occurrence in the future. The advantages of the suggested model are (1) that the cause of a project risk can be easily figured out via the BN, (2) that the future value of the project can be sufficiently increased by updating relevant components of the project, and (3) that more credible prediction can be made in the similar and future situation by using the data obtained in current analysis. A numerical example is also given.

Experimental Evaluation of Distance-based and Probability-based Clustering

  • Kwon, Na Yeon;Kim, Jang Il;Dollein, Richard;Seo, Weon Joon;Jung, Yong Gyu
    • International journal of advanced smart convergence
    • /
    • 제2권1호
    • /
    • pp.36-41
    • /
    • 2013
  • Decision-making is to extract information that can be executed in the future, it refers to the process of discovering a new data model that is induced in the data. In other words, it is to find out the information to peel off to find the vein to catch the relationship between the hidden patterns in data. The information found here, is a process of finding the relationship between the useful patterns by applying modeling techniques and sophisticated statistical analysis of the data. It is called data mining which is a key technology for marketing database. Therefore, research for cluster analysis of the current is performed actively, which is capable of extracting information on the basis of the large data set without a clear criterion. The EM and K-means methods are used a lot in particular, how the result values of evaluating are come out in experiments, which are depending on the size of the data by the type of distance-based and probability-based data analysis.

BAYESIAN CLASSIFICATION AND FREQUENT PATTERN MINING FOR APPLYING INTRUSION DETECTION

  • Lee, Heon-Gyu;Noh, Ki-Yong;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.713-716
    • /
    • 2005
  • In this paper, in order to identify and recognize attack patterns, we propose a Bayesian classification using frequent patterns. In theory, Bayesian classifiers guarantee the minimum error rate compared to all other classifiers. However, in practice this is not always the case owing to inaccuracies in the unrealistic assumption{ class conditional independence) made for its use. Our method addresses the problem of attribute dependence by discovering frequent patterns. It generates frequent patterns using an efficient FP-growth approach. Since the volume of patterns produced can be large, we propose a pruning technique for selection only interesting patterns. Also, this method estimates the probability of a new case using different product approximations, where each product approximation assumes different independence of the attributes. Our experiments show that the proposed classifier achieves higher accuracy and is more efficient than other classifiers.

  • PDF

부분적 주변 비율에 의한 확률적 흥미도 측도 기반 유사성 측도의 상한 및 하한의 설정 (Bounds of PIM-based similarity measures with partially marginal proportion)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권4호
    • /
    • pp.857-864
    • /
    • 2015
  • 데이터 마이닝은 다양한 형태의 방대한 데이터 집합으로부터 보이지 않는 지식이나 새로운 법칙을 발견한 후, 이를 바탕으로 의사결정 등을 위한 정보로 활용하고자 하는 것이다. 데이터 마이닝 기법중의 하나인 군집 분석은 거리 또는 유사성 측도를 이용하여 집단을 분류하고, 구분된 각 집단의 특성을 파악하기 위한 기법이다. 본 논문에서는 주변 확률이 일부 포함된 확률적 흥미도 측도 기반의 유사성 측도들인 Peirce I, Peirce II, Cole I, Cole II, 그리고 이들을 응용한 Park I 및 Park II에 대한 대소 관계를 수식의 증명뿐만 아니라 예제 데이터에 의해서도 규명하였다. 그 결과, Cole I과 Cole II의 측도를 동시에 고려한 Loevinger 측도가 기존의 측도들 중에서는 상한이 되나 Park I 및 Park II를 함께 고려했을 경우에는 동시발생비율, 동시 비발생비율, 그리고 두 가지 형태의 불일치비율의 크기에 따라 변한다는 사실을 확인하였다.

MANET에서 이격 비율과 노드 밀집도에 기반한 동적 확률을 적용한 브로드캐스팅 기법 (Dynamically Adjusted Probabilistic Broadcasting Mechanism based on Distance Ratio and Node Density for MANETs)

  • 김재수
    • 한국멀티미디어학회논문지
    • /
    • 제16권9호
    • /
    • pp.1077-1088
    • /
    • 2013
  • 브로드캐스팅은 한 노드가 모든 노드들에게 패킷을 전달하는 과정으로, 모바일 애드 혹 네트워크(MANET)에서 경로 탐색과 제어 정보 메시지 전송과 같은 서비스를 위하여 많이 사용되는 기본 작업이다. 본 논문에서는 MANET에서 송수신 노드 사이의 이격 비율과 노드 밀집도에 따라 동적으로 재전송 확률 값을 구하는 브로드캐스팅 기법을 제안한다. 이격 비율은 송수신 노드사이의 거리와 무선 전파의 전달 거리에 대한 비율을 계산하며, 노드 밀집도는 1-홉 단위의 이웃 노드의 수를 계산한다. 패킷을 수신한 노드는 송신노드로부터의 이격 비율과 자신의 노드 밀집도을 고려하여 재전송 확률을 결정하는데, 송신자에 가까운 노드와 노드 밀집도가 높은 노드는 낮은 재전송 확률 값을 부여하여 패킷의 조기 소멸을 통해 재전송 패킷의 수를 줄이도록 한다. 플러딩 기법과 고정된 확률 값 기법과의 성능 비교를 통하여 제안 기법이 다른 방법보다 우수한 성능을 보여주었는데, 제안 기법은 플러딩에 비하여 30% 이상의 패킷 전송을 감소시킬 수 있었으며, 96%에 가까운 패킷의 도착율을 보여주었다.