• 제목/요약/키워드: tree-based identification

검색결과 199건 처리시간 0.027초

시맨틱 구문 트리 커널을 이용한 생명공학 분야 전문용어간 관계 식별 및 분류 연구 (A Study on the Identification and Classification of Relation Between Biotechnology Terms Using Semantic Parse Tree Kernel)

  • 최성필;정창후;전홍우;조현양
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.251-275
    • /
    • 2011
  • 본 논문에서는 단백질 간 상호작용 자동 추출을 위해서 기존에 연구되어 높은 성능을 나타낸 구문 트리 커널을 확장한 시맨틱 구문 트리 커널을 제안한다. 기존 구문 트리 커널의 문제점은 구문 트리의 단말 노드를 구성하는 개별 어휘에 대한 단순 외형적 비교로 인해, 실제 의미적으로는 유사한 두 구문 트리의 커널 값이 상대적으로 낮아지는 현상이며 결국 상호작용 자동 추출의 전체 성능에 악영향을 줄 수 있다는 점이다. 본 논문에서는 두 구문 트리의 구문적 유사도(syntactic similarity)와 어휘 의미적 유사도(lexical semantic similarity)를 동시에 효과적으로 계산하여 이를 결합하는 새로운 커널을 고안하였다. 어휘 의미적 유사도 계산을 위해서 문맥 및 워드넷 기반의 어휘 중의성 해소 시스템과 이 시스템의 출력으로 도출되는 어휘 개념(WordNet synset)의 추상화를 통한 기존 커널의 확장을 시도하였다. 실험에서는 단백질 간 상호작용 추출(PPII, PPIC) 성능의 심층적 최적화를 위해서 기존의 SVM에서 지원되던 정규화 매개변수 외에 구문 트리 커널의 소멸인자와 시맨틱 구문 트리 커널의 어휘 추상화 인자를 새롭게 도입하였다. 이를 통해 구문 트리 커널을 적용함에 있어서 소멸인자 역할의 중요성을 확인할 수 있었고, 시맨틱 구문 트리 커널이 기존 시스템의 성능향상에 도움을 줄 수 있음을 실험적으로 보여주었다. 특히 단백질 간 상호작용식별 문제보다도 비교적 난이도가 높은 상호작용 분류에 더욱 효과적임을 알 수 있었다.

RFID 시스템에서 비트변화감지를 이용한 하이브리드 충돌 방지 프로토콜 (A Hybrid Anti-Collision Protocol using Bit Change Sensing Unit in RFID System)

  • 김정환;김영태;박용수;안광선
    • 인터넷정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.133-141
    • /
    • 2009
  • RFID 시스템에서 리더의 식별영역 내에 다수개의 태그가 존재할 경우 태그 충돌 문제가 발생할 수 있으며, 따라서 태그 인식에 많은 시간이 필요하다. 태그 충돌 문제는 RFID 시스템 설계 시 가장 중요한 핵심 이슈중의 하나이며 다양한 프로토콜이 제안되고 있다. 일반적인 트리 기반의 프로토콜들은 적합한 프리픽스를 생성하여 태그 인식을 빠르게 하는 것이 목적이다. 본 논문에서는 리더와 태그의 질의-응답 횟수를 줄일 수 있는 QT-BCS 프로토콜을 제안한다. QT-BCS 프로토콜에서는 타임 슬롯과 비트 변화 감지 유닛을 통하여 프리픽스를 생성한다. 식별영역내의 태그들은 이전 비트와 다른 값이 나올 때까지의 비트값을 리더에 전송하도록 설계되고, 리더는 0-슬롯과 1-슬롯에 첫째 비트 값에 따라 비트값을 저장한다. 이와 같은 방법은 질의 프리픽스를 쉽게 추적하므로 질의 횟수를 효과적으로 줄인다. 시뮬레이션 결과 QT-BCS 프로토콜은 Query Tree, 4-ary Query Tree 프로토콜 보다 질의-응답 횟수를 줄여 태그 인식 속도를 빠르게 개선시켰다.

  • PDF

Differentiation of Actinomycete Genera Based on Partial rpoB Gene Sequences

  • Kim, Bum-Joon;Koh, Young-Hwan;Chun, Jong-Sik;Kim, Chang-Jin;Lee, Seung-Hyun;Cho, Moon-Jae;Hyun, Jin-Won;Lee, Keun-Hwa;Cha, Chang-Yong;Kook, Yoon-Hoh
    • Journal of Microbiology and Biotechnology
    • /
    • 제13권6호
    • /
    • pp.846-852
    • /
    • 2003
  • rpoB DNAs (279 bp) from 34 species of 5 actinomycete genera were sequenced and a phylogenetic tree was constructed based on the sequences obtained. The genera were clearly differentiated in the rpoB tree, forming clades specific to their respective genus. In addition, 2 signature amino acid residues specific to Streptomyces were found in a multiple alignment of the deduced amino acid sequences. To empirically confirm that this rpoB gene analysis system could be used to differentiate actinomycete isolates, the proposed system was used to identify 16 actinomycete isolates from Jeju Island. All isolates were successfully differentiated into the genera Streptomyces and Micromonospora. Accordingly, this is the first report that an rpoB sequence analysis has been effectively used to differentiate actinomycete strains at the genus level.

결정 트리를 이용한 지시 표현 '것'의 구별 (Distinguishing Referential Expression 'Geot' Using Decision Tree)

  • 조은경;김학수;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.880-888
    • /
    • 2007
  • 지시 표현 '것'은 한국어 대화에서 자주 등장하는 표현이지만, 그 자체로서 대명사나 한정 명사구와 같은 지시 표현이 아니고, 비지시적인 표현으로 쓰이는 '것'과 구별되지 못했기 때문에 지시 해석(reference resolution)에 관한 기존 연구에서 제대로 다루어지지 못했다. 이러한 문제를 해결하기 위해 '것'이 가지고 있는 언어학적 속성과 담화 상의 속성을 기반으로 하여 자질 집합을 설정하고, 결정트리를 이용하여 '것'을 구별하는 방법을 제안한다. 이 방법에 의한 시스템은 비지시 표현의 것에 대해 92%, 지시표현의 것에 대해 82%의 F-measure를 보였으며, 전체적인 분류 성능은 89%였다. 이는 패턴에 따른 규칙을 적용한 분류 성능에 비해 약 15% 가량 향상된 결과이다.

전기철도 전철전력설비의 위험도 평가 기반 안전관리에 관한 연구 (A Risk Assessment Approach to Safety Management of Electric Railway Facilities)

  • 장윤석;최규형
    • 전기학회논문지
    • /
    • 제58권5호
    • /
    • pp.960-967
    • /
    • 2009
  • Power supply system of electric railway has a diversity of safety problems since it should supply high electric power to the trains moving high speed with a lot of passengers on board. This paper provides a risk assessment approach to safety management of the electric railway facilities. Construction of database from field accident information, risk assessment and management of the risk are carried out systematically to ensure the safety. The risk assessment includes hazard identification, cause analysis by FTA(Fault Tree Analysis), consequence analysis by EVA(Event Tree Analysis), and loss analysis. In terms of the severity and the probability of the accidents deduced by these analyses, the risk of the accidents is assessed by using a risk matrix designed for electric railway facilities. Based on the risk assessment, possible risk mitigation options are identified and evaluated by analyzing their impact on the risk reduction and their cost benefit ratio. The long-term safety of the electric railway facilities can be ensured by renewal of the risk assessment and the risk mitigation option analysis with continuous accident database update. The proposed approach is applied to the electric railway facilities of Korean railway based on the accident data from 2002 to 2008.

실내 환경에서의 주행가능성을 고려한 라이다 기반 이동 로봇 탐사 기법 (LiDAR-based Mobile Robot Exploration Considering Navigability in Indoor Environments)

  • 유혜정;최진우;김태현
    • 로봇학회논문지
    • /
    • 제18권4호
    • /
    • pp.487-495
    • /
    • 2023
  • This paper presents a method for autonomous exploration of indoor environments using a 2-dimensional Light Detection And Ranging (LiDAR) scanner. The proposed frontier-based exploration method considers navigability from the current robot position to extracted frontier targets. An approach to constructing the point cloud grid map that accurately reflects the occupancy probability of glass obstacles is proposed, enabling identification of safe frontier grids on the safety grid map calculated from the point cloud grid map. Navigability, indicating whether the robot can successfully navigate to each frontier target, is calculated by applying the skeletonization-informed rapidly exploring random tree algorithm to the safety grid map. While conventional exploration approaches have focused on frontier detection and target position/direction decision, the proposed method discusses a safe navigation approach for the overall exploration process until the completion of mapping. Real-world experiments have been conducted to verify that the proposed method leads the robot to avoid glass obstacles and safely navigate the entire environment, constructing the point cloud map and calculating the navigability with low computing time deviation.

Identification of Cardiovascular Disease Based on Echocardiography and Electrocardiogram Data Using the Decision Tree Classification Approach

  • Tb Ai Munandar;Sumiati;Vidila Rosalina
    • International Journal of Computer Science & Network Security
    • /
    • 제23권9호
    • /
    • pp.150-156
    • /
    • 2023
  • For a doctor, diagnosing a patient's heart disease is not easy. It takes the ability and experience with high flying hours to be able to accurately diagnose the type of patient's heart disease based on the existing factors in the patient. Several studies have been carried out to develop tools to identify types of heart disease in patients. However, most only focus on the results of patient answers and lab results, the rest use only echocardiography data or electrocardiogram results. This research was conducted to test how accurate the results of the classification of heart disease by using two medical data, namely echocardiography and electrocardiogram. Three treatments were applied to the two medical data and analyzed using the decision tree approach. The first treatment was to build a classification model for types of heart disease based on echocardiography and electrocardiogram data, the second treatment only used echocardiography data and the third treatment only used electrocardiogram data. The results showed that the classification of types of heart disease in the first treatment had a higher level of accuracy than the second and third treatments. The accuracy level for the first, second and third treatment were 78.95%, 73.69% and 50%, respectively. This shows that in order to diagnose the type of patient's heart disease, it is advisable to look at the records of both the patient's medical data (echocardiography and electrocardiogram) to get an accurate level of diagnosis results that can be accounted for.

Molecular identification of Bacillus licheniformis isolates from Korean traditional fermented soybean by the multilocus phylogenetic analysis

  • Moon, Sung-Hyun;Hossain, Md Mukter;Oh, Yeonsu;Cho, Ho-Seong
    • 한국동물위생학회지
    • /
    • 제39권1호
    • /
    • pp.1-6
    • /
    • 2016
  • In this study, Bacillus licheniformis which has been used as probiotics was isolated from Korean traditional fermented soybean. A total of 69 strains were presumptively identified as B. licheniformis by phenotypic methods. Based on PCR amplification and 16S rRNA gene sequencing, the multilocus sequence typing of gyrA and rpoB, followed by phylogenetic analysis was performed. The isolates were distinctly differentiated and found to be closely related to B. amyloliquefaciens, B. subtilis, and B. aerius. The partial 16S rRNA gene sequences of those strains matched those of B. sonorensis (97%) and B. aerius (98%) in the phylogenetic tree. In contrast, multilocus phylogenetic analysis (MLPA) showed that only 61 (86.9%) out of 69 strains were B. licheniformis. The rest of those strains were found to be B. subtilis (5.8%), B. amyloliquefaciens (2.9%), and B. sonorensis (2.9%), respectively. Therefore, our results suggested that since the 16S rRNA gene sequencing alone was not sufficient to compare and discriminate closely related lineages of Bacillus spp., it was required to analyze the MLPA simultaneously to avoid any misleading phenotype-based grouping of these closely related species.

Identification of Regression Outliers Based on Clustering of LMS-residual Plots

  • Kim, Bu-Yong;Oh, Mi-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제11권3호
    • /
    • pp.485-494
    • /
    • 2004
  • An algorithm is proposed to identify multiple outliers in linear regression. It is based on the clustering of residuals from the least median of squares estimation. A cut-height criterion for the hierarchical cluster tree is suggested, which yields the optimal clustering of the regression outliers. Comparisons of the effectiveness of the procedures are performed on the basis of the classic data and artificial data sets, and it is shown that the proposed algorithm is superior to the one that is based on the least squares estimation. In particular, the algorithm deals very well with the masking and swamping effects while the other does not.

결정트리 기반의 기계학습을 이용한 동적 데이터에 대한 재익명화기법 (Re-anonymization Technique for Dynamic Data Using Decision Tree Based Machine Learning)

  • 김영기;홍충선
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.21-26
    • /
    • 2017
  • 사물인터넷, 클라우드 컴퓨팅, 빅데이터 등 새로운 기술의 도입으로 처리하는 데이터의 종류와 양이 증가하면서, 개인의 민감한 정보가 유출되는 것에 대한 보안이슈가 더욱 중요시되고 있다. 민감정보를 보호하기 위한 방법으로 데이터에 포함된 개인정보를 공개 또는 배포하기 전에 일부를 삭제하거나 알아볼 수 없는 형태로 변환하는 익명화기법을 사용한다. 그러나 준식별자의 일반화 수준을 계층화하여 익명화를 수행하는 기존의 방법은 데이터 테이블의 레코드가 추가 또는 삭제되어 k-익명성을 만족하지 못하는 경우에 더 높은 일반화 수준을 필요로 한다. 이와 같은 과정으로 인한 정보의 손실이 불가피하며 이는 데이터의 유용성을 저해하는 요소이다. 따라서 본 논문에서는 결정트리 기반의 기계학습을 적용하여 기존의 익명화방법의 정보손실을 최소화하여 데이터의 유용성을 향상시키는 익명화기법을 제안한다