• 제목/요약/키워드: Scoring algorithm

검색결과 66건 처리시간 0.026초

Development and Application of Protein-Protein interaction Prediction System, PreDIN (Prediction-oriented Database of Interaction Network)

  • 서정근
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2002년도 제1차워크샵
    • /
    • pp.5-23
    • /
    • 2002
  • Motivation: Protein-protein interaction plays a critical role in the biological processes. The identification of interacting proteins by bioinformatical methods can provide new lead In the functional studies of uncharacterized proteins without performing extensive experiments. Results: Protein-protein interactions are predicted by a computational algorithm based on the weighted scoring system for domain interactions between interacting protein pairs. Here we propose potential interaction domain (PID) pairs can be extracted from a data set of experimentally identified interacting protein pairs. where one protein contains a domain and its interacting protein contains the other. Every combinations of PID are summarized in a matrix table termed the PID matrix, and this matrix has proposed to be used for prediction of interactions. The database of interacting proteins (DIP) has used as a source of interacting protein pairs and InterPro, an integrated database of protein families, domains and functional sites, has used for defining domains in interacting pairs. A statistical scoring system. named "PID matrix score" has designed and applied as a measure of interaction probability between domains. Cross-validation has been performed with subsets of DIP data to evaluate the prediction accuracy of PID matrix. The prediction system gives about 50% of sensitivity and 98% of specificity, Based on the PID matrix, we develop a system providing several interaction information-finding services in the Internet. The system, named PreDIN (Prediction-oriented Database of Interaction Network) provides interacting domain finding services and interacting protein finding services. It is demonstrated that mapping of the genome-wide interaction network can be achieved by using the PreDIN system. This system can be also used as a new tool for functional prediction of unknown proteins.

  • PDF

소분자 도킹에서 탐색공간의 축소 방법 (Search Space Reduction Techniques in Small Molecular Docking)

  • 조승주
    • 통합자연과학논문집
    • /
    • 제3권3호
    • /
    • pp.143-147
    • /
    • 2010
  • Since it is of great importance to know how a ligand binds to a receptor, there have been a lot of efforts to improve the quality of prediction of docking poses. Earlier efforts were focused on improving search algorithm and scoring function in a docking program resulting in a partial improvement with a lot of variations. Although these are basically very important and essential, more tangible improvements came from the reduction of search space. In a normal docking study, the approximate active site is assumed to be known. After defining active site, scoring functions and search algorithms are used to locate the expected binding pose within this search space. A good search algorithm will sample wisely toward the correct binding pose. By careful study of receptor structure, it was possible to prioritize sub-space in the active site using "receptor-based pharmacophores" or "hot spots". In a sense, these techniques reduce the search space from the beginning. Further improvements were made when the bound ligand structure is available, i.e., the searching could be directed by molecular similarity using ligand information. This could be very helpful to increase the accuracy of binding pose. In addition, if the biological activity data is available, docking program could be improved to the level of being useful in affinity prediction for a series of congeneric ligands. Since the number of co-crystal structures is increasing in protein databank, "Ligand-Guided Docking" to reduce the search space would be more important to improve the accuracy of docking pose prediction and the efficiency of virtual screening. Further improvements in this area would be useful to produce more reliable docking programs.

영작문 자동채점 시스템 개발에서 학습데이터 부족 문제 해결을 위한 앙상블 기법 적용의 효과 (Effect of Application of Ensemble Method on Machine Learning with Insufficient Training Set in Developing Automated English Essay Scoring System)

  • 이경호;이공주
    • 정보과학회 논문지
    • /
    • 제42권9호
    • /
    • pp.1124-1132
    • /
    • 2015
  • 일반적으로, 교사 학습 알고리즘이 적절히 학습되기 위해서는 레이블의 편향이 없는 충분한 양의 학습데이터가 필요하다. 그러나 영작문 자동채점 시스템 개발을 위한 충분하고 편향되지 않은 학습데이터를 수집하는 것은 어려운 일이다. 또한 영어 작문 평가의 경우, 전체적인 답안 수준에 대한 다면적인 평가가 이루어진다. 적고 편향되기 쉬운 학습데이터와 이를 이용한 여러 평가영역에 대한 학습모델을 생성해야하기 때문에, 이를 위한 적절한 기계학습 알고리즘을 결정하기 어렵다. 본 논문에서는 이러한 문제를 앙상블학습을 통해 완화할 수 있음을 실험에 통해 보이고자 한다. 실제 중, 고등학교 학생들을 대상으로 시행된 단문형 영작문 채점 결과를 학습데이터 개수와 편향성을 조절하여 실험하였다. 학습데이터의 개수 변화와 편향성 변화의 실험 결과, 에이다부스트 알고리즘을 적용한 결과를 투표로 결합한 앙상블 기법이 다른 알고리즘들 보다 전반적으로 더 나은 성능을 나타냄을 실험을 통해 나타내었다.

Spring boot 기반의 프로그래밍 교육 및 온라인 채점 시스템 (Spring Boot-based Programming Education and Online Scoring System)

  • 조민우;이태준;최지영;이성옥;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.450-452
    • /
    • 2021
  • 최근 프로그래밍, 인공지능에 관한 관심이 높아지면서 초등학교부터 소프트웨어 교육을 의무적으로 실시하고 있다. 이러한 프로그래밍 교육의 목표를 달성하기 위해 기본적으로 학생과 교사에게 맞는 실습실 환경을 구축해야 한다. 하지만 학교의 실습실 환경은 노후 컴퓨터로 인한 성능 문제가 있으며, 학생들이 동시에 접속해 문제해결 능력을 평가하고자 하는 알고리즘 경진대회 프로그램을 시행하면서 기존의 온라인에 출시된 플랫폼을 구매해 사용해야 하는 문제가 있다. 따라서 본 논문에서는 이러한 문제를 해결하고자 React, Spring boot를 사용한 웹 기반의 온라인 실습 환경과 알고리즘 경진대회 채점 시스템을 제안한다. 이를 통해 사양이 낮은 컴퓨터에서도 웹 브라우져만을 사용하여 프로그래밍을 공부할 수 있을 것으로 사료된다.

  • PDF

An Improved Recommendation Algorithm Based on Two-layer Attention Mechanism

  • Kim, Hye-jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.185-198
    • /
    • 2021
  • 인터넷 기술의 발달로 기존의 추천 알고리즘은 사용자나 항목의 심층적인 특성을 학습할 수 없기 때문에 본 논문은 이 문제를 해결하기 위해 AMITI(주의 메커니즘 및 개선된 TF-IDF)에 기반한 추천 알고리즘을 제안했다. CNN(Convolutional Neural Network)에 2중 주의 메커니즘을 도입함으로써 CNN의 특징 추출 능력이 향상되고, 항목 특징에 다른 선호도 가중치가 할당되며, 사용자 선호도와 더 일치하는 권고사항이 달성되었다. 대상 사용자에게 항목을 추천할 때 점수 데이터와 항목 유형 데이터를 TF-IDF와 결합하여 권장 결과의 그룹화를 완료하였다. 본 논문에서 진행한 MovieLens-1M 데이터 세트에 대한 실험 결과는, AMITI 알고리즘이 권장 사항의 정확도를 향상시키고 프레젠테이션 방법의 순서와 선택성을 향상시킨다는 것을 보여준다.

보안 시그니처 탐지를 위한 필터링 우선순위 알고리즘 구현 (Development on Filtering Priority Algorithm for Security Signature Search)

  • 전은아;김점구
    • 융합보안논문지
    • /
    • 제20권5호
    • /
    • pp.41-52
    • /
    • 2020
  • 본 논문은 보안 이벤트 위험성에 따른 능동적 대응을 위해서 우선순위 알고리즘을 구현하는 것이며, 이를 기반으로 효율적인 이벤트 처리를 수행하는 이벤트 스케줄러를 구현하고자 한다. CVE나 CVSS 같이 세계적으로 표준을 가지고 있는 기준에 따라, 보안 이벤트를 실행시켰을 때 점수를 매길 수 있는 기준을 마련하고, 정형화 하여 보다 객관적으로 우선순위를 정할 수 있도록 한다. 그래서 이를 바탕으로 보안 이벤트 데이터베이스를 구축하고, 이를 이용하여 스케줄링을 할 수 있도록 한다. 또한 보안 이벤트 스케줄링 우선순위 알고리즘을 우리나라 보안 이벤트 실정에 맞게 개발하고 적용함으로써 국내 기관 및 기업의 정보보호에 대한 신뢰성 확보와 산업 발전에 기여하게 될 것이다.

A Clustering Approach for Feature Selection in Microarray Data Classification Using Random Forest

  • Aydadenta, Husna;Adiwijaya, Adiwijaya
    • Journal of Information Processing Systems
    • /
    • 제14권5호
    • /
    • pp.1167-1175
    • /
    • 2018
  • Microarray data plays an essential role in diagnosing and detecting cancer. Microarray analysis allows the examination of levels of gene expression in specific cell samples, where thousands of genes can be analyzed simultaneously. However, microarray data have very little sample data and high data dimensionality. Therefore, to classify microarray data, a dimensional reduction process is required. Dimensional reduction can eliminate redundancy of data; thus, features used in classification are features that only have a high correlation with their class. There are two types of dimensional reduction, namely feature selection and feature extraction. In this paper, we used k-means algorithm as the clustering approach for feature selection. The proposed approach can be used to categorize features that have the same characteristics in one cluster, so that redundancy in microarray data is removed. The result of clustering is ranked using the Relief algorithm such that the best scoring element for each cluster is obtained. All best elements of each cluster are selected and used as features in the classification process. Next, the Random Forest algorithm is used. Based on the simulation, the accuracy of the proposed approach for each dataset, namely Colon, Lung Cancer, and Prostate Tumor, achieved 85.87%, 98.9%, and 89% accuracy, respectively. The accuracy of the proposed approach is therefore higher than the approach using Random Forest without clustering.

기관사의 해기능력 평가용 PID 제어 튜닝 시뮬레이터의 구성 (Configuration of PID tuning simulator for evaluation of marine engineer's ability)

  • 최순만
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제33권8호
    • /
    • pp.1268-1274
    • /
    • 2009
  • 훈련 및 시험 목적의 시뮬레이터 평가 시스템이 다양하게 적용되고 있는 상황에서 본 논문은 개인용 컴퓨터를 이용한 평가용 득점 시스템의 한 방식을 제시한다. 여기서는 기기들에 대한 피평가자의 운전 능력과 관련 지식을 100점 만점의 상대 평가 방식으로 점수를 출력하게 되고 이를 위해 PID 튜닝 시스템의 시뮬레이션 환경을 구축한 후 평가 알고리듬을 결합하였다. 먼저 시뮬레이션 프로그램을 모의 운전하는 과정에서 피평가자가 만들어내는 오류들의 적분값을 구한 후 다음 단계로 100점 만점의 점수로 변환하였으며 피평가자 그룹의 수준은 몇 가지 방식으로 적절하게 보상될 수 있도록 하였다. 설정된 한 시나리오에서 운전한 데이터를 분석한 결과 구축된 시스템이 나타내는 평가의 적절성과 유효성이 확인될 수 있었다.

블록 레벨의 분류 특성을 이용한 지문 영상의 품질 측정 방법 (Scoring Method of Fingerprint Image Quality using Classified Block-level Characteristics)

  • 문지현;김학일
    • 정보보호학회논문지
    • /
    • 제17권2호
    • /
    • pp.29-40
    • /
    • 2007
  • 입력이 되는 지문 영상의 품질은 지문 인식 시스템의 전체 인식 성능에 다양하게 영향을 미친다. 지문 영상의 품질은 추출, 정합 등의 알고리즘 내에서도 중요한 정보로 활용되는데, 특히 센서 입력부에서의 품질 측정 및 평가는 불필요한 처리 과정을 줄여 시스템의 전반적인 안정성을 유도하는데 사용되는 만큼 매우 중요한 과정이 된다. 본 논문에서는 기존의 많은 연구 결과들과는 달리 센서, 인식 알고리즘, 손가락의 특성에 독립적인 지문 영상 품질을 정의하였다. 또한 이의 측정을 위하여 지문 영상의 지역적 특성들만을 이용한 새로운 품질 측정 방법도 제안하였다. 제안하는 품질 측정 방법은 블록별 품질 특성 분류 결과를 이용하여 전체 지문 영상의 품질을 수치화하는 것으로, 본 논문에서는 FVC에서 사용된 몇 가지 서브 데이터베이스들을 이용하여 제안하는 방법의 유용함을 증명하였다. 실험 결과는 NIST의 NFIQ, AWARE사의 QualityCheck 품질 측정 알고리즘들과 비교되었는데, 이들 알고리즘들에 비해 제안하는 측정 방법이 인간의 시각적 분류 기준과 유사한 결과를 보였다.

Interactive Morphological Analysis to Improve Accuracy of Keyword Extraction Based on Cohesion Scoring

  • Yu, Yang Woo;Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.145-153
    • /
    • 2020
  • 최근 소셜 빅데이터를 대상으로 한 키워드 분석은 고객 관점의 의견이나 불만 사항을 추출하기 위한 목적으로 광범위하게 활용되고 있다. 이와 관련하여, 이전 연구에서는 키워드 분석의 정확도를 높이기 위해 응집도 점수를 활용한 방법을 제안하였으나, 리뷰의 수가 적을 경우 오류율이 증가하는 문제가 있었다. 본 논문에서는 응집도 점수 기반 알고리즘으로부터 추출된 키워드에 대해 간소화된 형태소 분석 단계를 후처리 형태로 적용함으로써 키워드 추출의 정확도를 개선하고자 하였다. 제안 방법은 입력 데이터가 주어질 때마다 필요한 형태소 분석 규칙을 점증적으로 추가할 수 있도록 지원함으로써, 사전의 크기를 최소화하고 분석의 효율을 높이고자 하였다. 또한 대화형 규칙 입력 시스템을 제공하여 분석 규칙 추가에 드는 노력을 최소화하고자 하였다. 제안 방법을 검증하기 위해 온라인에서 수집된 실제 리뷰를 대상으로 실험을 수행하였으며, 제안 방법을 적용할 경우 오류율이 기존 10%에서 1%로 개선되는 동시에, 5,000개의 리뷰 처리에 450ms가 소요되어 실시간 처리가 가능한 수준임을 확인하였다.