• Title/Summary/Keyword: 유사도 가중치

Search Result 576, Processing Time 0.034 seconds

Classification Protein Subcellular Locations Using n-Gram Features (단백질 서열의 n-Gram 자질을 이용한 세포내 위치 예측)

  • Kim, Jinsuk
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2007.11a
    • /
    • pp.12-16
    • /
    • 2007
  • The function of a protein is closely co-related with its subcellular location(s). Given a protein sequence, therefore, how to determine its subcellular location is a vitally important problem. We have developed a new prediction method for protein subcellular location(s), which is based on n-gram feature extraction and k-nearest neighbor (kNN) classification algorithm. It classifies a protein sequence to one or more subcellular compartments based on the locations of top k sequences which show the highest similarity weights against the input sequence. The similarity weight is a kind of similarity measure which is determined by comparing n-gram features between two sequences. Currently our method extract penta-grams as features of protein sequences, computes scores of the potential localization site(s) using kNN algorithm, and finally presents the locations and their associated scores. We constructed a large-scale data set of protein sequences with known subcellular locations from the SWISS-PROT database. This data set contains 51,885 entries with one or more known subcellular locations. Our method show very high prediction precision of about 93% for this data set, and compared with other method, it also showed comparable prediction improvement for a test collection used in a previous work.

  • PDF

A Korean Text Summarization System Using Aggregate Similarity (도합유사도를 이용한 한국어 문서요약 시스템)

  • 김재훈;김준홍
    • Korean Journal of Cognitive Science
    • /
    • v.12 no.1_2
    • /
    • pp.35-42
    • /
    • 2001
  • In this paper. a document is represented as a weighted graph called a text relationship map. In the graph. a node represents a vector of nouns in a sentence, an edge completely connects other nodes. and a weight on the edge is a value of the similarity between two nodes. The similarity is based on the word overlap between the corresponding nodes. The importance of a node. called an aggregate similarity in this paper. is defined as the sum of weights on the links connecting it to other nodes on the map. In this paper. we present a Korean text summarization system using the aggregate similarity. To evaluate our system, we used two test collection, one collection (PAPER-InCon) consists of 100 papers in the field of computer science: the other collection (NEWS) is composed of 105 articles in the newspapers and had built by KOROlC. Under the compression rate of 20%. we achieved the recall of 46.6% (PAPER-InCon) and 30.5% (NEWS) and the precision of 76.9% (PAPER-InCon) and 42.3% (NEWS).

  • PDF

A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research (유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구)

  • Park, Dong-Jin;Choi, Ki-Seok;Lee, Myung-Sun;Lee, Sang-Tae
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.11
    • /
    • pp.54-62
    • /
    • 2009
  • To avoid the redundant investment on the project selection process, it is necessary to check whether the submitted research topics have been proposed or carried out at other institutions before. This is possible through the search engines adopted by the keyword matching algorithm which is based on boolean techniques in national-sized research results database. Even though the accuracy and speed of information retrieval have been improved, they still have fundamental limits caused by keyword matching. This paper examines implemented TFIDF-based algorithm, and shows an experiment in search engine to retrieve and give the order of priority for similar and redundant documents compared with research proposals, In addition to generic TFIDF algorithm, feature weighting and K-Nearest Neighbors classification methods are implemented in this algorithm. The documents are extracted from NDSL(National Digital Science Library) web directory service to test the algorithm.

Implementation of Content Based Color Image Retrieval System using Wavelet Transformation Method (웨블릿 변환기법을 이용한 내용기반 컬러영상 검색시스템 구현)

  • 송석진;이희봉;김효성;남기곤
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.40 no.1
    • /
    • pp.20-27
    • /
    • 2003
  • In this paper, we implemented a content-based image retrieval system that user can choose a wanted query region of object and retrieve similar object from image database. Query image is induced to wavelet transformation after divided into hue components and gray components that hue features is extracted through color autocorrelogram and dispersion in hue components. Texture feature is extracted through autocorrelogram and GLCM in gray components also. Using features of two components, retrieval is processed to compare each similarity with database image. In here, weight value is applied to each similarity value. We make up for each defect by deriving features from two components beside one that elevations of recall and precision are verified in experiment results. Moreover, retrieval efficiency is improved by weight value. And various features of database images are indexed automatically in feature library that make possible to rapid image retrieval.

Development of a Wellness Mentor Support System based on CBR (CBR 기반의 웰니스멘토지원시스템 개발)

  • Park, Seong-bin;Chung, Kyung-ryul;Kim, sa-yup;Lee, Sang-ho
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.389-390
    • /
    • 2013
  • 건강관리서비스는 금연, 절주, 식이 운동 등 생활습관을 개선하여 스스로 건강을 증진하도록 평가 교육 상담 등을 제공하는 서비스이다. 본 연구의 목적은 건강관리 서비스 분야에서 성공적인 건강상담사례들 중 유사한 사례를 추출하여 이를 건강관리 상담에 활용하기 위한 CBR(Case based Reasoning) 기반의 웰니스멘토지원시스템을 개발하는 것이다. 자가 건강관리 서비스를 위해 수집한 개인 건강관리 관련 정보로부터 운동처방 및 식이영양 처방을 위한 판단기준이 되는 변인들을 추출하였고, 변인들 간 유사도 비교를 위한 함수를 선정하고 가중치를 부여하였다. 또한 기존의 성공사례들에 대한 DB를 구축하고 유사도 비교(Retrieve)를 통해 가장 적절한 사례를 추천하기 위한 웰니스멘토지원시스템의 프로토타입을 개발하였다. 웰니스멘토지원시스템을 통해 과거의 성공적인 상담사례를 참고하여 상담해줌으로써 상담에 필요한 시간을 단축시키고 서비스의 질 향상을 도모할 수 있을 것이다.

  • PDF

Thresholds for Collaborative Filtering using Singular Value Decomposition (Singular Value Decomposition을 이용한 협력적 여과를 위한 임계값)

  • Jeong, Jun;Kim, Yong-Han;Lee, Phill-Kyu
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.125-127
    • /
    • 2000
  • 협력적 여과는 사용자의 아이템에 대한 단계적 평가에 기초하여 그 평가 패턴이 유사한 사용자를 찾아 그 사용자들이 선호한 아이템을 상대방에게 교차 추천을 해주는 방법이다. 따라서, 유사한 사용자를 찾는 방법이 중요한 문제가 되며, 현재까지 여러 가지 방법들이 제안되어 왔다. 순수한 협력적 여과 방법은 n차원 공간에서 사용자를 모델링하여 가장 유사한 이웃을 찾는다. 이러한 모델링의 문제점은 사용자가 평가한 아이템의 집합은 전체 아이템의 집합에 비해서 극히 작으므로 유사한 사용자를 찾기 위해서는 충분한 수의 아이템에 대해서 평가해야 한다는 것이다. 따라서, 본 논문에서는 유사란 사용자를 찾기 위해서 충분한 수의 평가를 요구하는 명백하게 사용자의 평가를 비교하는 것 대신에 특징 가중치에 초하여 사용자를 비교하는 방법을 사용하고 사용하는 방법의 정확성을 높일 수 있는 임계값을 제안하고자 한다.

  • PDF

Assumption based on Recommending Harmonious Colors (예측기반 색 조화 추천방안)

  • Park, Eun-Young;Park, Young-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1478-1480
    • /
    • 2011
  • 경제가 발전할수록 디자인의 중요성이 높아지고 있으며 디자인을 이루는 여러 요소들 가운데 색이 차지하고 있는 비중은 매우 높다. 하지만 일반인은 조화로운 색을 선택하는데 어려움을 겪고 있다. 이를 위해 기존의 연구들은 다양한 색상 추천 방법을 제안하고 있지만 개인이 어떠한 배색을 더 선호하는 가에 관한 사용자 선호도는 고려되지 않는 경우가 대부분이다. 이에 본 연구에서는 협업필터링의 유사도 측정 방법을 컬러조화 추천 방법에 적용함으로써 사용자의 성향을 고려한 맞춤형 색 조화 추천 방안을 제안한다. 제안하는 방법은 색상별로 선호하는 색 조화 간의 유사도를 가중치로 사용하기 때문에 새로운 사용자의 선호도 예측 및 추천이 가능하며 이를 통해 향후 색과 조화를 선정하는 기본 적인 자료로 활용할 수 있으며 저장된 선호도는 유사한 성향을 지닌 사용자의 선호도 예측 및 각종 제품 마케팅 등에 적용이 가능하다.

Experiments using query expansion in LSI (LSI에서 질의 확장을 이용한 실험)

  • 안성수;김동주;이기영;김한우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.151-153
    • /
    • 1999
  • 한번의 질의로 사용자가 모든 요구를 표현하기 어렵고 만족시킬 수 없기 때문에 질의를 확장하는 연구가 계속되고 있다. 본 논문에서는 LSI(Latent Semantic Indexing)에서 사용자의 질의와 의미공간에서의 용어들간의 유사도를 구해 최상위의 용어들을 순서를 정해 질의확장을 하는 방법과 LCA(Local Context Analysis)을 이용하는 방법을 제안한다. 그리고 문서 집합에 대해 3가지 가중치를 적용한 결과를 분석하고 질의확장시의 문제점과 향후 연구과제에 대해 설명한다.

  • PDF

Zernike Moments Shape Descriptor with Region Partitioning (영역분할에 의한 Zernike Moments 모양정보 기술자)

  • 김종득;김해광
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.11b
    • /
    • pp.53-57
    • /
    • 1999
  • 모양정보는 사람이 물체를 구분하는 특징 중 하나이며 Zernike moments등의 방법으로 그 특징을 표현한다. 본 논문에서는 기존의 Zernike moment 방법을 수정하여 입력 모양정보를 내부 모양정보와 외부 모양정보로 분리하여 각각의 영역에 대해서 특징을 추출한다. 그리고 두 모양정보의 유사도를 계산하는 과정에서 내부 모양정보와 외부 모양정보의 특징에 각각 다른 가중치를 적용함으로써 사용자의 의도에 가장 적합한 질의 결과를 얻을 수 있는 새로운 기능성을 부여하여 검색의 효율성을 높였다. 실험 결과 기존의 Zernike moments 방법에 비해서 최대 12 %의 성능 향상이 있음을 보였다.

  • PDF

Implementation of video structuring system using color and motion information (칼라와 모션 정보를 이용한 비디오 구조화 시스템 구현)

  • 송창준;고한석;권용무
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.11b
    • /
    • pp.123-128
    • /
    • 1999
  • 본 논문에서는 기존에는 샷 경계 검출에 초점을 맞춘 것과는 달리 본 논문에서는 샷 보다 상위레벨인 비디오 씬 추출에 초점을 맞추어 디지털 비디오를 구조화하는 시스템을 제안한다. 샷간의 유사도를 측정하기 위해서 칼라와 모션 특징을 이용하였으며, 비디오 내의 동적 또는 정적 특성을 반영하기 위해서 적응적 가중치를 적용하였다. 칼라 특징을 추출하기 위해서 각 샷의 내부에서 대표 프레임을 추출하였고, 각 샷 내부의 모션 정보는 MPEG 비디오 모션 벡터를 이응해서 추출하였다. 또한, 비디오 씬 분할 시 연산 시간을 줄이기 위한 기법을 제시하였다. 마지막으로 추출된 비디오 씬에 대해서 성능평가를 하였다.

  • PDF