• 제목/요약/키워드: Part Similarity

검색결과 504건 처리시간 0.033초

Target Prediction Based On PPI Network

  • Lee, Taekeon;Hwang, Youhyeon;Oh, Min;Yoon, Youngmi
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.65-71
    • /
    • 2016
  • To reduce the expenses for development a novel drug, systems biology has been studied actively. Target prediction, a part of systems biology, contributes to finding a new purpose for FDA(Food and Drug Administration) approved drugs and development novel drugs. In this paper, we propose a classification model for predicting novel target genes based on relation between target genes and disease related genes. After collecting known target genes from TTD(Therapeutic Target Database) and disease related genes from OMIM(Online Mendelian Inheritance in Man), we analyzed the effect of target genes on disease related genes based on PPI(Protein-Protein Interactions) network. We focused on the distinguishing characteristics between known target genes and random target genes, and used the characteristics as features for building a classifier. Because our model is constructed using information about only a disease and its known targets, the model can be applied to unusual diseases without similar drugs and diseases, while existing models for finding new drug-disease associations are based on drug-drug similarity and disease-disease similarity. We validated accuracy of the model using LOOCV of ten times and the AUCs were 0.74 on Alzheimer's disease and 0.71 on Breast cancer.

공동주택 프로젝트의 초기 공사비 예측정확도 향상에 관한 연구 (Improving the Accuracy of Early Stage Cost Estimation in Apartment Construction Project)

  • 임소연;여상구;고성석
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2010년도 춘계 학술논문 발표대회 1부
    • /
    • pp.143-147
    • /
    • 2010
  • Due to the diversification and complication of construction projects, controlling risks from the early design-planning phase gives huge impact on success of the construction project. As a part of managing uncertainties it is also important to estimate the project cost several times. Especially, estimating project cost in the early stage gives effects on making a budget for projects. This study estimated the apartment project cost using case-based reasoning(CBR), which is the process of solving new problems based on the past problems. For this, we deduced the apartment cost influence factors which can be gathered in the early stage of project. Based on the factors we established the database for apartment project and calculated the attribute value, attribute similarity and case similarity. Although we retrieve the most similar case from the database, it is very hard to utilize it directly due to the uniqueness of each project. So, Genetic Algorithm(GA) was applied in revising the cost of the retrieved-case. Therefore, the accuracy of the prediction was improved by GA optimization.

  • PDF

패션리더에 대한 재고 - 팔로워로서의 대학생 관점 - (Fashion leaders revisited - The viewpoint of college students as fashion followers -)

  • 박경애
    • 복식문화연구
    • /
    • 제26권5호
    • /
    • pp.777-792
    • /
    • 2018
  • As social media has become a part of daily life, new types of online opinion leaders are emerging, and in turn, changes in traditional fashion leaders and leadership are expected. Considering such changes, this study attempted to reexamine fashion leader types and influence characteristics from the perspective of college students as fashion followers. Students were asked to write an essay identifying their fashion leader and how and why they were influenced by him or her. Sixty essays entitled "My Fashion Leader" were collected and content-analyzed. A total of 78 fashion leaders were identified and categorized into four types including celebrities, social media influencers, friends/family/acquaintances, and people seen on the street in order of frequency. Influence characteristics of the identified fashion leaders included superiority, role model, similarity, and familiarity. Similarity was observed across all types of fashion leaders, while superiority and familiarity were identified for celebrities and friends/family/acquaintances, respectively. The results imply that celebrities, mostly those from the TV, movie, and music industries, are still important as fashion leaders in society regardless of their communication style, while friends/family/acquaintances as opinion leaders within a consumer group are important to provide information, advice, and help. However, social media influencers between the two groups are expanding the influence.

휴리스틱을 이용한 kNN의 효율성 개선 (An Improvement Of Efficiency For kNN By Using A Heuristic)

  • 이재문
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.719-724
    • /
    • 2003
  • 이 논문은 kNN의 정확도의 손실 없이 kNN의 효율성을 개선하는 휴리스틱을 제안한다. 제안된 휴리스틱은 kNN 실행 시간의 주요 요소인 두 문서간 유사성 계산을 최소화하는 것이다. 이것을 위하여 본 논문은 유사성의 상한값을 계산하는 방법과 훈련 문서를 정렬하는 방법을 제안한다. 제안된 휴리스틱을 문서 분류 프레임?인 AI :: Categorizer 상에서 구현하였으며, 잘 알려진 로이터-21578 데이터를 사용하여 기존의 kNN과 비교하였다. 성능 비교의 결과로부터 제안된 휴리스틱을 적용한 방법이 기존의 kNN보다 실행 속도측면에서 약 30∼40%의 개선 효과가 있음을 알 수 있었다.

비트맵 필터를 이용한 효율적인 역 리스트 탐색 기법 (Efficient Inverted List Search Technique using Bitmap Filters)

  • 권인택;김종익
    • 정보처리학회논문지D
    • /
    • 제18D권6호
    • /
    • pp.415-422
    • /
    • 2011
  • 텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 Suffix 필터링 과정에서 역 리스트의 탐색 비용을 줄이기 위해 역 리스트의 통계 정보인 비트맵 필터를 사용하는 기법을 제안한다. 제안하는 기법은 비트맵 필터를 사용하여 Suffix 필터링 과정에서 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 Suffix 필터링 알고리즘보다 더 효율적임을 보인다.

Few Samples Face Recognition Based on Generative Score Space

  • Wang, Bin;Wang, Cungang;Zhang, Qian;Huang, Jifeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권12호
    • /
    • pp.5464-5484
    • /
    • 2016
  • Few samples face recognition has become a highly challenging task due to the limitation of available labeled samples. As two popular paradigms in face image representation, sparse component analysis is highly robust while parts-based paradigm is particularly flexible. In this paper, we propose a probabilistic generative model to incorporate the strengths of the two paradigms for face representation. This model finds a common spatial partition for given images and simultaneously learns a sparse component analysis model for each part of the partition. The two procedures are built into a probabilistic generative model. Then we derive the score function (i.e. feature mapping) from the generative score space. A similarity measure is defined over the derived score function for few samples face recognition. This model is driven by data and specifically good at representing face images. The derived generative score function and similarity measure encode information hidden in the data distribution. To validate the effectiveness of the proposed method, we perform few samples face recognition on two face datasets. The results show its advantages.

SMS 트래픽의 Self-similarity (Self-similarity of SMS Traffic)

  • 하준;신우철;박진경;최천원
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 통신소사이어티 추계학술대회논문집
    • /
    • pp.353-356
    • /
    • 2003
  • As the wireless mobile telecommunication system has been developed with astonishment, its offering service has also widely been expanded including various data service. Currently, the wireless mobile telecommunication network presents voice service that covers for the most part of the whole service areas. For this reason, the availability of the switching capacity in the mobile switching center(MSC) is manipulated by the required volume of voice service. However, considering the increase of data service, it is desirable for the current switching method to be modified for more efficiency. In this Paper, we analyze the data traffic caused by providing data service in the wireless mobile telecommunication network. For this, we are firstly going to review the result of the analysis in the feature of the data traffic. Secondly, based on the review, we are also going to perform analyzing the other feature of the data traffic normally generated in the wireless mobile telecommunication network. We expect that this paper would be utilized as an elementary source for the feature of the SMS data .traffic and it will be an honour for ourselves to work on it.

  • PDF

히스토그램 보간에 의한 영상 검색 (Image Search Using Interpolated Color Histograms)

  • 이효종
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.701-706
    • /
    • 2002
  • 영상의 색상 정보는 비슷한 영상들의 유사도를 효과적으로 측정하는데 사용된다. 그러나, 색상정보의 크기는 영상 데이터베이스에서 효율적으로 다루기에는 너무나 방대하다. 본 논문에서는 히스토그램 보간법에 의하여 유사한 영상들을 검색하는 새로운 방법을 제시한다 알고리즘의 기본 원리는 색상 히스토그램의 분포를 이용하여 영상을 검색하는 기존 방법에서 출발한다. 그러나, 질의 영상과 대상 영상과의 유사도를 결정하는데 있어서 보간법에 의하여 히스토그램의 분포도를 간략화 시킨다는 근본적인 차이를 가지고 있다. 색상 히스토그램의 분포는 최적 차수의 다항식으로 보간되어서 표현되었다. 히스토그램의 분포가 보간된 후에는 저차원 다항식의 계수들만이 색상 구분자로서 데이터베이스에 저장되고 검색하는데 활용될 수 있다. 제안된 방법은 실제 영상들에 적용되었으며 만족할 만한 결과를 보여주고 있다.

연속적 I/O와 클러스터 인덱싱 구조를 이용한 이미지 데이타 검색 연구 (A study on searching image by cluster indexing and sequential I/O)

  • 김진옥;황대준
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.779-788
    • /
    • 2002
  • 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들은 텍스트기반의 데이터에 비하여 대용량이고 비정형적인 특성때문에 검색이 어렵다. 또한 멀티미디어 데이터의 특징은 행렬이나 벡터의 형태로 표현되기 때문에 완전일치 검색이 아닌 유사 검색을 수행하여 원하는 이미지와 유사한 이미지를 검색해야 한다. 본 논문에서는 멀티미디어 데이터 검색에 클러스터링과 인덱싱 기법을 같이 적용하여 유사한 이미지는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축함으로써 이미지 근처의 클러스터를 찾아 빠른 검색 결과를 제공하는 유사 검색방법을 제시한다. 본 논문에서는 트리 유사 구조의 인덱스 대신 해싱 방법을 이용하며 검색시 I/O 시간을 줄이기 위해 오브젝트를 가진 클러스터 위치를 찾는데 한번의 I/O를 사용하고 이 클러스터를 읽기 위해 연속적인 파일 I/O를 사용하여 클러스터를 찾는 비용을 최소화한다. 클러스터 인덱싱 접근은 클러스터링을 생성하는 알고리즘과 해싱 기법의 인덱싱을 이용함으로써 고차원 데이터가 갖는 차원의 문제를 해결하며 클러스터링 또는 인덱싱 만을 이용하는 내용기반의 이미지 검색보다 효율적인 검색 적합성을 보인다.

CS-트리 : 고차원 데이터의 유사성 검색을 위한 셀-기반 시그니쳐 색인 구조 (CS-Tree : Cell-based Signature Index Structure for Similarity Search in High-Dimensional Data)

  • 송광택;장재우
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.305-312
    • /
    • 2001
  • 최근 고차원 색인 구조들이 멀티미디어 데이터베이스, 데이터 웨어하우징과 같은 데이터베이스 응용에서 유사성 검색을 위해 요구된다. 본 논문에서는 고차원 특징벡터에 대한 효율적인 저장과 검색을 지원하는 셀-기반 시그니쳐 트리(CS-트리)를 제안한다. 제안하는 CS-트리는 고차원 특징 벡터 공간을 셀로써 분할하여 하나의 특징 벡터를 그에 해당되는 셀의 시그니쳐로 표현한다. 특징 벡터 대신 셀의 시그니쳐를 사용함으로써 트리의 깊이를 줄이고, 그 결과 효율적인 검색 성능을 달성한다. 또한 셀에 기반하여 탐색 공간을 효율적으로 줄이는 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 삽입시간, k-최근접 질의에 대한 검색 시간 그리고 부가저장 공간 측면에서 성능 비교를 수행한다. 성능비교 결과 CS-트리가 검색 성능에서 우수함을 보인다.

  • PDF