• 제목/요약/키워드: 유사도 질의

검색결과 1,858건 처리시간 0.032초

CS-트리 : 고차원 데이터의 유사성 검색을 위한 셀-기반 시그니쳐 색인 구조 (CS-Tree : Cell-based Signature Index Structure for Similarity Search in High-Dimensional Data)

  • 송광택;장재우
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.305-312
    • /
    • 2001
  • 최근 고차원 색인 구조들이 멀티미디어 데이터베이스, 데이터 웨어하우징과 같은 데이터베이스 응용에서 유사성 검색을 위해 요구된다. 본 논문에서는 고차원 특징벡터에 대한 효율적인 저장과 검색을 지원하는 셀-기반 시그니쳐 트리(CS-트리)를 제안한다. 제안하는 CS-트리는 고차원 특징 벡터 공간을 셀로써 분할하여 하나의 특징 벡터를 그에 해당되는 셀의 시그니쳐로 표현한다. 특징 벡터 대신 셀의 시그니쳐를 사용함으로써 트리의 깊이를 줄이고, 그 결과 효율적인 검색 성능을 달성한다. 또한 셀에 기반하여 탐색 공간을 효율적으로 줄이는 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 삽입시간, k-최근접 질의에 대한 검색 시간 그리고 부가저장 공간 측면에서 성능 비교를 수행한다. 성능비교 결과 CS-트리가 검색 성능에서 우수함을 보인다.

  • PDF

클러스터 세그먼트 인덱스를 이용한 단백질 이차 구조의 효율적인 유사 검색 (Clustered Segment Index for Efficient Approximate Searching on the Secondary Structure of Protein Sequences)

  • 서민구;박상현;원정임
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.251-260
    • /
    • 2006
  • 단백질 일차 구조(아미노산 배열)에 대한 상동 검색은 유전자나 단백질의 기능과 진화 과정을 유추하기 위한 필수 연산이다. 그러나 진화 단계가 멀리 떨어진 경우 단백질 일차 구조는 보존되지 않기 때문에 단백질의 공간적 구조에 대한 유사 검색을 통해서만 진화 단계를 유추할 수 있다. 따라서 본 논문에서는 단백질의 공간적 구조를 표현하는 단백질 이차 구조를 대상으로 하여 RDBMS상에 쉽게 구현이 가능한 인덱싱 방안을 제안한다. 제안된 인덱싱 방안은 클러스터링 기법과 LookAhead 개념을 활용하여 Exact Match, Range Match, Wildcard Match 질의를 신속하게 처리한다. 제안된 방법의 우수성을 검증하기 위하여 실제의 단백질 데이타를 대상으로 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 방법은 기존의 방법과 비교하여 Exact Match의 경우 6.3배까지, Range Match의 경우 3.3배까지, Wildcard Match의 경우 1.5배까지의 개선된 검색 성능을 가지는 것으로 나타났다.

퍼지필터링 기반의 메시지 사서함 서비스를 위한 genealogy 그룹화 (Genealogy grouping for services of message post-office box based on fuzzy-filtering)

  • 이종득;안정용
    • 한국지능시스템학회논문지
    • /
    • 제15권6호
    • /
    • pp.701-708
    • /
    • 2005
  • 사서함 구조에서 메시지 서비스를 위한 중요한 구조적 메커니즘은 메시지 객체들을 콘텐츠에 따라 그룹 클래스 계층 구조를 구성하는 것이다. 본 논문에서는 응용 도메인에서 많은 구조적인 메시지 객체들을 클러스터링하기 위한 $\alpha$-cut 기반의 genealogy 그룹화 방법을 제안한다. 제안된 방법은 의미적 유사 관계와 퍼지 유사 관계를 이용하여 관계성을 결정하고 search() insert(), hierarchy()의 연산을 이용하여 그룹화 구조를 수행한다. 이러한 구조는 그룹과 관련된 작업을 쉽게 처리해주고 질의응답 객체 식별, 유사성 발견 등을 쉽게 해준다. 따라서 제안된 사서함 구조는 그룹화 생성을 통해서 사용자들에게 메시지객체를 효율적으로 서비스하고 관리하는 기능을 제공한다. 그리고 제안된 기법의 성능을 알아보기 위해 5600개의 메시지 객체를 이용하여 non-grouping, BGM, RGM, OGM 방법과 비교 분석한다.

꼼치에서 특징적으로 발현되는 새로운 유전자 곰신의 분리 및 동정 (Molecular Cloning and Identification of Novel Genes, Gomsin, Characteristically Expressed in Snailfish, Liparis tanakae)

  • 송인선;이석근;손진기
    • 한국발생생물학회지:발생과생식
    • /
    • 제6권1호
    • /
    • pp.7-16
    • /
    • 2002
  • 점액질이 풍부한 꼼치 조직에서 NIH 3T3 세포주를 이용하여 subtracted cDNA 라이브러리를 얻어 200례의 클론을 제작하였다. 이 클른 중에서 비반복성 유전자를 선택하고, RNA in situ hybridization을 실행하여 꼼치 조직에서 특이하게 발현되는 곰신 클론(C90-171)을 선택하였다. 이 클론은 사람의 타액선 조직에서도 특이하게 발현되는 유전자로서 이를 확인하기 위하여 C90-171(곰신) 항체를 제작하였다. 꼼치의 cDNA 라이브러리에서 곰신의 항체를 통하여 스크리닝한 결과 PRP(proline-rich protein)와 가장 많이 교차반응하며, 면역조직화학적 염색으로 PRP와 유사한 양성반응으로 나타나 PRP와 유사한 기능을 하는 단백질로 사료된다. 또한 타액 내에서의 꼼치 단백질의 분해에 대한 실험결과 거의 분해가 일어나지 않는 것으로 보아, 곰신은 꼼치의 몸통을 보호하는 유전물질일 뿐만 아니라, PRP와 유사하게 조직을 보호하는 안정된 새로운 기능성 단백질로 사료된다.

  • PDF

광물질 결합재 및 조강형 재료 조합에 따른 조강형 저발열 콘크리트의 기초적 특성 (Fundamental characteristics of high early strength low heat concrete according to mineral binder and high early strength material combination)

  • 김경민;손호정
    • 한국결정성장학회지
    • /
    • 제24권1호
    • /
    • pp.27-32
    • /
    • 2014
  • 본 연구에서는 매스콘크리트의 수화열 저감 및 초기강도 향상을 목적으로 3성분계 배합에 따른 콘크리트의 기초적 특성을 분석하였는데 결과를 요약하면 다음과 같다. 굳지 않은 콘크리트의 물성은 목표범위를 모두 만족하는 것으로 나타났다. 응결시간은 W/B와 관계없이 저열 시멘트 배합이 가장 빠른 것으로 나타났고, 간이 수화열은 저열 배합의 피크 온도가 가장 높은 것으로 나타났고, 저발열-B 배합이 가장 낮은 온도를 나타내었으며, 조강형 저발열 배합은 저발열-B와 유사한 것으로 나타났다. 경화 콘크리트의 압축강도는 초기재령에서 저발열-B 배합을 제외한 모든 배합이 유사한 강도 범위를 나타내었고, 장기 재령에서는 큰 차이 없이 유사한 강도 범위를 나타내었다.

2형 당뇨병을 동반한 만성치주염 환자의 치은조직에서 Matrix Metalloproteinse-13과 elastase의 발현 양상 비교 (Interrelationship of of Matrix metalloproteinase-13 and Elastase Expression in Human Gingiva with Chronic Periodontitis Associated to Type 2 Diabetes Mellitus)

  • 박현규;이재목
    • Journal of Periodontal and Implant Science
    • /
    • 제36권2호
    • /
    • pp.397-408
    • /
    • 2006
  • 치주질환은 치아 지지조직의 파괴로 튿정 지어지는 감염성 질환으로서 이것은 주로 조직의 교원질 성분을 분해시키는 MMP(matrix metalloproteinase)에 의해 이루어진다. 한편, 여러 연구에서 당뇨병과 치주질환의 심도와의 관계에 대한 논의가 있어왔으며 당뇨병이 치주염을 포함한 구강 감염에 대한 감수성을 증가시키며 역으로 만성 치주염의 염증성 매개물질에 의해 인슐린 작용이 방해받을 수 있음을 보고하였다. 본 연구의 목적은 만성 치주염 환자와 제 2형 당뇨병을 동반한 만성 치주염 환자의 치은조직에서 MMP-13과 elastase의 발현 양상을 비교하여 병리 기전의 차이점을 규명하고, 두 단백질간의 상호관계를 알아보기 위한 것이다. 경북대 병원 치주과에 내원한 환자의 비당뇨 환자의 정상 치은 부위, 비당뇨 환자의 만성 치주염 부위, 제 2형 당뇨병 환자의 만성 치주염 부위에서 각각 8개의 변연 치은을 채득하여 액화 질소에 급속 동결시켰다. 모든 조직 샘플에서 동량의 단백질을 western blotting을 통해 분석하여였고, densitometer를 이용하여 정량한 후 ANOVA 분석으로 통계처리 하였다. 결과분석에서 MMP-13은 제 2형 당뇨를 가진 환자의 염증성 조직에서 가장 높게 발현되었고 전신적으로 건강한 환자의 염증성 조직과 정상 조직에서는 유사한 양상을 보였으며 그 차이는 통계적으로 유의하였다. 또한 elastas는 그룹간에 유의한 차이 없이 유사한 양상으로 발현되었고, 염증성 조직에서도 당뇨병의 유무에 관계없이 유사하게 나타났다. 한편 조직내 MMP-13과 elastase의 발현 양상간에 유의한 상관관계는 보이지 않았다. 결론적으로 MMP-13은 당뇨병을 동반한 환자의 치은 염증초직에서 유의하게 증가되어 나타났으며, 전신적으로 건강한 환자의 염증조직과 당뇨를 동반한 환자의 염증조직에서 MMP-13과 elastase의 발현양상은 큰 상관관계가 발견되지 않았다.

색인어 가중치 부여 방법에 따른 K-Means 문서 클러스터링의 LSI 분석 (Latent Semantic Indexing Analysis of K-Means Document Clustering for Changing Index Terms Weighting)

  • 오형진;고지현;안동언;박순철
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.735-742
    • /
    • 2003
  • 정보검색 시스템에서 문서 클러스터링 기술은 사용자 질의에 대해 검색된 문서들을 문서간의 유사도를 기반으로 특정 주제에 따라 재배치하여 놓는 기술로써 사용자에게 검색의 편의성을 제공하고, 그 결과들을 시각적으로 보여줄 수 있다. 본 논문에서는 K-Means 알고리즘을 사용하여 문서를 클러스터링하며 문서를 대표하는 색인어에 가중치를 부여하는 기법에 대하여 논한다. 클러스터링 결과를 시각적으로 보여주기 위하여 문서와 클러스터 중심들을 2차원 공간으로 사상하기 위한 Latent Semantic Indexing 접근 방법을 적용하였다. 실험 결과 문서의 색인어에 대한 가중치 부여 방법을 동일하게 하거나 또는 유사한 수식을 적용한 사례보다는 로컬가중치, 글로벌가중치, 정규화 요소를 모두 부여한 사례에서 문서들이 2차원 벡터 공간에서 군집하여 분포하는 클러스터링 효과가 우수하였다. 특히 로컬 가중치와 글로벌 가중치에 logarithm을 적용하였을 때 문서 분포의 군집도는 현저하게 나타남을 알 수 있었다.

Improving Accuracy of Chapter-level Lecture Video Recommendation System using Keyword Cluster-based Graph Neural Networks

  • Purevsuren Chimeddorj;Doohyun Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권7호
    • /
    • pp.89-98
    • /
    • 2024
  • 본 논문은 챕터 수준의 강의 동영상 추천 시스템에 있어서 추천의 정확도와 처리속도 간의 균형문제, 즉, 추천 정확도를 향상시키려면 처리 속도가 저하되고, 반대로 처리 속도를 높일 경우 정확도가 감소하는 문제에 대하여 연구한다. 본 논문에서는 이의 해결을 위하여 TF-IDF, K-Means++ Clustering, Graph Neural Network(GNN) 등 다양한 기법을 복합적으로 활용하는 방법을 제안한다. 즉, 챕터들의 유사성을 바탕으로 클러스터를 사전에 구성함으로써 검색 시의 계산량을 줄여 속도를 향상시키면서도, 클러스터를 노드로 하는 그래프에 대하여 GNN을 적용함으로써 추천의 정확도를 향상시키는 방법을 제안한다. 실험 결과 GNN을 사용한 경우 추천의 정확도가 MRR 지표에서 약 19.7% 증가하였으며, 유사도 기반의 정밀도에 있어서 약 27.7% 증가하는 결과를 확인할 수 있었다. 이를 통해 학습자의 질의에 보다 적합한 동영상 챕터를 추천하는 학습시스템 구축에 기여할 것으로 기대한다.

고성만과 강진만에서 현탁물 섭식자에 유용한 입자물질 양과 질의 계절 변동 (Seasonal Variation of the Quantity and Quality of Seston as Diet Available to Suspension-Feeders in Gosung and Kangjin Bays of Korea)

  • 이필용;강창근;최우정;양한섭
    • 한국수산과학회지
    • /
    • 제34권4호
    • /
    • pp.340-347
    • /
    • 2001
  • 한반도 남해안의 고성만과 강진만에 대한 입자유기물질 양과 현탁물식자를 위한 먹이로서의 질의 월별변동을 밝히기 위하여 부유입자물질의 원소 및 생화학 조성에 대한 현장조사를 1999년7월부터 2000년 8월까지 실시하였다. 두 해역의 총 부유입자물질은 해역간에 유사한 농도 분포로 뚜렷한 월별 변동 양식을 나타내지 않았다. 그러나 이들 생물군의 잠재 먹이원인 입자유기물질 조성성분들은 두 해역 모두 여름철에 뚜렷이 높은 농도를 보이는 계절 변동성을 나타내었다. 한편, 입자유기물질의 원소나 생화학 조성 성분의 높은 농도가 나타나는 시기는 chlorophyll a와 잘 일치하여 식물플랑크톤 생산이 입자유기물질의 중요한 조절자라는 것을 가리킨다. 그러나, chlorophyll a와 입자유기물질 조성성분(입자 단백질, 탄수화물 및 지질)들 사이에 유의한 상관관계는 나타나지 않았고, 이들 생화학 성분들 간에도 높은 상관성은 발견되지 않았다 이와 같은 결과들은 식물플랑크톤 생물량이 낮은 시기에 연구 해역들의 입자유기물질에 대한 또 다른 과정들에 의한 기여가 있다는 것을 시사하였는데, 가을에서 봄철사이에 높은 C:Chl a, C:N 비 및 입자 탄수화물의 높은 농도 등은 입자유기물질의 생화학성분 농도가 표층 퇴적물 재부유나 양식생물의 배설과 같은 과정들에 의해 영향을 받고 있다는 것을 나타낸다. 본 조사해역에서 입자유기물질 중 생화학 성분들의 합으로 나타낸 먹이물질은 그것들의 에너지 값과 함께 가을부터 봄철사이에는 다소 높은 농도가 관찰되었지만, 가장 높은 농도는 여름철에 나타났다. 총 부 유입자물질 중 먹이물질이 차지하는 비율로서 표시한 먹이지수는 대체로 $6\%$를 넘지 않는 수준으로 입자유기물질의 영양상태에 있어서 다소 낮은 질을 나타내는 것으로 평가되었다. 본 연구 결과는 식물플랑크톤 변동과 함께 입자유기물질의 먹이물질과 먹이지수 변동을 동시에 측정함으로서 현탁물 섭식자 생물군의 성장과 비만 및 생리생태를 이해하기 위한 자연의 먹이환경으로서 입자유기물질 농도나 질을 더욱 효과적으로 나타낼 수 있다는 것을 보인다.

  • PDF

벼에 대한 규산질비료의 시용량 및 시용주기 결정 (Determination of Optimum Rate and Interval of Silicate Fertilizer Application for Rice Cultivation in Korea)

  • 송요성;전희중;정병간;박우균;이기상;곽한강;윤정희;이춘수;연병열;김필주;윤영상
    • 한국토양비료학회지
    • /
    • 제40권5호
    • /
    • pp.354-363
    • /
    • 2007
  • 벼에 대한 규산질비료의 시용수준별 수량으로 본 비효반응, 적정시용량, 그리고 수량 및 토양 유효규산 함량에 의한 시용주기를 구명하기 위하여 2002 2005년에 추청벼를 재배하여 배수 약간 불량한 지산통인 보통답과 석천통인 사질답 토양에서 포장시험을 수행하였다. 규산질비료의 시용량이 증가함에 따라 벼 수량은 증가하여 토양 유효규산 130, 200 및 $270mg\;kg^{-1}$ 조절량 시용시 무시용구보다 벼 증수율은, 보통답 6, 9 및 12%, 사질답 10, 17 및 25%이였다. 벼 수확 후 토양 유효규산 함량과 벼 수량과의 관계를 2차 회귀관계식으로 분석한 결과 토양의 유효규산 함량이 보통답 $154mg\;kg^{-1}$, 사질답 $160mg\;kg^{-1}$, 평균 $157mg\;kg^{-1}$일 때 최고수량을 얻을 수 있었다. 규산질 비료를 토양의 유효규산 함량의 현행기준인 $130mg\;kg^{-1}$으로 조절 시용할 때 수량으로 본 규산질비료의 잔효는 보통답 및 사질답 모두 3년 정도이었다. 규산질비료를 유효규산 함량 $130mg\;kg^{-1}$으로 조절시용시 토양의 유효규산 함량은 연도가 경과함에 따라 일정하게 감소하여 규산질비료시용 3년 이후에는 무처리 수준에 도달하였다. 따라서 현행 규산질비료의 공급주기는 현행 4년 1주기에서 3년 1주기로의 조정이 가능하였지만, 수량반응과 토양유효규산 함량으로 볼 때 유효규산 $200{\sim}270mg\;kg^{-1}$으로 조절시용시의 공급주기는 3~5년이었다. 그러나 보통답은 물론 특히 사질답의 경우 토양검정에 의하여 매년 적절한 양을 시용하는 것이 더 바람직한 것으로 밝혀졌다. 벼 수확기 규산흡수량을 보면 규산질비료 무시용구 (보통답 $559kg\;ha^{-1}$, 사질답 $622kg\;ha^{-1}$)에 비하여 토양의 유효규산 130, 200 및 $270mg\;kg^{-1}$ 조절량의 규산질비료 시용구는 각각 보통답 643, 731 및 $794kg\;ha^{-1}$, 사질답 706, 834 및 $853kg\;ha^{-1}$으로서 현저히 증가 하였다. 토양 유효규산 130, 200 및 $270mg\;kg^{-1}$ 조절량의 규산질비료 시용당년의 규산 흡수이용률은 각각 보통답 4.3, 3.7 및 3.2%, 사질답 8.0, 6.3 및 5.7%로 보통답에 비하여 사질답에서 매우 높았으며 4년 동안의 규산의 흡수이용률도 두 토양 모두 시용당년과 유사한 경향을 보였다.