• 제목/요약/키워드: 유사성 탐색

검색결과 491건 처리시간 0.025초

특징벡터의 차원축약 기법을 이용한 2단계 내용기반 이미지검색 시스템 (Two-stage Content-based Image Retrieval Using the Dimensionality Condensation of Feature Vector)

  • 조정원;최병욱
    • 한국통신학회논문지
    • /
    • 제28권7C호
    • /
    • pp.719-725
    • /
    • 2003
  • 내용기반 이미지검색 시스템에서는 색인과정으로 색상, 형태 및 질감 등의 특징정보를 추출하여 데이터베이스에 저장한다. 전체 검색 시스템 내에서 탐색이라 함은 특징정보 데이터베이스를 이용하여 질의이미지와 유사한 특징정보를 갖는 이미지를 찾아나가는 부분 과정으로 정의할 수 있다. 본 논문에서는 내용기반 이미지검색 시스템에서의 새로운 2단계 탐색방법을 제안한다. 제안하는 방법은 사용자가 질의를 입력한 후 결과를 얻을 때까지의 반응시간 중 가장 큰 비중을 차지하는 유사도 비교시간인 탐색시간을 최소화하기 위해 Cauchy-Schwartz 부등식의 특성을 이용하여 미리 특징벡터의 차원을 축약하여 저장하고, 이를 사용하여 검색범위를 최소화함으로써 검색속도를 향상시킬 수 있다. 실험결과를 통해 차원축약 기법을 이용하는 2단계 검색방법으로 기존 상세검색 방법과 비교하여, 동일한 검색 적합성을 보장하면서 대용량의 이미지 데이터베이스에서 월등한 탐색속도 향상을 확인하였으며, 특징벡터가 더욱 고차원화 되고 이미지의 수가 더욱 늘어날수록 효과적이었다.

멀티데이터베이스 시스템에서 정보공유를 위한 개념-기반 의미망의 구축 (A Concept-based Semantic Network for Information Sharing in Multidatabase Systems)

  • 이정욱;백두권
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.188-203
    • /
    • 2001
  • 멀티데이터베이스 시스템(multidatabase system)에서 여러 요소 데이터베이스(component database)에 대한 통합된 접근을 제공하기 위해서는 의미 이질성(semantic heterogeneity)이 탐색되고 해결되어져야 한다. 즉, 멀티데이터베이스 시스템은 각 요소 데이터베이스가 가지고 있는 정보의 의미를 이해하고 의미적으로 동등한 또는 유사한 정보들을 식별할 수 있어야 한다. 또한, 멀티데이터베이스 시스템은 사용자로 하여금 실세계의 동일한 정보를 가지고 있는 여러 다른 데이터베이스로부터 원하는 정보를 용이하게 획득할 수 있도록 해야 한다. 본 논문에서는, 요소 데이터베이스간의 의미 이질성을 탐색하고 해결하기 위하여 정보가 갖고 있는 개념간 의미관계에 기반한 의미망(semantic network)을 구축한다. 또한 의미질의어(semantic query language)를 제공하여 사용자가 스키마에 대한 사전 지식이 없이도 여로 자율적인 데이터베이스로부터 원하는 정보를 용이하게 획득 할 수 있도록 한다.

  • PDF

조선시대 후기 가구와 명식(明式)가구 탁자(卓子)류 가구 조형 디자인의 유사성 연구 (Research on the Similarity of Furniture Design of Table Furniture in the Later Joseon Dynasty and Ming-style Furniture)

  • 소양;김기수;이양
    • 한국콘텐츠학회논문지
    • /
    • 제20권8호
    • /
    • pp.522-537
    • /
    • 2020
  • 조선 왕조는 명나라, 청나라와 여러 차원의 긴밀한 교류를 가졌으며, 가구 조형 디자인의 발전 과정에서 같은 문화적 원천과 상호 왕래, 동일한 요소들이 서로의 가구 조형에서 나타나고 있다. 본 논문은 '조선시대 후기 가구'와 '명식(明式) 가구'를 연구 주제로 탁자(卓子)류 가구를 구체적인 연구 대상으로 삼아 양국 교류사의 연구를 결합한 '유사성'의 시각에서, 전체적 디자인과 부분적 디자인 두 가지 측면에서 양국 전통 가구의 조형 디자인을 검토했다. 구체적인 사례 분석에서 조선시대 소반(小盤), 경상(經床), 연상(硯床) 등의 탁자(卓子)류 가구는 명청시대의 항탁(炕桌), 방탁(方卓), 주탁(酒桌) 등 탁자(卓子)류 가구와 전체적인 조형 디자인에서 유사성을 나타냈다. 부분적인 디자인은 비슷한 두 나라의 가구의 안면(案面), 운각(雲角), 두루마리(卷筒), 다리(足) 등에서 유사성을 잘 보여주고 있다. 본 논문은 '풍혈(風穴)' 조형물의 연원(淵源)을 추정함으로써 한국 전통가구 문화에 대한 연구의 폭을 넓히고자 했다. 한중간에 다방면에 걸친 교류가 확대되고 있는 현실을 감안할 때, 전통가구에서 유사성을 탐색하는 것은 양국의 문화교류 과정을 분석하고 교류를 활성화하는 일에 도움이 될 것이다.

시계열 데이터베이스에서 인덱스 보간법을 기반으로 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘 (An Index Interpolation-based Subsequence Matching Algorithm supporting Normalization Transform in Time-Series Databases)

  • 노웅기;김상욱;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.217-232
    • /
    • 2001
  • 본 논문에서는 시계열 데이터베이스에서 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 정규화 변환을 시계열 데이터 간의 절대적인 유클리드 거리에 관계 없이, 구성하는 값들의 상대적인 변화 추이가 유사한 패턴을 갖는 시계열 데이터를 검색하는 데에 유용하다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 정규화 변환 서브시퀀스 매칭에 단순히 응용할 경우, 질의 결과로 반환되어야 할 서부시퀀스를 모두 찾아내지 못하는 착오 기각이 발생한다. 또한, 정규화 변환을 지원하는 기존의 전체 매칭 알고리즘의 경우, 모든 가능한 질의 시퀀스 길이 각각에 대하여 하나씩의 인덱스를 생성하여야 하므로, 저장 공간 및 데이터 시퀀스 삽입/삭제의 부담이 매우 심각하다. 본 논문에서는 인덱스 보간법을 이용하여 문제를 해결한다. 인덱스 보간법은 인덱스가 요구되는 모든 경우 중에서 적당한 간격의 일부에 대해서만 생성된 인덱스를 이용하며, 인덱스가 필요한 모든 경우에 대한 탐색을 수행하는 기법이다. 제안된 알고리즘은 몇 개의 질의 시퀀스 길이에 대해서만 각각 인덱스를 생성한 후, 이를 이용하여 모든 가능한 길이의 질의 시퀀스에 대해서 탐색을 수행한다. 이때, 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 질의 시에 주어진 질의 시퀀스의 길이에 따라 생성되어 있는 인덱스 중에서 가장 적절한 것을 선택하여 탐색을 수행한다. 이때, 생성되어 있는 인덱스의 개수가 많을수록 탐색 성능이 향상된다. 필요에 따라 인덱스의 개수를 변화함으로써 탐색 성능과 저장 공간 간의 비율을 유연하게 조정할 수 있다. 질의 시퀀스의 길이 256 ~ 512중 다섯 개의 길이에 대해 인덱스를 생성하여 실험한 결과, 탐색 결과 선택률이 $10^{-2}$일 때 제안된 알고리즘의 탐색 성능이 순차 검색에 비하여 평균 2.40배, 선택률이 $10^{-5}$일 때 평균 14.6배 개선되었다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 더욱 향상되므로, 실제 데이터베이스 응용에서의 효용성이 높다고 판단된다.

  • PDF

영상 압축을 위한 유사성 함수 연구 (Study on the Similarity Functions for Image Compression)

  • 주우석;강종오
    • 한국정보처리학회논문지
    • /
    • 제4권8호
    • /
    • pp.2133-2142
    • /
    • 1997
  • 프랙탈 영상압축은 블록단위의 비교방식을 사용함으로써 기존의 압축 방법에 비해 획기적으로 증대된 압축율을 보인다. 소프트웨어에 의한 실시간대 재생이 가능함에도 불구하고 프랙탈 영상압축의 실용화에 관건이 되는 것은 압축에 소요되는 시간이다. 본 논문에서는, i)영상내부의 차원정보 추출 및 군집화에 의해 유사블럭 탐색 횟수를 줄임으로써 압축에 소요되는 시간을 최소화시키는 알고리즘과 ii)영상내부의 휘도 및 명암대비 정보를 사용하여 재생영상의 화질을 증가시키는 알고리즘을 제안하고 검증함으로써, 고속이면서도 상대적으로 고화질을 유지할 수 있는 방법을 제시하였다.

  • PDF

Candida antarctica lipase B의 상동체 효소 탐색과 발현 (Exploration and functional expression of homologous lipases of Candida antarctica lipase B)

  • 박성순
    • 미생물학회지
    • /
    • 제51권3호
    • /
    • pp.187-193
    • /
    • 2015
  • Candida (Pseudozyma로도 알려짐) antarctica lipase B(CAL-B)는 학문적으로 그리고 산업적으로 많이 활용되고 있다. CAL-B 자체에 대한 연구는 많이 진행되어온 반면, CAL-B 상동체에 관한 연구는 그리 알려진 바가 없다. 본 연구에서는 단백질 유사성 검색을 통해서 CAL-B의 상동체 탐색을 수행하였고, 6종의 단백질 서열을 찾았다. 해당하는 유전자들을 대장균에 대한 코돈 최적화를 수행하였고, 이를 바탕으로 유전자 합성을 진행하였다. 이들 유전자를 대장균 발현용 벡터에 클로닝한 후, 대장균 내에서 단백질 발현을 시도하여 이들 중 4종의 단백질이 성공적으로 발현되었다. 이들 단백질들이 가수분해 효소로서의 활성이 있는지 확인하기 위해서, 4-nitrophenyl acetate와 4-nitrophenyl butyrate를 반응기질로 하여 가수분해 반응성을 확인하였다. 이들 단백질들의 비활성(specific activity)값은 $(1.3-30){\times}10^{-2}{\mu}mol/min/mg$로 측정되었고, 이는 CAL-B의 비활성 수치보다는 다소 낮은 값에 해당하였다. (${\pm}$)-1-phenylethyl acetate의 가수분해 반응에 대한 입체선택성은 이들 상동체 효소들 중에서 Pseudozyma hubeiensis SY62에서 유래된 효소만이 CAL-B의 입체선택성과 유사함이 확인되었다.

CS-트리 : 고차원 데이터의 유사성 검색을 위한 셀-기반 시그니쳐 색인 구조 (CS-Tree : Cell-based Signature Index Structure for Similarity Search in High-Dimensional Data)

  • 송광택;장재우
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.305-312
    • /
    • 2001
  • 최근 고차원 색인 구조들이 멀티미디어 데이터베이스, 데이터 웨어하우징과 같은 데이터베이스 응용에서 유사성 검색을 위해 요구된다. 본 논문에서는 고차원 특징벡터에 대한 효율적인 저장과 검색을 지원하는 셀-기반 시그니쳐 트리(CS-트리)를 제안한다. 제안하는 CS-트리는 고차원 특징 벡터 공간을 셀로써 분할하여 하나의 특징 벡터를 그에 해당되는 셀의 시그니쳐로 표현한다. 특징 벡터 대신 셀의 시그니쳐를 사용함으로써 트리의 깊이를 줄이고, 그 결과 효율적인 검색 성능을 달성한다. 또한 셀에 기반하여 탐색 공간을 효율적으로 줄이는 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 삽입시간, k-최근접 질의에 대한 검색 시간 그리고 부가저장 공간 측면에서 성능 비교를 수행한다. 성능비교 결과 CS-트리가 검색 성능에서 우수함을 보인다.

  • PDF

독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구 (A Study on the Application of Topic Modeling for the Book Report Text)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권4호
    • /
    • pp.1-18
    • /
    • 2016
  • 이 연구는 독후감 텍스트의 주제분석에 토픽모델링의 활용방안을 탐색하는 것을 목적으로 하고 있다. 텍스트의 주제분석 방안으로서 토픽모델링 분석방법을 이해하고, R에서 제공하는 "topicmodels" 패키지의 LDA 함수를 사용하여 23건의 사례 독후감 텍스트들을 대상으로 실제의 분석작업을 수행하였다 토픽모델링 분석결과 16개의 토픽들을 추출하였고 토픽과 구성 단어들의 관계에서 토픽 네트워크 사례 독후감과 토픽들의 관계에서 독후감 네트워크를 구성하였다. 이후 토픽 네트워크와 독후감 네트워크를 대상으로 중심성 분석을 수행하였으며 분석결과는 다음과 같다. 첫째 16개의 토픽들이 1개의 컴포넌트를 가지는 네트워크로 나타났다. 이것은 16개 토픽들이 상호 연관되어 있다는 것을 의미한다. 둘째, 독후감 네트워크에서는 연결정도 중심성이 높은 독후감들과 낮은 독후감들로 구분이 되었다. 전자의 독후감들은 다른 독후감들과 주제적으로 유사성을 가지며 후자의 독후감들은 다른 독후감들과 주제적으로 상이성을 가지는 것으로 해석하였다. 토픽모델링의 결과를 네트워크 분석과 결합함으로써 독후감의 주제파악에 유용한 결과들을 얻게 되었다.

정량적인 구조-활성상관 (QSAR) 기법에 의한 새로운 농약의 개발. III. 3D QSAR 기법들과 컴퓨터를 이용한 분자설계(CAMD) (Development of new agrochemicals by quantitative structure-activity relationship (QSAR) methodology. III. 3D QSAR methodologies and computer-assisted molecular design (CAMD))

  • 성낙도
    • 농약과학회지
    • /
    • 제7권1호
    • /
    • pp.1-11
    • /
    • 2003
  • 새로운 농약을 탐색하고 개발하는데 있어서 고효율 유기함성 (HTOS) 기술과 고효율 검색 (HTS) 기술 등의 발전과 더불어 컴퓨터 화학을 이용한 분자설계 (CAMD) 방법으로 보편화되고 있는 비교 분자장 분석(CoMFA)과 비교 분자 유사성 지수분석(CoMSIA) 등, 3D QSAR 기법들을 위시하여 분자 홀로그램 구조 - 활성관계 (HQSAR) 분석방법 등, QSAR 기법들을 요약하고 그 활용 사례들을 간략하게 소개하였다.

웹 문서 형식과 클러스터 내의 문서 유사도를 이용한 동적 추천 시스템 (Dynamic Recommendation System Using Web Document Type and Document Similarity in Cluster)

  • 김진수;김태용;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.274-276
    • /
    • 2001
  • 기존의 여러 동적 추천 시스템에서 사용자들의 브라우징 패턴을 반영하려고 노력하였다 .그러나 대부분의 동적 추천 시스템들은 웹 문서들의 형식이나 웹 문서들 간의 연관성을 고려하지 않고, 사용자들의 브라우징 패턴에만 근거하기 때문에 연관성이 없거나 의미 없는 웹 문서들에 대한 추천까지 제공하는 문제점을 지니고 있다. 본 논문에서는 웹 문서들 사이의 유사도와 로그 파일 안에 들어있는 사용자들이 패턴을 이용하여 웹 문서 자체의 형식에 따라 연관된 웹 문서뿐만 아니라 순차적인 특성을 가진 웹 문서를 추천 문서로 제공한다. 이때 추천 웹 문서의 형식이 탐색 페이지이면 사용자 브라우징 순차 패턴 DB 중에서 사용자들이 자주 항해하는 순차적인 특성을 갖는 웹 문서까지 제공하는 동적 추천 시스템을 제안한다.

  • PDF