• 제목/요약/키워드: 패턴 유사성 검색

검색결과 50건 처리시간 0.03초

순차 패턴을 이용한 XML문서의 유사성 계산 방법 분석 (Korea Information Science Society)

  • 이원철;이상민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.232-234
    • /
    • 2004
  • XML 문서의 요소는 의미적인 정보와 트리기반의 구조적인 정보를 포함하고 있기 때문에 요소의 구조적인 유사성이 곧 XML 문서의 유사성으로 연구되어 왔다. 그러나 구조적이고 순차적인 유사성만을 고려한 순차패턴 유사성 검색 방법은 의미적인(sementic) 유사성을 제대로 반영을 할 수가 없다. 이것은 정보 검색에 있어 재현율(recall)을 낮을 수밖에 없는 원인을 제공한다. 따라서 본 논문에서는 기존에 사용되었던 순차패턴을 기반으로 한 유사성의 계산 방법과 각각의 연구 방법이 의미적인 유사성에 대하여 한계가 있음을 찾아보았다.

  • PDF

소셜 네트워크 기반 사용자 유사성 발견을 통한 개인화 및 소셜 검색 (Personalized and Social Search by Finding User Similarity based on Social Networks)

  • 박건우;오정운;이상훈
    • 정보처리학회논문지D
    • /
    • 제16D권5호
    • /
    • pp.683-690
    • /
    • 2009
  • 소셜 네트워크(Social Network)는 웹 환경에서 개인 중심의 네트워크로 구성되어 웹 사용자별 프로파일을 탐색하고 새로운 연결을 형성함으로써 정보의 소통을 지원한다. 따라서 유사한 내재적 정보를 가진 웹 사용자들로 구성 된 소셜 네트워크를 찾아서 검색에 적용한다면 검색의 효율성과 검색 결과에 대한 웹 사용자의 만족도를 향상 시킬 수 있다. 본 논문에서는 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜 네트워크를 구성 한다. 둘째, 사용자들의 속성(Feature)에 내재된 정보를 이용하여 주제(topic)별 웹 사용자 간 유사성(Similarity)을 산정한 후, 주제(Topic)별 변화되는 유사성에 따라 소셜 네트워크를 재구성한다. 마지막으로 산정된 유사성과 웹 사용자들의 검색결과에 대한 만족도, 즉 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 주제별 유사성이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 이와 같은 사실을 검색에 적용한다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성 및 신뢰성 향상에 기여 할 수 있다.

토픽별 인간 속성의 영향력 기반 소셜 관계 지수 산정 (Social Relationship Value Computation based on the Influence of Human Attributes classified by Topics)

  • 권오상;박건우;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.884-887
    • /
    • 2010
  • 최근 검색엔진의 효율성을 향상시키고 검색결과에 있어서 사용자들의 요구사항을 충족시키기 위한 연구들이 활발히 수행되고 있으며, 많은 방법론들이 제시되고 있다. 이는 방대한 정보 속에서 사용자의 검색 의도에 맞는 정보를 효과적으로 제공하는 것을 그 목표로 한다. 특히 본 논문에서는 검색하고자 하는 토픽별 사용자의 인적 속성들이 미치는 영향력을 기반으로 사용자간 소셜 관계 지수(SRV : Social Relationship Value)를 산정하는 방법을 제안한다. 소셜 관계 지수란 인간의 내재적인 특성을 수치로 산정한 것으로, 웹 사용자들에게 있어서는 검색 성향의 유사정도와 직결된다. 따라서 검색하고자 하는 토픽별 개인 성향의 유사정도를 수치로 부여하고 유사성이 높은 사람들의 검색 정보를 이용하면 사용자에 보다 만족된 검색결과를 제공할 수 있다. 본 연구에서는 구글 디렉터리(Google directory)의 정제된 각 토픽별 하위 범주(category)에 대해 선택 결과가 같은 사람들을 대상으로 인적 속성을 분석하고, 그 영향력을 가중치로 적용해 산정된 소셜 관계 지수와 사용자들의 검색 패턴을 비교 하였다. 그 결과 특정인을 기준으로 소셜 관계 지수가 높은 사람들의 검색 패턴이 매우 유사함을 확인 하였다. 이를 통해 토픽별 개인 간 연결 강도가 강할수록, 즉 유사성이 높은 사용자간에는 검색 패턴 또한 유사함을 검증 할 수 있었다.

시계열 데이터베이스에서의 분해법을 이용한 유사 검색 기법 (Similarity Search in Time-Series Databases Using Decomposition Method)

  • 박신유;문봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.110-112
    • /
    • 2000
  • 최근 몇 년간 시계열 데이터의 저장 및 분석에 대한 연구가 활발히 진행되고 있으며, 시계열 데이터베이스에서 유사패턴(similarity pattern)을 탐색하는 기법이 광범위한 응용분야에서 중요한 연구주제로 자리잡고 있다. 본 논문에서는 회귀분석방법을 바탕으로 한 분해 시계열 방법을 이용함으로써 기존의 유사성의 개념을 확장시켰다. 즉, 시계열 데이터가 가지고 있는 패턴을 여러 성분으로 분해하여 각기 다른 저장 공간에 저장하고, 이를 이용하여 유사성을 탐색할 때에도 분리된 각 성분 중 특정 변동특성이 유사한 데이터를 추가적으로 요구되는 시간없이 검색할 수 있다. 이는 전체 시계열 데이터를 이해하는데 뿐만 아니라 데이터를 예측하는 방법에도 유용하게 사용될 수 있다.

  • PDF

시계열 데이터의 유사성 검색을 위한 히스토그램 비교법 (Histogram Comparing Technique for Similarity Search in Time-Series Data)

  • 임동혁;김창룡;정진완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.331-333
    • /
    • 1999
  • 데이터웨어하우스의 주된 용도는 비즈니스 의사결정이며, 이를 위한 경향 및 패턴을 찾는 문제는 매우 중요한 연구분야이다. 경향 및 패턴은 데이터웨어하우스 내의 데이터간의 상호관계를 분석함으로써 찾을 수 있는데, 이를 위한 유사성 검색기법 중 특히 뛰어난 3가지 기법들을 자세히 알아보고, 이들에 모두 적용 가능한 히스토그램 비교법을 제안하였다. 제안된 히스토그램 비교법을 이용하면 유클리디안 거리측정의 부담을 대폭 줄여, 전체 처리시간을 비약적으로 감소시킬 수 있다.

  • PDF

소셜 관계 랭크 및 토픽기반_소셜 관계 랭크 알고리즘; 소셜 검색을 향해 (SRR(Social Relation Rank) and TS_SRR(Topic Sensitive_Social Relation Rank) Algorithm; toward Social Search)

  • 박건우;정재학;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.364-368
    • /
    • 2009
  • "소셜 네트워크(Social Network)와 검색(Search)의 만남"은 현재 인터넷 상에서 매우 의미 있는 두 영역의 결합이다. 이와 같은 두 영역의 결합을 통해 소셜 네트워크 내에서 친구들의 생각이나 관심사 및 활동을 검색하고 공유함으로써 검색의 효율성과 적합성을 높이기 위한 연구들이 활발히 수행되고 있다. 본 논문에서는 일반적인 소셜 관계 랭크(SRR : Social Relation Rank) 및 토픽이 반영된 소셜 관계 랭크(TS_SRR : Topic Sensitive_Social Relation Rank) 알고리즘을 제안한다. SRR은 소셜 네트워크 내에 존재하는 웹 사용자들의 내재적인 특성 및 검색 성향 등에 대한 관련성(또는 유사정도)을 수치로 산정한 '소셜 관계 지수(SRV : Social Relation Value)'에 랭킹(Ranking)을 부여한 것을 의미한다. 제안하는 알고리즘의 검색 적용 가능성을 검증하기 위해 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜네트워크를 구성 한다. 둘째, 웹 사용자들의 속성에 내재된 정보를 이용하여 토픽별 SRV를 산정한 후 랭킹을 부여하고, 토픽별 변화되는 랭킹에 따라 소셜 네트워크를 재구성 한다. 마지막으로 (TS_)SRR과 웹 사용자들의 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 (TS_)SRR이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 결론적으로 (TS_)SRR 알고리즘을 기반으로 관심분야에 연관성이 높은, 즉 상위에 랭크 된 웹 사용자들을 검색하여 검색 패턴을 공유 또는 상속받는 다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성과 신뢰성 향상에 기여 할 수 있다.

패턴매칭을 이용한 유사도 비교 분석 (A Similarity Valuating System using The Pattern Matching)

  • 고방원;김영철
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.185-192
    • /
    • 2010
  • 본 논문에서는 서로 다른 두 개의 문서에 등장하는 패턴 매칭을 이용하여 유사도를 평가하는 시스템을 제안한다. 기존의 문서들의 유사도를 평가하는 방법에는 지문법과 같은 통계적 방법을 주로 이용하였다. 하지만 이 방법은 관련이 없는 두 문서에서 우연히 유사한 단어가 많이 등장 할 때 유사성이 높게 나오는 정확성의 문제점이 있다. 이러한 문제점은 단순히 두 문서의 통계적인 수치를 비교하기 때문에 발생한다. 하지만 본 논문에서 제시하는 패턴을 이용한 방법은 일치하는 패턴을 검색하여 유사성을 판별하기 때문에 이러한 문제를 해결하였다. 하지만 패턴을 검색하는 시간이 오래 걸리는 단점이 있는데 이를 개선하는 알고리즘 또한 본문에서 소개한다.

패턴 정보를 이용한 설계패턴 검색 시스템 구축 (Construction of Design Pattern Retrieval System using Pattern Information)

  • 김귀정;송영재
    • 정보처리학회논문지D
    • /
    • 제8D권1호
    • /
    • pp.88-98
    • /
    • 2001
  • 본 연구는 설계패턴의 효율적인 관리와 재사용을 위하여 패턴 정보를 이용한 설계패턴 검색 시스템을 구축하였다. 패턴 정보는 패턴 속성정보와 패턴 메타정보로 구성하였고, 패턴 속성정보는 패턴 패싯 분류와 패턴 검색을 위한 유사도 측정에 이용되며, 패턴 구조를 UML로 모델링하기 위하여 패턴 메타 정보를 이용하였다. Gamma 분류 방법을 확장하여 각 설계패턴이 사용될 수 있는 여러 경험적 상황을 패싯 항목으로 설정하고 패턴 정보로 관리하였다. 또한 E-SARM 검색 방법을 사용하여 검색된 패턴은 메타정보를 이용하여 UML 클래스 다이어그램으로 나타낼 수 있도록 하였고, E-SARM을 설계패턴의 검색에 적용하여 최적의 결과를 얻을 수 있는 환경을 시뮬레이션 하였다. 패턴 뷰어를 통한 신규 패턴 등록이 가능하며, 등록된 패턴은 패턴 속성정보와 메타정보로 관리된다. 따라서 본 시스템은 효율적인 패턴 관리가 가능하고, UML 모델링을 지원하며, 관련 패턴의 우선순위 검색이 가능하여 패턴 선택 비용이 적고, 재사용성이 높은 설계패턴 검색 시스템이다.

  • PDF

효율적인 설계패턴의 검색 및 관리에 관한 연구 (A Study on Retrieval and Management of Efficient Design Patterns)

  • 최영건;김귀정;송영재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.535-538
    • /
    • 2000
  • 본 연구는 점차로 늘어가고 있는 설계 패턴의 효율적인 관리와 재사용을 위하여 패싯 방식을 이용한 패턴 분류와 검색 방법을 제안하고 이를 UML 다이어그램으로 나타낼 수 있도록 설계 구현하였다. 재사용 가능한 설계 패턴은 기본적인 특성을 기준으로 영역별로 라이브러리에 저장하고 각 패턴의 특성을 표현하기 위하여 패싯과 항목을 설정하였다. 또한 모든 패턴의 패싯 항목에 대해 유사성을 측정하여 관련 패턴을 찾을 수 있도록 하였으며, 패턴 분류 체계에 따라 패턴을 추가.갱신함으로써 적절한 경험을 자동화된 방식으로 제공할 수 있도록 하였다. 제안한 분류 방식은 검색 결과 Gamma의 분류방법을 사용했을 때 보다 질의 작성이 간단하고 관련 패턴을 쉽게 찾을 수 있어 재사용에 용이하며 이를 UML 다이어그램으로 표현할 수 있다.

  • PDF

개념간 유사성 측정을 이용한 개념 기반 이미지 검색 (Concept based Image Retrieval Using Similarity Measurement Between Concepts)

  • 조미영;최춘호;신주현;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.253-255
    • /
    • 2003
  • 기존의 개념 기반 이미지 검색에서는 이미지의 의미적 내용 인식을 위해 일반적으로 어휘적 정보나 텍스트 정보를 이용했다. 이러한 텍스트 정보 기반 이미지 검색은 전통적인 검색 방법인 키워드 검색 기술을 그대로 사용하여 쉽게 구현할 수 있으나 텍스트의 개념적 매칭이 아닌 스트링 매칭이므로 주석처리된 단어와 정확한 매칭이 없다면 찾을 수가 없었다. 이에 본 논문에서는 ontology의 일종인 WordNet을 이용하여 깊이 정보량 링크 타입, 밀도 등을 고려한 개념간 유사성 측정으로 패턴 매칭의 문제를 해결하고자 했다. 또한 키워드로 주석처리 되어 있는 Microsofts Design Gallery Live의 이미지를 이용하여 개념간 유사성 측정법을 실질적으로 개념 기반 이미지 검색에 적용해 보았다.

  • PDF