• 제목/요약/키워드: 패턴검색

검색결과 574건 처리시간 0.035초

디자인 패턴 구조를 이용한 클러스터링에 관한 연구 (A Study on Clustering Algorithm Using Design Pattern Structure)

  • 한정수;김귀정
    • 한국콘텐츠학회논문지
    • /
    • 제2권1호
    • /
    • pp.68-76
    • /
    • 2002
  • 클러스터링은 부품 분류의 대표적인 방법인데, 클래스나 모듈의 응집도와 결합도를 이용한 기존의 클러스터링 방법은 클래스간의 관계에 중점을 둔 디자인 패턴을 기존의 클러스터링 방법을 이용하는 것은 효과적일 수 있다. 본 논문에서는 디자인 패턴을 분류하기 위해 패턴 구조의 특성을 가지고 분류하였다. 그리고 클러스터링에 의한 분류는 패싯 분류에 의한 방법보다 높은 정확도를 보여주었다. 따라서 자동화된 분류방법인 클러스터링 알고리즘을 사용하여 디자인 패턴을 분류하는 것이 효과적이라 할 수 있다. 디자인 패턴의 분류는 검색 시 유사한 패턴들이 같은 카테고리에 저장이 되므로 유사 패턴을 비교하여 사용할 수 있으며, 패턴 클러스터링에 의해 분류되고, 패턴의 링크정보를 이용하여 저장하므로 저장소를 효율적으로 관리할 수 있다.

  • PDF

한글화된 수식 패턴을 이용한 수학식 검색 시스템 (A Mathematical Equation Retrieval System Based on Formula Patterns Expressed in Korean)

  • 김신일;양선;고영중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.233-236
    • /
    • 2011
  • 일반적인 문서에 대한 정보 검색 연구는 활발히 진행되고 있으며, 일상 생활 속에서도 대중화되어 많이 사용되고 있다. 이에 따라 음성, 이미지 검색 등 특정 분야의 검색에 대한 연구도 활발히 진행되고 있지만, 수학식 검색에 대한 연구는 비교적으로 미비한 실정이다. 수학식 검색과 관련된 연구들은 대부분 MathML (Mathematical Markup Language), TeX 등으로 작성된 수학식을 대상으로 진행되었지만, 특정 언어나 별개의 수학 입력 툴들을 이용한 검색 방법은 일반 사용자들이 사용하기에는 쉽지 않다는 단점이 있다. 그래서, 본 논문에서는 일반 문서 검색과 마찬가지로, 수학식을 읽듯이 한글을 입력했을 때 색인어 추출 방법 및 검색 방법에 대해 제안한다. 실험을 위해서 수학 문제집에 나오는 1,432개의 수학식을 한글화 시켰고, 한글화된 결과에 대해 패턴 등을 추출하여 MRR (Mean Reciprocal Rank), $Rel_{EQ}$@N(Relevance evaluation at N)로 평가하였다. 100개의 한글 질의어에 대해 MRR@5로 계산된 수학식 검색 결과가 약 0.6 정도 되는 것을 확인할 수 있었고, 학습 데이터에 포함되지 않은 질의수학식 5개에 대해 $Rel_{EQ}$@5로 계산했을 때 평균 60% 의 정확률을 보였다.

퀀터티가 있는 순차 패턴을 찾는 효율적인 알고리즘 (An Efficient Algorithm for Mining Sequential Patterns with Quantities)

  • 임종화;심규석;김철연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.569-571
    • /
    • 2003
  • 순차 패턴을 찾는 것은 데이타 마이닝 응용분야에서 중요한 문제이다. 기존의 순차 패턴 마이닝 알고리즘들은 아이템으로만 이루어진 순차 패턴만을 찾아 주었다. 하지만 아이템과 관련된 퀀터티 정보가 더욱 유용한 정보를 제공해 주는 경우가 많이 있다. 본 논문에서는 퀀터티가 있는 순차 패턴을 찾는 알고리즘을 소개한다. 기존 알고리즘을 초보적으로 확장한 알고리즘은 탐색 공간을 모두 다 검색하여 결과를 얻는 방법을 사용하기 때문에 결과적으로 나쁜 성능을 나타내었다. 이러한 단점을 없애기 위해 여과 과정과 샘플링 기반 알고리즘을 사용하여 검색해야 하는 후보 패턴의 수를 줄여줌으로써 알고리즘의 성능을 개선하였다. 실험 결과는 새로운 방법들이 초보적인 확장을 한 기존 알고리즘보다 훨씬 더 좋은 성능을 나타냄을 보여주었다.

  • PDF

내용기반 음악장르 검색에서 시계열 패턴 인덱스 화일의 성능 분석 (Performance Analysis of the Time-series Pattern Index File for Content-based Music Genre Retrieval)

  • 김영인;김선종
    • 한국산업정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.18-27
    • /
    • 2006
  • 음악 데이타의 양이 급속히 증가함에 따라 음악 데이타베이스의 오디오 특정을 이용한 내용기 반 음악 장르의 효율적인 유사도 검색 방법이 요구되고 있다. 이러한 시스템을 구현하기 위해서는 시계열 패턴인 오디오 특징을 인덱싱 할 수 있는 인덱싱 기법과 데이터마이닝 기술이 필요하다. 본 논문에서는 인덱싱 기법을 기반으로 하는 유사 장르 음악 검색 시스템의 개발에 대하여 논의한다. 먼저, 시계열 패턴 인덱싱 기법과 데이터마이닝을 이용한 내용기반 음악장르 검색 시스템의 구조를 제안한다. 또한, 오디오 특정을 이용한 유사 장르 검색의 성능을 보이기 위하여 시계열 패턴 인덱스 화일을 구축하고 성능 분석 을 제시한다. 실제 데이타의 특정값을 이용한 실험을 통하여 제안한 기법의 성능을 확인하였다.

  • PDF

정보검색에 있어서 두 패러다임의 비교분석 : 이용자에 대한 새로운 인식을 중심으로 (A Comparative Study of Two Paradigms in Information Retrieval: Centering on Newer Perspectives on Users)

  • 조명대
    • 한국문헌정보학회지
    • /
    • 제24권
    • /
    • pp.333-369
    • /
    • 1993
  • 정보검색 시스템을 대하는 대부분의 이용자의 대답은 '이용하기에 어렵다'라는 것이다. 기계적인 정보검색을 기본 철학으로 하는 기존의 matching paradigm은 정보 곡체를 여기 저기 내용을 옮길 수 있는 물건으로 간주한다. 그리고 기존의 정보시스템은 이용자가 시스템을 구성한 사람의 의도 (즉, indexing, cataloguing rule)를 완전히 이해한다면, 즉 완전하게 질문식(query)을 작성한다면, 효과적인 검색을 할 수 있는 그런 시스템이다. 그러나 어느 이용자가 그 복잡한 시스템을 이해하고 정보검색을 할 수 있겠는가? 한마디로 시스템을 설계한 사람의 의도로 이용자가 적응해서 검색을 한다는 것은 아주 힘든 일이다. 그러나 우리가 이용자에 대한 인식을 다시 한다면 보다 나은 시스템을 만들 수 있다고 본다. 우리 인간은 아주 창조적이어서 자기가 처한 상황에서 이치에 맞게끔 자기 나름대로의 행동을 할 수 있다(sense-making approach). 이 사실을 인식한다면, 왜 이용자들의 행동양식에 시스템 설계자가 적응을 못하는 것인가? 하고 의문을 던질 수 있다. 앞으로의 시스템이 이용자들의 자연스러운 행동 패턴에 맞게 끔 설계된다면 기존의 시스템과 함께 쉽게 이용할 수 있는 편리한 시스템이 설계될 수 있을 것이다. 그러므로 도서관 및 정보학 연구에 있어서 기존의 분류. 목록에 대한 연구와 이용자체에 대한연구(예를 들면, 몇 시에 이용자가 많은가? 어떤 종류의 책을 어떤 계충에서 많이 보는가? 도서 및 잡지가 어떻게 양적으로 성장해 왔는가? 등등의 use study)와 함께 여기서 제시한 제3의 요소인 이용자의 인식(cognition)을 시스템설계에 반드시 도입을 해야만 한다고 본다(user-centric approach). 즉 이용자를 중간 중간에서 도울 수 있는 facilitator가 많이 제공되어야 한다. 이용자의 다양한 패턴의 정보요구(information needs)에 부응할 수 있고, 질문식(query)을 잘 만들 수 없는 이용자를 도울 수 있고(ASK hypothesis: Anomolous State of Knowledge), 어떤 질문식 없이도 자유스럽게 Browsing할 수 있는(예를 들면 hypertext) 시스템을 설계하기 위해서는 눈에 보이는 이용자의 행동패턴(external behavior)도 중요하지만 우리 눈에는 보이지 않는 이용자의 심리상태를 이해한다면 훨씬 나은 시스템을 만들 수 있다. 이용자가 '왜?' '어떤 상황에서,' '어떤 목적으로,' '어떻게,' 정보를 검색하는지에 대해서 새로운 관심을 들려서 이용자들이 얼마나 우리 시스템 설계자들의 의도에 미치지 못한다는 사실을 인식 해야한다. 이 분야의 연구를 위해서는 새로운 paradigm이 필수적으로 필요하다고 본다. 단지 'user-study'만으로는 부족하며 새로운 시각으로 이용자를 연구해야 한다. 가령 새롭게 설치된 computer-assisted system에서 이용자들이 어떻게, 그리핀 어떤 분야에서 왜 그렇게 오류 (error)를 범하는지 분석한다면 앞으로의 computer 시스템 선계에 큰 도움을 줄 수 있을 것으로 믿는다. 실제로 많은 방법이 개발되고 있다. 그러면 시스템 설계자가 가졌던 이용자들이 이러 이러한 방식으로 정보검색을 할 것이라는 예측과(즉, conceptual model) 실제 이용자들이 정보검색을 할 때 일어나는 행동패턴 사이에는(즉, mental model) 상당한 차이점이 있다는 것을 알게 될 것이다. 이 차이점을 줄이는 것이 시스템 설계자의 의무라고 생각한다. 결론적으로, Computer에 대한 새로운 지식과 함께 이용자들의 인식을 연구할 수 있는, 철학적이고 방법론적인 연구를 계속하나가면서, 이용자들의 행동패턴을 어떻게 시스템 설계에 적용할 수 있는 지를 연구해야 한다. 중요하게 인식해야할 사실은 구 Paradigm을 완전히 무시하라는 것은 아니고 단지 이용자에 대한 새로운 인식을 추가하자는 것이다. 그것이 진정한 User Study가 될 수 있는 길이라고 생각하며, 컴퓨터와 이용자 사이의 '원활한 의사교환'이 필수불가결 한 지금 우리 학문이 가야 할 한 연구분야이다. (Human Interaction with Computers)

  • PDF

사용자 패턴을 분석한 지능형 메타 검색 시스템 구현 (User-patterns Analysis Intelligent Meta-search System Implementation)

  • 범수한;김복용;이동원;서대영;오용철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.58-61
    • /
    • 2010
  • 최근 인터넷이 보편화되면서 검색에 대한 관심도가 높아지고 있다. 특히 사용자는 정확한 키워드의 입력 없이도 자신이 원하는 검색을 하고 싶어 한다. 그러한 욕구를 충족시키기 위해서 네이트의 '시맨틱', MSN의 'Bing' 등이 새로 제작되어 지고 있으며 네이버, google 등 대형 포털 사이트들도 검색분야에 투자를 아끼지 않고 있다. 본 논문은 사용자중심의 검색을 구현하기 위해서 패턴을 분석하여 연관규칙을 사용하여 검색시간을 단축함을 물론 검색결과의 정확성을 높였다. 구현을 위해서 네이버 사이트의 블로그로 검색의 범위를 한정 하여 데이터를 분석, 관리 및 시각화 하는 사이트를 개발하였다. 또한 검색을 위한 크롤러, 루씬 등을 실질적으로 직접 개발 활용 하였다. 시제품의 시험결과 정답사이트 도출 정확도는 google에 비해 20%, 재현율은 7.2%의 향상성을 보였다.

패턴 기반 기법을 사용한 용어 간 관계 추출 방법 (A Method for Extracting Relationships Between Terms Using Pattern-Based Technique)

  • 김영태;김치수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권8호
    • /
    • pp.281-286
    • /
    • 2018
  • 최근 정보의 복잡성과 다양성 및 방대한 양의 가용 정보가 증가함에 따라 대규모 데이터로부터 의미 있는 검색 결과를 추출하는 방법으로서 온톨로지에 대한 관심과 필요성이 증가하고 있다. 주어진 자연어 텍스트로부터 온톨로지를 추출하는 많은 방법이 제안되었지만, 현재 대부분의 방법은 온톨로지의 구조에 일치되도록 추출하지 못하는 실정이다. 본 논문에서는 온톨로지를 구축하기 위해 필요한 용어를 특정 도메인에서 주어진 텍스트와 구별하고 패턴 기반 방법을 기반으로 용어 사이의 다양한 관계를 추출하는 방법을 제안한다. 용어들 간의 관계를 추출하기 위해 일치 패턴 집합을 고려하고 조인 집합 개념과 패턴의 정렬을 연결하여 검색 공간의 크기를 줄이는 방법을 제안한다. 그 결과 이 방법이 검색 공간으로부터 유용한 어떤 패턴도 제거하지 않고 50-95% 정도로 검색 공간의 크기를 줄이는 결과를 보였다.

인터넷 사용 패턴 분석을 통한 인터넷 LBS상에서의 고성능 위치 검색 기법 설계 및 구현 (High Performance Location Query Method based on Access Pattern Analysis)

  • 김민경;조민정;류옥현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (D)
    • /
    • pp.151-153
    • /
    • 2006
  • 웹을 이용하는 사용자들은 통상적으로 짧은 시간 내에 포탈의 여러 페이지를 방문하는 현상이 있는데, 이 때 방문하는 각 페이지 상에 위치 정보를 필요로 하는 콘텐츠(위치 기반 광고 배너, 위치 기반 날씨 등)가 존재한다면 웹의 특성상 짧은 시간 내에 동일 IP에 대한 위치 정보 검색을 반복하게 된다. 본 논문에서는 이러한 웹 사용 패턴을 캐시를 통해 반영한 고성능 인터넷 위치 검색을 제안, 구현하고 그 성능을 검증한 것이다. 이는 초당 2-3천 건 이상의 대용량 위치 정보를 검색을 수행하데 특히 적합한 방법으로, 적은 비용으로 위치 검색 성능을 획기적으로 높일 수 있었다.

  • PDF

구매자의 탐색 패턴에 기반한 상품 검색 지원 에이전트의 설계 및 구현 (A Design and Implementation of Product Search Support Agent based on the Behavior of Customers)

  • 홍영준;박경환
    • 한국멀티미디어학회논문지
    • /
    • 제3권1호
    • /
    • pp.41-52
    • /
    • 2000
  • 본 논문에서는 인터넷 쇼핑몰에서 구매자가 효과적으로 상품을 검색할 수 있는 상품 검색 지원 에이전트를 설계하고 구현하였다. 기존 쇼핑몰에서의 전자 카탈로그는 주제별 또는 검색어에 의한 상품 정보를 제공하거나 상품구매 이력에 관한 구매 정보를 구매자에게 제시하였다. 본 논문에서는 보다 효과적인 구매 정보를 제공하기 위해 기존 구매자의 탐색 패턴을 분석하여 이를 근거로 하여 구매하려는 상품과 관련된 상품 정보를 제시해 주는 상품 검색 지원 에이전트를 개발하였다. 따라서 구매자는 구매하려는 상품과 관련된 정보를 보다 효과적으로 얻을 수 있어 효율적인 쇼핑을 즐길 수 있을 것이다.

  • PDF

회전 주사 패턴을 사용한 효율적인 영상 기술 및 내용 기반 영상 검색 (An Efficient Image Description Method and Content-based Image Retrieval using Circular Scanning Pattern)

  • 송호근;강응관
    • 한국멀티미디어학회논문지
    • /
    • 제4권1호
    • /
    • pp.29-36
    • /
    • 2001
  • 본 논문에서는 회전 주사 패턴을 사용하여 영상 검색을 위한 효율적인 영상 기술 방법을 제안하였다. 본 논문에서 근회전 주사 패턴을 영상 중심부에 위치시키고, 이를 이용하여 공간 칼라 정보를 기술하였다. 사용된 특징은 회전 대표 칼라와 회전 칼라 질감 그리고 회전 칼라 변화도이다. 제안 방식은 영상의 색상 정보와 그와 관련된 국부적 공간 분포를 효율적으로 기술할 수 있었다. 따라서 위 방식은 영상 검색에 있어 기존방식에 비하여 계산량, 메모리 사용량 등을 줄일 수 있었다.

  • PDF