• 제목/요약/키워드: 분류별 검색

검색결과 307건 처리시간 0.027초

점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 모델 (A Hypertext Categorization Model Exploiting Link and Incrementally Available Category Information)

  • 오효정;임정묵;이만호;맹성현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.89-96
    • /
    • 1999
  • 본 논문은 하이퍼텍스트가 갖는 중요한 특성인 링크 정보를 활용한 문서 분류 모델을 제안한다. 하이퍼링크는 문서간의 관계를 나타내는 유용한 정보로서 링크를 통해 연결된 두 문서는 내용적으로 관련이 있어 검색에 도움을 준다는 것은 이미 밝혀진바 있다. 본 논문에서는 이러한 과거 연구를 바탕으로 새로운 문서 분류 모델을 제안하는데, 이 모델의 주안점은 대상 문서와 링크로 연결된 이웃 문서의 내용 및 범주를 분석하여 대상 문서 벡터를 조정하고, 이를 근거로 문서의 범주를 결정한다. 이웃 문서에 포함된 용어를 반영함으로써 대상 문서의 내용을 확장 해석하고, 이웃 문서의 가용 분류 정보가 있는 경우 이를 참조함으로써 정확도 향상을 기한다. 이 모델은 이웃한 문서의 범주가 미리 할당되어 있지 않은 경우 용어 기반 분류 방법으로 가용 범주를 할당하고, 이렇게 할당된 분류 정보가 다시 새로운 문서의 범주를 결정할 때 사용됨으로써, 문서 집합 전체의 분류가 점진적으로 이루어지며 그 정확도를 더해 나가는 효과를 가져올 수 있다. 이러한 접근 방법은 일반 웹 환경에 적용할 수 있는데, 특히 하이퍼텍스트를 주제별로 분류하여 관리하는 검색 엔진의 경우 매일 쏟아져 나오는 새로운 문서와 기존 문서간의 링크를 활용함으로써 전체 시스템의 점진적인 분류에 매우 유용하다. 제안된 모델을 검증하기 위하여 Reuter-21578과 계몽사(ETRI-Kyemong) 자료를 대상으로 실험한 결과 18.5%의 성능 향상을 얻었다.

  • PDF

온톨로지를 이용한 맞춤형 여행정보 시스템 (The System of customized Travel Information based on Ontology)

  • 조미영;최창;김판구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2006
  • 본 논문에서는 지능형 여행 정보 제공을 위해 제주여행 온톨로지를 구축하여 사용자별 맞춤형 여행정보 제공 및 검색을 위한 시스템을 제안하고자 한다. 기존의 일반 검색이 제한된 정보에 대한 키워드 매칭이 라면, 온톨로지 기반 검색은 키워드 검색, 사전에 의한 확장 검색, 지식입력에 의한 검색이 모두 가능하여 좀 더 지능적 검색이라 할 수 있겠다. 이러한 온톨로지 검색의 장정으로는 속성값, 분류, 메타 정보 등 관련된 여행정보를 모두 활용할 수 있다는 것과. 유사어 활용이 가능하다는 것이다. 또한 검색 어휘의 역할에 따른 차등적인 가중치값 등을 적용하여 Many-Answers-Problem 해결할 수 있다. 즉, 가장 관련 있는 정보를 상위에 랭크시켜 사용자의 체감 정확률을 향상시킬 수 있다.

  • PDF

독립 운동 컬렉션 분류 체계 개발에 관한 연구 - 공훈전자사료관을 중심으로 - (A Study on the Development of an Independent Movement Collection Classification System: Focus on the Gonghun Digital Archive)

  • 오정희;정연경
    • 한국기록관리학회지
    • /
    • 제18권4호
    • /
    • pp.99-124
    • /
    • 2018
  • 본 연구는 국가보훈처의 '공훈전자사료관' 컬렉션을 기반으로 독립 운동 컬렉션에 대한 출처별, 주제별, 자료유형별 분류 체계를 제안하였다. 먼저 출처별 분류 체계는 계층별로 구성하였으며 출처별로 분류된 기록물들은 관련 주제어에 따라 2차 분류한 후, 17가지 자료유형별로 분류하였고 '출처-주제-자료유형'의 인용 순서로 기술하였다. 또한 주제어를 바탕으로 한 귀납적 방법을 이용하여 유의미한 컬렉션을 도출하였다. 이를 통해 공훈전자사료관 컬렉션을 출처별, 주제별, 자료유형별로 이용자가 기록물을 쉽게 찾을 수 있도록 분류하였다. 본 연구의 결과는 독립 운동 DB 자료의 기록물 검색을 지원하기 위한 분류 체계로서 이용자의 접근성을 높이고 독립 운동 기록물 서비스를 확장하는데 기초가 될 것이다.

토픽모델링 및 주성분 분석 기반 검색 질의 유형 분류 연구 (A Study on Search Query Topics and Types using Topic Modeling and Principal Components Analysis)

  • 강현아;임희석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권6호
    • /
    • pp.223-234
    • /
    • 2021
  • 4차 산업 혁명 시대의 도래에 따라 쇼핑의 행태는 더욱 빠르게 오프라인에서 온라인으로 이동하고 있다. 온라인 쇼핑에서 고객의 정보요구를 가장 집약적으로 보여주는 것이 바로 검색 질의이다. 하지만 검색 분야에서도 검색 질의 관련 연구 사례는 많지 않으며 대부분의 검색 질의 연구 분야 선행 연구들은 연구자의 정성적인 판단에 근거하여 제한적인 주제와 데이터 기반으로 연구되어 왔다. 이에 본 연구는 검색 질의 연구 분야에 기계학습을 적용하여 검색 질의와 검색 이후 이용자가 조회한 문서명 로그를 기반으로 토픽모델링 수행 후 검색 질의 주제를 정의함으로써 데이터 기반의 정량적 방법론으로 15개의 검색 질의 주제 유형을 정의하였다. 또한 기존 검색어 자체만을 보고 판단하던 주제 유형에서 나아가 검색 행동특성을 반영한 유형을 정의하기 위하여 주성분 분석을 통해 주요 변수를 추출 후 각 주제별 검색 행동특성을 분석함으로써 검색 탐색 활성도, 상품 관여도에 따른 4가지의 새로운 검색 질의 유형 분류체계를 제시하였다. 본 연구결과는 효과적인 검색서비스 구축 및 검색 시스템 개발에 기여할 것으로 기대된다.

Wavelet 변환 영역에서 칼라 정보와 GLCM 및 방향성을 이용한 영상 검색 (Image Retrieval Using Color feature and GLCM and Direction in Wavelet Transform Domain)

  • 이정봉
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 춘계종합학술대회
    • /
    • pp.585-589
    • /
    • 2002
  • 본 논문에서는 효과적인 특징 추출을 기반으로 한 계층적인 검색 시스템을 제안한다. 조명 변화 및 영상의 이동과 크기 변화 그리고 회전과 같은 기하학적 변형에도 강한 속성을 가지는 영상 검색을 할 수 있도록 사용자의 질의 영상을 웨이블릿(Wavelet) 변환을 한 후 동일한 크기의 부영역으로 나누어진 저대역 부밴드에서 칼라의 특징으로 추출된 모멘트와 질감 특징인 GLCM(Gray Level Co-occurrence Matrix)의 Contrast를 사용해 유사 영상들의 1차 분류 과정을 거친다. 보다 정확한 검색을 수행하기 위해 1차 분류된 후보 영상들에 대해 고대역 부밴드에서 추출된 수평, 수직, 대각선 방향별 에너지(Energy)를 기반으로 한 에너지의 상대적인 성분 분포의 비교가 수행됨으로써 효율적인 영상 검색 결과를 보였다.

  • PDF

SGML 정보검색을 위한 인덱스 관리자의 설계 및 구현 (Design and Implementation of an Index Manager for SGML Information Retrieval)

  • 장재우;이희주;손정한;심부성;주종철
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권2호
    • /
    • pp.135-146
    • /
    • 1999
  • SGML 정보검색을 위한 인텍스 관리자는 SGML 정보 표현의 기본 단위인 엘리먼트 단위의 검색과 문서의 논리적인 구조에 기반한 검색을 지원해야 하면 아울러, 우수한 검색 시간과 낮은 부가 저장 공간을 보장하여야한다. 이러한 요구사항을 만족시키기 위해 본 논문에서는 SGML 정보검색을 위한 사용자 질의 형태별로 분류하여 이를 토대로 SGML 정보검색 인덱스 관리자를 설계한다. 아울러 인덱스 관리자를 UNIX 운영체제하에서 표준 C 언어를 가지고 02 Store 하부저장 시스템을 이용하여 구현한다. 마지막으로 저장 시간, 삭제시간, 검색 시간, 부가 저장 공간 측면에서 구현된 인덱스 관리자의 성능 평가를 수행한다.

대용량 분석 시스템을 이용한 교통 연구 검색 방법론에 관한 연구 (A Study on Traffic Research Retrieval Method using Large Capacity Analysis System)

  • 배진아;윤청
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.577-580
    • /
    • 2018
  • 지난 몇 년간 우리는 소셜 검색에 몰두하여 연관검색 및 소비자의 만족을 위해 빅데이터 분석을 하였다. 최근에는 빅데이터 분석이라는 흐름에 맞춰 기업 및 기관별 본연의 정보를 통합하여 효율적인 검색을 할 수 있도록 하는 솔루션을 대거 도입하고 있다. 또한 기업 및 기관에서 가지고 있는 정보는 기존 비정형 데이터로 방대하여 기존의 방법이나 도구로 수집 및 저장 분석이 어려운 실정이다. 이에 공공기관 및 민간기업 등에서는 키워드 중심의 다양한 검색엔진을 개발하거나 도입하고 있으며, 정보 분류의 확대, 메타데이터의 활용, 태그정보의 제공, 개인 맞춤형 서비스 등 고객의 만족도를 제고하기 위한 다양한 방법을 시도하고 있다. 본 연구에서는 기관의 교통 연구와 관련한 일련의 작업 중 행정문서, 연구정보, 유관기관 게시물 등의 통합 빅데이터를 가지고 검색시스템을 구현하였다. 이와 더불어 사용자 사전 및 동의어 사전을 통한 검색 키워드를 데이터베이스에 저장하여 검색 효율성을 제고하는 방안을 제시한다.

설계 패턴 기반 컴포넌트 분류와 E-SARM을 이용한 검색 (Design Pattern Base4 Component Classification and Retrieval using E-SARM)

  • 김귀정;한정수;송영재
    • 정보처리학회논문지D
    • /
    • 제11D권5호
    • /
    • pp.1133-1142
    • /
    • 2004
  • 본 연구에서는 성공적인 컴포넌트의 재사용을 위하여 도메인 지향(domain orientation) 개념을 도입하여 컴포넌트들을 저장소에 분류, 검색하는 방법을 제안한다. 설계 시 디자인 패턴이 적용된 기존 시스템의 컴포넌트를 대상으로, 해당 도메인 내에 있는 각 컴포넌트와 기준패턴과의 구조적 유사성을 비교함으로서 컴포넌트를 분류하는 방법을 제시하였다. 재사용 가능한 컴포넌트를 기능별로 분할하고 그 구조를 다이어그램으로 제공함으로서 컴포넌트의 재사용 및 플랫폼간의 이식성을 높일 수 있다. 또한 E-SARM 알고리즘을 이용하여 질의와 가장 적합한 컴포넌트와 그와 유사한 후보 컴포넌트들이 우선순위(priority order)로 제공됨으로서 컴포넌트 재사용 효율을 높여줄 수 있도록 하였다.

국제 데이터 속성 기반 건설자재 정보관리 시스템 구축 (Information management system development of construction material based on international data attribute)

  • 한충한
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.645-648
    • /
    • 2008
  • 최근 건설 분야의 정보화 기술이 발달함에 따라 건설생애(Life Cycle) 과정에서 파생되는 방대한 양의 정보를 수집·가공·축적·제공 하는 시스템이 급증하는 추세이다. 특히, 건설공사의 주요요소인 자재 정보를 제공하는 Web 기반 온라인 시스템만 현재 110여개 이상으로 토목·건축·설비·소방 분야에 이르기까지 매우 다양하다. 그러나 이러한 시스템에서 제공 중인 정보가 표준화 및 정형화 되지 않아 건설현장 실무자들의 정보 획득에 있어 많은 어려움을 겪고 있다. 이에 본 연구에서는 정형화되고 표준화된 건설자재정보를 제공하기 위해 건설자재 분류체계를 정의하고 건설자재 속성정보를 정형화하여 자재별 분류체계검색, 통합검색, 카테고리검색 뿐만 아니라 전자카탈로그로 변환 및 생성이 가능한 건설자재정보 관리 시스템을 설계 및 구현 하였다.

3차원 시점 변화를 활용한 이미지 외곽라인 검색 제안 (The Search of Image Outline Using 3D Viewpoint Change)

  • 김성곤
    • 문화기술의 융합
    • /
    • 제5권3호
    • /
    • pp.283-288
    • /
    • 2019
  • 이미지 외곽라인과 시점으로 유사이미지를 검색하는 방법을 제안한다. 첫 번째 테스트에서, 움직임을 통제할 수 없는 3차원 형태의 이미지는 정적인 평면형태 이미지보다 검색 정확도가 낮았다. 원인분석을 위해, 특정 6종류 열대어 데이터를 선별 제작하였다. 종류별 열대어 삼차원 그래픽을 제작하고 상하좌우 12단계 시점으로 144개의 이미지 외곽라인을 제작했다. 종류별 열대어를 수집하고 유사 검색을 통하여 144개의 시점으로 분류 나열했다. 연구 결과, 열대어 종류별로 많이 표현되는 고유 시점이 있음을 증명했다. 검색의 정확도를 높이기 위해, 사용자 시점을 선택하는 사용자 인터페이스를 제작했다. 이미지의 시점을 사용자가 선택하면, 관련 시점의 범위를 고려해 검색 결과를 보여주는 방법을 제안한다.