• 제목/요약/키워드: Indexing searching

검색결과 147건 처리시간 0.027초

Wavelet을 이용한 내용기반 검색에 관한 연구 (A Study on Contents-based Retrieval using Wavelet)

  • 강진석;박재필;나인호;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.1051-1066
    • /
    • 2000
  • 디지털 압축기술의 발달과 컴퓨팅 능력이 발전함에 따라서 많은 양의 이미지, 그래픽, 오디오, 비디오 정보가 인터넷을 통한 멀티미디어 시스템에서 활발히 이용되고 있다. 이에 따라 사용자가 원하는 멀티미디어 컨텐츠를 탐색하기 위한 다양한 검색기법이 요구되고 있으며, 특히 단순한 텍스트형 키워드에 의한 검색보다는 내용에 의한 검색 기법이 절실히 요구되고 있다. 본 논문에서는 여러 가지 전처리 과정을 통해 영상을 분류하고, 여기에 색상의 공간적, 질감적 특징을 선별적으로 적용함으로서 처리 효율을 높이면서 검색 성능을 증가시킬 수 있는 내용기반 색인 및 검색 알고리즘을 제안하였다. 또한, 특정 상표에 대한 내용기반 데이터 검색요청 및 수행 결과 분석을 통해 제안된 기법의 성능을 평가하였고, 그 결과를 기술하였다.

  • PDF

시그니쳐를 이용한 XML 경로 비교의 최소화 기법 (A Minimization Technique of XML Path Comparison Based on Signature)

  • 장경훈;황병연
    • 한국전자거래학회지
    • /
    • 제17권3호
    • /
    • pp.61-72
    • /
    • 2012
  • XML은 사용자가 태그를 자유롭게 정의할 수 있어 다양한 구조의 문서가 생성된다. 이렇게 작성된 XML 문서를 효율적으로 관리하기 위해 경로의 유사도에 기반한 클러스터링 및 검색에 대한 연구가 진행되어 왔다. 이에 대한 초기 연구인 3차원 비트맵 인덱싱 기법에서는 유사한 XML 문서를 클러스터링하고 검색하기 위해 경로가 인덱스를 구성하는 단위로 사용되었다. 이 기법은 XML 문서의 구조가 변경되었을 때 변경 전의 경로와 변경 후의 경로가 정도에 상관없이 완전히 다른 것으로 인식되는 문제점이 있다. 이에 따라 경로의 유사도를 측정하는 기법들이 제안되었다. 경로의 유사도를 측정하기 위해서는 비교 대상이 되는 두 경로의 노드들을 비교하는데, 이 과정에서 두 경로에 공통으로 존재하지 않는 노드로 인해 불필요한 비교가 발생한다. 하지만 기존의 경로 유사도 기법들은 이러한 점을 고려하지 않았다. 이를 해결하기 위해 본 논문에서는 시그니쳐를 이용하여 경로 간 노드의 비교를 최소화하는 기법을 제안한다. 실제 다양한 구조의 XML 문서를 가지고 성능 평가를 실시하여, 본 논문에서 제안한 기법을 이용했을 때 기존 기법을 이용했을 때보다 약 20%의 성능을 개선시켜 제안한 기법의 우수함을 보인다.

원 영상의 세부 묘사를 유지하는 두 층 이미지 타일 모자이크 방법에 대한 연구 (A Study on 2-Layered Image Tile Mosaics Preserving Details of the Source Image)

  • 강동완;박영섭;서상현;윤경현
    • 한국멀티미디어학회논문지
    • /
    • 제9권10호
    • /
    • pp.1282-1295
    • /
    • 2006
  • 본 논문은 원 영상의 세부 묘사 유지를 위한 이미지 타일 모자이크 방법을 제안한다. 이 방법은 기존의 모자이크 방법들이 빈 공간 발생으로 인해 세부 묘사 표현의 어려움을 지니고 있는 점을 개선하였다. 이는 타일 내부의 세부 묘사를 위한 이미지 타일의 사용과 타일간의 빈 공간을 제거하기 위한 두 층의 타일 사용을 통해 구현된다. 본 논문에서 제시한 방법은 다음 세 단계로 구성된다. 첫째, 에지 회피 기법이 적용된 무게 중심 보로노이 다이어그램(CVD: Centroidal Voronoi Diagram)을 통해 위층 타일의 위치를 얻고, 딜로니 삼각형화(Delaunay Triangulation)를 이용해 아래층 타일의 위치를 계산한다. 둘째, 타일간의 관계와 에지를 고려해 타일의 크기와 방향 등의 속성을 설정한다. 셋째, 이미지 타일의 적용을 위해 포토 모자이크 기법을 사용한다. 이때, 다단계 인덱싱 기법을 통해 이미지 검객의 속도를 높인다. 위의 과정을 통해 기존의 방법들에 비해 타일 간의 빈공간이 최소화되고 타일 내부의 세부 묘사가 강화된 모자이크 영상을 얻는다.

  • PDF

MapReduce 기반 분산 이미지 특징점 추출을 활용한 빠르고 확장성 있는 이미지 검색 알고리즘 (A Fast and Scalable Image Retrieval Algorithms by Leveraging Distributed Image Feature Extraction on MapReduce)

  • 송환준;이진우;이재길
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1474-1479
    • /
    • 2015
  • IoT 시대를 맞아 모바일 기기의 급격한 성능 향상에 힘입어 폭발적으로 증가하는 멀티미디어 빅데이터의 빠른 처리가 요구되고 있다. 하지만, 이런 환경의 대격변 속에서도 이미지 검색 연구 분야에서는 정확도 향상에 주로 초점을 맞춘 나머지, 고해상도 멀티미디어 데이터 Query에 대한 빠른 처리 측면에서는 제대로 대응하지 못하고 있다. 이에 우리는 이미지 검색만을 분산화한 선행연구와 달리 MapReduce 기반 분산 이미지 특징점 추출 기법을 활용하여 정확도는 유지하면서 빠른 응답시간을 확보하며, BIRCH 인덱싱을 기반으로 메모리 확장성까지 해결한 새로운 분산 이미지 검색 알고리즘을 제안한다. 그리고 제안하는 분산 이미지 검색 알고리즘의 정확도, 처리시간, 확장성에 대한 실험을 통해 뛰어난 성능을 확인한다.

시퀀스 데이터웨어하우스에서 이산푸리에변환과 비트맵을 이용한 시퀀스 스트림 색인 기법 (Sequence Stream Indexing Method using DFT and Bitmap in Sequence Data Warehouse)

  • 손동원;홍동권
    • 한국지능시스템학회논문지
    • /
    • 제22권2호
    • /
    • pp.181-186
    • /
    • 2012
  • 최근 시간적으로 변화된 데이터에서 유사한 값의 움직임 즉 유사 패턴을 검색하는 연구가 활발히 진행되고 있다. 시간적으로 변화된 데이터는 시계열 데이터 (time series data) 또는 시퀀스 데이터(sequence data)로 분류되며 기존의 스칼라 값을 가지는 데이터와는 매우 다른 의미를 가진다. 본 논문에서 유사 시퀀스 검색은 시퀀스 데이터웨어하우스에서 값의 변화가 유사한 형태를 가지는 시퀀스들을 검색한다. 유사 시퀀스를 검색하기 위하여 본 논문에서는 먼저 시퀀스 원시 데이터에 이 산 푸리에 변환(DFT, Discrete Fourier Transform)을 적용하여 데이터를 변환한다. 변환된 데이터는 그 특성으로 인하여 유사 패턴의 검색에 적합하며 또 유사도를 비교할 때 일부분만 사용되므로 색인에 사용되는 속성의 개수를 줄이는 장점이 있다. 또 데이터웨어하우스 환경이므로 더 좋은 성능을 보일 수 있는 비트맵 색인 기법을 적용하였다. 시퀀스 데이터의 효율적인 검색을 위하여 영역 지정 검색 방법을 제안하고 효율적인 실행을 위한 비트맵을 활용한 다양한 조합의 색인을 생성하고, 질의 최적화기의 연산 비용을 비교하면서 효율적인 검색 연산을 위한 최저 비용의 색인을 선택하는 기법을 연구하였다.

대용량 그래프에서 k-차수 인덱스 테이블을 이용한 RDBMS 기반의 효율적인 최단 경로 탐색 기법 (RDBMS Based Efficient Method for Shortest Path Searching Over Large Graphs Using K-degree Index Table)

  • 홍지혜;한용구;이영구
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권5호
    • /
    • pp.179-186
    • /
    • 2014
  • 소셜 네트워크, 웹 페이지 링크, 교통 네트워크 등과 같은 최근의 네트워크들은 노드와 에지의 수가 방대한 빅 데이터이다. 소셜 네트워크 서비스나 네비게이션 서비스와 같이 이와 같은 네트워크를 이용하는 애플리케이션이 많아지고 있다. 대용량 네트워크는 전체를 메모리에 적재할 수 없어, 기존의 네트워크 분석 기술을 활용할 수 없다. 최근 대용량 그래프의 효율적 탐색을 제공하는 RDB 기반 연산자들이 프레임워크(Frontier-expand-merge framework, FEM)로 제안되었다. FEM은 효율적인 최단 경로 탐색을 위해 부분 최단 경로를 저장하는 RDB 기반의 인덱스 테이블을 구축하였다. 그러나 FEM의 인덱스 테이블은 최단 경로에 포함될 확률보다 인덱스의 거리에 의해 결정되기 때문에 인덱스 테이블 참조율이 떨어진다. 본 논문에서는 효율적인 최단 경로 탐색을 지원하는 인덱스 참조율이 높은 차수가 큰 노드들을 이용한 인덱스 테이블 구축 기법을 제안한다. 실험을 통하여 제안하는 인덱스 테이블 구축 기법이 실세계 데이터 셋에서 효율적인 최단 경로 탐색을 지원함을 보인다.

실시간 소셜 네트워크 서비스를 위한 사용 가능한-통합적-유비쿼터스 (U3) 웹 서비스에서의 모바일 상호작용 (Mobile Interaction in a Usable-Unified-Ubiquitous (U3) Web Service for Real-time Social Networking Service)

  • 김영복;김철수
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.219-228
    • /
    • 2008
  • 실시간 소셜(Social) 네트워킹 서비스를 위해서, 사용 가능한-통합적-유비쿼터스 (U3) 웹 서비스에서의 모바일 상호작용을 연구하였다. 실시간 소셜 네트워크를 위한 편리한 모바일 HCI로서, 또한 유비쿼터스 웹 서비스에서의 메타데이터 정보 색인 키로서, 다국어 한 글자 도메인 명(예, 김.net, 이.net, 가.net, ㄱ.net, ㄴ.net, ㅎ.net, ㅏ.net, ㅔ.net, ㄱ.com, ㅎ.com) 은 소셜 정보를 검색하고 또한 등록할 때 편리한 모바일 인터페이스이다. U3 웹 서비스의 예로서, 실시간 소셜 네트워킹 서비스 구현과 함께 모바일 상호작용을 위해 스케치된 디자인 목표와 한국, 일본, 중국에서의 모바일 상호작용 경험을 소개한다. 또한, 소셜 네트워킹과 센서 네트워킹 서비스에서 통합 정보관리를 위해, IP 기반의 센서네트워크 (IP-USN)에서 메타데이터 디렉터리 서비스에의 응용 확장 가능성도 소개한다.

딥러닝을 통한 의미·주제 연관성 기반의 소셜 토픽 추출 시스템 개발 (Development of Extracting System for Meaning·Subject Related Social Topic using Deep Learning)

  • 조은숙;민소연;김세훈;김봉길
    • 디지털산업정보학회논문지
    • /
    • 제14권4호
    • /
    • pp.35-45
    • /
    • 2018
  • Users are sharing many of contents such as text, image, video, and so on in SNS. There are various information as like as personal interesting, opinion, and relationship in social media contents. Therefore, many of recommendation systems or search systems are being developed through analysis of social media contents. In order to extract subject-related topics of social context being collected from social media channels in developing those system, it is necessary to develop ontologies for semantic analysis. However, it is difficult to develop formal ontology because social media contents have the characteristics of non-formal data. Therefore, we develop a social topic system based on semantic and subject correlation. First of all, an extracting system of social topic based on semantic relationship analyzes semantic correlation and then extracts topics expressing semantic information of corresponding social context. Because the possibility of developing formal ontology expressing fully semantic information of various areas is limited, we develop a self-extensible architecture of ontology for semantic correlation. And then, a classifier of social contents and feed back classifies equivalent subject's social contents and feedbacks for extracting social topics according semantic correlation. The result of analyzing social contents and feedbacks extracts subject keyword, and index by measuring the degree of association based on social topic's semantic correlation. Deep Learning is applied into the process of indexing for improving accuracy and performance of mapping analysis of subject's extracting and semantic correlation. We expect that proposed system provides customized contents for users as well as optimized searching results because of analyzing semantic and subject correlation.

방사선 종양 자료관리 시스템 구축 (Establishment of Database System for Radiation Oncology)

  • 김대섭;이창주;유순미;김종민;이우석;강태영;백금문;홍동기;권경태
    • 대한방사선치료학회지
    • /
    • 제20권2호
    • /
    • pp.91-102
    • /
    • 2008
  • 목적: 방사선 종양학과 업무와 관련 자료 및 치료기기의 관리를 체계적으로 정리하고 사용하기 쉽게 색인하여 데이터베이스(Database)를 구축함으로써 업무 및 교육을 체계화시켜 업무 효율성을 증대시키고, 새로운 방사선 치료 발전의 기반이 되고자 한다. 대상 및 방법: 데이터베이스의 운영을 위해 마이크로 소프트 엑세스(MS OFFICE ACCESS)프로그램을 이용하였다. 방사선 종양학과 자료들을 업무에 관련된 업무 일지, 기기 관리에 대한 수리 내역 및 부속품의 재고 관리로 분류하였고, 학습 및 연구 자료는 부서 직무 교육 자료와 기기 사용자 지침서 및 관련 논문으로 구분하였다. 모든 자료의 등록은 각각의 주제에 맞도록 입력 폼(form)을 디자인하고, 자료의 정보는 보고서를 작성하여 열람할 수 있도록 설계하였다. 기기 수리 내역에서 2008년 1월부터 2009년 4월까지 고장건수와 유형 및 수리시간을 시스템 사용 초기와 사용 1년 후의 결과를 분석하였다. 결 과: 방사선 종양 자료관리 시스템을 업무에 관련된 영역과 학습 및 연구 활동 영역의 자료들로 완성하였다. 자료들은 주제와 분류에 의해 설명과 함께 정리되어 모아지고, 각 분류에서 원하는 자료를 검색하여 설명을 참고하여 첨부된 자료를 얻을 수 있다. 기기 수리 내역을 통하여 2008년 1월부터 2009년 4월까지 고장 건수 및 고장 유형의 정보를 얻을 수 있었고 수리시간을 분석하였을 때, 전체 평균 32.3%의 시간단축효과를 얻었다. 결 론: 방사선 종양 자료관리 시스템을 통하여 과거와 현재의 자료를 주제별로 분류하고 관련 자료를 정리하여 색인함으로써, 정보 이용이 원활하게 이루어져 업무 효율을 높일 수 있을 뿐만 아니라 업무 프로세스 개선의 기초자료가 되고 앞으로 새로운 방사선 치료에 요구되는 여러 가지 정보를 실시간으로 검색하여 얻을 수 있다.

  • PDF

역사객체 기반의 기계학습 기법을 활용한 웹 문서의 시간정보 추출 방안 제안 (A Proposal of Methods for Extracting Temporal Information of History-related Web Document based on Historical Objects Using Machine Learning Techniques)

  • 이준;권용진
    • 인터넷정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.39-50
    • /
    • 2015
  • 최근 검색엔진을 통한 정보검색 과정에서 특정 시구간 상황에 대응하는 문서를 검색하고자 하는 경우가 있다. 예를 들면, 임진왜란 이전의 시대적 상황과 관련된 문서를 검색하기 위해, 키워드 '임진왜란'으로 검색하면 시간에 관계없이 임진왜란 당시나 전후의 모든 문서가 검색되어 추가적인 작업이 요구된다. 또한, 역사관련 문서의 경우는 문서내용에 대응하는 시간 정보가 문서 생성시간과 일치하지 않는 경우가 대부분이다. 만약 웹 문서의 내용에 대응하는 시간 정보를 추출 할 수 있다면 효과적인 정보검색은 물론 다양한 응용에 적용 가능할 것이다. 따라서 본 논문은 문서 내용에 대응하는 시간정보 추출을 목적으로, 조선시대를 대상으로 한 역사문헌을 활용하여 조선시대 역사관련 문서의 시간추출에 대한 연구를 진행한다. 역사 문헌과 웹으로부터 수집된 역사관련 문서를 바탕으로 역사객체를 정의하고, 이를 기반으로 다양한 기계학습 기법을 활용하여 웹 문서의 시간정보 추출에 대한 가능성을 확인한다. 또한 기계학습 과정에 있어서 객체의 유사도에 기반 한 여과과정을 제안하고 이를 적용한 효율적인 시간정보 추출 및 정확도 향상에 대한 결과를 비교 분석한다.