• 제목/요약/키워드: 인덱싱

검색결과 449건 처리시간 0.032초

PrimeFilter: 소수 인덱싱 기법에 기반한 효율적 XML 데이타 필터링 (PrimeFilter: An Efficient XML Data Filtering based on Prime Number Indexing)

  • 김재훈;김상욱;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.421-431
    • /
    • 2008
  • 최근 이질적인 시스템 사이에서의 정보교환의 표준으로 널리 사용되는 XML을 사용하는 Publish/Subscribe 시스템의 스트리밍 XML 데이타 필터링 기법이 활발히 연구되었다. 스트리밍 XML 데이타 필터링 기법은 사용자가 등록한 질의에 대해서 신속한 질의-데이타 매칭을 목적으로 하기 때문에 효율적인 질의 처리 메커니즘이 요구된다. 현재까지 대부분의 연구는 질의 경로 표현식의 부분적인 공유를 꾀하거나 프레디킷을 효율적으로 처리함으로써 질의 처리의 시간적, 공간적 효율을 목적으로 하였다. 하지만 만약 질의간의 포함 관계를 알 수 있다면 질의 처리시에 가장 하위의 질의가 매칭되면 그 질의를 포함하고 있는 상위의 질의들은 별도의 처리 과정 없이 매칭됨을 알 수 있게 된다. 이러한 질의 포함 관계를 이용한 질의 처리 방식은 XML 스트리밍 데이타를 처리하는 또 하나의 효율적 방식이 될 수 있다. 본 논문에서는 소수 인덱싱 기법과 목표 질의 노드 중심의 포함 관계 설정에 기반하여 효율적인 스트리밍 XML 데이타 필터링을 수행하는 새로운 방법을 소개한다. 그리고 몇 가지 실험을 통하여 기존 방법과의 비교 분석 및 효율성을 보인다. 비록 각각의 실험은 서로 다른 실험 요소에 대하여 수행되었지만, 모두 제안 방법이 기존의 방법보다 두 배 이상 더 나은 성능을 가짐을 보여 주었다.

신조선에서 연료탄소로부터의 $CO_2$ 배출 특성 ([$CO_2$] Emission from Carbon of Marine Fuel Oil in New Ships)

  • 장미숙;김은찬;문일성;이재우;권오신
    • 한국해양환경ㆍ에너지학회지
    • /
    • 제9권3호
    • /
    • pp.148-153
    • /
    • 2006
  • 본 연구는 선박에서 배출되는 배기가스의 농도 측정, 연소효율 평가와 국제해사기구에서 권장하는 인덱싱 방법의 검토를 통해 이산화탄소 규제관련 대응전략 수립을 위한 기초자료 확보에 목적을 둔다. 평가된 평균 연소효율은 새 엔진의 경우 98%, 신조선의 경우 96.5%로 조사되었다. 연소효율은 엔진 및 선박의 노후로 점점 감소할 것으로 예상되며, 연소효율이 높으면 배기가스 중에 이산화탄소의 농도가 증가하고 연소효율이 낮으면 불완전연소 생성물의 방출이 증가되기 때문에 문제가 된다. 유해 오염물질을 방출하지 않고 가장 효율적으로 이산화탄소를 제어하기 위해 연료 대체, 연료 저소모 엔진 개발 및 경제적 선속 유지를 위한 해운사간 협조가 필요할 것이다. 국제해사기구의 인덱싱 방법을 검토한 결과, 보다 실제에 가까운 이산화탄소 배출량을 산출하기 위해서는 사용 연료의 탄소 함량을 조사하고 국제해사기구의 권장 수치와 비교하여 지수화 작업을 진행하는 것이 바람직한 것으로 나타났다.

  • PDF

분석 CRM 실무자의 자연어 질의 처리를 위한 기업 데이터베이스 구성요소 인덱싱 방법론 (A PageRank based Data Indexing Method for Designing Natural Language Interface to CRM Databases)

  • 박성혁;황경서;이동원
    • CRM연구
    • /
    • 제2권2호
    • /
    • pp.53-70
    • /
    • 2009
  • 분석 CRM 영역에서는 고객 데이터 분석을 통하여 고객 행동과 관련된 통찰력을 얻는 것이 중요하다. 이러한 분석 과정에서, 사용자 스스로 기업 데이터베이스에서 대용량 고객 이력 데이터를 조회하고 추출하기 위해서는 SQL 을 사용하여 자유롭게 질의구문을 작성할 수 있어야 한다. 그런데 일반 사용자들이 이러한 업무를 수행하고자 할 때, 기업 데이터베이스 구성 요소에 대한 전문적인 지식이 부족하기 때문에 정보 탐색에 있어서 어려움을 겪는다. 이를 해결하기 위한 방안으로 본 연구에서는 사용자가 제공하는 자연어 수준의 질의를 분석하고, 데이터베이스를 구성하는 값을 중심으로 올바른 질의 결과를 제공하기 위한 데이터베이스 구성요소 인덱싱 방법론을 제안한다. 구체적으로 기업 데이터베이스를 구성하는 세 가지 요소인 관계, 속성, 값에 대한 정보를 읽어 들여 요약 정보에 대한 인덱스를 구성한 다음 사용자의 자연어 질의에서 분석된 의미 단위 별로 데이터베이스 요약 정보와 연결해주는 TableRank 기법을 소개한다. 실험용 데이터베이스를 대상으로 테스트를 수행한 결과, 사용자의 자연어 질의 결과가 데이터베이스를 구성하는 값 정보와 연결되는 것이 관찰되었다. 논문의 후반부에서는 자연어 질의를 자동적으로 처리하기 위한 선행 모듈 개발의 시사점을 정리하고, 향후 기업 데이터베이스 자동 검색 시스템으로 발전하기 위한 방안에 대해서도 설명한다.

  • PDF

XML 문서 클러스터링을 이용한 개선된 연관규칙 (Advanced Association Rules using XML Document Clustering)

  • 김의찬;이재민;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.181-183
    • /
    • 2004
  • 기존의 연관규칙을 생성하는 알고리즘의 문제점을 개선하기 위해 본 논문에서는 XML 문서 클러스터링을 이용하였다. XML 문서 클러스터링을 이용하여 데이터베이스 탐색 횟수 일 조인 개수를 줄여서 수행 속도를 향상시키고, 또한 클러스터링을 통해 얻은 클러스터에서 규칙을 찾기 때문에 기존의 연관규칙 생성 방법에서는 찾지 못했던 규칙들도 찾아낼 수 있다 본 논문에서 사용하는 클러스터링 방법은 XML문서 검색을 위한 3차원 비트맵 인덱싱인 xPlaneb를 사용하여 구현하였다.

  • PDF

시계열 데이터 베이스에서의 효율적인 유사 검색을 위한 Polar Wavelet 기법 (Polar Wavelet Method for Efficient Similarity Search in Time Series Databases)

  • 이범기;강성구;이상준;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.85-87
    • /
    • 2004
  • 유클리드 거리에 기반하여 유사한 시퀀스 검색을 하는 기법들은 각 시퀀스에서 특징을 추출하여 차원을 감소시킨 후, R-tree 같은 다차원 인덱싱 기법을 사용하여 검색을 수행한다. 본 논문에서는 시계열 데이터 베이스에서의 유사 검색 성능 향상을 위한 새로운 특징 추출 기법인 Polar Wavelet 기법을 제안한다. 이 기법은 유사 검색 시 후보 시퀀스의 개수를 줄임으로써 검색 성능을 향상시킬 수 있고, 특징 추출을 위해 시퀀스의 길이를 2$^n$으로 만들 필요가 없는 장점을 갖고 있다.

  • PDF

고성능 XML 질의 처리를 위한 XML 뷰 인덱스의 생성 및 실체화 기법 (Creation and Materialization of XML View Indices for High Performance XML Query Processing)

  • 박대성;김영현;강현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.28-30
    • /
    • 2004
  • 웹에서 XML 데이터의 양이 많아짐에 따라 XML 질의 처리를 신속하게 해주는 기술이 필요하게 되었다. 이를 가능하게 해주는 것이 XML 질의 캐슁이다. 자주 제기되는 질의에 대하여 질의 결과를 캐쉬한 후 동일 질의에 재사용 함으로써 빠른 응답속도를 보장할 수 있다. 본 논문은 XML질의 캐슁 기법 중 캐쉬되는 데이터의 공간 부담을 줄일 수 있는 XML 뷰 인덱싱 기법에 관한 것으로, 뷰 인덱스의 생성 및 실체화 기법을 제안하고 구현 및 실험을 통한 성능 평가 결과를 기술한다.

  • PDF

비디오스트리밍 서비스를 위한 의미기반 비디오 표현 및 저장 기법 (Semantic-Based Video Representation and Storing Techniques for Video Streaming Services)

  • 이석룡
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2004년도 춘계공동학술대회 논문집
    • /
    • pp.505-509
    • /
    • 2004
  • 본 논문에서는 비디오 스트림 서버에서 의미 기반 검색을 가능하게 하기 위하여 대용량 스트림 데이터를 효과적으로 표현하고 저장하는 기법을 제시한다. 비디오 스트림 내의 각 프레임을 다차원 공간상의 점으로 사상함으로써 비디오 스트림은 다차원 시퀀스(multidimensional sequence)로 표현되고, 이 시퀀스는 다시 비디오 세그먼트로 분할된다. 분할된 세그먼트로부터 정적인 특성과 연속된 프레임의 움직임을 나타내는 트랜드 벡터(trend vector)등의 의미 정보를 추출하여 모델링 함으로서 스트림 데이터를 효과적으로 표현한다. 또한 제안된 기법은 효율적인 검색을 위하여 비디오 세그먼트를 인덱싱하고 저장하는 방법을 제공함으로써 공간 사용의 효율성을 높이고 신속한 검색을 가능하게 한다.

  • PDF

개념 공간을 이용한 의미 인덱싱 (Semantic Indexing Using Concept Space)

  • 강보영;김혜정;황선옥;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.380-382
    • /
    • 2003
  • 본 논문은 문서내의 의미적인 관계에 기반하여, 문서의 내용을 보다 잘 추측할 수 있는 의미 인덱스 추출 및 가중치 부여 시스템을 제안하고자 한다. 문서 내의 개념 추출에 있어서는 기존의 어휘 체인(lexical chains)에 관한 연구를 확장하여 적용였다. 또한, 추출된 개념에서 중요 어휘에 가중치를 부여하기 위해서, 개념 벡터 공간을 이용한 정보성(information quantity)과 정보비(information ratio)를 정의하고, 인덱스의 가중치를 측정할 수 있는 정량화 할 수 있는 척도로 제시하였다.

  • PDF

모바일 환경에서 원격지 시스템의 고장 진단을 위한 로그 인덱싱 (A Log Indexing Strategy for Fault-Detections of Remote Systems in Mobile Computing Systems)

  • 박병율;윤병선;임종태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.118-120
    • /
    • 2004
  • 네트워크 노드의 고장진단 내용을 모바일 클라이언트에 실시간으로 서버하기 위하여는 정보를 최소화하여야 한다. 이를 위해 고장진단의 내용을 인덱스하고 인덱스 된 정보만을 모바일 클라이언트에 서버함으로 모바일 클라이언트가 소요하는 비용을 최대한으로 줄였다. 네트워크 관리자는 모바일 환경을 이용하여 실시간으로 메인 서버에 접속하며, 자신이 관리하는 시스템의 상태를 파악하여 오류나 고장의 시간을 줄임으로 효율적으로 시스템을 운영한다. 로그는 메인 서버에 순차적으로 저장되고 인덱스 됨으로 모바일 환경에서의 검색 속도를 향상시킨다.

  • PDF

자동 이미지 태깅에 관한 연구 (A Research on Automatic Image Tagging)

  • 전우경;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(D)
    • /
    • pp.85-87
    • /
    • 2012
  • 최근 모바일 기기는 물론 디지털 카메라, SNS의 발전으로 인하여 매일 방대한 양의 디지털 이미지가 생성된다. 따라서 효과적이고 신뢰도 있는 인덱싱 기법과 탐색 기법이 요구되고 있다. 이미지 태깅은 효과적이고 신뢰도 있는 이미지 탐색에 큰 연관관계가 있다. 본 연구에서는 여러가지 이미지 태깅 기법들을 서베이하고 자동 및 반 자동 이미지 태깅 기법들에 대하여 알아본다.