• 제목/요약/키워드: Query Index

검색결과 410건 처리시간 0.031초

위치기반 서비스에서 효율적 검색과 사용자 정보보호를 위한 향상된 그리드 기반 궤적 클로킹 기법 (Enhanced Grid-Based Trajectory Cloaking Method for Efficiency Search and User Information Protection in Location-Based Services)

  • 윤지혜;송두희;채천원;박광진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권8호
    • /
    • pp.195-202
    • /
    • 2018
  • 스마트폰, GPS 네비게이션과 같은 위치 응용프로그램이 발달함에 따라 위치 및 궤적 프라이버시를 보호하기 위한 연구가 활발히 진행되고 있다. 위치 관련 서비스를 제공받기 위해서는 자신의 정확한 위치를 서버에게 공개해야 한다. 그러나 사용자 위치의 공개는 서버에게 자신의 위치뿐만 아니라 궤적까지 노출하게 되어 사생활 침해의 우려가 있다. 또한 사용자가 서버에게 요청한 정보는 위치 정보뿐만 아니라 멀티미디어 정보(위치에 대한 사진, 리뷰 등)를 포함하고 있기 때문에 서버가 처리해야 하는 비용 및 사용자가 받아야하는 정보가 증가하게 된다. 따라서 이를 해결하기 위해 본 논문에서는 EGTC (Enhanced Grid-based Trajectory Cloaking) 기법을 제안한다. EGTC 기법은 기존 GTC (Grid-based Trajectory Cloaking) 기법과 마찬가지로 사용자 궤적을 사용자가 원하는 프라이버시 레벨(UPL: User's desired Privacy Level) 수준으로 그리드를 분할하여 클로킹 영역을 생성 한 후, 랜덤한 질의 순서를 정한다. 다음 단계로 사용자가 이동하고자 하는 경로에 해당하는 서브 그리드 셀을 c(x,y)로 간주해 필요한 정보를 색인으로 구성해 받는다. 제안 기법은 기존 GTC 기법과 같이 궤적 프라이버시를 보장하면서 사용자가 청취해야 하는 정보의 양을 줄였다. 실험 결과를 통하여 제안 기법의 우수성을 증명하였다.

XML 컴포넌트 명세서 기반의 컴포넌트 검색 기법 (A Search Method for Components Based-on XML Component Specification)

  • 박서영;신영길;우치수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권2호
    • /
    • pp.180-192
    • /
    • 2000
  • 최근 들어 컴포넌트는 소프트웨어 재사용의 핵심 기술로 인식되고 있다. 컴포넌트는 인터페이스 부분만을 이용하여 개발되는 소프트웨어에 바로 바인딩시켜 재사용될 수 있는 독립적인 바이너리 코드이다. 많은 컴포넌트 사용자들이 인터넷 상에서 적합한 컴포넌트를 검색하고 사용할 수 있도록, 컴포넌트 명세서는 웹 문서 형태를 사용하는 것이 바람직하다. 기존의 HTML 웹 문서 기반의 검색 엔진을 통하여 컴포넌트를 검색할 때 정확한 의미 검색이 불가능하다는 문제점이 있다. 본 논문에서는 정확한 의미 검색을 수행할 수 있도록 컴포넌트 명세서를 HTML 문서 대신 XML 문서로 사용할 것을 제안한다. 또한, XML 컴포넌트 명세서를 통하여 사용자가 원하는 컴포넌트를 정확하게 검색할 수 있는 XML 문맥 기반 검색(context-based search)을 제안한다. 문맥 기반 검색은 컴포넌트의 특성을 나타내는 문맥(context)과 컴포넌트 특성의 실제 값인 용어(term)를 사용하여 사용자가 원하는 컴포넌트의 특성을 정확하게 질의하고 검색할 수 있는 방법이다. 이 검색 방법은 용어-문맥-컴포넌트 명세서 순으로 된 역화일 인덱싱 (Inverted File Indexing) 방법을 사용한다. 이와 함께 사용자의 편의를 위하여, 기존의 소프트웨어 재사용 라이브러리에서 사용되던 검색 방법인 키워드 검색, 퍼싯 검색, 브라우징 검색 방법 등을 지원한다. 이들 다양한 검색 방법들은 인터페이스 레이어, 질의 확장 레이어, XML 검색 엔진 레이어 등 3-레이어 검색엔진 구조를 통한 효율적인 인덱스 스킴에 의해 지원된다. 본 논문에서는 컴포넌트 사용자들이 원하는 컴포넌트를 정확하게 검색할 수 있도록 하기 위하여 컴포넌트 명세서를 대한 XML DTD(Document Type Definition)를 정의하고, HTML 기반 검색 방법과 XML 기반 검색 방법에 대한 컴포넌트 검색 성능을 비교한다.

  • PDF

R-트리에서 빈번한 변경 질의 처리를 위한 효율적인 기법 (An Efficient Technique for Processing Frequent Updates in the R-tree)

  • 권동섭;이상준;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.261-273
    • /
    • 2004
  • 정보 통신 기술의 발달은 데이타베이스 분야에도 새로운 응용들을 만들고 있다. 예를 들어, 수많은 객체들의 위치를 추적하는 이동 객체 데이타베이스나 각종 센서들로부터 들어오는 데이타 스트림을 처리하는 스트림 데이타베이스에서 다루는 데이타는 일반적으로 매우 빠르고 끊임없이 변경된다. 하지만, 전통적인 데이타베이스에서는 데이타를 사용자의 명시적인 변경이 있기 전까지는 변하지 않는 상대적으로 정적인 것으로 간주하고 있기 때문에, 전통적인 데이타베이스 시스템은 이러한 끊임없고 동적인 데이터의 변화를 효율적으로 처리하는데 문제를 지닌다. 특히 다차원 데이타 처리를 위한 대표적 인덱스 구조인 R-트리의 경우, 데이타의 삽입이나 삭제가 연속적인 노드의 분할이나 합병을 유발하고 있으므로 이러한 문제는 더 심각해진다. 본 논문에서는 이러한 빈번한 변경 효율적으로 처리하기 위하여 새로운 R-트리 갱신기법인 리프 갱신 기법을 제안한다. 리프 갱신 기법에서는 새로운 데이타가 이전에 속해있던 리프 노드의 MBR 내에 있으면 전체 트리를 변경하지 않고 해당 리프 노드만을 변경시킨다. 이러한 리프 갱신 처리와 리프 노드를 직접 접근하게 해주는 리프 접근 해시 테이블을 이용하여 리프 갱신 기법은 데이타의 변경연산 비용을 크게 줄인다. 제안기법은 기존 R-트리의 알고리즘과 구조를 그대로 이용하고, R-트리의 정확성을 보장하므로 다양한 R-트리 변종들에도 적용 가능하고 R-트리를 이용하는 다양한 응용 환경에 이용이 가능하다. 본 논문에서는 제안 기법이 기존 기법에 대하여 가지는 갱신 연산의 비용 이득을 수학적으로 분석하였고, 실험을 통하여 제안 기법의 우수성을 확인하였다.

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.

이동 객체 경로 탐색을 위한 시공간 클러스터링 기법 (A Spatio-Temporal Clustering Technique for the Moving Object Path Search)

  • 이기영;강홍구;윤재관;한기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제7권3호
    • /
    • pp.67-81
    • /
    • 2005
  • 최근 들어 지리 정보 시스템이 발전함에 따라 경로 검색, 주변 정보 검색, 응급 서비스 등을 제공하는 위치 기반 서비스, 텔레매틱스 등의 새로운 응용 서비스 개발에 대한 관심과 연구가 증대되고 있다. 위치 기반 서비스 및 텔레매틱스에서 사용되는 시공간 데이타베이스에서의 사용자의 검색은 시간 축을 현재의 시간으로 고정하고 공간 및 비공간 속성을 검색하기 때문에 시간 축에 대한 검색 범위가 넓을 경우에는 이를 효율적으로 처리하기 어렵다. 이를 해결하기 위하여 이동 객체의 위치 데이타를 요약하는 기법인 스냅샷이 소개되었다. 그러나, 이러한 스냅샷 기법은 저장해야 되는 총간 영역이 넓을 경우 저장 공간이 많이 필요하며 검색에 자주 사용되지 않는 불필요한 영역까지 스냅샷을 생성하므로 저장 공간 및 메모리를 많이 사용하게 된다. 이에 본 논문에서는 기존의 스냅샷 기법의 단점을 극복하기 위하여 이전에 공간 클러스터링을 위해 사용되던 2차원의 공간 해시 알고리즘을 시공간으로 확장한 해시-기반 시공간 클러스터링 알고리즘(H-STCA)과 과거 위치 데이타로부터 이동 객체 경로 탐색을 위한 지식을 추출하기 위해 H-STCA 알고리즘에 근거한 지식 추출 알고리즘을 제안한다. 그리고, 대용량의 이동 객체 데이터에 대한 검색 시간, 저장 구조 생성 시간, 최적 경로 탐색 시간 등에서 H-STCA를 사용한 스냅샷 클러스터링 방법, 기존의 시공간 인덱스 방법, 스냅샷 방법과의 성능평가에 대하여 설명한다. 성능평가 결과로 H-STCA를 사용한 스냅샷 클러스터링 방법은 기존의 시공간 인덱스 방법이나 스냅샷 방법 보다 이동 객체의 개수가 증가하면 할수록 성능 향상이 더욱 큰 것으로 나타났다.

  • PDF

계층적 행정 구역에 기반한 효율적인 위치 정보 표현 방식 (An Efficient Location Encoding Method Based on Hierarchical Administrative District)

  • 이상윤;박상현;김우철;이동원
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.299-309
    • /
    • 2006
  • 최근 이동 통신 기술의 급속한 발달로 인해 휴대폰, PDA등과 같은 휴대용 단말기의 사용이 보편화 되고 있다. 따라서 무선 이동기기의 시간에 따른 공간적인 위치 정보를 활용하여 다양하고 빠른 서비스를 제공하기 위해서 위치 기반 서비스(Location-Based Service)에 관한 많은 연구가 진행되고 있다. 효율적인 위치 기반 서비스의 제공을 위하여 시간에 따라 지속적으로 변하는 이동 객체의 대용량 시공간 정보를 신속하게 저장, 관리, 검색할 수 있는 인덱싱 및 질의 처리 기술이 수반되어야 한다. 본 논문에서는 대용량 이동 객체 데이타베이스를 대상으로 효율적인 인덱스 구축을 위한 위치 정보의 압축 표현 방식에 대하여 논한다. 이를 위해 본 논문에서는 기존의 주요 연구에서 (x,y) 형태의 2차원 공간 좌표로 표현되던 이동 객체의 위치 정보를 계층적 구조를 갖는 행정 구역과 도로 상의 위치를 이용하여 1차원의 위치 정보로 압축 표현하는 방식을 제안한다. 이를 이용해 도로를 따라 움직이는 이동 객체에 대해 위치 정보의 손실 없이 효율적인 위치 기반 서비스를 제공할 수 있다 또, 일정 공간 내의 객체 분포를 필요로 하는 교통 상황 파악, 근사적(approximate) 공간 정보를 필요로 하는 사람 차량 위치 추적 등에 유용하게 사용할 수 있다.

Node.js를 활용한 웹GIS 서버의 설계와 구현 (Design and Implementation of Web GIS Server Using Node.js)

  • 전상환;도경태
    • Spatial Information Research
    • /
    • 제21권3호
    • /
    • pp.45-53
    • /
    • 2013
  • 웹GIS는 수년 동안 사용자들에게 효율적이고 정확한 공간정보를 제공하기 위해 최신 웹기술을 기반으로 발전해왔다. 또한 웹GIS 서버는 클라이언트의 요청을 빠르게 연산 처리하고 공간정보 서비스를 제공하기 위해 성능개선을 지속해왔다. 본 연구에서는 서버 개발에 자바스크립트(JavaScript)를 사용하는 이벤트 기반의 비동기식 I/O 처리가 가능한 프레임웍 기술인 Node.js를 활용하여 NodeMap이라고 이름붙인 웹GIS 서버를 설계하고 구현하였다. NodeMap은 기본적으로 OGC 표준 인터페이스를 지원하는 웹GIS 서버이다. 이를 위해 공간 인덱스 및 표준 공간쿼리 함수를 지원하는 DBMS를 활용하여 GIS 데이터를 처리하도록 하였다. 그리고 공간 정보를 타일 맵 위에 렌더링 하기 위해 HTML5 Canvas를 지원하는 Node-Canvas 모듈을 활용하였다. 마지막으로 Node.js의 가장 많이 쓰이는 커넥트 모듈 기반의 프레임웍인 Express 모듈을 활용하였다. 구현된 NodeMap은 성능테스트를 통해 향 후 웹GIS 서버개발기술로서 Node.js의 활용 가능성을 확인하였다. 본 연구를 통해 기존 서버 개발 기술과 차별화된 기술인 Node.js를 웹GIS 서버 구현에 우선적용 함으로서 향 후 인터넷 GIS 서비스에서의 활용 가능성을 제시하였다.

고차원 멀티미디어 데이터 검색을 위한 벡터 근사 비트맵 색인 방법 (Vector Approximation Bitmap Indexing Method for High Dimensional Multimedia Database)

  • 박주현;손대온;낭종호;주복규
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.455-462
    • /
    • 2006
  • 고차원 데이터 공간에서의 효과적인 검색을 위해 최근 VA-file[1], LPC-file[2] 등과 같이 벡터 근사에 기반을 둔 필터링 색인 방법들이 연구되었다. 필터링 색인 방법은 벡터를 근사한 작은 크기의 색인 정보를 사용하여 근사 거리를 계산하고, 이를 사용하여 질의 벡터와 유사하지 않은 대부분의 벡터들을 빠른 시간 안에 검색 대상에서 제외한다. 즉, 실제 벡터 대신 근사 벡터를 읽어 디스크 I/O 시간을 줄여 전체 검색 속도를 향상시키는 것이다. 하지만 VA-file 이나 LPC-file은 근사 거리를 구하는 방법이 순차 검색과 같거나 복잡하기 때문에 검색 속도 향상 효과가 그리 크지 않다는 문제점을 가지고 있다. 본 논문은 이러한 근사 거리 계산 시간을 줄이기 위하여 새로운 비트맵 색인 구조를 제안한다. 근사 거리 계산속도의 향상을 위하여, 각 객체의 값을 특성 벡터 공간상의 위치를 나타내는 비트 패턴으로 저장하고, 객체 사이의 거리를 구하는 연산은 실제 벡터 값의 연산보다 속도가 훨씬 빠른 XOR 비트 연산으로 대체한다. 실험에 의하면 본 논문이 제안하는 방법은 기존 벡터 근사 접근 방법들과 비교하여 데이터 읽기시간은 더 크지만, 계산 시간을 크게 줄임으로써 전체 검색 속도는 순차 검색의 약 4배, 기존의 방법들보다는 최대 2배의 성능이 향상되었다. 결과적으로, 데이터베이스의 속도가 충분히 빠른 경우 기존의 벡터 근사 접근법의 필터링을 위한 계산 시간을 줄임으로써 더욱 검색 성능을 향상 시킬 수 있음을 확인할 수 있다.

그래프 데이터베이스를 활용한 공간 데이터 통합 방안 연구: 부동산 분야를 중심으로 (A Study on Spatial Data Integration using Graph Database: Focusing on Real Estate)

  • 김주영;박슬아;유기윤
    • 한국지리정보학회지
    • /
    • 제26권3호
    • /
    • pp.12-36
    • /
    • 2023
  • 그래프 데이터베이스는 다양한 유형의 데이터와 그 관계를 그래프로 모델링하여 적재하기 때문에 복잡한 관계로 연결될 수 있는 부동산 데이터를 관리하고 분석하는데 효과적일 수 있으나, 현재 제공되는 그래프 데이터베이스의 제한적인 공간 기능으로 인해 활발히 활용되지 못하고 있다. 이러한 배경에서, 본 연구에서는 다양한 부동산 공간 관련 질문들에 대응할 수 있도록 그래프 데이터베이스를 활용한 Uniform Grid 기반 부동산 공간 데이터 관리 방안을 제안한다. 핵심 데이터를 선정하기 위하여 부동산 커뮤니티의 관련 질의를 분석하였으며, 국가지점번호를 단위 Grid로 설정하고 다양한 부동산 관련 데이터들을 연결한 그래프 스키마를 구성하여 테스트 데이터베이스를 구축하였다. 데이터베이스 검증을 위해, Jackpine 벤치마크를 활용하여 기본 위상관계 및 공간함수를 테스트하였고, 나아가 다양한 시나리오 기반 질의 테스트를 수행함으로써 제안한 방법의 적절성을 검증하고자 하였다. 그 결과, 제안한 방법은 총 29개의 공간 위상관계와 공간함수 중 25개의 기능을 성공적으로 수행하였고, 25개의 기능과 15개의 시나리오에 대해 약 97%의 정확도를 달성하였다. 본 연구는 그래프 데이터베이스의 제한적인 공간 기능을 고려하여, 부동산 관련 공간 질문에 대응할 수 있는 효율적인 데이터 통합방안을 제안하였다는 점에서 의의를 가진다. 그러나 그리드 기반 인덱스 사용으로 인한 잘못된 공간 위상관계 생성 문제 및 리스트 비교에 따른 질의의 비효율성에 대한 한계점이 존재하며, 이는 후속 연구에서 개선할 필요가 있다.

산머루 관련 정보수집 및 데이터베이스의 구축 (Data Mining and Construction of Database Concerning Effects of Vitis Genus)

  • 김민아;조윤주;신지영;신민규;배현수;홍무창;김양석
    • 동의생리병리학회지
    • /
    • 제26권4호
    • /
    • pp.551-556
    • /
    • 2012
  • The database for the oriental medicine had been existed in documentation in past times and it has been developed to the database type for random accesses in the information society. However, the aspects of the database are not so diversified and the database for the bio herbal material exists in widened type dictionary style. It is a situation that the database which handles the in-depth raw herbal medicines is not sufficient in its quantity and quality. Korean wild grape is a deciduous plant categorized into the Vitaceae and it was found experimentally that it has various medical effects. It is one of the medical materials with higher potentiality of academic study and commercialization recently because it has a bigger possibility to be applied into diverse industrial fields including the medical product for health, food and beauty. We constituted the cooperative system among the Muju cluster business group for Korean mountain wild grapes, Physiology Laboratory in Kyung Hee University Oriental Medicine and Medical Classics Laboratory in Kyung Hee University Oriental Medicine with a view to focusing on such potentiality and a database for Korean wild grapes was made a touchstone for establishing the in-depth database for the single bio medical materials. First of all, the literatures based on the North East Asia in ancient times had been categorized into the classical literature (Korean literature published by government organization, Korean classical literature, Chinese classical literature and classical literature fro Korean and Chinese oriental medicine) and modern literature (Modern literature for oriental medicine, modern literature for domestic and foreign herbal medicine) to cover the eastern and western research records and writings related to Korean wild grapes and the text-mining work has been performed through the cooperation system with the Medical Classics Laboratory in Kyung Hee University Oriental Medicine. First of all, the data for the experiment and theory for Korean wild grape were collected for the Medline database controlled by the Parliament Library of USA to arrange the domestic and foreign theses with topic for Korean wild grapes and the network hyperlink function and down load function were mounted for self-thesis searching function and active view based on the collected data. The thesis searching function provides various auxiliary functions and the searching is available according to the diverse searching/queries such as the name of sub species of Korean wild grape, the logical intersection index for the active ingredients, efficacy and elements. It was constituted for the researchers who design the Korean wild grape study to design of easier experiment. In addition, the data related to the patents for Korean wild grape which were collected from European Patent Office in response to the commercialization possibility and the system available for searching and view was established in the same viewpoint. Perl was used for the query programming and MS-SQL for database establishment and management in the designing of this database. Currently, the data is available for free use and the address is as follows. http://163.180.41.43:8011/index.html