• 제목/요약/키워드: multidimensional indexes

검색결과 25건 처리시간 0.018초

논 블록킹 검색연산을 위한 R-tree 기반의 동시성 제어 기법 (A Concurrency Control Method for Non-blocking Search Operation based on R-tree)

  • 김명근;배해영
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.809-822
    • /
    • 2004
  • 본 논문에서는 검색 위주의 공간 데이터베이스 시스템을 위한 R-tree 기반의 동시성 제어 기법을 제안한다. 기존의 제안된 기법들은 검색연산이 갱신연산과 동시에 수행되는 것을 막기 위해 노드에 공유 락이나 래치를 획득함으로써 갱신연산으로 인한 검색연산의 블록킹을 막을 수 없다는 문제를 가지고 있으며, 또한 R-tree같은 다차원 색인의 경우 갱신연산의 락 획득은 여러 노드에 걸쳐 일어날 수 있으며, 노드 분할과 같은 경우 오랜 시간동안 락을 획득하고 있을 수도 있기 때문에 검색연산은 장시간 블록킹이 되어야 하는 문제를 갖는다. 따라서 본 논문에서는 이러한 문제를 해결하기 위하여 노드의 엔트리들을 링크드 리스트로 연결하는 방법을 사용하여 노드에 엔트리를 삽입하고 있는 중에도 락이나 래치를 획득하지 않고 검색연산을 할 수 있는 링크드 리스트 기반의 동시성 제어 기법과, 노드 분할이 진행 중에 있는 노드에도 검색연산이 락이나 래치를 획득하지 않고 노드를 탐색할 수 있는 버전 기반의 동시성 제어 기법을 제안한다.

Remote Sensing Information Models for Sediment and Soil

  • Ma, Ainai
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.739-744
    • /
    • 2002
  • Recently we have discovered that sediments should be separated from lithosphere, and soil should be separated from biosphere, both sediment and soil will be mixed sediments-soil-sphere (Seso-sphere), which is using particulate mechanics to be solved. Erosion and sediment both are moving by particulate matter with water or wind. But ancient sediments will be erosion same to soil. Nowadays, real soil has already reduced much more. Many places have only remained sediments that have ploughed artificial farming layer. Thus it means sediments-soil-sphere. This paper discusses sediments-soil-sphere erosion modeling. In fact sediments-soil-sphere erosion is including water erosion, wind erosion, melt-water erosion, gravitational water erosion, and mixed erosion. We have established geographical remote sensing information modeling (RSIM) for different erosion that was using remote sensing digital images with geographical ground truth water stations and meteorological observatories data by remote sensing digital images processing and geographical information system (GIS). All of those RSIM will be a geographical multidimensional gray non-linear equation using mathematics equation (non-dimension analysis) and mathematics statistics. The mixed erosion equation is more complex that is a geographical polynomial gray non-linear equation that must use time-space fuzzy condition equations to be solved. RSIM is digital image modeling that has separated physical factors and geographical parameters. There are a lot of geographical analogous criterions that are non-dimensional factor groups. The geographical RSIM could be automatic to change them analogous criterions to be fixed difference scale maps. For example, if smaller scale maps (1:1000 000) that then will be one or two analogous criterions and if larger scale map (1:10 000) that then will be four or five analogous criterions. And the geographical parameters that are including coefficient and indexes will change too with images. The geographical RSIM has higher precision more than mathematics modeling even mathematical equation or mathematical statistics modeling.

  • PDF

영상 색인용 VP-tree의 검색 범위 압축법의 개선에 관한 연구 (Study of Improvement of Search Range Compression Method of VP-tree for Video Indexes)

  • 박길양;이상곤;황재정
    • 한국멀티미디어학회논문지
    • /
    • 제15권2호
    • /
    • pp.215-225
    • /
    • 2012
  • 멀티미디어 데이터베이스에서는 검색 효율을 높이기 위해 다차원 공간에 기초한 색인 방법이 사용되고 있다. 그러나 이 방법은 거리 계산의 척도로 유클리드 거리를 이용하여야 한다는 전제가 있어 범용성이 떨어진다. 한편, 거리 공리의 성립을 전제로 하는 거리 공간에 기반한 색인 방법은 유클리드 거리 이외의 거리 척도를 이용할 수 있기 때문에 범용성이 높다. 본 논문에서는 거리 공간을 색인화하는 방법 중 하나인 VP-tree의 방법을 개선하고자 한다. VP-tree는 검색 시에 루트 노드로부터 검색 범위에 적합한 노드를 따라 최종에 이르는 리프 노드에 링크되어 있는 오브젝트와의 거리를 계산하고, 검색 범위에 적합한가를 검사한다. 그러나 리프 노드에서 거리 계산 횟수가 증가하면 검색 속도가 떨어지기 때문에 리프 노드에서 삼각 부등식을 이용한 범위 압축 방법에 주목하고 그 개량 방법으로서 질의 오브젝트에 대한 최근접점을 삼각 부등식의 기준점으로 이용하는 방법을 제안한다. 이 개량 방법에 의해 검색 범위를 크게 좁힐 수 있으며, 또한 거리 계산의 횟수도 꽤 줄일 수 있다. 실제로 10,000 건의 영상 데이터를 이용하여 시스템의 성능 평가를 진행해 본 결과 기존 방법에 비해 유사 영상의 검색 시간을 5%~12%까지 절감할 수 있었다.

RFID 태그 데이타 색인의 질의 성능 향상을 위한 불균형 삽입 정책 (Disproportional Insertion Policy for Improving Query Performance in RFID Tag Data Indices)

  • 김기홍;홍봉희;안성우
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권5호
    • /
    • pp.432-446
    • /
    • 2008
  • RFID 기술을 기반으로 한 자동화 제조, 재고 관리, 공급망 관리와 같은 응용에서 RFID 태그를 부착한 객체의 위치를 추적하는 질의는 가장 중요한 요구사항 중의 하나이다. 태그의 위치추적 질의를 지원하기 위해서 기존의 연구에서는 태그 아이디, 리더 아이디, 시간을 도메인으로 하는 색인을 제시하고 있으며 이는 이동체 색인을 기반으로 한다. 이동체 색인에서와 달리 RFE 태그를 위한 색인의 도메인은 도메인간의 크기 차이가 매우 크며 질의 영역이 차지하는 크기의 비율이 리더 아이디 도메인에 편중되는 특징이 있다. 그러나, 기존의 RFB 태그를 위한 색인에서는 이동체 색인과는 다른 도메인의 특징을 고려하지 않음으로써 질의 영역과 색인 노드간의 불필요한 겹침을 유발시키며 이로 인해 태그 객체 검색 시 많은 노드 접근이 발생하게 되는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 R*-tree를 기반으로 한 RFID 태그 데이타 색인의 불균형 삽입정책과 분할 정책을 제안한다. 제안된 방법은 각 도메인의 가중치와 노드의 가장자리 정보를 사용하여 가중치가 적용된 가장자리 값을 구한다. 데이타를 삽입할 때 이를 사용함으로써 데이타가 삽입될 하위트리를 선택하며 노드 분할 방법을 선택한다. 제안된 불균형 삽입 정책은 질의 영역과 MBR 간의 겹침을 줄임으로써 영역질의 수행 시 노드 접근 비용을 감소시켜 준다. 실험 결과 이 논문에서 제안된 불균형 삽입 정책을 적용한 색인은 기존의 삽입 정책을 사용하는 색인에 비하여 우수한 질의 성능을 보여줌을 확인할 수 있다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.