• 제목/요약/키워드: Inverted Index Method

검색결과 38건 처리시간 0.023초

Memory-Efficient NBNN Image Classification

  • Lee, YoonSeok;Yoon, Sung-Eui
    • Journal of Computing Science and Engineering
    • /
    • 제11권1호
    • /
    • pp.1-8
    • /
    • 2017
  • Naive Bayes nearest neighbor (NBNN) is a simple image classifier based on identifying nearest neighbors. NBNN uses original image descriptors (e.g., SIFTs) without vector quantization for preserving the discriminative power of descriptors and has a powerful generalization characteristic. However, it has a distinct disadvantage. Its memory requirement can be prohibitively high while processing a large amount of data. To deal with this problem, we apply a spherical hashing binary code embedding technique, to compactly encode data without significantly losing classification accuracy. We also propose using an inverted index to identify nearest neighbors among binarized image descriptors. To demonstrate the benefits of our method, we apply our method to two existing NBNN techniques with an image dataset. By using 64 bit length, we are able to reduce memory 16 times with higher runtime performance and no significant loss of classification accuracy. This result is achieved by our compact encoding scheme for image descriptors without losing much information from original image descriptors.

A Text Similarity Measurement Method Based on Singular Value Decomposition and Semantic Relevance

  • Li, Xu;Yao, Chunlong;Fan, Fenglong;Yu, Xiaoqiang
    • Journal of Information Processing Systems
    • /
    • 제13권4호
    • /
    • pp.863-875
    • /
    • 2017
  • The traditional text similarity measurement methods based on word frequency vector ignore the semantic relationships between words, which has become the obstacle to text similarity calculation, together with the high-dimensionality and sparsity of document vector. To address the problems, the improved singular value decomposition is used to reduce dimensionality and remove noises of the text representation model. The optimal number of singular values is analyzed and the semantic relevance between words can be calculated in constructed semantic space. An inverted index construction algorithm and the similarity definitions between vectors are proposed to calculate the similarity between two documents on the semantic level. The experimental results on benchmark corpus demonstrate that the proposed method promotes the evaluation metrics of F-measure.

XML 컴포넌트 명세서 기반의 컴포넌트 검색 기법 (A Search Method for Components Based-on XML Component Specification)

  • 박서영;신영길;우치수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권2호
    • /
    • pp.180-192
    • /
    • 2000
  • 최근 들어 컴포넌트는 소프트웨어 재사용의 핵심 기술로 인식되고 있다. 컴포넌트는 인터페이스 부분만을 이용하여 개발되는 소프트웨어에 바로 바인딩시켜 재사용될 수 있는 독립적인 바이너리 코드이다. 많은 컴포넌트 사용자들이 인터넷 상에서 적합한 컴포넌트를 검색하고 사용할 수 있도록, 컴포넌트 명세서는 웹 문서 형태를 사용하는 것이 바람직하다. 기존의 HTML 웹 문서 기반의 검색 엔진을 통하여 컴포넌트를 검색할 때 정확한 의미 검색이 불가능하다는 문제점이 있다. 본 논문에서는 정확한 의미 검색을 수행할 수 있도록 컴포넌트 명세서를 HTML 문서 대신 XML 문서로 사용할 것을 제안한다. 또한, XML 컴포넌트 명세서를 통하여 사용자가 원하는 컴포넌트를 정확하게 검색할 수 있는 XML 문맥 기반 검색(context-based search)을 제안한다. 문맥 기반 검색은 컴포넌트의 특성을 나타내는 문맥(context)과 컴포넌트 특성의 실제 값인 용어(term)를 사용하여 사용자가 원하는 컴포넌트의 특성을 정확하게 질의하고 검색할 수 있는 방법이다. 이 검색 방법은 용어-문맥-컴포넌트 명세서 순으로 된 역화일 인덱싱 (Inverted File Indexing) 방법을 사용한다. 이와 함께 사용자의 편의를 위하여, 기존의 소프트웨어 재사용 라이브러리에서 사용되던 검색 방법인 키워드 검색, 퍼싯 검색, 브라우징 검색 방법 등을 지원한다. 이들 다양한 검색 방법들은 인터페이스 레이어, 질의 확장 레이어, XML 검색 엔진 레이어 등 3-레이어 검색엔진 구조를 통한 효율적인 인덱스 스킴에 의해 지원된다. 본 논문에서는 컴포넌트 사용자들이 원하는 컴포넌트를 정확하게 검색할 수 있도록 하기 위하여 컴포넌트 명세서를 대한 XML DTD(Document Type Definition)를 정의하고, HTML 기반 검색 방법과 XML 기반 검색 방법에 대한 컴포넌트 검색 성능을 비교한다.

  • PDF

프리픽스 매취 조인을 이용한 XML 문서에 대한 분기 경로 질의 처리 (Branching Path Query Processing for XML Documents using the Prefix Match Join)

  • 박영호;한욱신;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.452-472
    • /
    • 2005
  • 본 논문에서는 정보 검색(Information Retrieval, IR) 기술과 새로운 인스턴스 조인 기술을 이용하여 방대하고도 이질적인 XML 문서들에 대한 부분 매취 질의(Partial Match Query)를 처리하는 새로운 방법으로, XIR-Branching을 제안한다. 부분 매취 질의는 경로 표현식에 조상-후손 관계성(descendent-or-self axis) "//"를 가지는 질의로 정의되며, 선형 경로 표현식(Linear Path Expression, LPE)과 분기 경로 표현식(Branching Path Expression, BPE)으로 구분된다 일반적 형식의 부분 매취 질의는 분기하는 경로들을 만드는 분기 조건들을 가진다. XIR-Branching의 목적은 이질적인 스키마들을 가진 방대한 문서들에 주어지는 부분 매취 질의를 효과적으로 지원하는 것이다. XIR-Branching은 관계형 테이블을 사용하는 전통적인 스키마-레벨 방법들(XRel, XParent, XIR-Linear[21])에 그 기초를 두고, 역 인덱스(inverted index) 기술과 새롭게 소개하는 인스턴스-레벨 조인 기술인 프리픽스 매취 조인(Prefix Match Join)을 사용하여 질의 처리 효율성과 확장성을 향상시킨다. 전자는 LPE를 처리하기 위한 기술로 XIR-Linear[21]에서 사용한 방법이다. 후자는 BPE를 처리하기 위한 기술로 본 논문에서 새롭게 제안하는 기술이며, 전통적인 방법에서 사용하는 포함 관계 조인(containment join) 보다 효과적인 방법으로 결과 노드(result node)를 찾는다. 기존 연구인 XR-Linear는 역 인덱스를 사용하여 LPE 처리에 우수한 성능을 보이고 있지만, BPE 처리 방법을 다루지 않았다. 그러나. 더욱 구체적이고 일반적인 질의를 위해서는 BPE도 처리할 수 있어야 한다. 본 논문에서는 BPE까지 다룰 수 있는 새로운 방법으로 기존의 XIR-Linear를 확장한 XIR-Branching을 제안한다. 제안하는 방법은 스키마-레벨 방법으로 질의 대상 후보 집합을 크게 줄인 후, 인스턴스-레벨 조인 방법인 프리픽스 매취 조인으로 최종 결과 집합을 효과적으로 구하는 방법이다. XIR-Branching의 우수성을 보이기 위해 기존 BP포 처리 방법인 XRei, XParent와 비교 분석을 수행한다. 마지막으로, 성능 평가를 통하여 XIR-Branching이 기존 방법들에 비해 수십에서 수백배 효과적이고 확장성 또한 뛰어남을 보인다.

관계형 DBMS 기반의 XML 데이터를 위한 k-비트맵 클러스터링 기법 (k-Bitmap Clustering Method for XML Data based on Relational DBMS)

  • 이범석;황병연
    • 정보처리학회논문지D
    • /
    • 제16D권6호
    • /
    • pp.845-850
    • /
    • 2009
  • 웹2.0 환경의 발달과 함께 XML 데이터의 사용도 증가하였는데, 특히 블로그나 뉴스 피드의 정보 전달을 위한 RSS나 ATOM 포맷의 기반 기술로 사용되면서 그 장점과 가치를 인정받고 있다. XML 데이터의 인덱싱을 위한 여러 기법들 중 빠른 검색성능을 보인 비트맵 클러스터링은 관계형 DBMS를 기반으로 메모리에 인덱스를 유지하는 기법이다. 기존의 비트맵 클러스터링 기법을 이용하여 XML 데이터를 인덱싱할 때 너무 많은 클러스터가 생성되어 오히려 검색 효율과 결과의 품질이 저하되는 문제점이 있었다. 본 논문에서는 이 문제점을 해결하기 위해 사용자가 제시하는 k개의 클러스터를 생성하는 k-비트맵 클러스터링 기법과 대표비트를 생성할 때 배제된 단어를 검색하기 위한 역인덱스를 함께 유지하는 방법을 제안한다. 성능평가를 수행한 결과 제안하는 기법은 생성되는 클러스터의 수를 임의로 설정할 수 있을 뿐만 아니라 단일 단어 검색에서 높은 재현율을 보였고, 2개의 인덱스를 함께 유지할 때에는 질의에 대해 모든 관련된 문서의 반환을 보장하였다.

동적 정보 저장을 위한 자동 하이퍼텍스트 색인 기법의 개발 (Development of an Automatic Hypertext Indexer for Dynamic Information Storage)

  • 이동애;장덕성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2333-2341
    • /
    • 1997
  • 하이퍼텍스트 정보를 저장할 때 정보가 삽입, 삭제, 변경되면, 인접한 정보들에 대한 하이퍼텍스트 링크도 변화되어야 한다. 하이터텍스트 링크는 하이터텍스트 색인어를 기준으로 관련있는 다른 정보를 찾는 수단을 제공한다. 따라서 하이퍼텍스트 색인어를 관리하는 것이 동적 정보 저장의 핵심이 된다. 본 논문에서는 새로운 정보가 삽입, 삭제, 변경될지라도 시스템이 안정성을 유지하며, 변경된 부분에 대한 하이퍼텍스트 색인어와 하이퍼텍스트 링크가 동적으로 결정될 수 있는 방법을 제시한다. 이를 위해 동적 색인기를 만들고, 동적 색인기의 동작을 돕기 위해 색인어 사전, 불용어 사전, 조사 사전, 역색인 파일, 시소러스 등을 구성한다.

  • PDF

성능지수와 제약조건을 고려한 불안정 시스템의 제어 (Control of Unstable Systems Concerned with the Performance Indexes and Constraints)

  • 안종갑;이윤형;소명옥
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제32권5호
    • /
    • pp.785-790
    • /
    • 2008
  • A technique for determining the feedback gain of the states feedback controller using a real-coded genetic algorithm(RCGA) is presented. It is concerned with the states error to the performance index of a RCGA. As for assessing the performance of the controller three performance criteria (ISE. IAE and ITAE) are adopted. And designing the controller involves a constrained optimization problem. Therefore a real-coded genetic algorithm incorporating the penalty strategy is used. The performance of the proposed method is demonstrated through a set of simulation about an inverted pendulum system.

희박 예혼합 덤프 연소기에서 OH 자발광을 이용한 열 방출에 관한 실험적 연구 (Experimental Study on Heat Release in a Lean Premixed Dump Combustor Using OH Chemiluminescence Images)

  • 문건필;이종호;전충환;장영준
    • 대한기계학회논문집B
    • /
    • 제28권11호
    • /
    • pp.1368-1375
    • /
    • 2004
  • Measurements of OH chemiluminescence in an atmospheric pressure, laboratory-scale dump combustor at equivalence ratios ranging from 0.63 to 0.89 were reported. The signal from the first electronically excited state of OH to ground state was detected through a band-pass filter with an ICCD. The objectives of this study are two: One is to see the effects of equivalence ratio on global heat release rate and local Rayleigh index distribution. To get the local Rayleigh index distribution, the line-of-sight images were inverted by tomographic method, such as Abel do-convolution. Another aim is to investigate the validity of using OH chemiluminescence acquired with an ICCD as a qualitative measure of local heat release. For constant inlet velocity and temperature, the overall intensities of OH emission acquired at different equivalence ratio showed periodic and higher value at high equivalence ratio. OH intensity averaged over one period of pressure increased exponentially with equivalence ratio. Local Rayleigh index distribution clearly showed the region of amplifying or damping the combustion instability as equivalence ratio increased. It could provide an information/insights on active control such as secondary fuel injection. Finally, local heat release rate derived from reconstructed OH images were presented fur typical locations.

Types of perception on the body shape of middle-aged women

  • Cha, Su-Joung
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권9호
    • /
    • pp.133-140
    • /
    • 2017
  • The purpose of this study is to provide a basic data of clothing development that can improve the satisfaction of the body shape by examining the subjective evaluation and characteristics of each type. The types of body shape of middle-aged women were analyzed as four types: elasticity loss ladder type, flat rectangular type, thin reverse ladder type, and upper body obesity inverted triangle type. The elasticity loss ladder type was developed with the lower body, and it was analyzed that the legs size such as the thighs and claves were large, the abdomen was protruded, and especially the underbelly appeared. The flat rectangular type was the largest of the four types, and was the skinny type. The width was larger than the thickness of the body, and the difference between the hip circumference and the waist circumference was small, and it was classified into a flat rectangular shape. The thin reverse ladder type was the smallest of the four types, the upper body was developed, the back had weight, and the body was leaning forward. And the lower body and leg were poor and the abdomen was protruding. Finally, the upper body obesity inverted triangular was the highest type of BMI index among 4 types. All of subjects belong to the mild and middle obesity, and the second was the smallest but the most weighted type among 4 types. They had the fat body and big bust, the upper body was developed, and the lower body and legs were analyzed to be poor body shape. Based on the body shape of middle-aged women, it is necessary to develop designs and patterns that can cover the shortcomings of body shape.

다변량 공정능력지수들의 비교분석 (Comparison Analysis of Multivariate Process Capability Indices)

  • 문혜진;정영배
    • 산업경영시스템학회지
    • /
    • 제42권1호
    • /
    • pp.106-114
    • /
    • 2019
  • Recently, the manufacturing process system in the industrial field has become more and more complex and has been influenced by many and various factors. Moreover, these factors have the dependent correlation rather than independent of each other. Therefore, the statistical analysis has been extended from the univariate method to the multivariate method. The process capability indices have been widely used as statistical tools to assess the manufacturing process performance. Especially, the multivariate process indices need to be enhanced with more useful information and extensive application in the recent industrial fields. The various multivariate process capability indices have been studying by many researchers in recent years. Hence, the purpose of the study is to compare the useful and various multivariate process capability indices through the simulation. Among them, we compare the useful models of several multivariate process capability indices such as $MC_{pm}$, $MC^+_{pm}$ and $MC_{pl}$. These multivariate process capability indices are incorporates both the process variation and the process deviation from target or consider the expected loss caused by the process deviation from target. Through the computational examples, we compare these process capability indices and discuss their usefulness and effectiveness.