• 제목/요약/키워드: Data Merge

검색결과 189건 처리시간 0.022초

비트맵 필터를 이용한 효율적인 역 리스트 탐색 기법 (Efficient Inverted List Search Technique using Bitmap Filters)

  • 권인택;김종익
    • 정보처리학회논문지D
    • /
    • 제18D권6호
    • /
    • pp.415-422
    • /
    • 2011
  • 텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 Suffix 필터링 과정에서 역 리스트의 탐색 비용을 줄이기 위해 역 리스트의 통계 정보인 비트맵 필터를 사용하는 기법을 제안한다. 제안하는 기법은 비트맵 필터를 사용하여 Suffix 필터링 과정에서 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 Suffix 필터링 알고리즘보다 더 효율적임을 보인다.

Prepress 중심으로 한 Lean Printing System에 관한 연구 (The Study of the Lean Printing System on the Prepress)

  • 이상현;하영백;오성상;최재혁;유건룡;이재수
    • 한국인쇄학회지
    • /
    • 제29권3호
    • /
    • pp.77-96
    • /
    • 2011
  • Most of all manufacturing industries are pursuing the manufacturing process innovation through the production process automation but the printing industry still does not get out of the analog ways of the entire process compared the entire manufacturing industry. Today, many printing enterprises have the difficulties by the short for delivery, multi-item small amount printing, high quality, rise in raw material cost, drop in receiving order cost, and etc. The printing industry can get over these difficulties and issues by implementing the compact workflow line, merge with the others, automatization and networking, minimization of the repetitive operation, efficiency of the working process, optimization of the operators' value creation, minimization of cost and materials and fast make-ready. The object of this thesis establishes the experimental data and study cases applicable in the printing industry by having high labor productivity and work in line with printing industry processes through "lean printing system".

대용량 비디오 데이터베이스 구축을 위하여 장면전환 검출과 샷 클러스터링을 이용한 비디오 개요 추출 (Video Abstracting Using Scene Change Detection and Shot Clustering for Construction of Efficient Video Database)

  • 신성윤;표성배
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.111-119
    • /
    • 2006
  • 본 대부분의 비디오는 대용량의 장시간 데이터로서 비디오 시청자들이 전반적인 내용을 이해하기에는 충분하지 못하다. 본 논문에서는 이러한 문제점을 해결하기 위하여 효율적인 장면 전환 검출 방법과 새로운 샷 클러스터링을 이용한 비디오 개요 추출 방법을 제시한다. 장면전환 검출 방법은 컬러 히스토그램과 $\chi2$ 히스토그램을 합성한 방법을 이용하여 추출하도록 한다. 클러스터링은 지역적 히스토그램의 차이값을 이용한 유사성 측정과 새로운 샷 병합 알고리즘을 통해 수행하도록 한다. 또한 실제 TV 방송 프로그램을 대상으로 비디오 개요 추출 실험 결과를 제시한다.

  • PDF

Performance Evaluation of SSD-Index Maintenance Schemes in IR Applications

  • Jin, Du-Seok;Jung, Hoe-Kyung
    • Journal of information and communication convergence engineering
    • /
    • 제8권4호
    • /
    • pp.377-382
    • /
    • 2010
  • With the advent of flash memory based new storage device (SSD), there is considerable interest within the computer industry in using flash memory based storage devices for many different types of application. The dynamic index structure of large text collections has been a primary issue in the Information Retrieval Applications among them. Previous studies have proven the three approaches to be effective: In- Place, merge-based index structure and a combination of both. The above-mentioned strategies have been researched with the traditional storage device (HDD) which has a constraint on how keep the contiguity of dynamic data. However, in case of the new storage device, we don' have any constraint contiguity problems due to its low access latency time. But, although the new storage device has superiority such as low access latency and improved I/O throughput speeds, it is still not well suited for traditional dynamic index structures because of the poor random write throughput in practical systems. Therefore, using the experimental performance evaluation of various index maintenance schemes on the new storage device, we propose an efficient index structure for new storage device that improves significantly the index maintenance speed without degradation of query performance.

A Heuristic Polynomial Time Algorithm for Crew Scheduling Problem

  • Lee, Sang-Un
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권11호
    • /
    • pp.69-75
    • /
    • 2015
  • This paper suggests heuristic polynomial time algorithm for crew scheduling problem that is a kind of optimization problems. This problem has been solved by linear programming, set cover problem, set partition problem, column generation, etc. But the optimal solution has not been obtained by these methods. This paper sorts transit costs $c_{ij}$ to ascending order, and the task i and j crew paths are merged in case of the sum of operation time ${\Sigma}o$ is less than day working time T. As a result, we can be obtain the minimum number of crews $_{min}K$ and minimum transit cost $z=_{min}c_{ij}$. For the transit cost of specific number of crews $K(K>_{min}K)$, we delete the maximum $c_{ij}$ as much as the number of $K-_{min}K$, and to partition a crew path. For the 5 benchmark data, this algorithm can be gets less transit cost than state-of-the-art algorithms, and gets the minimum number of crews.

SOM과 grassfire 기법을 이용한 효율적인 컬러 영상 분할 (Efficient Color Image Segmentation using SOM and Grassfire Algorithm)

  • 황영철;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 지능정보 및 응용 학술대회
    • /
    • pp.142-145
    • /
    • 2008
  • 본 논문에서는 self-organizing map(SOM)과 grassfire 기법을 이용한 계산 효율적인 컬러 영상 분할 방법을 제안한다. SOM에서 출력 뉴런 수를 축소하고 학습에 사용하는 입력 데이터를 줄임으로써 실행 시간을 단축 시켰다. 입력 영상을 CIE $L^*u^*v^*$ 컬러 공간으로 변환하고 3개의 입력 뉴런과 $4{\times}4$ 또는 $3{\times}3$ 출력 뉴런 구조의 SOM을 이용해 학습한다. 학습 완료 후 입력 영상의 픽셀에 대응하는 출력 값을 구하고 grassfire 기법을 이용해 지역적으로 인접하고 출력 값이 동일한 픽셀들을 하나의 영역으로 결합한다. 다양한 영상을 이용한 실험을 통해 제안한 방법이 컬러 영상 분할에서 기존의 방법에 비해 좋은 결과를 얻을 수 있음을 확인하였다.

  • PDF

대용량 비디오 데이터베이스 구축을 위한 비디오 개요 추출 (Video Abstracting Construction of Efficient Video Database)

  • 신성윤;표성배;이양원
    • 한국컴퓨터정보학회지
    • /
    • 제14권1호
    • /
    • pp.255-264
    • /
    • 2006
  • 대부분의 비디오는 대용량의 장시간 데이터로서 비디오 시청자들이 전반적인 내용을 이해하기에는 충분하지 못하다. 본 논문에서는 이러한 문제점을 해결하기 위하여 효율적인 장면 전환 검출 방법과 새로운 샷 클러스터링을 이용한 비디오 개요 추출 방법을 제시한다. 장면전환 검출 방법은 컬러 히스토그램과 ${\chi}^2$ 히스토그램을 합성한 방법을 이용하여 추출하도록 한다. 클러스터링은 지역적 히스토그램의 차이값을 이용한 유사성 측정과 새로운 샷 병합 알고리즘을 통해 수행하도록 한다. 또한 실제 TV 방송 프로그램을 대상으로 비디오 개요 추출 실험 결과를 제시한다.

  • PDF

IKONOS 영상을 활용한 IHS, FIHS, PCA, BT, WT 영상 융합법의 비교분석 (A Comparative Analysis of IHS, FIHS, PCA, BT and WT Image Fusion Methods Using IKONOS Image Data)

  • 김현;유재호;김중곤;서용수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.599-602
    • /
    • 2009
  • 본 논문에서는 IKONOS 영상에서 고공간 해상도인 PAN 영상과 저공간 해상도인 MS 영상을 사용하여 IHS 융합법, FIHS 융합법, PCA 융합법, BT 융합법, WT 융합법으로 각각 처리한 후, 그 결과를 공간해상도 및 분광특성의 측면에서 비교 분석하였다. 이 5가지 방법에 의한 융합결과를 분광특성의 측면에서 평가한 결과 FIHS, BT, PCA, IHS, WT 융합법 순으로 칼라왜곡이 나타났다. 공간특성의 측면에서 평가한 결과는 거의 동일한 공간해상도를 나타내었으며, Original IKONOS 위성영상에서는 식별하기 어려운 건물지붕의 형태, 건물사이의 도로 등이 명확히 잘 구별되고 있다. 정량적 결과분석에서는 평균, 표준 편차, 상관계수 등을 사용하여 비교하였다.

  • PDF

Building Hybrid Stop-Words Technique with Normalization for Pre-Processing Arabic Text

  • Atwan, Jaffar
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.65-74
    • /
    • 2022
  • In natural language processing, commonly used words such as prepositions are referred to as stop-words; they have no inherent meaning and are therefore ignored in indexing and retrieval tasks. The removal of stop-words from Arabic text has a significant impact in terms of reducing the size of a cor- pus text, which leads to an improvement in the effectiveness and performance of Arabic-language processing systems. This study investigated the effectiveness of applying a stop-word lists elimination with normalization as a preprocessing step. The idea was to merge statistical method with the linguistic method to attain the best efficacy, and comparing the effects of this two-pronged approach in reducing corpus size for Ara- bic natural language processing systems. Three stop-word lists were considered: an Arabic Text Lookup Stop-list, Frequency- based Stop-list using Zipf's law, and Combined Stop-list. An experiment was conducted using a selected file from the Arabic Newswire data set. In the experiment, the size of the cor- pus was compared after removing the words contained in each list. The results showed that the best reduction in size was achieved by using the Combined Stop-list with normalization, with a word count reduction of 452930 and a compression rate of 30%.

다종 위성 자료를 활용한 해수면온도(SST) 합성기법 개발 연구 (Study on Merging Method of SSTs Using Multi-satellite Data)

  • 오은경;양찬수
    • 해양환경안전학회지
    • /
    • 제17권3호
    • /
    • pp.197-202
    • /
    • 2011
  • 본 연구는 다종 위성 자료를 활용한 해수면온도 합성 기법에 대한 연구이다. 현재 많은 연구자들이 사용하고 있는 NGSST 알고리듬은 위성에 따른 정확도를 고려하지 않고 시 공간 상관도만을 계산하여 해당 픽셀의 값을 추정한다. 본 연구에서는 위성 센서별로 가지고 있는 정확도를 추가로 고려한 해수면온도 합성기법을 제안하고 기존 알고리듬과의 비교를 수행하였다. 합성장을 산출하는데 사용된 센서는 적외 센서인 MODIS, AVHRR 그리고 마이크로파 센서인 AMSR-E를 사용하였고, 2011년 4월 4일을 기준으로 5 km의 공간해상도를 갖는 일일 해수면 온도 합성장을 비교하였다. 부이와의 비교 결과, 기존 방법(NGSST Method)과 제안 방법(New Method)에 의한 표준편차는 각각 $0.15^{\circ}C$$0.12^{\circ}C$이었다. 또한 기존 방법보다 제안 방법에 의한 해수면온도 값은 연안을 제외한 대부분의 해역에서 다소 높게 산출이 되었다. 현 단계에서 정량적인 평가는 어렵지만, 본 연구를 통하여 해수면온도 합성기법에 대한 연구 방향이 제시되었다고 판단된다.