• Title/Summary/Keyword: 탐색비용

Search Result 710, Processing Time 0.029 seconds

Performance Improvement on Similar Texts Searching System for Massive Document Repository (대용량 문서 집합에서 유사문서 탐색 시스템의 성능 개선)

  • Park, Sun-Young;Cho, Hwan-Gue
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.413-416
    • /
    • 2010
  • 최근 발생한 수많은 표절 논란으로 인해 많은 유사 문서 탐색 시스템이 개발되어 사용되고 있다. 많은 시스템 중 내용기반 유사문서 탐색 시스템인 DeVAC은 대용량 문서 1:1간의 비교에서 빠른 성능을 보여주지만 수천~수만 개의 문서 집합에 대해서는 적절한 성능을 보여주지 못한다. 이를 해결하기 위해 전역 사전(Global Dictionary)을 이용한 전처리 방법이 고안되어 적용되었다. 이 전처리 방법을 통해 비교해야 할 문서쌍이 줄어들고 전체 시스템의 성능을 향상시킬 수 있다는 것은 밝혀졌으나, 전처리를 위해 발생하는 추가 비용에 대한 계측이 이루어지지 않았을 뿐 아니라 문서 쌍이 얼마나 감소하는지 측정한 실험에서도 언어 처리용 실험적 데이터(말뭉치)에 대한 실험이 대부분을 차지하였기 때문에 실제 데이터에 대해 어떤 성능을 보일지 정확히 예측할 수 없었다. 본 논문에서는 전체 시스템에서 전처리를 위해 필요한 모든 추가 비용을 측정하고, 데이터를 1.5Gb, 6263개의 문서로 이루어진 실존하는 문서 집합으로 구성하여 성능 향상 정도를 측정함으로써 실제 데이터에 대한 전처리 신뢰도를 예측하였다. 실험 결과 전처리 후 찾아낸 유사한 문서 쌍을 전처리를 하지 않을 경우의 80~89.3% 정도로 유지하면서 검사 시간을 기존의 10.8%~15.4% 수준으로 대폭 감소시킬 수 있었다.

A method for similar-word retrival based on BTI dictionary indexing mechanism (BTI 사전 색인을 이용한 유사단어 검색)

  • 정연수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.291-296
    • /
    • 1994
  • 유사단어의 추정에 있어서 사전 검색에 드는 비용, 즉 사전탐색 횟수는 효율성의 문제와 직결된다. 본 논문에서는 BTI 사전 색인을 이용하여 한 글자의 변형요소가 있는 유사단어들을 효율적으로 거색하는 방법을 제안한다. BTI 방식은 정방향, 역방향 표제어를 모두 저장하는 방법이다. BTI 방식으로 사전 표제어를 색인하여 표제어에 대한 사전 탐색 도중에 사전에 존재하는 prefix와 postifix를 모두 검색할 수 있다. 이러한 정보를 이용하면 유사 단어에 대한 정확한 변형 위치를 결정할 수 있다. BTI 사전 색인은 사전 표제어에 대한 정보없이 유사단어를 추정한 후에 사전 검색을 통하여 확인하는 방법보다 사전 검색에 드는 비용이 적다. 추가적으로 유사단어 후보들에 대한 우선 순위를 정하기 위하여 corpus에서 추출한 각 표제어의 발견 빈도를 이용하였다.

  • PDF

Early Termination Algorithm of Prediction Unit (PU) Search for Fast HEVC Encoding (HEVC 고속 부호화를 위한 PU 탐색 조기 종료 기법)

  • Kim, Jae-Wook;Kim, Dong-Hyun;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2013.11a
    • /
    • pp.172-173
    • /
    • 2013
  • 최근 표준화가 완료된 HEVO(High Efficiency Video Coding)에서는 계층적 구조를 갖는 가변블록의 크기를 사용하고 재귀적으로 부호화를 수행사여, 최적의 부호화단위(CU: Coding Unit) 분할 구조와 예측단위(PU: Prediction Unit)를 결정함으로써 높은 부호화 효율을 얻을 수 있는 반면 부호화 복잡도가 증가하는 문제가 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위한 고속 부호화 알고리즘으로 고속 모드 결정 기법을 제안한다. 제안기법은 상위 깊이(CU: Coding Unit)의 최적 모드와 부호화 율-왜곡 비용을 이용해서 현재 깊이 CU에서의 특정 모드의 율-왜곡 비용 계산을 생략함으로써 PU 탐색을 조기 종료한다. 즉, 상위 깊이 CU의 조건에 따라 화면간 예측 모드의 일부 또는 화면내 예측을 수행하지 않는다. 실험결과 제안기법은 HM 12.0대비 0.2%의 비트 증가에 22.9%의 계산시간 감소 효과를 얻을 수 있음을 확인하였다.

  • PDF

A Study on Path Selection Mechanism Based on Dynamic Context-Awareness (동적 상황인식 기반 경로 선정 기법 연구)

  • Choi, Kyung-Mi;Park, Young-Ho
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2012.05a
    • /
    • pp.234-235
    • /
    • 2012
  • 본 논문에서는 개미 집단 최적화(Ant Colony Optimization, ACO) 알고리즘을 적용한 감속률에 따른 동적 상황인식 경로 선정 방법을 제안한다. 최근 ITS(Intelligent Transportation Systems)의 개발과 함께 차량용 내비게이션의 실시간 교통 정보를 이용하는 수요가 급증하면서, 경로탐색의 중요성이 더욱 가속화되고 있다. 현재 차량용 내비게이션은 멀티미디어 및 정보통신 기술의 결합과 함께 다양한 기능 및 정보를 사용자에게 제공하고 있으며, 이러한 경로탐색 알고리즘은 교통시스템, 통신 네트워크, 운송 시스템 등 다양한 분야에 적용되고 있다. 본 논문에서는 감속률에 따른 동적 상황인식 경로 선정 방법을 제안함으로써, 최단 시간 및 최소 비용의 정보를 제공해 줄 뿐만 아니라 교통정체로 인한 사회적 비용 감소의 효과를 가져다 줄 것으로 기대한다.

  • PDF

Study of Integrated Modelling for Internet Shopping Mall (인터넷 쇼핑몰의 통합 모형 연구)

  • 권영국;박현지
    • Proceedings of the Korea Association of Information Systems Conference
    • /
    • 2004.11a
    • /
    • pp.57-66
    • /
    • 2004
  • 인터넷의 발전과 더불어 날고 치열해 지는 경쟁 속에서 관광산업 웹사이트들의 생존 전략은 Reichheld(1993)의 연구결과처럼 고객 충성도의 유지를 통한 경쟁적 우위를 점하는 것이다. 인터넷을 이용함으로써 소비자는 교체비용의 감소, 탐색비용의 절감이 가능해짐(Bakos, 1997; Strader 등, 1997)에 따라 웹사이트에 대한 충성도 역시 현격히 낮아지게 된다. 왜냐하면 오프라인에서는 이동이 불편하고 힘들지만 인터넷상의 거래에서는 마우스 클릭만으로 간단하게 이뤄지기 때문이다. 국내 인터넷업체가 많은 고객을 끌어 모으는 반면 수익성 문제가 사라지지 않는 원인 중 하나는 이처럼 낮아진 고객 충성도에서 찾을 수 있다 (안준모 등, 2001). 오랜 기간에 걸쳐 지속적으로 거래할 가능성이 높은 고객확보는(Reichheld, 1993) 곧 기업의 성공과 연관되며, 이는 기업이 충성도를 중시해야 할 이유일 것이다. 따라서 본 연구는 인터넷 쇼핑몰 웹사이트의 환경특성에 따른 사용자의 만족, 신뢰, 몰입 등의 매개변수를 고려하여 최종적으로 사용자의 충성도를 분석하고자 한다. 쇼핑몰에서 충성도(loyalty)의 문제가 매우 중요한 것으로 파악되고 있다. 하지만, 기존 연구들에서는 관계몰입을 중심으로 한 연구는 별로 눈에 띄지 않고 있다. 따라서 관계몰입을 중심으로 한 종합적 인터넷 쇼핑몰의 연구모형의 제시와 검증은 매우 필요한 연구과제라 할 수가 있을 것이다.

  • PDF

Index-base Multi Access Control for XML Document (XML문서를 위한 인덱스기반의 다중 접근 제어)

  • Choi, Nam-Kyu;Whang, Jeong-Hee;Ryu, Keun-Ho;Park, Jin-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1599-1602
    • /
    • 2003
  • 최근, 정보 보호의 중요성이 부각됨에 따라 현재 웹 데이터 교환의 표준인 XML 데이터에 대한 보안과 접근 제어 기법이 주요 연구로 부상하고 있으며 연구의 초점은 안전함을 보장하면서, 동시에 부가적인 비용 증가를 줄이는데 있다. 그렇지만 이러한 연구의 방식에서는 인덱스를 고려하지 않기 때문에 불필요한 탐색은 물론 데이터 증가에 따른 탐색 비용이 증가한다. 따라서 이 연구에서는 XPath의 원리를 기반으로 인덱스와 접근제어를 동시에 고려하는 인덱스 기반의 접근 제어 맵을 제안하고, 이 기법을 관계형 데이터베이스에 적용하여 구현하였다.

  • PDF

A Dynamic Data Replica Deletion Strategy on HDFS using HMM (HMM을 이용한 HDFS 기반 동적 데이터 복제본 삭제 전략)

  • Seo, Young-Ho;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.07a
    • /
    • pp.241-244
    • /
    • 2014
  • 본 논문에서는 HDFS(Hadoop Distributed File System)에서 문제되고 있는 복제정책의 개선을 위해 HMM(Hidden Markov Model)을 이용한 동적 데이터 복제본 삭제 전략을 제안한다. HDFS는 대용량 데이터를 효과적으로 처리할 수 있는 분산 파일 시스템으로 높은 Fault-Tolerance를 제공하며, 데이터의 접근에 높은 처리량을 제공하여 대용량 데이터 집합을 갖는 응용 프로그램에 최적화 되어있는 장점을 가지고 있다. 하지만 HDFS 에서의 복제 메커니즘은 시스템의 안정성과 성능을 향상시키지만, 추가 블록 복제본이 많은 디스크 공간을 차지하여 유지보수 비용 또한 증가하게 된다. 본 논문에서는 HMM과 최상의 상태 순서를 찾는 알고리즘인 Viterbi Algorithm을 이용하여 불필요한 데이터 복제본을 탐색하고, 탐색된 복제본의 삭제를 통하여 HDFS의 디스크 공간과 유지보수 비용을 절약 할 수 있는 전략을 제안한다.

  • PDF

A Design and Implementation of a Timing Analysis Simulator for a Design Space Exploration on a Hybrid Embedded System (Hybrid 내장형 시스템의 설계공간탐색을 위한 시간분석 시뮬레이터의 설계 및 구현)

  • Ahn, Seong-Yong;Shim, Jea-Hong;Lee, Jeong-A
    • The KIPS Transactions:PartA
    • /
    • v.9A no.4
    • /
    • pp.459-466
    • /
    • 2002
  • Modern embedded system employs a hybrid architecture which contains a general micro processor and reconfigurable devices such as FPGAS to retain flexibility and to meet timing constraints. It is a hard and important problem for embedded system designers to explore and find a right system configuration, which is known as design space exploration (DSE). With DES, it is possible to predict a final system configuration during the design phase before physical implementation. In this paper, we implement a timing analysis simulator for a DSE on a hybrid embedded system. The simulator, integrating exiting timing analysis tools for hardware and software, is designed by extending Y-chart approach, which allows quantitative performance analysis by varying design parameters. This timing analysis simulator is expected to reduce design time and costs and be used as a core module of a DSE for a hybrid embedded system.

기계학습을 이용한 수출 컨테이너의 무게그룹 분류

  • Gang, Jae-Ho;Gang, Byeong-Ho;Ryu, Gwang-Ryeol;Kim, Gap-Hwan
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.05a
    • /
    • pp.77-86
    • /
    • 2005
  • 컨테이너 터미널에서는 장치장으로 반입되는 수출 컨테이너의 무게를 몇 단계 그룹으로 나누고 각 무게그룹 별로 모아서 장치한다. 이는 수출 컨테이너를 선박에 싣는 적하 작업 시 선박의 안정성을 위하여 무거운 무게그룹의 컨테이너들을 장치장에서 먼저 반출하여 선박의 바닥 쪽에 놓기 위함이다. 하지만 반입되는 컨테이너의 무게그룹을 결정할 때 사용하는 운송사로부터 받은 무게정보는 부정확한 경우가 많아 하나의 스택(stack)에 서로 다른 무게그룹에 속하는 컨테이너들이 섞이게 된다. 이로 인하여 무거운 무게그룹의 컨테이너를 반출할 때 해당 컨테이너의 상단에 놓여진 보다 가벼운 무게그룹의 컨테이너들을 임시로 옮겨야 하는 재취급(rehandling, reshuffling)이 발생하게 된다. 적하작업 시 장치장에서 재취급이 빈번히 발생하면 작업이 지연되므로 터미널 생산성 향상을 위해서는 재취급 발생을 가급적 줄여야 한다. 본 논문에서는 기계학습 기법을 적용하여 반입 컨테이너의 무게그룹을 보다 정확히 추정하는 방안을 제안한다. 또한 탐색을 통하여 분류기 생성에 관여하는 비용행렬(cost matrix)을 조정함으로써 재취급 발생을 줄일 수 있는 분류기(classifier)를 생성하는 방안을 함께 소개한다. 실험 결과 본 논문에서 제안하는 방안 적용 시 재취급 발생을 $5{\sim}7%$ 정도 줄일 수 있음을 예상할 수 있었다.

  • PDF

The Strategy and the Tactics for Online Searching (온라인 검색(檢索)에 있어서 검색전략(檢索戰略)과 전술(戰術))

  • Lee, Hyyj-Je
    • Journal of Information Management
    • /
    • v.26 no.1
    • /
    • pp.80-98
    • /
    • 1995
  • Search strategies is a means to make an efficient search. Among several studies of search strategy, Bates' $\ulcorner$Search Tactics$\lrcorner$ has been often cited and introduced, but their studies have been superficial. In this paper, the contents of Bates' $\ulcorner$Search Tactics$\lrcorner$ are examined in detail, and we try to represent the actual online search process based upon Bates' $\ulcorner$Search Tactics$\lrcorner$. The following three kinds of survey are made in order to clarify which and how tactics are used: (1) Interview with 7 searchers who belong to different types of organizations, and use different kinds of databases (2) Analysis of some online search records. (3) Analysis of written applications for a newspaper database during one year. In conclusion, Bates' tactics falls into categories and new several tactics which often used are added. The following five factors affect online search activities, search strategy, and search tactics. (1) the difficulty of search requests (2) the kinds of databases (3) the charging policy for each online search (4) the presence of the user during the search (5) the searcher' online experience In the limited condition, typical tactics are suggested, but in order to generalize the pattern of using tactics, further investigation is necessary.

  • PDF