• 제목/요약/키워드: 탐색비용

검색결과 710건 처리시간 0.027초

대용량 문서 집합에서 유사문서 탐색 시스템의 성능 개선 (Performance Improvement on Similar Texts Searching System for Massive Document Repository)

  • 박선영;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.413-416
    • /
    • 2010
  • 최근 발생한 수많은 표절 논란으로 인해 많은 유사 문서 탐색 시스템이 개발되어 사용되고 있다. 많은 시스템 중 내용기반 유사문서 탐색 시스템인 DeVAC은 대용량 문서 1:1간의 비교에서 빠른 성능을 보여주지만 수천~수만 개의 문서 집합에 대해서는 적절한 성능을 보여주지 못한다. 이를 해결하기 위해 전역 사전(Global Dictionary)을 이용한 전처리 방법이 고안되어 적용되었다. 이 전처리 방법을 통해 비교해야 할 문서쌍이 줄어들고 전체 시스템의 성능을 향상시킬 수 있다는 것은 밝혀졌으나, 전처리를 위해 발생하는 추가 비용에 대한 계측이 이루어지지 않았을 뿐 아니라 문서 쌍이 얼마나 감소하는지 측정한 실험에서도 언어 처리용 실험적 데이터(말뭉치)에 대한 실험이 대부분을 차지하였기 때문에 실제 데이터에 대해 어떤 성능을 보일지 정확히 예측할 수 없었다. 본 논문에서는 전체 시스템에서 전처리를 위해 필요한 모든 추가 비용을 측정하고, 데이터를 1.5Gb, 6263개의 문서로 이루어진 실존하는 문서 집합으로 구성하여 성능 향상 정도를 측정함으로써 실제 데이터에 대한 전처리 신뢰도를 예측하였다. 실험 결과 전처리 후 찾아낸 유사한 문서 쌍을 전처리를 하지 않을 경우의 80~89.3% 정도로 유지하면서 검사 시간을 기존의 10.8%~15.4% 수준으로 대폭 감소시킬 수 있었다.

BTI 사전 색인을 이용한 유사단어 검색 (A method for similar-word retrival based on BTI dictionary indexing mechanism)

  • 정연수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.291-296
    • /
    • 1994
  • 유사단어의 추정에 있어서 사전 검색에 드는 비용, 즉 사전탐색 횟수는 효율성의 문제와 직결된다. 본 논문에서는 BTI 사전 색인을 이용하여 한 글자의 변형요소가 있는 유사단어들을 효율적으로 거색하는 방법을 제안한다. BTI 방식은 정방향, 역방향 표제어를 모두 저장하는 방법이다. BTI 방식으로 사전 표제어를 색인하여 표제어에 대한 사전 탐색 도중에 사전에 존재하는 prefix와 postifix를 모두 검색할 수 있다. 이러한 정보를 이용하면 유사 단어에 대한 정확한 변형 위치를 결정할 수 있다. BTI 사전 색인은 사전 표제어에 대한 정보없이 유사단어를 추정한 후에 사전 검색을 통하여 확인하는 방법보다 사전 검색에 드는 비용이 적다. 추가적으로 유사단어 후보들에 대한 우선 순위를 정하기 위하여 corpus에서 추출한 각 표제어의 발견 빈도를 이용하였다.

  • PDF

HEVC 고속 부호화를 위한 PU 탐색 조기 종료 기법 (Early Termination Algorithm of Prediction Unit (PU) Search for Fast HEVC Encoding)

  • 김재욱;김동현;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 추계학술대회
    • /
    • pp.172-173
    • /
    • 2013
  • 최근 표준화가 완료된 HEVO(High Efficiency Video Coding)에서는 계층적 구조를 갖는 가변블록의 크기를 사용하고 재귀적으로 부호화를 수행사여, 최적의 부호화단위(CU: Coding Unit) 분할 구조와 예측단위(PU: Prediction Unit)를 결정함으로써 높은 부호화 효율을 얻을 수 있는 반면 부호화 복잡도가 증가하는 문제가 있다. 본 논문에서는 부호화기의 복잡도를 감소시키기 위한 고속 부호화 알고리즘으로 고속 모드 결정 기법을 제안한다. 제안기법은 상위 깊이(CU: Coding Unit)의 최적 모드와 부호화 율-왜곡 비용을 이용해서 현재 깊이 CU에서의 특정 모드의 율-왜곡 비용 계산을 생략함으로써 PU 탐색을 조기 종료한다. 즉, 상위 깊이 CU의 조건에 따라 화면간 예측 모드의 일부 또는 화면내 예측을 수행하지 않는다. 실험결과 제안기법은 HM 12.0대비 0.2%의 비트 증가에 22.9%의 계산시간 감소 효과를 얻을 수 있음을 확인하였다.

  • PDF

동적 상황인식 기반 경로 선정 기법 연구 (A Study on Path Selection Mechanism Based on Dynamic Context-Awareness)

  • 최경미;박영호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2012년도 춘계학술발표대회논문집
    • /
    • pp.234-235
    • /
    • 2012
  • 본 논문에서는 개미 집단 최적화(Ant Colony Optimization, ACO) 알고리즘을 적용한 감속률에 따른 동적 상황인식 경로 선정 방법을 제안한다. 최근 ITS(Intelligent Transportation Systems)의 개발과 함께 차량용 내비게이션의 실시간 교통 정보를 이용하는 수요가 급증하면서, 경로탐색의 중요성이 더욱 가속화되고 있다. 현재 차량용 내비게이션은 멀티미디어 및 정보통신 기술의 결합과 함께 다양한 기능 및 정보를 사용자에게 제공하고 있으며, 이러한 경로탐색 알고리즘은 교통시스템, 통신 네트워크, 운송 시스템 등 다양한 분야에 적용되고 있다. 본 논문에서는 감속률에 따른 동적 상황인식 경로 선정 방법을 제안함으로써, 최단 시간 및 최소 비용의 정보를 제공해 줄 뿐만 아니라 교통정체로 인한 사회적 비용 감소의 효과를 가져다 줄 것으로 기대한다.

  • PDF

인터넷 쇼핑몰의 통합 모형 연구 (Study of Integrated Modelling for Internet Shopping Mall)

  • 권영국;박현지
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2004년도 추계학술대회
    • /
    • pp.57-66
    • /
    • 2004
  • 인터넷의 발전과 더불어 날고 치열해 지는 경쟁 속에서 관광산업 웹사이트들의 생존 전략은 Reichheld(1993)의 연구결과처럼 고객 충성도의 유지를 통한 경쟁적 우위를 점하는 것이다. 인터넷을 이용함으로써 소비자는 교체비용의 감소, 탐색비용의 절감이 가능해짐(Bakos, 1997; Strader 등, 1997)에 따라 웹사이트에 대한 충성도 역시 현격히 낮아지게 된다. 왜냐하면 오프라인에서는 이동이 불편하고 힘들지만 인터넷상의 거래에서는 마우스 클릭만으로 간단하게 이뤄지기 때문이다. 국내 인터넷업체가 많은 고객을 끌어 모으는 반면 수익성 문제가 사라지지 않는 원인 중 하나는 이처럼 낮아진 고객 충성도에서 찾을 수 있다 (안준모 등, 2001). 오랜 기간에 걸쳐 지속적으로 거래할 가능성이 높은 고객확보는(Reichheld, 1993) 곧 기업의 성공과 연관되며, 이는 기업이 충성도를 중시해야 할 이유일 것이다. 따라서 본 연구는 인터넷 쇼핑몰 웹사이트의 환경특성에 따른 사용자의 만족, 신뢰, 몰입 등의 매개변수를 고려하여 최종적으로 사용자의 충성도를 분석하고자 한다. 쇼핑몰에서 충성도(loyalty)의 문제가 매우 중요한 것으로 파악되고 있다. 하지만, 기존 연구들에서는 관계몰입을 중심으로 한 연구는 별로 눈에 띄지 않고 있다. 따라서 관계몰입을 중심으로 한 종합적 인터넷 쇼핑몰의 연구모형의 제시와 검증은 매우 필요한 연구과제라 할 수가 있을 것이다.

  • PDF

XML문서를 위한 인덱스기반의 다중 접근 제어 (Index-base Multi Access Control for XML Document)

  • 최남규;황정희;류근호;박진수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1599-1602
    • /
    • 2003
  • 최근, 정보 보호의 중요성이 부각됨에 따라 현재 웹 데이터 교환의 표준인 XML 데이터에 대한 보안과 접근 제어 기법이 주요 연구로 부상하고 있으며 연구의 초점은 안전함을 보장하면서, 동시에 부가적인 비용 증가를 줄이는데 있다. 그렇지만 이러한 연구의 방식에서는 인덱스를 고려하지 않기 때문에 불필요한 탐색은 물론 데이터 증가에 따른 탐색 비용이 증가한다. 따라서 이 연구에서는 XPath의 원리를 기반으로 인덱스와 접근제어를 동시에 고려하는 인덱스 기반의 접근 제어 맵을 제안하고, 이 기법을 관계형 데이터베이스에 적용하여 구현하였다.

  • PDF

HMM을 이용한 HDFS 기반 동적 데이터 복제본 삭제 전략 (A Dynamic Data Replica Deletion Strategy on HDFS using HMM)

  • 서영호;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.241-244
    • /
    • 2014
  • 본 논문에서는 HDFS(Hadoop Distributed File System)에서 문제되고 있는 복제정책의 개선을 위해 HMM(Hidden Markov Model)을 이용한 동적 데이터 복제본 삭제 전략을 제안한다. HDFS는 대용량 데이터를 효과적으로 처리할 수 있는 분산 파일 시스템으로 높은 Fault-Tolerance를 제공하며, 데이터의 접근에 높은 처리량을 제공하여 대용량 데이터 집합을 갖는 응용 프로그램에 최적화 되어있는 장점을 가지고 있다. 하지만 HDFS 에서의 복제 메커니즘은 시스템의 안정성과 성능을 향상시키지만, 추가 블록 복제본이 많은 디스크 공간을 차지하여 유지보수 비용 또한 증가하게 된다. 본 논문에서는 HMM과 최상의 상태 순서를 찾는 알고리즘인 Viterbi Algorithm을 이용하여 불필요한 데이터 복제본을 탐색하고, 탐색된 복제본의 삭제를 통하여 HDFS의 디스크 공간과 유지보수 비용을 절약 할 수 있는 전략을 제안한다.

  • PDF

Hybrid 내장형 시스템의 설계공간탐색을 위한 시간분석 시뮬레이터의 설계 및 구현 (A Design and Implementation of a Timing Analysis Simulator for a Design Space Exploration on a Hybrid Embedded System)

  • 안성용;심재홍;이정아
    • 정보처리학회논문지A
    • /
    • 제9A권4호
    • /
    • pp.459-466
    • /
    • 2002
  • 최근의 내장형 시스템은 유연성을 유지하고 시간 제약사항을 만족하기 위해서 일반적인 프로세서와 FPGA와 같은 재구성 가능한 부품을 결합하는 Hybrid 시스템을 사용하는 추세이다. 이러한 내장형 시스템은 구축하는 설계 시간을 단축하여 짧은 시간 안에 시장에 진입하는 것이 아주 중요하다. 새로이 주목받고 있는 연구분야인 설계공간탐색은 실제 시스템을 제작하지 않고도 시스템 수준에서 어플리케이션의 성능을 분석하여 최소의 비용으로 시스템에서 요구하는 제약사항을 만족하는 구조를 예측하는 것을 가능하게 한다. 본 논문에서는 Hybrid 내장형 시스템의 설계공간탐색을 위한 시간분석 시뮬레이터를 선계하고 구현하였다. 시스템 설계변수를 변화하면서 정량적인 성능 데이타를 이용하여 설계공간 탐색을 가능하게 하는 Y-Chart 방법을 Hybrid 시스템의 경우에 적용하여 시뮬레이터를 확장 구현하였으며, 기존의 소프트웨어 시간 분석 도구 및 하드웨어 시간분석도구를 활용한다. 본 논문에서 제시하는 시간분석 시뮬레이터는 Hybrid 내장형 시스템의 설계 비용과 시간을 현저하게 줄이면서, 최적의 하드웨어 구성을 찾는 설계공간탐색의 핵심 모듈로 활용될 것으로 기대된다.

기계학습을 이용한 수출 컨테이너의 무게그룹 분류

  • 강재호;강병호;류광렬;김갑환
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.77-86
    • /
    • 2005
  • 컨테이너 터미널에서는 장치장으로 반입되는 수출 컨테이너의 무게를 몇 단계 그룹으로 나누고 각 무게그룹 별로 모아서 장치한다. 이는 수출 컨테이너를 선박에 싣는 적하 작업 시 선박의 안정성을 위하여 무거운 무게그룹의 컨테이너들을 장치장에서 먼저 반출하여 선박의 바닥 쪽에 놓기 위함이다. 하지만 반입되는 컨테이너의 무게그룹을 결정할 때 사용하는 운송사로부터 받은 무게정보는 부정확한 경우가 많아 하나의 스택(stack)에 서로 다른 무게그룹에 속하는 컨테이너들이 섞이게 된다. 이로 인하여 무거운 무게그룹의 컨테이너를 반출할 때 해당 컨테이너의 상단에 놓여진 보다 가벼운 무게그룹의 컨테이너들을 임시로 옮겨야 하는 재취급(rehandling, reshuffling)이 발생하게 된다. 적하작업 시 장치장에서 재취급이 빈번히 발생하면 작업이 지연되므로 터미널 생산성 향상을 위해서는 재취급 발생을 가급적 줄여야 한다. 본 논문에서는 기계학습 기법을 적용하여 반입 컨테이너의 무게그룹을 보다 정확히 추정하는 방안을 제안한다. 또한 탐색을 통하여 분류기 생성에 관여하는 비용행렬(cost matrix)을 조정함으로써 재취급 발생을 줄일 수 있는 분류기(classifier)를 생성하는 방안을 함께 소개한다. 실험 결과 본 논문에서 제안하는 방안 적용 시 재취급 발생을 $5{\sim}7%$ 정도 줄일 수 있음을 예상할 수 있었다.

  • PDF

온라인 검색(檢索)에 있어서 검색전략(檢索戰略)과 전술(戰術) (The Strategy and the Tactics for Online Searching)

  • 이혁제
    • 정보관리연구
    • /
    • 제26권1호
    • /
    • pp.80-98
    • /
    • 1995
  • 검색전략(檢索戰略)은 효과적인 탐색을 수행하는 수단이다. 검색전략(檢索戰略)의 여러 연구 중에서 베이츠의 탐색전술은 자주 인용되고 소개되어 왔으나, 대부분의 연구는 피상적이었다. 본 논문에서는 베이츠의 탐색전술의 내용을 자세하게 조사하고 베이츠의 탐색전술에 기초하여 실제 온라인 탐색과정을 기술하려고 노력하였다. 사용된 전술(戰術)을 구분하기 위하여 다음의 3가지 유형의 조사가 이루어 졌다. (1) 다른 유형의 조직에 속하고, 다른 유형의 데이터베이스를 사용하는 7명의 탐색자와의 면담 (2) 온라인 탐색 레코드의 분석 (3) 1년간 신문 데이터베이스의 검색 신청서의 분석 결론적으로 베이츠 전술의 일부가 빠지고 자주 사용된 새로운 전술이 추가되었다. 다음의 5가지 요소가 온라인 검색행위(檢索行爲), 검색전략(檢索戰略), 검색전술(檢索戰術)에 영향을 미친다. (1) 탐색요구의 난이도 (2) 데이터베이스의 내용 (3) 온라인 탐색의 요금정책(검색비용의 부담자) (4) 탐색과정에서 이용자의 동석여부 (5) 탐색자의 온라인 경험 제한된 조건에서 전형적인 전술이 제안되었다. 그러나 전술의 사용유형을 일반화하기 위해서는 많은 조사연구가 필요하다.

  • PDF