• Title/Summary/Keyword: Query Response Time

검색결과 117건 처리시간 0.023초

심층 웹 문서 자동 수집을 위한 크롤링 알고리즘 설계 및 실험 (Crawling algorithm design and experiment for automatic deep web document collection)

  • 강윤정;이민혜;원동현
    • 한국정보통신학회논문지
    • /
    • 제27권1호
    • /
    • pp.1-7
    • /
    • 2023
  • 심층 웹 수집은 검색 양식에 질의어를 입력하고 응답 결과를 수집하는 것을 의미한다. 심층 웹이 가진 정보는 정적으로 구성되는 표면 웹보다 약 450~550배 이상의 정보를 가지고 있을 것으로 추산한다. 정적인 방식에서는 웹페이지가 새로 고쳐지기 전까지 변화된 정보를 보여주지 못한다. 동적 웹페이지 방식은 실시간으로 필요한 정보가 갱신되어 웹페이지를 새로 불러오지 않아도 실시간 정보 제공이 가능한 장점이 있지만, 일반적인 크롤러는 갱신된 정보에 접근하는 데 어려움이 있다. 따라서 이들 심층 웹에 있는 정보들을 크롤러를 이용해 자동으로 수집할 방안이 필요하다. 이에 본 논문은 스크립트를 일반적인 링크로 활용하는 방법을 제안하였으며, 이를 위해 클라이언트 스크립트를 일반 URL처럼 활용이 가능한 알고리즘을 제안하고 실험하였다. 제안된 알고리즘은, 검색 양식에 데이터를 입력하는 일반적인 방법 대신 메뉴 탐색 및 스크립트 실행으로 웹 정보를 수집하는 데 중점을 두었다.

SNMP 기반 네트워크관리를 위한 적응형 네트워크 모니터링 방법 (Adaptive Network Monitoring Strategy for SNMP-Based Network Management)

  • Cheon, Jin-young;Cheong, Jin-ha;Yoon, Wan-oh;Park, Sang-bang
    • 한국통신학회논문지
    • /
    • 제27권12C호
    • /
    • pp.1265-1275
    • /
    • 2002
  • 네트워크 관리시스템에서는 SNMP를 기반으로 하는 중앙 집중형 방법과 모빌 에이전트를 사용하는 분산형 방법으로 나눌 수 있다. 네트워크 정보가 시간에 따라 변하는 경우 매니저는 실시간으로 이를 관찰할 필요가 있으며, 이 경우 SNMP에서는 매니저가 주기적으로 에이전트에 질의를 보낼 수 있어 주로 폴링을 사용한다. 그러나 폴링에서는 정보 전송을 위해서 매번 요구와 응답의 두 메시지 전송이 필요하여 네트워크 트래픽이 증가한다. 본 논문은 SNMP 기반 네트워크 관리에서 기존의 폴링 방법과 비교하여 트래픽을 줄이면서 여러 에이전트를 충실히 모니터링할 수 있는 적응형 방법을 제안하였다. 제안된 방법에서는 각 에이전트가 정보의 시간적 변화량에 따라 최적의 에이전트 모니터링 주기를 결정하고, 매니저는 이 주기들을 취합하여 모니터링에 의한 부하가 전체 네트워크 트래픽의 일정 부분 이하가 되도록 모니터링 주기를 결정한다. 에이전트는 매니저로부터 받은 모니터링 주기에 따라 스스로 정보를 전송함으로써 기존의 폴링 방법보다 상대적으로 적은 트래픽 부하로 네트워크 관리가 가능하다. 제안된 방법의 성능을 평가하기 위하여 그 기능을 구현하였으며, 모니터링의 충실도와 트래픽 면에서 일반적인 폴링방법과 비교하였다.

내용 기반 음악 정보 검색을 위한 음악 구성 형식을 고려한 대표 선율의 추출 및 색인 (Extraction and Indexing Representative Melodies Considering Musical Composition Forms for Content-based Music Information Retrievals)

  • 구경이;임상혁;이재헌;김유성
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.495-508
    • /
    • 2004
  • 최근 내용 기반 음악 정보 검색 시스템에서는 사용자의 응답 시간을 단축시키기 위해 음악의 대표성을 갖는 선율을 추출하여 색인하고, 검색시 이를 이용한다 음악에서 대표성을 갖는 선율은 해당 음악을 대표하여 사용자가 기억하고 있으며, 사용자가 질의 선율로 사용할 가능성이 높아야 한다. 그러나, 기존의 내용 기반 음악 정보 검색 시스템에서는 음악 구성 형식을 고려하지 않기 때문에 음악 구성 형식에 따라 반복, 대조되는 선율들을 해당 음악을 대표하는 선율로 추출하지 못한다. 본 논문에서는 해당 음악을 대표하는 선율을 추출하기 위하여 한 음악에서 음악 구성 형식을 반영하여 일정한 유사도내에서 반복되는 선율들을 해당 음악의 반복 주제 선율로 추출한다. 또한, 사용자가 일반적으로 인지하는 첫 동기 선율과 절정 선율에 해당되는 선율들을 인식하여 대표 선율에 추가한다. 본 논문에서 제안된 시스템의 성능을 평가하기 위해 프로토타입을 구현하고, 다른 선을 색인과 비교 실험하였다. 실험 결과, 대표 선율 색인은 전체 동기를 색인한 경우에 비해 34%의 적은 저장 공간으로 색인을 구성하여 사용자의 응답 시간을 단축시켰다. 또한, 반복 주제 선율만으로 색인한 경우에 비해 사용자가 질의 가능성이 높은 첫 동기 선율, 절정 선율 등을 대표 선율로 색인하기 때문에 추가적으로 20의 색인 공간이 필요하였으나, 다양한 사용자의 질의 선율에 대해 검색의 정확성을 증진할 수 있음을 보였다.

AI기반 콜센터 실시간 상담 도우미 시스템 개발 - N은행 콜센터 사례를 중심으로 (Development of AI-based Real Time Agent Advisor System on Call Center - Focused on N Bank Call Center)

  • 류기동;박종필;김영민;이동훈;김우제
    • 한국산학기술학회논문지
    • /
    • 제20권2호
    • /
    • pp.750-762
    • /
    • 2019
  • 기업의 대고객 접점으로써 콜센터의 중요성은 커지고 있다. 하지만, 콜센터는 상담사의 지식 부족과 업무 부적응에 따른 잦은 이직으로 인해 상담사 운영이 어렵고, 이로 인한 고객 서비스 품질 저하의 문제를 안고 있다. 이에 본 연구에서는 상담사에게 업무 지식에 대한 부하를 줄이고 서비스 품질을 향상 시키기 위해 음성 인식 기술과 자연어 처리 및 질의응답을 지원하는 AI 기술과 PBX, CTI 등의 콜센터 정보시스템을 결합하여 실시간으로 상담사에게 고객의 질의 내용에 대한 답변을 제공해주는 "실시간 상담 도우미" 시스템 개발 방안에 대해 N은행 콜센터 사례를 통해 연구하였다. 사례연구 결과, 실시간 통화 분석을 위한 음성인식 시스템의 구성방안과, 질의응답 시스템의 자연어처리 성능 향상을 위한 말뭉치 구축 방안을 확인 할 수 있었으며, 특히 개체명 인식기의 경우 도메인에 맞는 말뭉치 학습 후 정확도가 31% 향상됨을 확인하였다. 또한, 상담 도우미 시스템을 적용한 후 상담 도우미의 답변에 대한 상담사들의 긍정적 피드백 비율이 93.1%로써 충분히 상담사 업무에 도움을 주고 있음을 확인하였다.

B+-트리 기반의 이동객체 색인 기법 ([ B+ ]-Tree based Indexing Method for Moving Object)

  • 서동민;유재수;송석일
    • 한국콘텐츠학회논문지
    • /
    • 제7권7호
    • /
    • pp.11-23
    • /
    • 2007
  • 이동객체 응용은 빈번하게 변경되는 이동객체의 위치정보를 효과적으로 처리할 수 있는 색인구조를 필요로 한다. 이동객체의 위치를 색인하기 위해 제안된 색인기법들은 대부분 R-트리를 기반으로 하고 있다. R-트리는 변경보다는 검색 연산의 성능에 초점이 맞추어진 색인구조이어서 잦은 변경을 다뤄야 하는 이동객체의 응용에 적합하지 않은 측면이 있다. 일부 연구에서는 R-트리의 변경 연산 성능을 향상시키기 위한 연구를 진행한 바 있다. 하지만, 변경 연산의 성능이 개선되었다 하더라도 R-트리가 기본적으로 내재하고 있는 동시성 제어기법 문제(동시성 제어 기법의 비효율성과 안정성) 때문에 R-트리 기반의 색인기법을 실제 응용에서 쓰는 데는 여전히 문제가 있다. 이 논문에서는 B+-트리와 힐버트 곡선 (Hilbert Curve)를 기반으로 하는 새로운 이동객체 색인 기법을 제안한다. 기존에 제안된 B+-트리 기반의 색인기법과는 다르게 이 논문에서는 힐버트 커브의 해상도(또는 차수, order)를 객체의 분포도와 개수에 따라서 가변적으로 적용하는 방법을 제안한다. 실험을 통해서 제안하는 색인 기법이 응답시간과 처리율 측면에서 기존 색인기법에 비해 우수함을 보인다.

경향 벡터 기반 비디오 스트림 검색 시스템 (A Video Stream Retrieval System based on Trend Vectors)

  • 이석룡;전석주
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.1017-1028
    • /
    • 2007
  • 본 논문에서는 비디오 스트림을 효과적으로 표현하고 저장하며, 저장된 비디오 스트림을 효율적으로 검색하는 기법을 제안한다. 각 비디오 프레임으로부터 특징(feature)들을 추출하고, 각 특징들의 수치값을 정규화 하여 [0,1] 사이의 값으로 표현하면, f 개의 특징으로 표현된 비디오 프레임은 f 차원의 공간 $[0,1]^f$ 상의 한 점으로 나타낼 수 있다. 따라서 비디오 스트림은 다차원 공간에서 점들의 궤적으로 표현될 수 있으며 이 궤적은 카메라 샷을 기준으로 비디오 세그먼트로 분할된다. 비디오 세그먼트는 세그먼트 내의 점들의 움직임 등의 정보를 나타내는 경향 벡터(trend vector)로 표현되며, 비디오 스트림 검색은 이러한 경향 벡터에 대하여 수행된다. 스포츠, 뉴스, 기록영화, 교육용 비디오 등의 비디오 스트림에 대하여 제안한 기법을 검증하였으며, 실험 결과 기존의 방법에 비하여 복원 오차율(reconstruction error rate)이 평균37% 감소되었고, 검색의 정밀도(precision)는 비슷한 수준의 재현율(recall) 및 응답 시간을 유지하면서 평균 2.1 배까지 향상되었음을 관찰할 수 있었다.

  • PDF

계층적 QoS 라우팅을 위한 스타 기반의 노드 집단화 (Star-Based Node Aggregation for Hierarchical QoS Routing)

  • 권소라;전창호
    • 정보처리학회논문지C
    • /
    • 제18C권5호
    • /
    • pp.361-368
    • /
    • 2011
  • 본 논문에서는 계층적 QoS 라우팅을 위해 소스 라우팅 방식을 채택하고 있는 전달망에서 적정 경로를 배정하기 위해 필요로 하는 망의 상태 정보를 효율적으로 집단화하는 방법을 제안한다. 이것은 비대칭망에서 집단화 할 링크의 QoS 파라미터가 두 개 이상일 때 기존 스타 집단화 방법이 갖는 집단화된 정보의 부정확성을 줄이기 위한 방법으로, 서비스경계라인을 논리 링크로 갖는 풀 메쉬 토폴로지를 스타 토폴로지로 변형한다. 이를 위해 본 논문에서는 서비스경계라인의 3가지 속성인 분할, 조인 그리고 통합을 정의하며 이 속성들을 이용한 스타 토폴로지로의 변형과 풀 메쉬로의 복원 방법을 제시한다. 제안 방법은 기존 방법과 유사한 공간 복잡도와 시간 복잡도를 갖지만 집단화된 정보의 정확도와 질의 응답 정확도는 기존 방법보다 높다는 것을 실험을 통해 알 수 있었다.

MapReduce 기반 분산 이미지 특징점 추출을 활용한 빠르고 확장성 있는 이미지 검색 알고리즘 (A Fast and Scalable Image Retrieval Algorithms by Leveraging Distributed Image Feature Extraction on MapReduce)

  • 송환준;이진우;이재길
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1474-1479
    • /
    • 2015
  • IoT 시대를 맞아 모바일 기기의 급격한 성능 향상에 힘입어 폭발적으로 증가하는 멀티미디어 빅데이터의 빠른 처리가 요구되고 있다. 하지만, 이런 환경의 대격변 속에서도 이미지 검색 연구 분야에서는 정확도 향상에 주로 초점을 맞춘 나머지, 고해상도 멀티미디어 데이터 Query에 대한 빠른 처리 측면에서는 제대로 대응하지 못하고 있다. 이에 우리는 이미지 검색만을 분산화한 선행연구와 달리 MapReduce 기반 분산 이미지 특징점 추출 기법을 활용하여 정확도는 유지하면서 빠른 응답시간을 확보하며, BIRCH 인덱싱을 기반으로 메모리 확장성까지 해결한 새로운 분산 이미지 검색 알고리즘을 제안한다. 그리고 제안하는 분산 이미지 검색 알고리즘의 정확도, 처리시간, 확장성에 대한 실험을 통해 뛰어난 성능을 확인한다.

바다/웹 : 웹과 객체지향 데이터베이스 관리시스템의 통합 (BADA/Web : Integration of The Web and An OODBMS)

  • 김완석;이장선;송영기;박진섭;김명준;오길록
    • 한국정보처리학회논문지
    • /
    • 제7권11호
    • /
    • pp.3534-3543
    • /
    • 2000
  • 정보서비스 관점에서 대규모 정보 서비스 시스템을 개발하기 가장 좋은 방법중의 하나가 웹의 서비스 능력과 데이터베이스 관리시스템의 유용한 기능을 상호 보완적 측면에서 통합하는 것이다. 웹과 데이터베이스 관리시스템 통합의 핵심 요소가 웹-DBMS 통로이다. 웹-DBMS 통로는 데이터베이스 관리시스템에 대한 요청을 웹의 기술을 이용하여 데이터베이스 관리시스템에 접근하고, 데이터베이스 관리시스템의 처리 결과를 웹서버에게 전한다. 바다/웹은 웹의 서비스 능력과 객체지향 데이터베이스 관리시스템인 바다-III를 서로 보완적 측면에서 통합한 웹-DBMS 통로이다. 이 논문에서는 웹과 바다-III를 통합하기 위한 설계와 구현상의 경험을 설명하고, 데이터베이스에 대한 질의들을 통해 바다/웹의 효과를 분석했다.

  • PDF

이동 데이터베이스 시스템에서 효율적인 캐쉬 일관성 유지 기법 (Efficient Schemes for Cache Consistency Maintenance in a Mobile Database System)

  • 임상민;강현철
    • 정보처리학회논문지D
    • /
    • 제8D권3호
    • /
    • pp.221-232
    • /
    • 2001
  • 이동 통신 기술의 급속한 발전으로, 이동 컴퓨팅 환경에서 데이타 서비스에 대한 수요가 증가하고있다. 이동 틀라이언트 내에 캐쉬가 존재하면, 대역폭의 절약 및 질의에 대한 빠른 응답을 제공할 수 있지만, 캐쉬일관성을 유지해야하는 부담이 생긴다. 한 셀 내에 존재하는 이동 클라이언트들의 캐쉬 일관성 유지를 위해서 서버가 캐쉬 무효화 보고를 일정 시간마다 주기적으로 방송하는 방법은 효율적일 수 있다. 그런데 아동 클라이언트가 오랜 시간 동안의 접속 단절로 인해 무효화 보고만으로 자신의 캐쉬유효성 여부를 판단하지 못할 경우에는, 서버에게 캐쉬유효성 여부레 대한 확인을 요청함으로써 캐쉬일관성을 유지할 수 있다. 이때, 할당 가능한 채널의 수와 이동클라이언트 수의 관계에 따라서 서로 다른 기법이 각각의 경우에 더 효율적일 수 있다. 본 논문에서는 (1) 할당 가능한 채널의 수가 이동 클라이언트 수보다 많거나 비슷한 경우와 (2) 채널의 수가 이동 클라이언트의 수보다 훨씬 적을 경우 각각에 대하여 효율적인 새로운 캐쉬 일관성 유지 기법을 제안하고 성능을 평가한다.

  • PDF