• 제목/요약/키워드: Analysis of Query

검색결과 457건 처리시간 0.027초

유사어 사전을 이용한 웹기반 질의문의 자동 범주화에 관한 연구 (A Study on Automatic Text Categorization of Web-Based Query Using Synonymy List)

  • 남영준;김규환
    • 정보관리연구
    • /
    • 제35권4호
    • /
    • pp.81-105
    • /
    • 2004
  • 본 연구에서는 웹기반 질의문을 자동 범주화하는 방안에 대해 조사하였다. 질의문 범주화에 대한 실험은 SVM-light를 사용하여 범주자질로써 유사어 사전을 부여하기 전과 후를 비교하였다. 유사어는 학습을 통해 수작업으로 대상문서에서 713개를 추출하였다. 전체적으로 유사어 부여전과 부여후의 결과는 6개 범주에서 정도율은 -0.01%로 거의 변화가 없었으며 재현율은 8.53%가 향상되었다. F1-Measure 값도 4.58%가 향상되었다. 특히 범주내 정도율과 재현율의 표준편차가 18.39%나 개선되어 적정한 검색효율을 확보할 수 있었다.

다양성을 지원하는 그래프 데이터베이스 벤치마킹 시스템 (Graph Database Benchmarking Systems Supporting Diversity)

  • 최도진;백연희;이소민;김윤아;김남영;최재용;이현병;임종태;복경수;송석일;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.84-94
    • /
    • 2021
  • 객체 간의 관계를 표현하기 위해 정점과 간선으로 구성된 그래프 데이터를 효율적으로 저장하고 질의 처리하기 위한 그래프 데이터베이스가 개발되었다. 그래프 데이터베이스는 질의 유형이 기존 NoSQL 데이터베이스와 매우 다른 특성을 보이기 때문에 그래프 데이터베이스의 성능을 검증하기 위해서는 그래프 데이터베이스에 알맞은 벤치마킹 도구가 필요하다. 본 논문에서는 그래프 입력과 질의에 대한 다양성을 지원하는 효율적인 그래프 데이터베이스 벤치마킹 시스템을 제안한다. 제안하는 시스템은 그래프 데이터베이스에 대한 벤치마킹을 테스트하기 위해서 OrientDB를 활용한다. 입력 그래프와 질의 그래프의 다양성을 지원하기 위해서 기존 그래프 데이터 생성 도구인 LDBC를 이용한다. 벤치마킹 결과 분석을 통해 제안하는 기법의 타당성 및 실효성을 입증한다. 성능 평가 결과 제안하는 시스템은 사용자 정의 가능한 가상 그래프 데이터가 생성이 가능하며, 생성된 그래프 데이터를 기반으로 벤치마킹이 가능함을 보였다.

페이지 랭크지수와 질의 확장을 이용한 재랭킹 방법 (A Reranking Method Using Query Expansion and PageRank Check)

  • 김태환;전호철;최중민
    • 정보처리학회논문지B
    • /
    • 제18B권4호
    • /
    • pp.231-240
    • /
    • 2011
  • 사람들은 월드 와이드 웹 상에서 사용자가 원하는 정보를 검색하는 여러 알고리즘들을 구현해 왔다. 이렇게 구현된 검색 알고리즘 중 가장 좋은 기술을 가지고 있는 곳은 페이지랭크(PageRank)방식의 구글이다. 하지만 외부에서 참조하는 링크가 많은 문서를 가지고 있는 문서 즉, 대중들이 관심을 가지는 문서를 상위에 보여주는 페이지랭크 방식으론 사용자가 원하는 문서를 찾아서 제공하지 못할 수 있다. 개인에게 가치가 있는 문서를 찾기보다 대중에게 가치가 있는 문서를 찾기 때문이다. 이러한 문제를 해결하기 위하여 본 논문에서는 어휘의 의미를 정확히 표현하고 있는 워드넷을 이용하여 사용자 질의 이력 정보를 분석하여 현재 질의를 확장한 개인적 가치와 페이지 랭크지수를 이용한 대중적 가치를 모두 고려한 방법을 제안한다. 실험결과 제안한 방법은 상위 30개의 검색결과 중 평균 약 60% 결과들에 대해 만족하는 것으로 나타났으며, 구글 검색 결과에 비해 평균 약 14% 향상된 만족도를 나타내었다.

All-IP 무선망을 위한 에이전트 기반의 멀티캐스트 랜드오프 메커니즘 (Agent based Multicast Handoff Mechanism for All-IP Wireless Network)

  • 김병순;한기준
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권2호
    • /
    • pp.197-203
    • /
    • 2002
  • 이 논문은 IP 멀티캐스트 상에서 핸드오프 지연을 줄이기 위해 Multicast Handoff Agent(MHA)라는 에이전트에 기반을 둔 새로운 멀티캐스트 랜드오프 메커니즘을 제안한다. MHA는 기지국에서 이동 호스트의 Internet Group Management Protocol (IGMP)에 대한 프록시로서 동작되고 셀 내의 멀티캐스트 그룹의 구성원에 대한 정보를 유지하는 역할을 한다. 이동 호스트가 다른 셀로 이동할 때, MHA는 IGMP query 메시지를 기다리지 않고 즉시 리포트 메시지를 전송한다. 제안하는 메커니즘은 시뮬레이션과 분석을 통해 성능평가 되고 마이크로 이동성과 IGMP 트래픽에 대하여 IGMPv2와 비교분석 한다. 시뮬레이션 결과로서 마이크로 이동성에 대한 랜드오프 지연이 크게 줄일 수 있고 또한 그룹의 구성원으로 있는 동안 무선 링크상의 IGMP 제어 트래픽을 제거될 수 있음을 보인다. 따라서 제안하는 메커니즘은 마이크로 이동성에 대해 기존의 메커니즘보다 뛰어나고, IGMP 질의에 대한 응답이 불필요하여 배터리 지속시간이 오래갈 수 있다.

유비쿼터스 환경에서 실시간 센서 데이터를 위한 XML 질의언어 처리 엔진 (An XQuery Processing Engine for Real-Time Sensor Data in Ubiquitous Environments)

  • 임형준;김재훈;이규철
    • 한국전자거래학회지
    • /
    • 제15권4호
    • /
    • pp.1-19
    • /
    • 2010
  • 최근에 유비쿼터스나 전자상거래와 같은 환경에서 발생하는 실시간 데이터를 처리해야 하는 요구가 늘어나고 있다. 유비쿼터스 환경에서 사용되는 센서 데이터는 그 크기가 작고 XML 문서로 표현 되어 있으며 대량으로 발생하는 특징이 있다. 이러한 대량의 센서 데이터를 처리하기 위한 효율적인 방법이 요구되고 있다. 센서 데이터에 대한 XML 질의언어(XQuery)는 주로 센서 데이터가 발생한 센서의 식별자나 표현하고자 하는 정보를 얻어오는 것과 사용자의 편의를 위한 결과 재구성으로 분류된다. 기존의 XML 질의언어 엔진들은 센서 데이터를 일괄적으로 처리하기 위한 효율적인 방법을 가지고 있지 않다. 본 논문에서는 대량의 센서 데이터들을 실시간으로 처리하기 위하여 역 경로 요약을 이용한 가지 질의(Twig Query) 처리 기법을 적용하였다. 또한, 재구성(Restructuring) 일괄 처리 기법을 개발하여 적용하였다. XMark와 RFID EPC 데이터를 이용한 성능 측정을 하고 MonetDB/XQuery와 Oracle Berkeley DB XML과의 비교 분석을 수행하였다.

모바일 중심 미래 인터넷: OpenFlow 기반 구현 및 KOREN 테스트베드 실험 (Mobile Oriented Future Internet (MOFI): OpenFlow-based Implementation and Testbed Experimentation over KOREN)

  • 김지인;정희영;고석주
    • 한국정보과학회논문지:정보통신
    • /
    • 제41권4호
    • /
    • pp.167-176
    • /
    • 2014
  • 본 논문은 이동 환경 위주의 미래 인터넷 환경을 위해 제안된 Mobile Oriented Future Internet (MOFI) 구조에 대하여 OpenFlow 기반 구현 이슈와 KOREN 실험망을 이용한 성능 분석을 논의한다. MOFI 구조는 호스트 식별자(host identifier)와 지역 위치자(local locator) 사용, 데이터 전달을 위한 Query 우선의 데이터 전달(Query-First Data Delivery), 식별자와 위치자간 분산형 매핑 시스템(Distributed Mapping System)을 특징으로 한다. 기존 MOFI 연구에서는 intra-domain 이동성 지원을 위해 6-to-4 터널링 기법 및 리눅스 플랫폼을 활용한 구현 방식을 제안하고 실험실 테스트베드에서 성능분석을 수행하였다. 한편, 본 논문에서는 inter-domain 이동성 지원을 위한 세부 절차를 논의하고 Click Modular Router와 OpenFlow 플랫폼을 활용한 MOFI 구현 방식을 제안한다. 나아가, 실제 KOREN 실험망을 활용한 성능 실험을 통해 MOFI 구조와 기존 이동성 제어 방식인 Proxy Mobile IP (PMIP) 기법을 비교한다. 실험 결과, 이동성 제어를 위한 시그널링 지연 시간 및 처리되는 메시지 수 측면에서 MOFI 구조가 기존 PMIP 이동성 제어 기법에 비하여 더 좋은 성능을 보이고 있음을 확인하였다.

P2P 환경의 위치 기반 서비스에서 연속적인 질의 처리를 지원하는 그리드 기반 Cloaking 영역 설정 기법 (Grid-based Cloaking Area Creation Scheme supporting Continuous Query Processing for Location-based Services of Peer-to-Peer Environment)

  • 김형일;이아름;장재우
    • Spatial Information Research
    • /
    • 제18권3호
    • /
    • pp.53-62
    • /
    • 2010
  • 최근 PDA, 휴대폰과 같은 모바일 기기 및 GPS와 같은 무선 통신 기술의 발달로 인하여 위치 기반 서비스의 이용이 확산되었다. 하지만 이러한 서비스는 사용자의 정확한 위치정보를 가지고 LBS 서버에 연속적으로 질의를 요청하기 때문에, 심각한 개인 정보 누출의 위협이 될 수 있다. 따라서 모바일 사용자의 안전하고 편리한 위치기반 서비스 사용을 위한 개인 정보 보호 방법이 필요하다. 이를 위해 본 논문에서는 Peer-to-Peer 환경의 위치기반 서비스에서 연속적인 질의 처리를 지원하는 그리드 기반 클로킹(Cloaking) 영역 설정 기법을 제안한다. 제안하는 기법은 Peer-to-Peer 환경에서 연속적인 위치기반 서비스를 지원하기 위하여, Chord 프로토콜을 사용하여 클로킹 영역을 설정한다. 마지막으로 성능평가를 통해서 제안하는 기법이 서비스 시간면에서 기존 연구보다 우수함을 보인다.

시멘틱 웹 환경에서의 개인화 검색 (Personalized Search Service in Semantic Web)

  • 김제민;박영택
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.533-540
    • /
    • 2006
  • 웹에 분산된 모든 윈 페이지는 구조가 서로 다르다. 시멘틱 웹 환경은 이형적인 구조를 갖는 웹 페이지들의 메타데이터 바탕으로 시멘틱 검색이 가능하다. 그러나 일반적으로 사용자의 요구에 따른 시멘틱 김색은 상황에 따라 엄청난 수의 검색 결과를 내놓는다. 따라서 검색 결과에 대해 각 사용자에 맞는 검색 결과 순위를 적용할 필요가 있다. Culture Finder는 시멘틱 웹 검색 에이전트들이 개인화 된 문화 정보를 검색할 수 있도록 도움을 준다. Culture Finder는 웹에 존재하는 각 웹 페이지에 대한 메타 데이터를 작성하고, 시멘틱 검색을 이행하며 사용자 프로파일을 기반으로 삼아 검색 결과에 대한 순위 점수를 계산한다. Culture Finder에는 개인화 된 시멘틱 검색을 효율적으로 실행하기 위해 중요한 5가지 기법이 적용되었다. 사용자의 검색 행위로부터 사용자 프로파일을 생성하기 위한 기계 학습기법, 시멘틱 웹 검색 에이전트를 위한 효율적인 시멘틱 검색 기법, 사용자 질의의 효과적인 파악을 위한 질의 분석 기법, 각 사용자에게 적합한 검색 결과를 제공하기 위한 순위 적용 기술, 메타데이터를 생성하기 위한 상위 온톨로지 표현 방법, 본 논문에서는 Culture Finder의 구조를 통해서 시멘틱 개인화 검색에 대한 기법을 제안한다.

하둡과 하이브를 이용한 BGP 아카이브 데이터의 포렌직 분석 툴 (Yet Another BGP Archive Forensic Analysis Tool Using Hadoop and Hive)

  • 이연희;이영석
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.541-549
    • /
    • 2015
  • 지속적으로 축적되는 BGP 아카이브 파일은 데이터의 규모로 인해 관리와 분석 방법에 대한 기술적인 어려움에 처해 있다. 최근 오픈소스 분산 컴퓨팅 기반인 하둡 (Hadoop)의 발전에 힘입어 대량의 데이터를 효율적으로 다루는 것이 가능해졌다. 본 논문에서는 대량의 BGP 아카이브 데이터로부터 민첩한 분석 방법을 제공하고 저가의 컴퓨터를 이용하여 성능 확장이 가능한 하둡 기반의 BGP 분석 아키텍쳐 (BGPdoop)를 제안한다. BGPdoop은 여러 지점에서 수집하여 오랜 기간 축적된 대량의 BGP 아카이브 데이터의 효율적인 관리와 분석을 위하여 데이터의 구조와 접근 방법을 정의하고, 유연하고 민첩한 질의 기반의 BGP 분석 방법을 제시한다. 20대 노드로 구성된 테스트베드를 이용한 규모확장성 실험에서 4대 노드 대비 5배의 단위 시간당 증가된 처리량을 확인했다. 또한 하이브 (Hive) 질의를 이용한 BGP 라우팅의 포렌식 분석 사례를 통해 본 논문의 제안방법에 대한 타당성을 제시한다.

사무실 환경 내 다중카메라 영상의 이벤트분석을 통한 자연어 기반 동영상 검색시스템 (Natural Language based Video Retrieval System with Event Analysis of Multi-camera Image Sequence in Office Environment)

  • 임수정;홍진혁;조성배
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.384-389
    • /
    • 2008
  • 최근 동영상을 저장하거나 효과적으로 검색하는 시스템의 필요성이 증가하고 있다. 기존 동영상 검색 시스템은 메뉴나 텍스트 기반의 키워드로 동작하는데, 검색을 위한 정보가 빈약하여 많은 동영상이 동시에 검색되는 경우가 많고, 사용자가 해당 시스템을 사용하기 위한 지식이 필요하다. 본 논문에서는 키워드 기반 질의에 비해 사용자의 의도나 다양한 정보를 포함 할 수 있고 이벤트나 사람 뿐 아니라 인간의 기본적인 행동까지 검색하는 자연어 질의 기반 동영상 검색 시스템을 제안한다. 먼저, 사무실에서 수집된 동영상에 대한 도메인 분석을 통해 메타데이터로 이벤트 데이터베이스를 구축하고, 해당 영역에서의 사용자 질의에 대한 전처리 과정과 분석 작업을 통해 스크립트 데이터베이스를 구축한다. 이렇게 구축된 시스템을 바탕으로 대화형 질의와 답변 쌍 매칭을 통해 동영상을 검색한다. 10명의 사용자를 대상으로 메뉴 기반 검색 시스템과의 성능 평가와 프로세스 평가 비교 검증을 통해, 성능이나 사용자 만족도면에서 제안하는 시스템이 우수함을 보였다.

  • PDF