• 제목/요약/키워드: Query Compilation

검색결과 5건 처리시간 0.021초

분산 XML 저장 시스템에서 질의 컴파일 시 시스템 카탈로그 관리 기법의 성능 평가 (Performance Evaluation of System Catalog Management Schemes for Distributed XML Repository Systems at the Query Compilation Time)

  • 장건업;홍의경
    • 한국멀티미디어학회논문지
    • /
    • 제12권2호
    • /
    • pp.178-190
    • /
    • 2009
  • XML은 W3C(World Wide Web Consortium)에서 제안한, 인터넷 환경에서의 데이터 표현과 교환을 위한 표준 마크업 언어이다. 최근에는 XML 문서의 사용과 XML 문서의 양이 급속하게 증가하여 언제 어디서나 쉽게 필요한 XML 문서에 액세스할 수 있어야 한다. 이에 따라 분산 환경에서의 XML 문서의 처리가 요구되면서 분산 XML 저장 시스템(Distributed XML Repository System)이 개발되고 있다. 이를 위해 분산 XML 저장 시스템에서의 시스템 카탈로그 관리 기법에 대한 연구가 필요하다. 본 논문에서는 분산 XML 저장시스템에서 CPU 비용, I/O 비용, 동시성 제어, 이단계 완료 프로토콜, 큐잉 지연 등을 모두 고려하고, 합리적으로 매개변수를 설정하고 시뮬레이션을 수행함으로써 중앙 집중식 카탈로그, 완전 중복식 카탈로그, 분할식 카탈로그 관리 기법의 성능을 평가하였다.

  • PDF

Pre-Processing of Query Logs in Web Usage Mining

  • Abdullah, Norhaiza Ya;Husin, Husna Sarirah;Ramadhani, Herny;Nadarajan, Shanmuga Vivekanada
    • Industrial Engineering and Management Systems
    • /
    • 제11권1호
    • /
    • pp.82-86
    • /
    • 2012
  • In For the past few years, query log data has been collected to find user's behavior in using the site. Many researches have studied on the usage of query logs to extract user's preference, recommend personalization, improve caching and pre-fetching of Web objects, build better adaptive user interfaces, and also to improve Web search for a search engine application. A query log contain data such as the client's IP address, time and date of request, the resources or page requested, status of request HTTP method used and the type of browser and operating system. A query log can offer valuable insight into web site usage. A proper compilation and interpretation of query log can provide a baseline of statistics that indicate the usage levels of website and can be used as tool to assist decision making in management activities. In this paper we want to discuss on the tasks performed of query logs in pre-processing of web usage mining. We will use query logs from an online newspaper company. The query logs will undergo pre-processing stage, in which the clickstream data is cleaned and partitioned into a set of user interactions which will represent the activities of each user during their visits to the site. The query logs will undergo essential task in pre-processing which are data cleaning and user identification.

Contents Analysis and Synthesis Scheme for Music Album Cover Art

  • Moon, Dae-Jin;Rho, Seung-Min;Hwang, Een-Jun
    • 전기전자학회논문지
    • /
    • 제14권4호
    • /
    • pp.305-311
    • /
    • 2010
  • Most recent web search engines perform effective keyword-based multimedia contents retrieval by investigating keywords associated with multimedia contents on the Web and comparing them with query keywords. On the other hand, most music and compilation albums provide professional artwork as cover art that will be displayed when the music is played. If the cover art is not available, then the music player just displays some dummy or random images, but this has been a source of dissatisfaction. In this paper, in order to automatically create cover art that is matched with music contents, we propose a music album cover art creation scheme based on music contents analysis and result synthesis. We first (i) analyze music contents and their lyrics and extract representative keywords, (ii) expand the keywords using WordNet and generate various queries, (iii) retrieve related images from the Web using those queries, and finally (iv) synthesize them according to the user preference for album cover art. To show the effectiveness of our scheme, we developed a prototype system and reported some results.

분산 주기억장치 데이터베이스에서 카탈로그 관리 기법의 성능평가 (Performance Evaluation of Catalog Management Schemes for Distributed Main Memory Databases)

  • 정한라;홍의경;김명
    • 한국멀티미디어학회논문지
    • /
    • 제8권4호
    • /
    • pp.439-449
    • /
    • 2005
  • 분산 주기억장치 데이터베이스 관리 시스템 (DMM-DBMSs)은 데이터베이스를 참여 사이트의 주기억 장치에 저장한다. 지역 데이터베이스에 신속하게 접근할 수 있고 사이트들 사이에 고속 통신이 가능하므로 DMM-DBMS는 높은 성능을 보장한다. 최근 들어 DMM-DBMS에 대해 많은 연구 결과가 발표되었으나 아직까지 DMM-DBMS의 카탈로그 관리 기법에 대한 성능 분석 결과는 발표된 것이 없다. 본 연구에서는 높은 사이트 자치성을 보장하는 DMM-DBMS의 분할식 카탈로그 관리 기법의 성능을 실험적으로 평가하였다. 분할식 카탈로그 관리 기법을 캐시없는 분할식 카탈로그 방식(PCWC), 점진적 캐시를 이용한 분할식 카탈로그 방식(PCWIC), 완전 캐시를 이용한 분할식 카탈로그 방식(PCWFC)으로 분류하였고, 성능평가는 사이트 수, 사이트 당 터미널 수, 버퍼 크기, 쓰기 질의 비율, 지역 질의 비율 등을 중심으로 분석하였다. 분석 결과 PCWFC가 모든 경우에 가장 높은 성능을 보였다. 이는 또한 PCWIC가 시간이 흐름에 따라 더욱 높은 성능을 보인다는 것을 뜻한다. PCWFC 방식은 디스크 기반 분산 DMBS에서는 사이트 부하가 크거나 카탈로그 쓰기 비율이 높거나 원격 데이터 객체가 빈번히 액세스되는 상황에서 고성능을 보장하지 못하지만, DMM-DBMS에서는 원격 데이터 객체의 카탈로그가 자주 갱신된다고 해도 질의 컴파일과 원격 카탈로그 액세스가 고속으로 이루어질 수 있기 때문에 높은 성능을 보장하는 것이다.

  • PDF

새로운 생명공학작물 안전성 평가를 위한 작물 성분 DB 구축 (Development of the conventional crop composition database for new genetically engineered crop safety assessment)

  • 김은하;이성곤;박수윤;이상구;오선우
    • Journal of Plant Biotechnology
    • /
    • 제45권4호
    • /
    • pp.289-298
    • /
    • 2018
  • 국립농업과학원 생물안전성과는 생명공학기술로 개발되는 작물(GM작물)의 안전성 평가 중 '성분분석에 의한 비교평가'에 참고자료로 활용할 수 있도록 기존 상업화 작물성분의 분석 데이터를 제공하는 "작물성분 DB"를 구축하였다. "작물성분 DB"는 우리나라의 자연 환경에서 재배되는 주요 작물 품종들의 영양성분 함량정보를 제공함으로써 품종과 재배 지역, 연도에 따라 함량의 변화 정도를 확인할 수 있도록 데이터를 업그레이드 하고 있다. 현재 2곳 이상의 재배지역에서 2년 이상 재배한 벼와 고추 시료에 대한 주요 영양분과 항영양소, 2차 대사산물을 검증된 분석 방법을 사용하여 분석한 데이트를 제공하고 있다. 데이터는 평균값과 최저, 최대값을 제공함으로써 GM작물의 안전성 평가시 GM작물과 대응 비교작물 간에 나타나는 통계적 차이가 기존 상업작물의 생물학적 차이 또는 허용범위 내에 속하는지를 평가할 수 있도록 하였다. "작물성분 DB"는 사용자가 선택한 쿼리를 기반으로 쉽게 검색하고 활용하도록 하고 있다. 또한 유색미와 감자, 고구마, 콜리플라워와 같은 유색 작물의 기능성 성분 함량 정보를 제공하고 있어 일반 소비자들도 유용하게 정보를 활용할 수 있다. 본 논문은 상업작물 성분에 대한 중요한 정보를 제공하는 농진청 "작물성분 DB"의 구성과 사용법을 소개하였다.