• 제목/요약/키워드: Analysis of Query

검색결과 457건 처리시간 0.023초

데이터웨어하우스에서 유전자 알고리즘을 이용한 구체화된 뷰 선택 기법 (A Genetic Algorithm for Materialized View Selection in Data Warehouses)

  • 이민수
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.325-338
    • /
    • 2004
  • 데이터 웨어하우스는 복잡한 질의 및 분석을 위해서 다양한 종류의 여러 정보 출처들로부터 정보를 모아서 저장한다. 일반적으로 웨어하우스에는 자주 실행되는 질의들을 미리 계산해서 구체화된 뷰의 형태로 저장한다. 웨어하우스를 설계할 때 가장 중요한 일들 중의 하나는 웨어하우스에서 유지될 구체화된 뷰의 선택이다. 이것은 뷰들의 유지를 위해 제한된 시간이 주어졌을 때, 모든 질의들에 대한 총 질의 응답 시간을 최소화하는 방법으로 일련의 뷰들을 선택하는 것이다(유지-비용 뷰 선택 문제). 본 논문에서는 최적에 가까운 일련의 뷰들을 계산하기 위해 유전자 알고리즘을 사용하여 유지-비용 뷰 선택 문제에 대한 효율적인 해결책을 제안한다. 특히 OR 뷰 그래프들의 관점에서의 유지-비용 뷰 선택 문제를 다룬다. 본 논문의 접근방식은 휴리스틱 방법을 사용한 기존의 탐색-기반 접근 방식들에 비해서, 시간 복잡도에서 큰 향상을 보여준다. 본 논문의 알고리즘은 최적의 질의 비용에 비해 10%이내의 추가비용만을 갖는 해결책을 제시하면서도 실행시간 측면에서는 매우 향상된 선형 증가만을 보인다. 본 논문의 알고리즘에 대한 프로토타입을 구현하였으며 이것을 사용하여 논문에서 제안하는 접근방식의 분석을 수행하였다.

족저 근막염의 계절성에 대한 인터넷 검색어 데이터와 건강보험심사평가원 자료의 연관성 (Correlation between Internet Search Query Data and the Health Insurance Review & Assessment Service Data for Seasonality of Plantar Fasciitis)

  • 황석민;이금호;오승열
    • 대한족부족관절학회지
    • /
    • 제25권3호
    • /
    • pp.126-132
    • /
    • 2021
  • Purpose: This study examined whether there are seasonal variations in the number of plantar fasciitis cases from the database of the Korean Health Insurance Review & Assessment Service and an internet search of the volume data related to plantar fasciitis and whether there are correlations between variations. Materials and Methods: The number of plantar fasciitis cases per month was acquired from the Korean Health Insurance Review & Assessment Service from January 2016 to December 2019. The monthly internet relative search volumes for the keywords "plantar fasciitis" and "heel pain" were collected during the same period from DataLab, an internet search query trend service provided by the Korean portal website, Naver. Cosinor analysis was performed to confirm the seasonality of the monthly number of cases and relative search volumes, and Pearson and Spearman correlation analysis was conducted to assess the correlation between them. Results: The number of cases with plantar fasciitis and the relative search volume for the keywords "plantar fasciitis" and "heel pain" all showed significant seasonality (p<0.001), with the highest in the summer and the lowest in the winter. The number of cases with plantar fasciitis was correlated significantly with the relative search volumes of the keywords "plantar fasciitis" (r=0.632; p<0.001) and "heel pain" (r=0.791; p<0.001), respectively. Conclusion: Both the number of cases with plantar fasciitis and the internet search data for related keywords showed seasonality, which was the highest in summer. The number of cases showed a significant correlation with the internet search data for the seasonality of plantar fasciitis. Internet big data could be a complementary resource for researching and monitoring plantar fasciitis.

센서 네트워크를 위한 PCA 기반의 데이터 스트림 감소 기법 (A PCA-based Data Stream Reduction Scheme for Sensor Networks)

  • 알렉산더 페도시브;최영환;황인준
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.35-44
    • /
    • 2009
  • 데이터 스트림이란 새로운 개념과 기존의 단순 데이터 사이에 존재하는 개념적 차이를 극복하기 위해서는 많은 연구가 필요하다. 대표적인 예로써 센서 네크워크에서의 데이터 스트림 처리를 들 수 있는 데, 이를 위해서는 대역폭이나 에너지, 메모리와 같은 자원적 한계에서 부터 연속 질의를 포함하는 질의처리의 특수성까지 고려해야 할 대상이 광범위하다. 본 논문에서는 데이터 스트림 처리에서의 물리적 제약사항에 해당하는 한정된 메모리 문제를 해결하기 위해 PCA 기법을 기반으로 하는 데이터 스트림 축소 방안을 제안하다. PCA는 상호 관련된 다수의 변수들을 관련이 없는 적은 수의 변수로 변환해준다. 본 논문에서는 질의 처리 엔진의 협력을 가정하고서 센서 네크워크의 스트림 데이터 처리를 위해 PCA 기법을 적용하며, 다른 센서로부터 얻어진 많은 측정값 사이에 시공간적 관련성을 이용한다. 최종적으로 그러한 데이터 처리를 위한 프레임워크를 제시하고 다양한 실험을 통하여 기법의 성능을 분석한다.

  • PDF

텍스트 분석 기반 대화 이력 추적을 이용한 작가 지원 기법 (Authoring Support Technique Using Text Analysis-based Dialogue History Tracking)

  • 김현식;박승보;이오준;백영태;유은순
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.45-53
    • /
    • 2014
  • 본 논문에서는 스토리의 논리적 오류를 막기 위한 방법으로 캐릭터의 대화 이력 구축과 추적 방법을 제안한다. 장편 소설이나 공동 집필 작품등 작품의 길이가 길고 다수의 캐릭터가 등장하는 작품의 경우 작가에게 인지적 부담을 주게 되며 만약 작가가 캐릭터의 기억을 혼동할 경우 작품 속에 논리적 오류가 발생해 작품의 완전성과 무결성에 악영향을 미치게 된다. 본 논문에서는 상기한 추적 방법을 통해 작가의 인지적 부담을 경감하여 작품의 집필을 보조할 수 있는 작가 지원 시스템을 설계하고 기존에 집필된 소설을 분석하여 캐릭터의 대화 이력 추출 및 추적 예시를 보인다. 또한 질의문(query)의 성능평가를 통해 대화 이력 시스템이 평균 68.5%의 정확도를 보여주는 것으로 나타났다.

판별분석을 이용한 효율적인 3차원 모델 검색 (Efficient 3D Model Retrieval using Discriminant Analysis)

  • 송주환;최성희;권오봉
    • 전자공학회논문지 IE
    • /
    • 제45권2호
    • /
    • pp.34-39
    • /
    • 2008
  • 본 논문은 통계 기법인 판별 분석 함수를 이용하여 효율적으로 3차원 모델을 검색하는 시스템을 구현하였다. 제안한 방법은 판별분석 함수를 이용하여 색인으로 검색하는 기법으로, 색인의 생성은 Osada의 D2방법에 의해 추출된 128개의 특징벡터에 통계치(범위, 최소값, 평균, 표준편차, 왜도, 척도)를 변수로 판별분석 함수의 값을 색인 값으로 생성하였다. 쿼리 모델 검색 시 1차 검색으로 쿼리와 저장된 클래스(동종의 모델 그룹)의 색인을 비교하여 상위 2%이내(98% 이상)의 클래스를 추출하여 추출된 클래스에 속하는 모델만을 검색하였다. 이 방법은 검색시간을 단축시키는 효율적인 검색 기법임을 구현을 통해 알 수 있었다. 제안한 방법은 기존의 방법(Osada)보다 3차원 모델 검색 시간을 57%로 단축시켰으며, 쿼리 모델 검색 시 유사모델이 최초로 발견되는 정확도(pecision)가 0.362로 기존의 방법보다 44.8%의 효율이 있었음을 알 수 있었다.

웨이브렛 영역의 BDIP 및 BVLC 특징과 WPCA 분류기를 이용한 질감 분류 (Texture Classification Using Wavelet-Domain BDIP and BVLC Features With WPCA Classifier)

  • 김남철;김미혜;소현주;장익훈
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.102-112
    • /
    • 2012
  • 본 논문에서는 웨이브렛 영역의 BDIP(block difference of inverse probabilities)와 BVLC(block variance of local correlation coefficients) 특징, 그리고 WPCA(whitened principal component analysis) 분류기를 이용한 질감 분류 방법을 제안한다. 제안된 방법에서는 먼저 질의 영상에 웨이브렛 변환을 적용한다. 그런 다음 웨이브렛 영역의 각 부대역에 BDIP와 BVLC 연산자를 적용한다. 이어서 각 BDIP, BVLC 부대역에 대하여 전역 통계치를 계산하고 그 결과들을 벡터화하여 특징 벡터로 사용한다. 분류 단계에서는 얼굴 인식에 주로 사용되는 WPCA를 분류기로 하여 질의 특징 벡터와 가장 유사한 학습 특징 벡터를 찾는다. 실험 결과 제안된 방법은 3가지의 실험 질감 영상 DB에 대하여 낮은 특징 벡터 차원으로 매우 우수한 질감 분류 성능을 보여준다.

SQL 질의 애트리뷰트 값 제거 방법을 이용한 효과적인 SQL Injection 공격 탐지 방법 연구 (A Method for SQL Injection Attack Detection using the Removal of SQL Query Attribute Values)

  • 이인용;조재익;조규형;문종섭
    • 정보보호학회논문지
    • /
    • 제18권5호
    • /
    • pp.135-148
    • /
    • 2008
  • 인터넷이 발전함에 따라 웹 애플리케이션을 이용한 서비스가 대중화되었고, 웹 애플리케이션의 취약점을 목표로 하는 공격들도 증가하게 되었다. 많은 웹 공격 중의 하나인 SQL Injection 공격은 민감한 데이터를 처리하는 곳에서는 매우 치명적이고 위험하기 때문에 이를 탐지하고 예방하기 위한 연구들이 다양하게 이루어져 왔다. 이로 인하여 SQL Injection 공격들이 많이 감소했지만 아직도 이를 우회하는 방법들이 존재하며, 기존의 연구 방법들 또한 매우 복잡하여 실제 웹 애플리케이션에 적용하여 사용하기 어렵다. 따라서 본 논문에서는 SQL Injection 공격 탐지를 위해 웹 애플리케이션에 고정되어 있는 정적 SQL 질의와 사용자로부터 생성되는 동적 SQL 질의의 애트리뷰트 값을 제거한 정적 및 동적 분석 방법을 제안하고, 실험을 통하여 효율성을 검증하였다.

PHY/MAC 계층을 모두 고려한 RFID Gen-2 시스템의 간섭 분석 (Interference Analysis of RFID Gen-2 System Considering Both PHY and MAC Layers)

  • 윤현구;최선웅;장병준
    • 한국전자파학회논문지
    • /
    • 제21권7호
    • /
    • pp.752-760
    • /
    • 2010
  • 본 논문에서는 리더간 간섭이 EPCglobal Generation-2(Gen-2) RFID(Radio Frequency Identification) 시스템의 성능에 미치는 영향을 물리 계층과 MAC 계층을 모두 고려하여 분석하였다. 이를 위해 기존의 태그 충돌만을 고려한 Gen-2 프로토콜 성능 분석 연구에 리더간 간섭을 추가하여, 실제 UHF RFID 시스템 운용 상황과 유사한 환경에서 성능을 분석할 수 있는 모델을 제안하였다. 제안한 모델은 DTMC(Discrete Time Markov Chain) 모델에 다른 리더에 의해 발생하는 리더간 간섭 확률을 결합한 것으로, 간섭 리더의 수에 따른 QSR(Query Success Rate)와 TIS(Tag Identification Speed)의 변화를 정량적으로 분석할 수 있다. 시뮬레이션을 검증하기 위하여 이론치와 비교한 결과, 100개 이상의 태그를 갖는 경우 이론치와 차이를 보이지 않았다. 분석 결과, EPCglobal Gen-2 프로토콜에서 간섭 리더 1기당 TIS가 10 tags/sec씩 감소되는 것을 확인하였다.

2단계 퍼지 지식베이스를 이용한 질의 처리 모델 (Query Processing Model Using Two-level Fuzzy Knowledge Base)

  • 이기영;김영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-16
    • /
    • 2005
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 따라서 본 논문에서는 문서 지식 구조를 파악하여 사용자 질의 용어와 색인어 사이의 내용 기반 유사도를 반영한 순위 재조정 모델을 제안한다. 이를 위해 전자는 시소러스 및 유사관계 행렬을 구축하여 주제 분석 메커니즘을 제공하고, 후자는 사용자 요구를 분석하기 위해 질의 확장 등의 탐색 모형을 수립하는 알고리즘을 제안한다. 따라서 본 논문에서 제안한 알고리즘은 검색 시스템의 정보 구조를 활용한 검색으로 재현율을 유지하면서 동시에 기존 퍼지 검색 모델의 단점인 정확률을 향상시키는 2단계 탐색모형을 수립하는 내용 기반검색 기법이라 할 수 있다.

  • PDF

지능 정보검색 서비스를 위한 실시간검색어 변화량 평가 (Evaluating real-time search query variation for intelligent information retrieval service)

  • 정민영
    • 디지털융복합연구
    • /
    • 제16권12호
    • /
    • pp.335-342
    • /
    • 2018
  • 포털 사이트의 핵심 서비스인 검색서비스는 입력되는 검색어 중에서 짧은 순간에 급상승하는 검색어를 대상으로 순간 검색빈도가 높은 것을 기준으로 순위별로 제시하는 것이므로 일정기간 동안 관심도가 높은 검색어를 곧바로 알려주기는 힘들다. 따라서 이를 극복하고 검색어 변화에 대한 향상된 분석결과가 나오게 하여 보다 지능적인 정보검색 서비스를 제공하기 위한 노력이 필요하다. 이를 위하여 본 논문에서는 실시간검색어의 관심도와 지속도, 그리고 주목도를 측정할 수 있는 기준을 제시한다. 그리고 그 기준에 맞추어 일정기간 동안 시간, 일간, 주간, 월간 실시간검색어에 대한 변화의 측정과 집계를 하고 이를 통해 관심도가 높은 이슈, 관심이 길게 지속된 이슈, 변화가능성이 커서 앞으로 주목해야 할 이슈를 평가한다.