• Title/Summary/Keyword: Analysis of Query

Search Result 457, Processing Time 0.03 seconds

A Study on Performing Join Queries over K-anonymous Tables

  • Kim, Dae-Ho;Kim, Jong Wook
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권7호
    • /
    • pp.55-62
    • /
    • 2017
  • Recently, there has been an increasing need for the sharing of microdata containing information regarding an individual entity. As microdata usually contains sensitive information on an individual, releasing it directly for public use may violate existing privacy requirements. Thus, to avoid the privacy problems that occur through the release of microdata for public use, extensive studies have been conducted in the area of privacy-preserving data publishing (PPDP). The k-anonymity algorithm, which is the most popular method, guarantees that, for each record, there are at least k-1 other records included in the released data that have the same values for a set of quasi-identifier attributes. Given an original table, the corresponding k-anonymous table is obtained by generalizing each record in the table into an indistinguishable group, called the equivalent class, by replacing the specific values of the quasi-identifier attributes with more general values. However, query processing over the anonymized data is a very challenging task, due to generalized attribute values. In particular, the problem becomes more challenging with an equi-join query (which is the most common type of query in data analysis tasks) over k-anonymous tables, since with the generalized attribute values, it is hard to determine whether two records can be joinable. Thus, to address this challenge, in this paper, we develop a novel scheme that is able to effectively perform an equi-join between k-anonymous tables. The experiment results show that, through the proposed method, significant gains in accuracy over using a naive scheme can be achieved.

RFID 충돌 비트를 이용한 다중 태그 인식 알고리즘 (A New RFID Multi-Tag recognition Algorithm using Collision-Bit)

  • 지유강;조미남;홍성수;박수봉
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.999-1005
    • /
    • 2008
  • RFID(Radio Frequency IDentification)리더는 영역 내에 있는 다수의 태그를 인식할 때 데이터간의 충돌이 발생하는데 이러한 충돌은 리더의 태그인식 시간을 지연시키는 원인이 된다. 리더의 태그인식 시간의 지연을 방지하는 프로토콜은 대표적으로 QT(Query Tree)알고리즘을 사용하는데 본 논문에서는 충돌비트위치를 이용하여 개선된 QT-MTC(Query Tree with Multi-Tag Cognition)알고리즘을 제안한다. 제안 알고리즘은 충돌이 일어난 비트수와 충돌이 발생한 비트 위치를 스택에 저장하여 트리를 순회하는 횟수를 줄였고, 두 개의 태그를 동시에 식별할 수 있도록 설계되었다. 성능분석 결과 QT 알고리즘에 비하여 제안 알고리즘은 연속된 태그 비트에 대해 높은 성능 개선 효과를 보였다.

OQL/Geo : 지리 정보 시스템을 위한 객체지향 공간 질의어 (OQL/Geo : An object- oriented spatial query language for Geographic Information Systems)

  • 김양희;김명선;권석형;정창성
    • Spatial Information Research
    • /
    • 제3권2호
    • /
    • pp.191-204
    • /
    • 1995
  • 데이타 모델(data model)이란 실세계에 대한 공간 및 비공간적 특성(feature)을 추상화한 시스템 모델이다. 각 시스템들을 고유한 데이타 모델을 통해 외부 세계에 대한 내부 표현및 외부 세계와의 접속관계에 대한 틀(framework)을 정의하게 되며, 공간 질의어는 지리 정보시스템에서 정의하고 있는 외부 세계화의 접속 관계를 우한 효과적인 틀의 하나이다. 기존의 지리 정보 시스템에서는 관계형 데이타 모델에 기반한 공간 데이타 모델들이 주로 사용되었으므로 데이타 추상화(abstraction)및 상속 (inheritance)을 통한 복합 객체의 표현에 문제점이 있었다. 본 논문에서는 ODMG의 객체 모델을 기반으로 평면 위상 모델 (planar topological model)을 수용하여 객체지향 데이타 모델인 위상 객체 모델(Topological Object Model : TOM)을 제안하고, 이를 기반으로 객체지향 공간 질의어인 OQL/Geo을 설계하였다. OQL/Geo은 ODMG에 의해 개발된 질의어인 OQL을 기반으로 하여 위상 객체 모델을 효과적으로 표현할 수 있도록 확장하였으며, 기하연산, 위상연산및 가시연산등의 풍부한 연산자들을 제공하고 있으며, 복잡한 공간 분석에 대한 요구 뿐 아니라 질의 결과에 대한 출력 형식도 다양하게 표현할 수 있도록 하였다.

  • PDF

도로 네트워크 환경에서 암호화된 공간데이터를 위한 K-최근접점 질의 처리 알고리즘 (A K-Nearest Neighbour Query Processing Algorithm for Encrypted Spatial Data in Road Network)

  • 장미영;장재우
    • Spatial Information Research
    • /
    • 제20권3호
    • /
    • pp.67-81
    • /
    • 2012
  • 최근 클라우드 컴퓨팅의 발전에 따라, 데이터베이스 아웃소싱(Outsourcing)에 대한 연구가 활발히 진행되고 있다. 또한 무선 통신 기술 및 모바일 기기의 발전으로 인해 위치 기반 서비스를 이용하는 사용자의 수가 증가하였다. 따라서 개인 또는 소규모의 사업자는 데이터 저장 및 관리 비용을 줄이기 위해 그들의 공간 데이터를 위치 기반 서비스 제공자에게 아웃소싱 한다. 그러나 사용자의 위치 정보는 시간대별 방문 장소 및 개인 정보를 지니고 있기 때문에, 이에 대한 허용되지 않은 접근 시 개인 정보 유출 문제가 발생한다. 따라서 위치 정보 아웃소싱을 위한 개인 정보 보호 연구가 필요하다. 이러한 문제를 해결하기 위해, 본 논문에서는 아웃소싱 환경에서 도로네트워크를 고려한 암호화된 공간 데이터베이스 기반 k-최근접점 질의 처리 알고리즘을 제안하였다. 제안하는 기법은 데이터베이스 아웃소싱을 위해 위치 데이터를 네트워크 거리 정보로 변환 및 암호화한 가공데이터를 생성하여 이를 서비스 제공자에게 전송한다. 또한, 전처리 과정을 통해 네트워크 노드와 POI 거리를 미리 저장하여 네트워크 탐색을 빠르게 수행하며, 질의 수행 시 최근접 대표 POI 및 암호화된 거리 정보를 이용하여 질의 결과 후보 집합을 탐색한다. 마지막으로, 질의 영역 재설정 과정을 통해 불필요한 후보 탐색을 줄임으로써 효율적으로 POI를 탐색한다. 마지막으로, 성능평가를 통해 제안하는 기법이 기존 방법에 비해 우수함을 보인다.

데이터 샘플링 기반 프루닝 기법을 도입한 효율적인 각도 기반 공간 분할 병렬 스카이라인 질의 처리 기법 (An Efficient Angular Space Partitioning Based Skyline Query Processing Using Sampling-Based Pruning)

  • 최우성;김민석;;정재화;정순영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권1호
    • /
    • pp.1-8
    • /
    • 2017
  • 다기준 의사결정 시 활용할 수 있는 스카이라인 질의는 다수의 선택지 중에서 사용자가 '선호하지 않을 만한'(uninteresting) 선택지를 제거함으로써 사용자가 검토해야 하는 선택지의 수를 대폭 감소시키기 때문에 대용량 데이터 분석 시 매우 유용하게 활용될 수 있다. 이러한 배경에서 대용량 데이터에 대한 스카이라인 질의를 분산 병렬 처리하는 기법이 각광을 받고 있으며, 특히 맵리듀스(MapReduce) 기반의 분산 병렬 처리 기법 연구가 활발히 진행되어 왔다. 맵리듀스 기반 알고리즘의 병렬성 제고를 위해서는 부하 불균등 문제 중복 계산 문제 과다한 네트워크 비용 발생 문제를 해소해야 한다. 본 논문에서는 부하 불균등 문제와 중복 계산 문제를 해소하면서도 데이터 샘플링 기반 프루닝을 통해 네트워크 비용 절감 시킬 수 있는 맵리듀스 기반 병렬 스카이라인 질의 처리 기법인 MR-SEAP(MapReduce sample Skyline object Equality Angular Partitioning)을 소개한다. 또한 다양한 관점에서의 실험 평가함으로써 제안 기법의 효용성을 다방면으로 검증했다.

비정상도메인 분류를 위한 DNS 쿼리 기반의 주성분 분석을 이용한 성분추출 (Feature Selection with PCA based on DNS Query for Malicious Domain Classification)

  • 임선희;조재익;김종현;이병길
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제1권1호
    • /
    • pp.55-60
    • /
    • 2012
  • 최근 봇넷(Botnet)은 탐지 기술을 피하기 위하여 C&C(Command and Control)서버 접속시 DNS(Domain Name System) 서비스를 이용하고 있다. DNS 서비스를 이용한 비정상 행위에 대응하기 위해서 DNS 트래픽 기반의 분석 연구가 필요하다. 본 논문에서는 좀비PC의 C&C서버 도메인주소 질의와 같은 DNS트래픽 기반의 비정상 도메인 분류(Classification)를 위해서 DNS트래픽 수집 및 지도학습(Supervised Learning)에 대해 연구한다. 특히, 본 논문에서는 PCA(Principal Component Analysis) 주성분분석 기술을 통해 DNS 기반의 분류시스템에서의 효과적인 분석 성분들을 구성할 수 있다.

이동객체의 궤적처리를 위한 트리기반 색인기법의 성능분석 (Performance Analysis of Tree-based Indexing Scheme for Trajectories Processing of Moving Objects)

  • 심춘보;신용원
    • 한국지리정보학회지
    • /
    • 제7권4호
    • /
    • pp.1-14
    • /
    • 2004
  • 본 연구에서는 GIS 응용에서 이동객체의 궤적을 인덱싱하기 위해 기존에 제안되었던 TB(Trajectory-Bundle)-트리의 성능을 개선시킬 수 있는 연결테이블(LinkTable:L-Table) 기반의 확장된 TB-트리(L-Table TB-Tree:LTB-Tree)를 제안하고 아울러 제안하는 색인기법의 성능평가를 위해 다음과 같은 사항을 고려한다. 첫째, 기존의 R*-트리, TB-트리, 그리고 제안하는 LTB-트리를 성능평가 대상으로 선정한다. 둘째, 실험 데이타 집합으로는 랜덤 데이타 집합 및 실제 데이타 집합을 이용한다. 셋째, 시스템의 가용 메모리의 제약을 고려해 메모리 버퍼 크기에 따른 성능평가를 수행한다. 넷째, 다양한 데이타 분포도를 가지고 있는 실험 데이타를 이용하여 성능평가를 수행한다. 마지막으로 삽입성능 및 검색성능(궤적질의 및 영역질의)을 평가한다. 성능평가를 분석한 결과, 제안하는 색인기법이 기존의 색인기법들에 비해 삽입과 궤적질의의 검색 측면에서 더 우수함을 보인다.

  • PDF

AQS: An Analytical Query System for Multi-Location Rice Evaluation Data

  • 프란코 나자레노;정승현;강유진;이경희;조완섭
    • 한국산업정보학회논문지
    • /
    • 제15권2호
    • /
    • pp.59-67
    • /
    • 2010
  • Rice varietal information exchange is vital for agricultural experiments and trials. With the growing size of rice data gathered around the world, and numerous research and development achievements, the effective collection and convenient ways of data dissemination is an important aspect to be dealt with. The collection of this data is continuously worked out through various international cooperation and network programs. The problem in acquiring this information anytime anywhere is the new challenge faced by rice breeders, scientist and crop information specialists, in order to perform rapid analysis and obtain significant results in rice research, thus alleviating rice production. To address these constraints, we propose an Online Analytical Query System, a web query application to provide breeders and rice scientist around the world a fast web search engine for rice varieties, giving the users the freedom to choose from which trial it has been used, trait observation parameters as well as geographical or weather conditions, and location specifications. The application uses data warehouse techniques and OLAP for summarization of agricultural trials conducted, and statistical analysis in deriving outstanding varieties used in these trials, consolidated in an Model-View-Controller Web framework.

의견 어구의 구문 관계를 고려한 트위터 의견 검색 (Opinion Retrieval in Twitter Considering Syntactic Relations of Sentiment Phrase)

  • 김윤성;양민철;이승욱;임해창
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권9호
    • /
    • pp.492-497
    • /
    • 2014
  • 본 연구에서는 대중적인 소셜 네트워크 서비스 중 하나이며 많은 사람들이 다양한 의견을 공유하는 트위터를 대상으로 질의어(또는 주제어)에 적합한 의견을 지닌 트윗을 검색하는 방법론을 제안한다. 기존의 의견 검색 시스템은 의견을 지닌 구절이 주어진 질의어나 화자와 관련이 없음에도 불구하고 그런 구절의 유무를 중요한 요소로 여겼다. 이와 같은 문제를 해결하기 위하여 본 연구에서는 1) 의견 어구-질의어 관계, 2) 의견 어구-화자 관계, 그리고 3) 의견 어구의 의존 구문 역할 등의 구문 요소를 반영하는 방법을 고안하였다. 또한, 의견을 가진 트윗을 검색하기 위하여 질의어와의 적절성, 텍스트 정보, 사용자 정보, 트위터 특화 자질에 기반한 랭킹 학습 방법을 이용하였다. 실제 데이터를 이용한 실험 결과, 본 시스템은 기존 연구들보다 더 좋은 성능을 보이고 있다.

도서관 이용자와 사서간의 대면적 커뮤니케이션의 고찰 (A study on the face to face communication between library users and librarians)

  • 유길호
    • 한국도서관정보학회지
    • /
    • 제24권
    • /
    • pp.81-106
    • /
    • 1996
  • Without an accurate understanding of information needs of library users, an efficient services can't be implement. And we can expect that there is a difference between query statement and actual information needs of users. It also will occur difference in the process of librarian's interpretation of query statement because of an inaccurate presentation and their different working experiences. It means that there is a communication problems between users and librarians. The purpose of this study is to provide the techniques of face to face communication between users and librarians as a method of efficient library service activities. And focused on the importance of non-language communication. The effectiveness of this study are as follows: 1. With the understanding of information flow, librarians can expand the extent of library services. 2. Knowing that how to communicate with users at the a n.0, ppropriate degree, librarians can improve the communication techniques. 3. Expanding the satisfaction of information services and heitening the reliability of users. 4. From the analysis of user information needs, librarians can convert present system to the proper service-oriented system. 5. Knowing the importance of non-language communication, librarians can improve the service environment.

  • PDF