• 제목/요약/키워드: Tree Structured Data

검색결과 90건 처리시간 0.026초

효율적인 XML 질의 처리를 위한 적응형 경로 인덱스 (Adaptive Path Index for Efficient U Query Processing)

  • 민준기;심규석;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.61-71
    • /
    • 2004
  • XML은 정형적(regular) 구조로부터 비정형적(irregular) 구조, 평탄한(flat) 구조로부터 깊게 내포된(deeply nested) 구조에 이르기까지 다양한 형태의 자료를 표현할 수 있다. 따라서, 현재 XML은 효율적인 데이타 교환 및 통합 기능을 제공하면서 웹 문서 표준으로 부각되고 있다. 또한, XML로 표현되어 있는 정보를 검색하기 위한 다양한 질의 언어들이 제안되었다. XPath와 XQuery같은 XML 질의 언어들은 XML 엘리먼트(element)로 이루어진 비정형적 구조를 탐색하기 위하여 경로 표현식(path expression)을 기반으로 한다. 이러한 경로 표현식을 효율적으로 처리하기 위하여 다양한 경로 인덱스들이 제안되었으나, 기존의 경로 인덱스들은 XML 데이타의 구조 정보만을 이용하여 생성된다. 따라서, 본 논문에서는 XML 데이타의 구조 정보와 질의 부하(workload)를 이용한 적응형 경로 인덱스를 제안한다. 본 논문에서 제안하는 적응형 경로 인덱스는 질의 성능을 향상하기 위하여 해쉬 트리와 그래프 구조를 이용하여 자주 사용되는 경로 정보와 XML 데이타의 구조 요약을 관리한다. 실험 결과로서, 적응형 경로 인덱스가 기존의 경로 인덱스들에 비하야 평균적으로 2배에서 69배 좋은 성능을 보였다.

모바일 및 웨어러블 센서 데이터를 이용한 다양한 식사상황 인식 시스템 (A Context Recognition System for Various Food Intake using Mobile and Wearable Sensor Data)

  • 김기훈;조성배
    • 정보과학회 논문지
    • /
    • 제43권5호
    • /
    • pp.531-540
    • /
    • 2016
  • 최근 모바일 환경의 다양한 센서 정보를 이용한 상황인지 서비스가 활발히 연구되고 있다. 본 논문에서는 모바일 및 웨어러블 센서 데이터를 사용해 다양한 맥락에서 나타날 수 있는 사용자의 식사상황을 효과적으로 인식할 수 있는 확률모델을 제안한다. 식사행위와 관련된 상황들을 체계적으로 모델링하기 위해 행위이론의 4가지 행위 요소 및 육하원칙의 5가지 구성 요소들을 모바일 및 웨어러블의 저수준 센서 데이터로 추론 가능한 범위에 맞게 통합하여 인식모델을 구축하고, 트리구조의 베이지안 네트워크 모델링 방식을 사용하여 인식의 경량화를 시도하였다. 제안하는 시스템의 유용성을 입증하기 위하여 1주일간 다양한 배경의 4명 사용자로부터 식사상황 및 일상생활에 대한 383분의 데이터를 수집하였다. 실험결과 기존의 대표적인 분류기들과 비교하여 상대적으로 우수한 인식률(93.21%)이 도출되는 것을 확인하였다. 또한 실제 시나리오를 통한 내부 분석을 수행하여 인식에 사용되는 각 요소들의 유용성을 검증하였다.

탄소저감설계 지원을 위한 수목 탄소계산기 개발 및 적용 (Development of Tree Carbon Calculator to Support Landscape Design for the Carbon Reduction)

  • 하지아;박재민
    • 한국조경학회지
    • /
    • 제51권1호
    • /
    • pp.42-55
    • /
    • 2023
  • 지구온난화로 인한 세계적 기후 위기를 맞아 탄소성능 정량화에 기반한 정책들이 빠르게 도입되면서, 신규 조성되는 도시녹지 계획안의 탄소성능을 예측할 수 있는 방법론이 요구되고 있다. 이에 본 연구에서는 조경분야에서 탄소저감설계를 위해 활용할 수 있는 수목 탄소계산기를 개발하고, 조경설계 실무에서의 효용성을 검증하고자 하였다. 설계 현장에서의 운용성 확보를 위해 범용성 높은 MS Excel을 포맷으로 선정하고, 식재설계의 업무적 특성을 반영할 수 있도록 대표 수종 93종을 대상으로 수종별, 규격별 탄소흡수량과 저장량을 추출하였다. 특히 실무에서 비용적 한계를 반영할 수 있도록 수목 단가를 포함한 데이터베이스를 구축하였다. 수목 탄소계산기의 성능 검증을 위한 식재 실험설계는 조경설계 전문가 4인을 대상으로 중부지방 소공원에 대한 설계 시뮬레이션을 시행하였고, 전후로 반구조적 인터뷰를 진행하여 그 인과관계를 분석하였다. 그 결과 수목 탄소계산기를 사용한 설계안의 탄소흡수량과 탄소저장량이 각각 약 17-82%, 약 14-85% 높게 나타났다. 탄소성능 효율이 높아진 이유는 탄소성능 우수종으로의 교체와 더불어, 예산 범위 내에서 적극적인 추가 식재로 인한 것임을 확인하였다. 설계가들은 사전 인터뷰에서 수목 탄소계산기에 대한 불신과 새로운 프로그램에 대한 부담감을 가졌으나, 사용 후 유용성 및 편의성에 대해 긍정적으로 평가하며 인식의 변화를 보여주었다. 추후 조경분야 탄소저감설계의 본격적인 도입을 위해서는 수목뿐 아니라 조경성능 전반에 대한 탄소계산기로 발전할 필요가 있다. 본 연구는 조경설계 분야에서 본격적으로 정량적 데이터에 입각한 탄소저감설계를 도입하는 데 있어 유용한 방향성을 제시해 줄 것으로 기대된다.

XML 질의 처리를 위한 효율적인 시퀀스 매칭 기법 (An Efficient Sequence Matching Method for XML Query Processing)

  • 서동민;송석일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.356-367
    • /
    • 2008
  • 인터넷 상에서 정보 표현 및 교환의 표준으로 XML이 대두되면서 데이타베이스 연구 분야에서는 XML 질의 처리에 대한 중요성이 커지고 있다. 그리고 과거 몇 년간 빠른 XML 질의 처리를 위해 XISS, XR-트리와 같은 구조적 XML 질의 처리 기법이 제안되었다. 하지만 구조적 XML 질의 처리는 가지 경로 질의 처리를 위해 많은 조인 비용이 요구되는 문제를 가지고 있다. 최근에는 구조적 XML 질의 처리 기법의 조인 문제를 해결하기 위해 ViST와 PRIX와 같은 시퀀스 매칭 기반의 XML 질의 처리 기법이 제안되었다. 시퀀스 매칭 기반의 XML 질의 처리 기법은 가지 경로 질의를 다수의 부질의로 분리하지 않고 질의 시퀀스가 문서 내에 포함되는지만 비교하기 때문에 조인 비용이 요구되지 않는 장점을 가지고 있다. 하지만 ViST는 최적화되지 못한 번호부여 기법을 사용함으로써 질의 처리 시 구조 관계를 정확하게 판단하지 못하고, PRIX는 질의와 문서의 NPS와 LPS를 비교하는데 많은 비용이 요구된다. 따라서 본 논문에서는 XML 질의 처리 성능 향상을 위해 상향식 질의 처리를 사용하는 효율적인 시퀀스 매칭 기법을 제안한다. 또한 본 논문의 성능 평가에서는 제안하는 기법을 ViST PRIX와 비교하여 제안하는 기법이 와일드-카드('*'와 '//')를 포함하는 선형 경로 질의뿐만 아니라 가지 경로 질의 처리에 대해 향상된 성능을 나타냄을 보인다.

표본 적응 프러덕트 양자기에 기초한 DPCM을 이용한 고 전송률 영상 압축 (High Bit Rate Image Coder Using DPCM based on Sample-Adaptive Product Quantizer)

  • 김동식;이상욱
    • 한국통신학회논문지
    • /
    • 제24권12B호
    • /
    • pp.2382-2390
    • /
    • 1999
  • 본 논문에서는 표본 적응 프러덕트 양자기(sample-adaptive product quantizer: SAPQ)라 불리는 새로운 기법의 양자기를 불변 길이 출력을 가지며 높은 전송률을 가지는 DPCM(differential pulse coded modulation)에 기초한 영상 데이터 감축에 적용하였다. DPCM의 성능을 개선하기 위해서는 기존의 스칼라 양자기 대신에 벡터 양자기(vector quantizer: VQ)를 사용해야 하는데, 전송률이 증가함에 따라 일반적인 VQ나 심지어 나무 구조를 가지는 변형된 VQ도 부호화 복잡도나 요구되는 기억 장치의 양으로 인하여 그 구현이 거의 불가능하다. SAPQ는 매우 짧은 적응 주기를 가지는 feed-forward 적응 스칼라 양자기로 일종의 제한적 구조를 가지는 VQ의 일종이다. 따라서, 비록 전송률이 높다고 해도, SAPQ를 사용하면 일반 VQ에서의 부호화 복잡도와 요구되는 기억 장치의 양을 줄이면서 VQ의 성능을 얻을 수 있다. 나아가서 SAPQ가 스칼라 양자기 구조를 가지고 있으므로 DPCM 부호기에서 기존의 스칼라 값을 예측하는 예측기를 그대로 사용하면서 SAPQ는 양자화 역할을 수행할 수 있다. 합성 신호와 실제 영상 데이터에 대하여 실험한 결과 DPCM의 양자화 부분?을 바꾸어서 전송률이 4 b/point 이상에서 2-3 dB 정도의 성능 향상을 얻을 수 있었다.

  • PDF

항공관제용 현시시스템을 위한 패턴매칭 기반의 ASTERIX 파싱 모듈 설계 및 구현 (Design and Implementation of ASTERIX Parsing Module Based on Pattern Matching for Air Traffic Control Display System)

  • 김강희;김호중;은윤동;최상방
    • 전자공학회논문지
    • /
    • 제51권3호
    • /
    • pp.89-101
    • /
    • 2014
  • 최근 국내 항공교통량이 급증함에 따라 안전하고 효율적인 항공교통관리를 위한 항공관제 시스템의 필요성이 커지고 있다. 특히 원활한 항공교통관제를 위해 비행정보구역(FIR : Flight Information Region) 내의 모든 항공상황을 추가지연 없이 보여주어야 하는 현시시스템의 성능 보장이 무엇보다 중요하다. 본 논문에서는 표준 레이더 감시자료 포맷인 ASTERIX(All purpose STructured Eurocontrol suRveillance Information eXchange) 메시지의 파싱 과정에서 발생하는 오버헤드를 줄여 시스템 부하를 최소화함으로써 안정적인 관제운영을 도모할 수 있는 패턴매칭 기반의 ASTERIX 파싱 모듈을 설계하였다. 설계한 패턴매칭 기반의 ASTERIX 파싱 모듈은 수신 ASTERIX 데이터를 분석하여 패턴을 생성하며, 이후 수신되는 ASTERIX는 패턴을 통해 정의된 프로시저로 파싱한다. 기존 비트 수준 파싱 모듈의 불필요한 파싱 과정을 줄여 현시에 필요한 정보만을 빠르게 추출함으로써 현시 오류를 최소화하고 안정적인 항공관제를 가능하게 한다. 설계한 패턴매칭 기반의 ASTERIX 파싱 모듈의 성능을 비교하기 위하여 일반적인 비트 수준 ASTERIX 파싱 모듈과 비교한 결과, 짧은 처리지연시간, 높은 처리량, 낮은 CPU 사용률을 보이는 것을 확인하였다.

Effectiveness of Repeated Examination to Diagnose Enterobiasis in Nursery School Groups

  • Remm, Mare;Remm, Kalle
    • Parasites, Hosts and Diseases
    • /
    • 제47권3호
    • /
    • pp.235-241
    • /
    • 2009
  • The aim of this study was to estimate the benefit from repeated examinations in the diagnosis of enterobiasis in nursery school groups, and to test the effectiveness of individual-based risk predictions using different methods. A total of 604 children were examined using double, and 96 using triple, anal swab examinations. The questionnaires for parents, structured observations, and interviews with supervisors were used to identify factors of possible infection risk. In order to model the risk of enterobiasis at individual level, a similarity-based machine learning and prediction software Constud was compared with data mining methods in the Statistica 8 Data Miner software package. Prevalence according to a single examination was 22.5%; the increase as a result of double examinations was 8.2%. Single swabs resulted in an estimated prevalence of 20.1% among children examined 3 times; double swabs increased this by 10.1%, and triple swabs by 7.3%. Random forest classification, boosting classification trees, and Constud correctly predicted about 2/3 of the results of the second examination. Constud estimated a mean prevalence of 31.5% in groups. Constud was able to yield the highest overall fit of individual-based predictions while boosting classification tree and random forest models were more effective in recognizing Enterobius positive persons. As a rule, the actual prevalence of enterobiasis is higher than indicated by a single examination. We suggest using either the values of the mean increase in prevalence after double examinations compared to single examinations or group estimations deduced from individual-level modelled risk predictions.

Integrative Analysis of Microarray Data with Gene Ontology to Select Perturbed Molecular Functions using Gene Ontology Functional Code

  • Kim, Chang-Sik;Choi, Ji-Won;Yoon, Suk-Joon
    • Genomics & Informatics
    • /
    • 제7권2호
    • /
    • pp.122-130
    • /
    • 2009
  • A systems biology approach for the identification of perturbed molecular functions is required to understand the complex progressive disease such as breast cancer. In this study, we analyze the microarray data with Gene Ontology terms of molecular functions to select perturbed molecular functional modules in breast cancer tissues based on the definition of Gene ontology Functional Code. The Gene Ontology is three structured vocabularies describing genes and its products in terms of their associated biological processes, cellular components and molecular functions. The Gene Ontology is hierarchically classified as a directed acyclic graph. However, it is difficult to visualize Gene Ontology as a directed tree since a Gene Ontology term may have more than one parent by providing multiple paths from the root. Therefore, we applied the definition of Gene Ontology codes by defining one or more GO code(s) to each GO term to visualize the hierarchical classification of GO terms as a network. The selected molecular functions could be considered as perturbed molecular functional modules that putatively contributes to the progression of disease. We evaluated the method by analyzing microarray dataset of breast cancer tissues; i.e., normal and invasive breast cancer tissues. Based on the integration approach, we selected several interesting perturbed molecular functions that are implicated in the progression of breast cancers. Moreover, these selected molecular functions include several known breast cancer-related genes. It is concluded from this study that the present strategy is capable of selecting perturbed molecular functions that putatively play roles in the progression of diseases and provides an improved interpretability of GO terms based on the definition of Gene Ontology codes.

XML 문서의 공통 구조를 이용한 클러스터링 기법 (A Clustering Technique using Common Structures of XML Documents)

  • 황정희;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.650-661
    • /
    • 2005
  • 인터넷의 성장으로 인해 반구조적인 문서의 표준인 XML 문서의 사용이 증가하고 있고 이에 따라 XML 문서의 통합과 검색을 위한 연구가 많이 진행되고 있다. 효율적인 문서의 통합과 검색을 위한 기초 작업은 유사 구조의 XML 문서를 클러스터링 하는 것이다. 기존 연구의 XML 문서 클러스터링에서는 문서간의 구조적 유사도를 이용하여 클러스터를 생성한다. 그러나 이러한 방법은 문서간의 구조적 유사성외 정확한 측정 기준을 만들기 어렵고, 반복적인 유사도의 비교로 인해 처리 속도가 느리다는 단점이 있다. 이러한 문제점을 개선하기 위하여 이 논문에서는 많은 데이타에도 유연하게 적용할 수 있는 트랜잭션 데이타를 위한 클러스터링 알고리즘을 적용하는 새로운 클러스터링 방법을 제안한다. 이 논문에서 제안하는 클러스터링 방법은 하나의 DTD나 XML 스키마를 공유하는 문서 집합이 아닌 스키마가 없는 다양한 구조의 XML 문서들을 대상으로 공통 구조를 이용한다. 공통 구조를 이용하기 위하여 XML 문서의 트리 모델에서 구조를 분리하여 빈발 구조를 추출하고 이를 기반으로 클러스터링을 수행한다. 아울러, 기존 연구와의 비교 및 실험을 통해 제안 기법의 효율성을 보인다.

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.