• 제목/요약/키워드: Large Data Set

검색결과 1,058건 처리시간 0.029초

A Swing-Arm On-Machine Inspection Method for Profile Measurement of Large Optical Surface in Lapping Process

  • Sung In Kyoung;Oh Chang Jin;Lee Eung Suk;Kim Ock Hyun
    • Journal of Mechanical Science and Technology
    • /
    • 제19권8호
    • /
    • pp.1576-1581
    • /
    • 2005
  • Generally, the optical components are fabricated by grinding, lapping, and polishing. And, those processes take long time to obtain such a high surface quality. Therefore, in the case of large optical component, the on-machine inspection (OMI) is essential. Because, the work piece is fragile and difficult to set up for fabricating and measuring. This paper is concerned about a swing-arm method for measuring surface profile of large optical concave mirror. The measuring accuracy and uncertainty for suggested method are studied. The experimental results show that this method is useful specially in lapping process with the accuracy of $3\~5\;{\mu}m$. Those inspection data are provided for correcting the residual figuring error in lapping or polishing processes.

Fault Tree를 활용한 항공기 격납고 소화시스템의 화재 안전성 분석 (Fire Safety Analysis of Fire Suppression System for Aircraft Maintenance Hangar Using Fault Tree Method)

  • 이종국
    • 한국화재소방학회논문지
    • /
    • 제31권6호
    • /
    • pp.67-73
    • /
    • 2017
  • 항공기 정비 격납고는 고가의 항공기를 보관하거나 정비, 점검등을 하는 건축물로 화재발생 빈도는 낮지만 화재발생 시 인적, 물적 피해가 매우 클 수 있다. 따라서 본 연구에서는 Fault tree를 이용하여 현재 운용중인 항공기 정비 격납고 소화시스템의 화재 안전성에 대한 정성적 분석을 시행하고, 도출된 기본사상에 대한 고장률 자료를 활용하여 정량적 분석을 실시한 후 정상사상의 발생 확률에 대한 Minimal cut set의 중요도를 분석하였다. Minimal cut set에 의한 정성적 분석결과 항공기 격납고 포헤드 소화시스템의 화재제어 실패로 대형화재로 확대될 수 있는 사고경로는 14개라는 것을 알 수 있었다. 또한 정량적인 분석 결과 대형화재로 확대될 확률은 $2.08{\times}E-05/day$이며, Minimal cut set의 중요도 분석 결과 화재 발생 시 4개의 Minimal cut set 즉, 구역별 화재 감지기 및 포헤드 동작과 항공기 날개 및 Fire plume에 의한 소화약제 차단이 동일하게 24.95%로 대형화재로 확대될 가능성의 대부분을 차지하였으며, 항공기 정비 격납고의 포헤드 소화시스템은 항공기 날개 하부화재에 대한 적응성이 없어 개선이 필요한 것으로 Fault tree를 이용하여 처음 확인하였다.

A Design of Spatio-Temporal Data Model for Simple Fuzzy Regions

  • Vu Thi Hong Nhan;Chi, Jeong-Hee;Nam, Kwang-Woo;Ryu, Keun-Ho
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.384-387
    • /
    • 2003
  • Most of the real world phenomena change over time. The ability to represent and to reason geographic data becomes crucial. A large amount of non-standard applications are dealing with data characterized by spatial, temporal and/or uncertainty features. Non-standard data like spatial and temporal data have an inner complex structure requiring sophisticated data representation, and their operations necessitate sophisticated and efficient algorithms. Current GIS technology is inefficient to model and to handle complex geographic phenomena, which involve space, time and uncertainty dimensions. This paper concentrates on developing a fuzzy spatio-temporal data model based on fuzzy set theory and relational data models. Fuzzy spatio-temporal operators are also provided to support dynamic query.

  • PDF

Applying Formal Methods to Modeling and Analysis of Real-time Data Streams

  • Kapitanova, Krasimira;Wei, Yuan;Kang, Woo-Chul;Son, Sang-H.
    • Journal of Computing Science and Engineering
    • /
    • 제5권1호
    • /
    • pp.85-110
    • /
    • 2011
  • Achieving situation awareness is especially challenging for real-time data stream applications because they i) operate on continuous unbounded streams of data, and ii) have inherent realtime requirements. In this paper we showed how formal data stream modeling and analysis can be used to better understand stream behavior, evaluate query costs, and improve application performance. We used MEDAL, a formal specification language based on Petri nets, to model the data stream queries and the quality-of-service management mechanisms of RT-STREAM, a prototype system for data stream management. MEDAL's ability to combine query logic and data admission control in one model allows us to design a single comprehensive model of the system. This model can be used to perform a large set of analyses to help improve the application's performance and quality of service.

A guideline for the statistical analysis of compositional data in immunology

  • Yoo, Jinkyung;Sun, Zequn;Greenacre, Michael;Ma, Qin;Chung, Dongjun;Kim, Young Min
    • Communications for Statistical Applications and Methods
    • /
    • 제29권4호
    • /
    • pp.453-469
    • /
    • 2022
  • The study of immune cellular composition has been of great scientific interest in immunology because of the generation of multiple large-scale data. From the statistical point of view, such immune cellular data should be treated as compositional. In compositional data, each element is positive, and all the elements sum to a constant, which can be set to one in general. Standard statistical methods are not directly applicable for the analysis of compositional data because they do not appropriately handle correlations between the compositional elements. In this paper, we review statistical methods for compositional data analysis and illustrate them in the context of immunology. Specifically, we focus on regression analyses using log-ratio transformations and the alternative approach using Dirichlet regression analysis, discuss their theoretical foundations, and illustrate their applications with immune cellular fraction data generated from colorectal cancer patients.

대규모 RDF 데이터의 분산 저장을 위한 동적 분할 기법 (A Dynamic Partitioning Scheme for Distributed Storage of Large-Scale RDF Data)

  • 김천중;김기연;윤종현;임종태;복경수;유재수
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1126-1135
    • /
    • 2014
  • 최근 대규모 RDF 데이터를 효과적으로 분산 저장 및 관리하기 위해 RDF 분할 기법의 연구가 진행되고 있다. 본 논문에서는 지속적으로 데이터의 추가 및 변경이 발생하는 동적 환경에서 부하 분산을 지원하는 RDF 동적 분할 기법을 제안한다. 제안하는 기법은 그래프 분할을 수행하기 위한 기준으로 질의에 의해 사용된 RDF 데이터의 사용 빈도에 따라 클러스터와 서브 클러스터 그룹을 생성한다. 생성된 클러스터와 서브 클러스터는 분산된 서버의 부하 및 저장되는 데이터 크기를 고려하여 분할을 수행한다. 이를 통해 지속적인 데이터 변경 및 추가로 인해 특정 서버에 대한 데이터 집중을 해결하고 서버들간에 효율적인 부하 분산을 수행한다. 성능평가를 통하여 분산 서버에서 제안하는 기법이 기존 분할 기법에 비해 질의 수행 시간이 크게 향상됨을 보인다.

J-tree : 사용자의 검색패턴을 이용한 대용량 데이타를 위한 효율적인 색인 (J-Tree: An Efficient Index using User Searching Patterns for Large Scale Data)

  • 장수민;서광석;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권1호
    • /
    • pp.44-49
    • /
    • 2009
  • 최근에 휴대용 단말기들의 발전으로, 대용량 데이타에 대한 다양한 검색 서비스들이 휴대용 단말기에 제공되고 있다. 정보 검색을 위한 대부분 응용프로그램들은 대용량 데이타를 검색하기 위하여 B-tree나 R-tree와 같은 색인을 사용한다. 그러나 전체 데이타의 매우 적은 부분이 사용자에 의하여 접근된다. 또한, 각 데이타에 대한 접근 빈도수들은 다양하다. 그러나 B-tree나 R-tree와 같은 색인들은 편향적 접근 패턴의 특성을 고려하지 않는다. 그리고 캐쉬는 빠른 접근을 위해서 반복적으로 접근되는 데이타를 메모리에 저장한다. 그러나 캐쉬에서 사용하는 메모리의 크기는 제한적이다. 본 논문에서는 사용자의 검색패턴들을 고려한 디스크 기반의 새로운 색인구조, J-tree를 제안한다. 제안된 색인은 모든 데이터에 대한 일정한 검색속도를 보장하는 균형트리이다. 그리고 자주 접근된 데이타에 대해서는 빠른 검색속도를 제공한다. 성능평가는 다양한 실험환경에서 제안된 색인의 효율성을 보여준다.

그룹특징기반 슬라이딩 윈도우 클러스터링에서의 k-means와 k-medoids 비교 평가 (Comparison between k-means and k-medoids Algorithms for a Group-Feature based Sliding Window Clustering)

  • 양주연;심준호
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.225-237
    • /
    • 2018
  • 대용량 데이터의 발생과 처리가 대중화되면서 대용량 데이터 스트림 처리에 대한 수요가 급격하게 증가하고 있다. 이 수요에 따라 다양한 대용량 데이터 처리 기술이 개발되고 있다. 한 분야로 주목받고 있는 방식은 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링이다. 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링은 윈도우가 이동할 때마다 새로운 클러스터를 생성한다. 기존의 슬라이딩 윈도우 상의 클러스터링 기법은 코어셋(Coreset)을 기반으로 데이터 스트림 클러스터링을 구현하고 있다. 이 연구에서는 코어셋을 활용한 그룹특징을 이용한 알고리즘 내에서 이용하는 클러스터링 알고리즘을 변경하였다. 그리고 이를 통해 제안 알고리즘과 기존 알고리즘의 파라미터 값 변화에 따른 성능 비교 실험을 진행하였다. 개선된 사항에 대해 논하여 두 알고리즘을 비교하고 실험자에게 파라미터에 따른 이용 방향을 제시한다.

A Case Study: Unsupervised Approach for Tourist Profile Analysis by K-means Clustering in Turkey

  • Yildirim, Mustafa Eren;Kaya, Murat;FurkanInce, Ibrahim
    • 인터넷정보학회논문지
    • /
    • 제23권1호
    • /
    • pp.11-17
    • /
    • 2022
  • Data mining is the task of accessing useful information from a large capacity of data. It can also be referred to as searching for correlations that can provide clues about the future in large data warehouses by using computer algorithms. It has been used in the tourism field for marketing, analysis, and business improvement purposes. This study aims to analyze the tourist profile in Turkey through data mining methods. The reason relies behind the selection of Turkey is the fact that Turkey welcomes millions of tourist every year which can be a role model for other touristic countries. In this study, an anonymous and large-scale data set was used under the law on the protection of personal data. The dataset was taken from a leading tourism company that is still active in Turkey. By using the k-means clustering algorithm on this data, key parameters of profiles were obtained and people were clustered into groups according to their characteristics. According to the outcomes, distinguishing characteristics are gathered under three main titles. These are the age of the tourists, the frequency of their vacations and the period between the reservation and the vacation itself. The results obtained show that the frequency of tourist vacations, the time between bookings and vacations, and age are the most important and characteristic parameters for a tourist's profile. Finally, planning future investments, events and campaign packages can make tourism companies more competitive and improve quality of service. For both businesses and tourists, it is advantageous to prepare individual events and offers for the three major groups of tourists.

집합 결합과 신경망을 이용한 복합질환의 예측 (A Prediction Model for Complex Diseases using Set Association & Artificial Neural Network)

  • 최현주;김승현;위규범
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.323-330
    • /
    • 2008
  • 복합질환은 다수의 유전자들이 상호작용하여 유발되는 질병으로서, 여러 유전자들이 관여한다는 복잡성 때문에 전통적인 분석 방법을 적용하는데 한계가 있다. 최근에는 기계학습 기법을 이용한 새로운 분석 방법들이 제안되고 있다. 신경망은 이처럼 복잡한 데이터에서 일정한 패턴을 찾아 이를 분류하는데 적합한 모델이다. 그러나 다량의 데이터가 입력으로 들어오는 경우에 학습에 오랜 시간이 걸리고 패턴을 찾기가 어려워지는 단점이 있다. 본 연구에서는 다량의 SNP 데이터로부터 질병에 연관된 소수의 중요 SNP을 찾기 위한 통계학적인 방법인 집합결합(set association)과 신경망을 결합한 모델을 제시한다. 이 모델을 천식 관련 SNP 데이터에 적용하여 천식 발병 여부를 예측한 결과, 신경망만 사용했을 때보다 실행 시간도 빠르고 예측 정확도도 높았다. 이 모델은 다른 복합질환의 예측에도 효과적으로 사용할 수 있을 것으로 기대한다.