• 제목/요약/키워드: Data set

검색결과 10,916건 처리시간 0.032초

지식 누적을 이용한 실시간 주식시장 예측 (A Real-Time Stock Market Prediction Using Knowledge Accumulation)

  • 김진화;홍광헌;민진영
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.109-130
    • /
    • 2011
  • 연속발생 데이터는 데이터의 원천으로부터 데이터 저장소로 연속적으로 축적이 되는 데이터를 말한다. 이렇게 축적된 데이터의 크기는 시간이 지남에 따라 점점 커진다. 또한 이러한 대용량 데이터에서 정보를 추출하기 위해서는 저장공간, 시간, 그리고 많은 자원이 필요하다. 이러한 연속발생 데이터의 특성은 시간이 지남에 따라 축적된 대용량 데이터의 이용을 어렵고 고비용이 되게 한다. 만약 정보나 패턴을 추출할 때 누적된 전체 발생 데이터 중에서 최근의 일부만 사용 한다면 적은 일부 표본의 사용의 문제로 인하여 전체 데이터 사용에서 발견될 수 있는 유용한 정보의 유실이 있을 수 있다. 이러한 문제점을 해결하기 위해서 본 연구는 연속발생 데이터를 발생 시점에서 계속 모으기 보다 이러한 발생되는 데이터에서 규칙을 추출하여 효율적으로 지식을 관리하고자 한다. 이 방법은 기존의 방법에 비하여 적은 양의 데이터 저장공간을 필요로 한다. 또한 이렇게 축적된 규칙집합은 미래에 예측을 위해서 언제든 실시간 예측을 할 수 있게 준비가 된다. 여러 예측 모델을 결합시키는 방법인 앙상블 이론에 의하면 본 연구가 제시하는 데로 체계적으로 규칙집합을 시간에 따라 융합시킬 경우 더 나은 예측 성과가 가능하다. 본 연구는 주식시장의 변동성을 예측하기 위하여 주식시장 데이터를 사용하였다. 본 연구는 이 데이터를 이용해 본 연구가 제시하는 방법과 기존의 방법의 예측 정확도를 비교 하였다.

애완동물 분류를 위한 딥러닝 (Deep Learning for Pet Image Classification)

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.151-152
    • /
    • 2019
  • 본 논문에서는 동물 이미지 분류를위한 작은 데이터 세트를 기반으로 개선 된 심층 학습 방법을 제안한다. 첫째, CNN은 소규모 데이터 세트에 대한 교육 모델을 작성하고 데이터 세트를 사용하여 교육 세트의 데이터 세트를 확장하는 데 사용된다. 둘째, VGG16과 같은 대규모 데이터 세트에 사전 훈련 된 네트워크를 사용하여 작은 데이터 세트의 병목을 추출하여 새로운 교육 데이터 세트 및 테스트 데이터 세트로 두 개의 NumPy 파일에 저장하고, 마지막으로 완전히 연결된 네트워크를 새로운 데이터 세트로 학습한다.

  • PDF

시뮬레이션 출력분석을 위한 임계값 부트스트랩의 성능개선 (Improving the Performance of Threshold Bootstrap for Simulation Output Analysis)

  • 김윤배
    • 대한산업공학회지
    • /
    • 제23권4호
    • /
    • pp.755-767
    • /
    • 1997
  • Analyzing autocorrelated data set is still an open problem. Developing on easy and efficient method for severe positive correlated data set, which is common in simulation output, is vital for the simulation society. Bootstrap is on easy and powerful tool for constructing non-parametric inferential procedures in modern statistical data analysis. Conventional bootstrap algorithm requires iid assumption in the original data set. Proper choice of resampling units for generating replicates has much to do with the structure of the original data set, iid data or autocorrelated. In this paper, a new bootstrap resampling scheme is proposed to analyze the autocorrelated data set : the Threshold Bootstrap. A thorough literature search of bootstrap method focusing on the case of autocorrelated data set is also provided. Theoretical foundations of Threshold Bootstrap is studied and compared with other leading bootstrap sampling techniques for autocorrelated data sets. The performance of TB is reported using M/M/1 queueing model, else the comparison of other resampling techniques of ARMA data set is also reported.

  • PDF

퍼지 엔트로피 함수를 이용한 데이터추출 (Selection of data set with fuzzy entropy function)

  • Lee, Sang-Hyuk;Cheon, Seong-Pyo;Kim, Sung-Shin
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.349-352
    • /
    • 2004
  • In this literature, the selection of data set among the universe set is carried out with the fuzzy entropy function. By the definition of fuzzy entropy, we have proposed the fuzzy entropy function and the proposed fuzzy entropy function is proved through the definition. The proposed fuzzy entropy function calculate the certainty or uncertainty value of data set, hence we can choose the data set that satisfying certain bound or reference. Therefore the reliable data set can be obtained by the proposed fuzzy entropy function. With the simple example we verify that the proposed fuzzy entropy function select reliable data set.

  • PDF

Selection of data set with fuzzy entropy function

  • Lee, Sang-Hyuk;Cheon, Seong-Pyo;Kim, Sung shin
    • 한국지능시스템학회논문지
    • /
    • 제14권5호
    • /
    • pp.655-659
    • /
    • 2004
  • In this literature, the selection of data set among the universe set is carried out with the fuzzy entropy function. By the definition of fuzzy entropy, the fuzzy entropy function is proposed and the proposed fuzzy entropy function is proved through the definition. The proposed fuzzy entropy function calculate the certainty or uncertainty value of data set, hence we can choose the data set that satisfying certain bound or reference. Therefore the reliable data set can be obtained by the proposed fuzzy entropy function. With the simple example we verify that the proposed fuzzy entropy function select reliable data set.

Nursing Minimum Data Set (NMDS)과 Nursing Management Minimum Data Set(NMMDS) 과의 관계 (The Nursing Minimum Data Set (NMDS) and Its Relationship with the Nursing Management Minimum Data Set (NMMDS): significance, development, and future of nursing profession)

  • Lee, Eunjoo
    • 대한간호학회지
    • /
    • 제31권3호
    • /
    • pp.401-416
    • /
    • 2001
  • 현재의 보건의료체계에서는 모든 것이 급박하게 변화하고 있으며 또 구체적인 자료를 요구한다. 컴퓨터의 보급과 함께 이러한 변화에 능동적으로 대처하기 위해 간호학에서도 표준화된 대규모 데이터베이스의 개발이 필수적이다. Nursing Minimum Data Set (NMDS)은 간호학분야에서 개발된 최초의 표준화된 대규모 데이터 베이스로서, 간호가 일어나는 모든 상황에서 반드시 수집되어야 할 핵심적인 간호요소를 포함하고 있다. 따라서 본 논문에서는 NMDS 개발의 역사적인 배경, 목적, 요소, 그리고 간호계의 세계적인 동향과 관련하여 NMDS가 이루어야 할 방향, 그리고 NMDS를 완성하기 위해 선행되어 할 문제로 표준화된 분류체계에 대해 논의하였다. 그리고 미국이외에도 몇몇나라에서 NNDS나 혹은 유사한 데이터베이스가 개발 중이거나 이미 수집되고 있는 나라들이 있으므로 이들에 대한 비교와 분석도 제시하였다. 그리고 보다 최근에 개발된 데이터 베이스로 주로 행정적인 목적을 위해 개발된 Nursing Management Minimum Data Set (NMMDS)을 소개하였다. 즉 NMDS가 임상적인 자료의 수집에 초점을 맞춘 데 비해, NMMD는 효과적인 간호관리에 필수적인 요소들을 포함시켰다. 그래서 간호행정가들이 의사결정에 필요한 재정적자원, 환경적자원, 간호자원에 대한 정보를 수집할 수 있게 고안되었다. 이러한 데이터 베이스들은 관계형 데이터베이스로 서로 연결되어야 하며, 다른 학문분야와도 연계되어 활용되어져야 할 것이다. 만약 이러한 대규모 데이터베이스 들이 한국에서도 개발되고 사용되어 진다면 환자간호에 더욱 비용 효과적인 관리가 가능하게 될 것이다. 마지막으로 우리나라에서 NMDS나 NMMDS 같은 대규모데이터 베이스의 개발이 시급히 요청됨을 강조하였다.

  • PDF

행정정보 데이터세트의 기록관리 방안 (Managing Data Set in Administrative Information Systems as Records)

  • 오세라;이해영
    • 한국기록관리학회지
    • /
    • 제19권2호
    • /
    • pp.51-76
    • /
    • 2019
  • 기록관리 전문가와 학자들은 행정정보 데이터세트 기록의 관리 필요성과 그 시급성을 역설하여 왔으나 실제 현장에서 데이터세트의 관리는 시행하지 못 하고 있는 실정이다. 데이터세트는 기술 종속적인 특성과 방대한 규모는 물론 시스템별 다양한 운영 환경으로 인해 현행 종이기록 중심의 표준 기록관리 지침과 절차를 적용하기 어렵다. 무엇보다 데이터세트 자체의 고유한 특성을 수용하는 관리체계가 필요하며, 그 관리 방안은 업무 현장에서 적용할 수 있어야 한다. 이 연구는 공공기관에서 실제 운영 중인 행정정보시스템의 데이터세트의 현황을 조사한 분석 결과에 기반하여 데이터세트 관리 방안과 절차를 개발하여 제시하였다.

보건의료정보 자료 세트의 비교 및 간호정보 표준화에 대한 고찰 (A Review of Minimum Data Sets and Standardized Nursing Classifications)

  • 염영희;이지순;김희경;장혜경;오원옥;차보경;박창승;천숙희;이정애
    • 한국간호교육학회지
    • /
    • 제5권1호
    • /
    • pp.72-85
    • /
    • 1999
  • The paper presents a review of three data sets(Uniform Hospital Discharge Data Set, Nursing Minimum Data Set, and Nursing Management Minimum Data Set) and six major nursing classifications(the North American Nursing Diagnoses Association Taxonomy I, Omaha System, Nursing Interventions Classification, Nursing Intervention Lexicon and Taxonomy, Nursing Outcome Classification, Nursing Outcomes Classification, and Classification of Patient Outcome). The reviewed data sets and nursing classifications were different from each other in the purpose, structure, and user. Nursing Interventions Classification and Nursing Outcomes Classification were linked to North American Nursing Diagnosis Association, but others not. The data set and nursing classifications need to be linked to other data sets and classifications.

  • PDF

A Novel Reversible Data Hiding Scheme for VQ-Compressed Images Using Index Set Construction Strategy

  • Qin, Chuan;Chang, Chin-Chen;Chen, Yen-Chang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권8호
    • /
    • pp.2027-2041
    • /
    • 2013
  • In this paper, we propose a novel reversible data hiding scheme in the index tables of the vector quantization (VQ) compressed images based on index set construction strategy. On the sender side, three index sets are constructed, in which the first set and the second set include the indices with greater and less occurrence numbers in the given VQ index table, respectively. The index values in the index table belonging to the second set are added with prefixes from the third set to eliminate the collision with the two derived mapping sets of the first set, and this operation of adding prefixes has data hiding capability additionally. The main data embedding procedure can be achieved easily by mapping the index values in the first set to the corresponding values in the two derived mapping sets. The same three index sets reconstructed on the receiver side ensure the correctness of secret data extraction and the lossless recovery of index table. Experimental results demonstrate the effectiveness of the proposed scheme.

프마이크로어레이 데이터의 유전자 집합 및 대사 경로 분석 (Gene Set and Pathway Analysis of Microarray Data)

  • 김선영
    • 유전체소식지
    • /
    • 제6권1호
    • /
    • pp.29-33
    • /
    • 2006
  • Gene set analysis is a new concept and method. to analyze and interpret microarray gene expression data and tries to extract biological meaning from gene expression data at gene set level rather than at gene level. Compared with methods which select a few tens or hundreds of genes before gene ontology and pathway analysis, gene set analysis identifies important gene ontology terms and pathways more consistently and performs well even in gene expression data sets with minimal or moderate gene expression changes. Moreover, gene set analysis is useful for comparing multiple gene expression data sets dealing with similar biological questions. This review briefly summarizes the rationale behind the gene set analysis and introduces several algorithms and tools now available for gene set analysis.

  • PDF