• Title/Summary/Keyword: 표본 기반

Search Result 685, Processing Time 0.029 seconds

Double Clustering of Gene Expression Data Based on the Information Bottleneck Method (정보병목기법에 기반한 유전자 발현 데이터의 이중 클러스터링)

  • 김병희;황규백;장정호;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.362-364
    • /
    • 2003
  • 기능 유전체학에서 클러스터링 기법은 고차원의 마이크로 어레이 데이터 분석을 위한 주된 도구 중의 하나이다. 본 논문에서는 정보병목(information bottleneck)기법 기반의 이중 클러스터링에 의한, 유전자 발현 데이터의 계층적 병합방식 클러스터링 기법을 제안한다. 정보병목기법은, 두 랜덤변수의 결합확률분포가 주어진 경우 두 변수의 상호 정보량을 최대한 보존하면서 한 변수를 압축하는 기법이며, 두 변수를 차례로 압축하는 것이 이중 클러스터링이다. 실제 마이크로 어레이 데이터인 NC160 데이터(암세포 내 유전자 발현 데이터)에 대한 실험에서, 먼저 유전자를 그 발현패턴에 따라 클러스터링 한 후 이를 이용하여 표본들을 클러스터링하고 그 성능을 다각도로 분석하였다. 상호 정보량과 유전자 및 표본 클러스터 수와 엔트로피 척도에 의한 성능을 검토해 본 결과, 표본이 추출 조직에 따라 구분 가능할 것이라는 가정을 검증할 수 있었으며, 적절한 클러스터의 수를 결정할 수 있는 임계점의 기준을 설정할 수 있었다.

  • PDF

A RSS-Based Localization Method Utilizing Robust Statistics for Wireless Sensor Networks under Non-Gaussian Noise (비 가우시안 잡음이 존재하는 무선 센서 네트워크에서 Robust Statistics를 활용하는 수신신호세기기반의 위치 추정 기법)

  • Ahn, Tae-Joon;Koo, In-Soo
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.11 no.3
    • /
    • pp.23-30
    • /
    • 2011
  • In the wireless sensor network(WSN), the detection of precise location of sensor nodes is essential for efficiently utilizing the sensing data acquired from sensor nodes. Among various location methods, the received signal strength (RSS) based localization scheme is mostly preferable in many applications since it can be easily implemented without any additional hardware cost. Since the RSS localization method is mainly effected by radio channel between two nodes, outlier data can be included in the received signal strength measurement specially when some obstacles move around the link between nodes. The outlier data can have bad effect on estimating the distance between two nodes such that it can cause location errors. In this paper, we propose a RSS-based localization method using Robust Statistic and Gaussian filter algorithm for enhancing the accuracy of RSS-based localization. In the proposed algorithm, the outlier data can be eliminated from samples by using the Robust Statistics as well as the Gaussian filter such that the accuracy of localization can be achieved. Through simulation, it is shown that the proposed algorithm can increase the accuracy of localization and is more robust to non gaussian noise channels.

Assessing the Impact of Sampling Intensity on Land Use and Land Cover Estimation Using High-Resolution Aerial Images and Deep Learning Algorithms (고해상도 항공 영상과 딥러닝 알고리즘을 이용한 표본강도에 따른 토지이용 및 토지피복 면적 추정)

  • Yong-Kyu Lee;Woo-Dam Sim;Jung-Soo Lee
    • Journal of Korean Society of Forest Science
    • /
    • v.112 no.3
    • /
    • pp.267-279
    • /
    • 2023
  • This research assessed the feasibility of using high-resolution aerial images and deep learning algorithms for estimating the land-use and land-cover areas at the Approach 3 level, as outlined by the Intergovernmental Panel on Climate Change. The results from different sampling densities of high-resolution (51 cm) aerial images were compared with the land-cover map, provided by the Ministry of Environment, and analyzed to estimate the accuracy of the land-use and land-cover areas. Transfer learning was applied to the VGG16 architecture for the deep learning model, and sampling densities of 4 × 4 km, 2 × 4 km, 2 × 2 km, 1 × 2 km, 1 × 1 km, 500 × 500 m, and 250 × 250 m were used for estimating and evaluating the areas. The overall accuracy and kappa coefficient of the deep learning model were 91.1% and 88.8%, respectively. The F-scores, except for the pasture category, were >90% for all categories, indicating superior accuracy of the model. Chi-square tests of the sampling densities showed no significant difference in the area ratios of the land-cover map provided by the Ministry of Environment among all sampling densities except for 4 × 4 km at a significance level of p = 0.1. As the sampling density increased, the standard error and relative efficiency decreased. The relative standard error decreased to ≤15% for all land-cover categories at 1 × 1 km sampling density. These results indicated that a sampling density more detailed than 1 x 1 km is appropriate for estimating land-cover area at the local level.

일상어휘를 기반으로 한 선물 가격 예측모형의 개발

  • 김광용;이승용
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.291-300
    • /
    • 1999
  • 본 논문은 인공신경망과 귀납적 학습방법 등의 인공지능 방법과 선물가격결정에 대한 기존 재무이론을 사용하여 일상어휘로 표현되는 파생상품 가격예측 모형을 개발하는데 있다. 모형의 개발은 1단계로 인공신경망이나 기존의 선물가격결정이론(평균보유비용모형이나 일반균형모형)을 이용하여 선물 가격을 예측한 후, 서로 비교분석하여 인공신경망 모형의 우수성을 확인하였다. 귀납적 학습방법중 CART 알고리듬을 사용하여 If-Then 규칙을 생성하였다. 특히 실용적 측면에서 선물가격의 일상어휘화를 통한 모형개발을 여러 가지 방법으로 시도하였다. 이러한 선물가격 예측모형의 유용성은 일단 If-Then 규칙으로 표현되어 전문가의 판단에 확실한 이론적인 근거를 제시할 수 있는 장점이 있으며, 특히 의사결정지원시스템으로 활용화 될 경우 매우 유용한 근거자료로 활용될 수 있다. 이러한 선물가격 예측모형은 정확성은 분석표본과 검증표본으로 나누어 검증표본에서 세가지 기본모형(평균보유비용모형, 일반균형모형, 인공신경망 모형)과 각 모형의 귀납적 학습방법 모형의 다른 3가지 어휘표현방법 3가지를 모형별로 비교 분석하였다. 분석결과 인공신경망모형은 상당한 예측력을 갖고 있는 것으로 판명되었으며, 특히 CART를 기반으로 한 일상어휘 기반의 선물가격예측 모형은 예측력이 높은 것으로 나타났다.

  • PDF

Kullback-Leibler Information-Based Tests of Fit for Inverse Gaussian Distribution (역가우스분포에 대한 쿨백-라이블러 정보 기반 적합도 검정)

  • Choi, Byung-Jin
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.6
    • /
    • pp.1271-1284
    • /
    • 2011
  • The entropy-based test of fit for the inverse Gaussian distribution presented by Mudholkar and Tian(2002) can only be applied to the composite hypothesis that a sample is drawn from an inverse Gaussian distribution with both the location and scale parameters unknown. In application, however, a researcher may want a test of fit either for an inverse Gaussian distribution with one parameter known or for an inverse Gaussian distribution with both the two partameters known. In this paper, we introduce tests of fit for the inverse Gaussian distribution based on the Kullback-Leibler information as an extension of the entropy-based test. A window size should be chosen to implement the proposed tests. By means of Monte Carlo simulations, window sizes are determined for a wide range of sample sizes and the corresponding critical values of the test statistics are estimated. The results of power analysis for various alternatives report that the Kullback-Leibler information-based goodness-of-fit tests have good power.

A study on Link Travel Time Estimating Methodology for Traffic Information Service (Determination of an Adequate Sample Size) (교통정보제공을 위한 구간통행시간 산출 방법론 연구 (적정표본수 결정방법을 중심으로))

  • 이영인;이정희
    • Journal of Korean Society of Transportation
    • /
    • v.20 no.3
    • /
    • pp.55-67
    • /
    • 2002
  • 구간검지체계를 기반으로 한 첨단교통정보제공시스템(Advanced Traveler Information Systems)은 그 기능 수행시 다음의 중요 고려사항을 지닌다. 첫째는 제공 정보의 신뢰성이며, 둘째는 정보수집비용에 관련한 수집자료수의 한계이다. 본 논문에서는 이러한 한계성 극복을 위해 보다 대표성 있는 교통정보 형태의 설정 및 통계적으로 신뢰성 있는 정보산출을 위해 요구되는 적정표본수의 결정에 대한 연구를 수행하였다. 도시고속도로(올림픽대로)와 도시간선도로(천호대로)의 실측 구간통행시간분포 분석결과 단일교차로 구간의 경우 다른 구간들의 단일봉(unimodal)의 정규분포형태와는 다른 두 개의 봉우리를 지닌 분포형태(bimodal)가 나타났다. 따라서 이러한 구간은 기존과는 다른 새로운 교통정보 형태가 필요하며, 본 논문에서는 모든 통과차량들의 평균통행시간으로 정의되는 한 개의 대표치가 아닌 신호주기에 의한 정지여부에 따라 분리되는 주행시간과 지체시간 또는 주행속도와 통행속도 개념의 세분화된 정보형태를 설정하였다. 또한 중심극한정리를 기초로 한 통계적인 표본수 결정식을 이용하여 설정된 신뢰수준 하에서의 정보산출을 위해 요구되는 적정 표본수를 산출하였다. 그 결과, 교통이 혼잡할수록 요구되는 표본수는 적어지는 것으로 나타났다. 우선 적정 표본수 만큼의 표본추출을 하고 제안된 정보산출 방법에 의해 교통정보를 산출한 후 실측치와의 오차를 비교하였다. 그 결과 산출된 교통정보는 신뢰수준 95%와 허용오차 5㎞/h를 만족하였다. 다음으로 구간검지체계를 이용하여 정보를 산출하는 타시스템 교통정보와의 오차율을 비교하였다. 그 결과, 실측치와 본 연구의 산출방법에 의한 교통정보, 로티스교통정보 및 차량번호판 인식시스템의 교통정보와의 비교 결과 제안된 교통정보형태의 타당성을 볼 수 있었다.

AGV Dispatching with Stochastic Simulation (확률적 시뮬레이션 기반 AGV 배차)

  • Choe, Ri;Park, Tae-Jin;Ryu, Kwang-Ryel
    • Journal of Navigation and Port Research
    • /
    • v.32 no.10
    • /
    • pp.837-844
    • /
    • 2008
  • In an automated container terminal, various factors affect the operation of container handling equipment such as quay cranes and AGVs, and thus calculating the exact operation time is nearly infeasible. This uncertainty makes it difficult to dispatch AGVs well. In this paper, we propose a simulation-based AGV dispatching algorithm When dispatching an AGV to an operation, the proposed algorithm conducts multiple stochastic simulation for the succeeding AGV operations for the predetermined period to collect stochastic samples of the result of the dispatching. In the stochastic simulation, the uncertainty of crane operations is represented as a simple probability distribution and the operation time of a crane is determined according to this. A dispatching option is evaluated by the total delay time of quay cranes which is estimated by averaging the quay crane delay of each simulation In order to collect a sufficient number of samples that guarantee the credibility of the evaluation, we devised a high-speed simulator that simulates AGV operation The effectiveness of the proposed algorithm is validated by simulation experiments.

Probability Based Motion Transformation (확률 기반의 동작 변환)

  • 장진욱;정규만;이승용
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.520-522
    • /
    • 2001
  • 본 논문에서는 동작 표본을 이용하여 내재하는 동작 특성을 추정하고, 이를 동작 변환에 적용하는 새로운 동작 변환 알고리즘을 제안한다. 기존의 역 운동학에 기반한 동작 변환 알고리즘은 우선 앤드 이펙터 (end effector)의 궤적 차이를 줄이도록 한 후, 자세 공간에서 동작간의 거리를 최소화하는 방향으로 자세를 변환시켰다. 그러나 동작간의 거리에 대한 정의가 명확하지 않고, 이렇게 생성된 동작이 동작 주체가 취할 수 있는 자세라는 보장이 없기 때문에 실존 가능성이 낮은 부자연스러운 동작이 생성될 수 있다. 본 논문에서 제안하는 방법은 역 운동학 기반의 실존 가능성이 높은 자연스러운 동작 생성을 위해 동작 주체의 동작 표본을 고려한 확률분포를 이용한다. 제시된 알고리즘을 통한 동작 변환은 실존 가능성이 높은 자연스러운 동작을 생성할 수 있다.

  • PDF

Transformation Technique for Null Space-Based Linear Discriminant Analysis with Lagrange Method (라그랑지 기법을 쓴 영 공간 기반 선형 판별 분석법의 변형 기법)

  • Hou, Yuxi;Min, Hwang-Ki;Song, Iickho;Choi, Myeong Soo;Park, Sun;Lee, Seong Ro
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.38C no.2
    • /
    • pp.208-212
    • /
    • 2013
  • Due to the singularity of the within-class scatter, linear discriminant analysis (LDA) becomes ill-posed for small sample size (SSS) problems. An extension of LDA, the null space-based LDA (NLDA) provides good discriminant performances for SSS problems. In this paper, by applying the Lagrange technique, the procedure of transforming the problem of finding the feature extractor of NLDA into a linear equation problem is derived.

Effects of Parameter Estimation in Phase I on Phase II Control Limits for Monitoring Autocorrelated Data (자기상관 데이터 모니터링에서 일단계 모수 추정이 이단계 관리한계선에 미치는 영향 연구)

  • Lee, Sungim
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.5
    • /
    • pp.1025-1034
    • /
    • 2015
  • Traditional Shewhart control charts assume that the observations are independent over time. Current progress in measurement and data collection technology lead to the presence of autocorrelated process data that may affect poor performance in statistical process control. One of the most popular charts for autocorrelated data is to model a correlative structure with an appropriate time series model and apply control chart to the sequence of residuals. Model parameters are estimated by an in-control Phase I reference sample since they are usually unknown in practice. This paper deals with the effects of parameter estimation on Phase II control limits to monitor autocorrelated data.