• 제목/요약/키워드: Sum of squares

검색결과 192건 처리시간 0.02초

Rank-Based Nonlinear Normalization of Oligonucleotide Arrays

  • Park, Peter J.;Kohane, Isaac S.;Kim, Ju Han
    • Genomics & Informatics
    • /
    • 제1권2호
    • /
    • pp.94-100
    • /
    • 2003
  • Motivation: Many have observed a nonlinear relationship between the signal intensity and the transcript abundance in microarray data. The first step in analyzing the data is to normalize it properly, and this should include a correction for the nonlinearity. The commonly used linear normalization schemes do not address this problem. Results: Nonlinearity is present in both cDNA and oligonucleotide arrays, but we concentrate on the latter in this paper. Across a set of chips, we identify those genes whose within-chip ranks are relatively constant compared to other genes of similar intensity. For each gene, we compute the sum of the squares of the differences in its within-chip ranks between every pair of chips as our statistic and we select a small fraction of the genes with the minimal changes in ranks at each intensity level. These genes are most likely to be non-differentially expressed and are subsequently used in the normalization procedure. This method is a generalization of the rank-invariant normalization (Li and Wong, 2001), using all available chips rather than two at a time to gather more information, while using the chip that is least likely to be affected by nonlinear effects as the reference chip. The assumption in our method is that there are at least a small number of non­differentially expressed genes across the intensity range. The normalized expression values can be substantially different from the unnormalized values and may result in altered down-stream analysis.

근적외선을 이용한 사과의 당도예측 (II) - 부분최소제곱 및 인공신경회로망 모델 - (Predicting the Soluble Solids of Apples by Near Infrared Spectroscopy (II) - PLS and ANN Models -)

  • 이강진;;;노상하
    • Journal of Biosystems Engineering
    • /
    • 제23권6호
    • /
    • pp.571-582
    • /
    • 1998
  • The PLS(Partial Least Square) and ANN(Artificial Neural Network) were introduced to develop the soluble solids content prediction model of apples which is followed by making a subsequent selection of photosensor. For the optimal PLS model, number of factors needed for spectrum analysis were increased until the convergence of prediction residual error sum of squares. Analysis has shown that even part of the overall wavelength with no pretreatment may turn out better performing. The best PLS model was found in the 800 to 1,100nm wavelength region without pretreatment of second derivation, having $R^2$=0.9236, bias= -0.0198bx, SEP=0.2527bx for unknown samples. On the other hand, for the ANN model the second derivation led to higher performance. On partial range of 800 to 1,100nm wavelengh region, prediction model with second derivation for unknown samples reached $R^2$=0.9177, SEP=0.2903bx in contrast to $R^2$=0.7507, SEP =0.4622bx without pretreatment.

  • PDF

역공학을 위한 측정점의 영역화 (Segmentation of Measured Point Data for Reverse Engineering)

  • 양민양;이응기
    • 한국CDE학회논문집
    • /
    • 제4권3호
    • /
    • pp.173-179
    • /
    • 1999
  • In reverse engineering, when a shape containing multi-patched surfaces is digitized, the boundaries of these surfaces should be detected. The objective of this paper is to introduce a computationally efficient segmentation technique for extracting edges, ad partitioning the 3D measuring point data based on the location of the boundaries. The procedure begins with the identification of the edge points. An automatic edge-based approach is developed on the basis of local geometry. A parametric quadric surface approximation method is used to estimate the local surface curvature properties. the least-square approximation scheme minimizes the sum of the squares of the actual euclidean distance between the neighborhood data points and the parametric quadric surface. The surface curvatures and the principal directions are computed from the locally approximated surfaces. Edge points are identified as the curvature extremes, and zero-crossing, which are found from the estimated surface curvatures. After edge points are identified, edge-neighborhood chain-coding algorithm is used for forming boundary curves. The original point set is then broke down into subsets, which meet along the boundaries, by scan line algorithm. All point data are applied to each boundary loops to partition the points to different regions. Experimental results are presented to verify the developed method.

  • PDF

다중회귀모형에서 전진선택과 후진제거의 기하학적 표현 (Geometrical description based on forward selection & backward elimination methods for regression models)

  • 홍종선;김명진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.901-908
    • /
    • 2010
  • 다중회귀모형에서 변수선택법 중에서 전진선택과 후진제거의 과정을 기하학적으로 표현하는 그래픽적 방법을 제안한다. 반지름이 1인 반원의 제1사분면에는 전진선택 과정을, 제2사분면에는 후진제거 과정을 표현한다. 각 단계에서 회귀제곱합을 벡터로 표현하고, 추가제곱합 또는 부분결정계수를 벡터 사이의 각도로 나타내며 벡터의 끝을 연결할 때 통계적으로 유의하면 점선으로 표현하여 부분가설검정의 통계적 분석결과를 인지할 수 있도록 작성한다. 이 방법을 이용하면 전진선택과 후진제거 방법에 의한 최종모형을 비교 분석하고 전체적으로 모형의 적합도를 파악할 수 있다.

균형불완비블록설계의 혼합효과에서 블록간 정보 (Interblock Information from BIBD Mixed Effects)

  • 최재성
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.151-158
    • /
    • 2015
  • 본 논문은 균형불완비블록설계(balanced incomplete block design)에서 사영에 근거한 블록내(intrablock) 분석과 블록간(interblock) 분석을 다루고 있다. 블록간 분석을 위한 행렬모형을 제시하고 블록간 추정벡터를 구하는 방법을 다루고 있다. 처리효과의 블록내 추정벡터와 블록간 추정벡터의 분산공분산행렬을 규명하고 공분산행렬의 구조적 특성으로 두 추정벡터 간에 상관성이 없음을 보여주고 있다. 처리효과의 상관성없는 두 추정벡터를 이용한 결합추정에서 가중치를 구하는 방법으로 공분산행렬을 이용할 수 있음을 다루고 있다. 또한 처리효과에 적합된 블록변동량의 계산은 상수적합법을 이용한 블록제곱합과 일치함을 보여주고 있다.

로지스틱 회귀모형에서의 SUPPRESSION (Suppression for Logistic Regression Model)

  • 홍종선;김호일;함주형
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.701-712
    • /
    • 2005
  • 로지스틱 회귀모형에서 suppression의 논의는 선형회귀의 논의보다 많지 않은데 그 이유 중의 하나는 회귀제곱합 또는 결정계수의 정의가 유일하지 않고 다양하기 때문이다. 여러 종류의 결정계수들 중에서 선호되는 두 종류의 결정계수와 Liao와 McGee(2003)가 제안한 두 종류의 수정 결정계수의 정의로부터 회귀제곱합을 유도하여 로지스틱 회귀모형에서의 suppression을 설명하고자 한다. 모의실험을 통하여 자료를 생성하여 어떤 경우에 suppression이 발생하는지를 살펴보고 그 결과를 선형회귀모형에서의 suppression 결과와 비교한다.

초지수분포(Hyper-exponential)를 이용한 소프트웨어 신뢰성장 모형에 관한 연구 (The Study for NHPP Software Reliability Growth Model Based on Hyper-exponential Distribution)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제7권1호
    • /
    • pp.45-53
    • /
    • 2007
  • 유한고장수를 가진 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개당 고장 발생률은 일반적으로 상수, 혹은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 기존의 소프트웨어 신뢰성 모형인 Goel-Okumoto 모형과 Yamada-Ohba-Osaki 모형을 재조명하고 이 분야에 적용될 수 있는 hyper-exponential 분포를 이용한 모형을 제안하였다. 수치적인 예에서는 Minitab(version 14) 통계 페키지에 있는 와이블분포(형상모수가 0.5이고 척도모수가 1)에서 발생시킨 30개의 난수를 이용한 모의 실험 고장 간격시간으로 구성된 자료를 이용하였고 모수추정 방법은 최우추정법 과 일반적인 수치해석 방법인 이분법을 사용하여 모수 추정을 실시하였다. 그리고 모형 설정과 선택 판단기준은 편차 자승합을 이용한 적합도 검정이 사용되었다.

  • PDF

GPS-Based Orbit Determination for KOMPSAT-5 Satellite

  • Hwang, Yoo-La;Lee, Byoung-Sun;Kim, Young-Rok;Roh, Kyoung-Min;Jung, Ok-Chul;Kim, Hae-Dong
    • ETRI Journal
    • /
    • 제33권4호
    • /
    • pp.487-496
    • /
    • 2011
  • Korea Multi-Purpose Satellite-5 (KOMPSAT-5) is the first satellite in Korea that provides 1 m resolution synthetic aperture radar (SAR) images. Precise orbit determination (POD) using a dual-frequency IGOR receiver data is performed to conduct high-resolution SAR images. We suggest orbit determination strategies based on a differential GPS technique. Double-differenced phase observations are sampled every 30 seconds. A dynamic model approach using an estimation of general empirical acceleration every 6 minutes through a batch least-squares estimator is applied. The orbit accuracy is validated using real data from GRACE and KOMPSAT-2 as well as simulated KOMPSAT-5 data. The POD results using GRACE satellite are adjusted through satellite laser ranging data and compared with publicly available reference orbit data. Operational orbit determination satisfies 5 m root sum square (RSS) in one sigma, and POD meets the orbit accuracy requirements of less than 20 cm and 0.003 cm/s RSS in position and velocity, respectively.

잡음이 있는 두 음향 센서를 이용한 시간 지연 추정을 위한 향상된 적응 고유벡터 추정 기반 알고리즘 (Improved time delay estimation by adaptive eigenvector decomposition for two noisy acoustic sensors)

  • 임준석
    • 한국음향학회지
    • /
    • 제37권6호
    • /
    • pp.499-505
    • /
    • 2018
  • 서로 떨어져 설치된 두 개의 음향 센서에 도달하는 신호의 상호 지연 시간을 추정하는 것은 실내 음향과 소나 등에서 목표물 위치 추정 문제나 추적 및 동기화에 이르기까지 다방면에서 쓰이고 있다. 시간 지연을 구하는 방법에서는 두 수신 신호 사이의 상호 상관을 이용한 방법이 대표적이다. 그러나 이 방법은 수신 음향 센서에 잡음이 부과 되는 것에 충분한 고려가 없었다. 본 논문은 수신 음향 센서에 모두 잡음이 부과된 경우를 고려한 새로운 시간 지연 추정 방법을 제안한다. 기존의 일반 상호 상관법과 적응 고유치 분석법과 비교를 통해서 새로 제안한 알고리즘이 유색 신호에 부가된 가우시안 잡음환경에서 우수성이 있음을 확인한다.

비선형 강도함수를 가진 NHPP 소프트웨어 신뢰성장 모형에 관한 비교 연구 (The Comparative Study for NHPP Software Reliability Growth Model Based on Non-linear Intensity Function)

  • 김희철
    • 융합보안논문지
    • /
    • 제7권2호
    • /
    • pp.1-8
    • /
    • 2007
  • 유한고장수를 가진 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개당 고장 발생률 (강도함수)은 일반적으로 상수, 혹은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 기존의 소프트웨어 신뢰성 모형인 Goel-Okumoto 모형 강도함수를 재조명하고 이 분야에 적용 될수 있는 보다 넓은 왜도와 첨도를 가지는 Burr모형 강도 함수 및 의료정보분야 및 여러 분야에서 널리 사용되는 2모수 카파(Kappa(2)) 분포 모형 강도함수를 제안하여 비교하고자 한다. 수치적인 예에서는 고장 간격시간으로 구성된 NTDS(Naval Tactical Data System)자료를 이용하였고 모수추정 방법은 최우추정법과 일반적인 수치해석 방법인 이분법을 사용하여 모수 추정을 실시하였다. 그리고 모형 설정과 선택 판단기준은 편차 자승합을 이용한 적합도 검정이 사용되었다.

  • PDF