• 제목/요약/키워드: Validation Set

검색결과 667건 처리시간 0.025초

근적외 분광분석법을 이용한 나프록센 정제의 정량분석 (Quantification of Naproxen in Pharmaceutical Formulation using Near-Infrared Spectrometry)

  • 김도형;우영아;김효진
    • 약학회지
    • /
    • 제49권1호
    • /
    • pp.1-5
    • /
    • 2005
  • Near-infrared (NIR) spectroscopy has been widely applied in various field, since it is nondestructive and no sample preparation is required. In this paper, NIR spectroscopy was used for the determination of naproxen in a commercial pharmaceutical preparation. NIR spectroscopy was used to determine the content of naproxen in intact naproxen tablets containing 250 mg ($65.8\%$ nominal concentration) by collecting NIR spectra in the range of $1100{\sim}1750nm$. The laboratory-made samples had $46.1{\sim}85.5\%$ nominal naproxen concentration. The measurements were made by reflection using a fiber-optic probe and calibration was carried out by partial least square regression (PLSR). Model validation was performed by randomly splitting the data set into calibration and validation data set (63 samples as a calibration data set and 42 samples as a validation data set). The developed NIR calibration gave results comparable to the known values of tablets in a laboratorial manufacturing process with standard error of calibration (SEC) and standard error of prediction (SEP) of $1.06\%\;and\;1.04\%$, respectively. The NIR method showed good accuracy and repeatability. NIR spectroscopic determination in intact tablets allowed the potential use of real time monitoring for a running production process.

실제 네트워크 모니터링 환경에서의 ML 알고리즘을 이용한 트래픽 분류 (Traffic Classification Using Machine Learning Algorithms in Practical Network Monitoring Environments)

  • 정광본;최미정;김명섭;원영준;홍원기
    • 한국통신학회논문지
    • /
    • 제33권8B호
    • /
    • pp.707-718
    • /
    • 2008
  • Traffic classification의 방법은 동적으로 변하는 application의 변화에 대처하기 위하여 페이로드나 port를 기반으로 하는 것에서 ML 알고리즘을 기반으로 하는 것으로 변하여 가고 있다. 그러나 현재의 ML 알고리즘을 이용한 traffic classification 연구는 offline 환경에 맞추어 진행되고 있다. 특히, 현재의 기존 연구들은 testing 방법으로 cross validation을 이용하여 traffic classification을 수행하고 있으며, traffic flow를 기반으로 classification 결과를 제시하고 있다. 본 논문에서는 testing방법으로 cross validation과 split validation을 이용했을 때, traffic classification의 정확도 결과를 비교한다. 또한 바이트를 기반으로 한 classification의 결과와 flow를 기반으로 한 classification의 결과를 비교해 본다. 본 논문에서는 J48, REPTree, RBFNetwork, Multilayer perceptron, BayesNet, NaiveBayes와 같은 ML 알고리즘과 다양한 feature set을 이용하여 트래픽을 분류한다. 그리고 split validation을 이용한 traffic classification에 적합한 최적의 ML 알고리즘과 feature set을 제시한다.

Deformable image registration in radiation therapy

  • Oh, Seungjong;Kim, Siyong
    • Radiation Oncology Journal
    • /
    • 제35권2호
    • /
    • pp.101-111
    • /
    • 2017
  • The number of imaging data sets has significantly increased during radiation treatment after introducing a diverse range of advanced techniques into the field of radiation oncology. As a consequence, there have been many studies proposing meaningful applications of imaging data set use. These applications commonly require a method to align the data sets at a reference. Deformable image registration (DIR) is a process which satisfies this requirement by locally registering image data sets into a reference image set. DIR identifies the spatial correspondence in order to minimize the differences between two or among multiple sets of images. This article describes clinical applications, validation, and algorithms of DIR techniques. Applications of DIR in radiation treatment include dose accumulation, mathematical modeling, automatic segmentation, and functional imaging. Validation methods discussed are based on anatomical landmarks, physical phantoms, digital phantoms, and per application purpose. DIR algorithms are also briefly reviewed with respect to two algorithmic components: similarity index and deformation models.

Prediction of the compressive strength of fly ash geopolymer concrete using gene expression programming

  • Alkroosh, Iyad S.;Sarker, Prabir K.
    • Computers and Concrete
    • /
    • 제24권4호
    • /
    • pp.295-302
    • /
    • 2019
  • Evolutionary algorithms based on conventional statistical methods such as regression and classification have been widely used in data mining applications. This work involves application of gene expression programming (GEP) for predicting compressive strength of fly ash geopolymer concrete, which is gaining increasing interest as an environmentally friendly alternative of Portland cement concrete. Based on 56 test results from the existing literature, a model was obtained relating the compressive strength of fly ash geopolymer concrete with the significantly influencing mix design parameters. The predictions of the model in training and validation were evaluated. The coefficient of determination ($R^2$), mean (${\mu}$) and standard deviation (${\sigma}$) were 0.89, 1.0 and 0.12 respectively, for the training set, and 0.89, 0.99 and 0.13 respectively, for the validation set. The error of prediction by the model was also evaluated and found to be very low. This indicates that the predictions of GEP model are in close agreement with the experimental results suggesting this as a promising method for compressive strength prediction of fly ash geopolymer concrete.

Validation Measures of Bicluster Solutions

  • Lee, Young-Rok;Lee, Jeong-Hwa;Jun, Chi-Hyuck
    • Industrial Engineering and Management Systems
    • /
    • 제8권2호
    • /
    • pp.101-108
    • /
    • 2009
  • Biclustering is a method to extract subsets of objects and features from a dataset which are characterized in some way. In contrast to traditional clustering algorithms which group objects similar in a whole feature set, biclustering methods find groups of objects which have similar values or patterns in some features. Both in clustering and biclustering, validating how much the result is informative or reliable is a very important task. Whereas validation methods of cluster solutions have been studied actively, there are only few measures to validate bicluster solutions. Furthermore, the existing validation methods of bicluster solutions have some critical problems to be used in general cases. In this paper, we review several well-known validation measures for cluster and bicluster solutions and discuss their limitations. Then, we propose several improved validation indices as modified versions of existing ones.

Robust Cross Validation Score

  • Park, Dong-Ryeon
    • Communications for Statistical Applications and Methods
    • /
    • 제12권2호
    • /
    • pp.413-423
    • /
    • 2005
  • Consider the problem of estimating the underlying regression function from a set of noisy data which is contaminated by a long tailed error distribution. There exist several robust smoothing techniques and these are turned out to be very useful to reduce the influence of outlying observations. However, no matter what kind of robust smoother we use, we should choose the smoothing parameter and relatively less attention has been made for the robust bandwidth selection method. In this paper, we adopt the idea of robust location parameter estimation technique and propose the robust cross validation score functions.

근적외선분광분석기를 이용한 황금(Scutellaria baicalensis)의 baicalin 및 baicalein 함량 분석 (Determination of Baicalin and Baicalein Contents in Scutellaria baicalensis by NIRS)

  • 김효재;김세영;이영상;김용호
    • 한국자원식물학회지
    • /
    • 제27권4호
    • /
    • pp.286-292
    • /
    • 2014
  • 황금에 함유된 baicalin, baicalein 및 wogonin 함량을 근적외선분광분석기(NIRS)로 비파괴적으로 신속하게 할 수 있는 방법을 개발하였다. 황금 유전자원 63종을 대상으로 NIRS로 400~2,500 ㎚ 파장범위를 scan한 후 물리적 영향에 의한 바탕선 변화 등의 오차를 줄이고 겹쳐있는 파장을 분리하기 위하여 미분법 등을 이용한 수처리를 하였다. 수처리 후 몇 가지 회귀분석법을 이용하여 검량식을 작성한 결과 MPLS 회귀법이 황금의 유용성분을 분석하기에 적당하였으며, MPLS 회귀분석법에 의한 검량식의 baicalin, baicalein, wogonin 함량은 HPLC로 분석된 황금의 성분함량과의 상관값에서 각각 0.958, 0.944, 0.709로 나타났다. 이렇게 작성된 검량식을 이용하여 validation set에서 상관관계를 분석한 바 baicalin 함량은 0.853, baicalein은 0.895의 상관치를 보여 황금의 baicalin 및 baicalein 함량은 NIRS로 분석이 가능한 것으로 판단되었다. 한편, wogonin 함량에 대한 validation set의 결과는 0.489로 나타나 NIRS 검량식을 wogonin의 정량분석에 바로 이용하기에는 부적당하였다.

NIRS를 이용한 삼지구엽초의 이카린 함량 분석 (Quantification of Icariin Contents in Epimedium koreanum N. by Using a Near Infrared Reflectance Spectroscopy)

  • 김용호;최병열;백흠영;이영상
    • 한국약용작물학회지
    • /
    • 제10권5호
    • /
    • pp.340-343
    • /
    • 2002
  • 삼지구엽초에 함유되어 있는 icariin 함량을 신속하게 추정하기 위하여 NIRS(근적외선 분광분석기)를 이용한 분석 방법을 검토하였다. HPLC를 이용하여 분석된 삼지구엽초 유전자원 150계통에 대한 이카린 함량치를 NIRS 스펙트럼에 적용시켜 42개의 calibration set 와 26개의 valilion set를 구분하였다. NIRS의 검량식을 몇가지 방법에 의하여 비교분석한 결과 2차미분된 스텍트럼을 MPLS(Modified Partial Least Squares)를 이용한 회귀식에 이용하는 것이 가장 적합하였다. HPLC를 이용한 유전자원들의 이카린 함량은 평균 $0.424%(0.12{\sim}0.67%)$이었으며, NIRS에서 도출된 검량식과의 상관계수는 0.951을 나타내었다. 따라서 삼지구엽초의 이카린 함량은 NIRS를 이용하여 신속 편리하게 분석할 수 있음이 인정되었다.

영상 데이터 특징 커버리지 기반 딥러닝 모델 검증 기법 (Deep Learning Model Validation Method Based on Image Data Feature Coverage)

  • 임창남;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권9호
    • /
    • pp.375-384
    • /
    • 2021
  • 딥러닝 기법은 영상 처리 분야에서 높은 성능을 입증 받아 다양한 분야에서 적용되고 있다. 이러한 딥러닝 모델의 검증에 가장 널리 사용되는 방법으로는 홀드아웃 검증 방법, k-겹 교차 검증 방법, 부트스트랩 방법 등이 있다. 이러한 기존의 기법들은 데이터 셋을 분할하는 과정에서 클래스 간의 비율에 대한 균형을 고려하지만, 같은 클래스 내에서도 존재하는 다양한 특징들의 비율은 고려하지 않고 있다. 이러한 특징들을 고려하지 않을 경우, 일부 특징에 편향된 검증 결과를 얻게 될 수 있다. 따라서 본 논문에서는 기존 검증 방법들을 개선하여 영상 분류를 위한 데이터 특징 커버리지 기반의 딥러닝 모델 검증 기법을 제안한다. 제안하는 기법은 딥러닝 모델의 학습과 검증을 위한 훈련 데이터 셋과 평가 데이터 셋이 전체 데이터 셋의 특징을 얼마나 반영하고 있는지 수치로 측정할 수 있는 데이터 특징 커버리지를 제안한다. 이러한 방식은 전체 데이터 셋의 특징을 모두 포함하도록 커버리지를 보장하여 데이터 셋을 분할할 수 있고, 모델의 평가 결과를 생성한 특징 군집 단위로 분석할 수 있다. 검증결과, 훈련 데이터 셋의 데이터 특징 커버리지가 낮아질 경우, 모델이 특정 특징에 편향되게 학습하여 모델의 성능이 낮아지며, Fashion-MNIST의 경우 정확도가 8.9%까지 차이나는 것을 확인하였다.

로지스틱 회귀분석과 퍼지 기법을 이용한 산사태 취약성 지도작성: 보은군을 대상으로 (Landslide susceptibility mapping using Logistic Regression and Fuzzy Set model at the Boeun Area, Korea)

  • 알-마문;장동호
    • 한국지형학회지
    • /
    • 제23권2호
    • /
    • pp.109-125
    • /
    • 2016
  • This study aims to identify the landslide susceptible zones of Boeun area and provide reliable landslide susceptibility maps by applying different modeling methods. Aerial photographs and field survey on the Boeun area identified landslide inventory map that consists of 388 landslide locations. A total ofseven landslide causative factors (elevation, slope angle, slope aspect, geology, soil, forest and land-use) were extracted from the database and then converted into raster. Landslide causative factors were provided to investigate about the spatial relationship between each factor and landslide occurrence by using fuzzy set and logistic regression model. Fuzzy membership value and logistic regression coefficient were employed to determine each factor's rating for landslide susceptibility mapping. Then, the landslide susceptibility maps were compared and validated by cross validation technique. In the cross validation process, 50% of observed landslides were selected randomly by Excel and two success rate curves (SRC) were generated for each landslide susceptibility map. The result demonstrates the 84.34% and 83.29% accuracy ratio for logistic regression model and fuzzy set model respectively. It means that both models were very reliable and reasonable methods for landslide susceptibility analysis.