• 제목/요약/키워드: Data Set Records

검색결과 197건 처리시간 0.029초

ADVANTAGES OF USING ARTIFICIAL NEURAL NETWORKS CALIBRATION TECHNIQUES TO NEAR-INFRARED AGRICULTURAL DATA

  • Buchmann, Nils-Bo;Ian A.Cowe
    • 한국근적외분광분석학회:학술대회논문집
    • /
    • 한국근적외분광분석학회 2001년도 NIR-2001
    • /
    • pp.1032-1032
    • /
    • 2001
  • Artificial Neural Network (ANN) calibration techniques have been used commercially for agricultural applications since the mid-nineties. Global models, based on transmission data from 850 to 1050 nm, are used routinely to measure protein and moisture in wheat and barley and also moisture in triticale, rye, and oats. These models are currently used commercially in approx. 15 countries throughout the world. Results concerning earlier European ANN models are being published elsewhere. Some of the findings from that study will be discussed here. ANN models have also been developed for coarsely ground samples of compound feed and feed ingredients, again measured in transmission mode from 850 to 1050 nm. The performance of models for pig- and poultry feed will be discussed briefly. These models were developed from a very large data set (more than 20,000 records), and cover a very broad range of finished products. The prediction curves are linear over the entire range for protein, fat moisture, fibre, and starch (measured only on poultry feed), and accuracy is in line with the performance of smaller models based on Partial Least Squares (PLS). A simple bias adjustment is sufficient for calibration transfer across instruments. Recently, we have investigated the possible use of ANN for a different type of NIR spectrometer, based on reflectance data from 1100 to 2500 nm. In one study, based on data for protein, fat, and moisture measured on unground compound feed samples, dedicated ANN models for specific product classes (cattle feed, pig feed, broiler feed, and layers feed) gave moderately better Standard Errors of Prediction (SEP) compared to modified PLS (MPLS). However, if the four product classes were combined into one general calibration model, the performance of the ANN model deteriorated only slightly compared to the class-specific models, while the SEP values for the MPLS predictions doubled. Brix value in molasses is a measure of sugar content. Even with a huge dataset, PLS models were not sufficiently accurate for commercial use. In contrast an ANN model based on the same data improved the accuracy considerably and straightened out non-linearity in the prediction plot. The work of Mr. David Funk (GIPSA, U. S. Department of Agriculture) who has studied the influence of various types of spectral distortions on ANN- and PLS models, thereby providing comparative information on the robustness of these models towards instrument differences, will be discussed. This study was based on data from different classes of North American wheat measured in transmission from 850 to 1050 nm. The distortions studied included the effect of absorbance offset pathlength variation, presence of stray light bandwidth, and wavelength stretch and offset (either individually or combined). It was shown that a global ANN model was much less sensitive to most perturbations than class-specific GIPSA PLS calibrations. It is concluded that ANN models based on large data sets offer substantial advantages over PLS models with respect to accuracy, range of materials that can be handled by a single calibration, stability, transferability, and sensitivity to perturbations.

  • PDF

기계학습을 이용한 식품위생점검 체계의 효율성 개선 연구 (Improving Efficiency of Food Hygiene Surveillance System by Using Machine Learning-Based Approaches)

  • 조상구;조승용
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.53-67
    • /
    • 2020
  • 본 연구는 가공식품의 제조·가공 업소를 대상으로 기계학습 분야의 지도학습(Supervised Learning) 예측 모형을 적용하여 부적합이 예상되는 업체를 사전에 적발하는 단속 선별시스템을 마련하여 단속 활동의 효율성을 높이고자 하였다. 본 연구에서는 머신러닝의 예측 모델링을 위한 목적 정의, 데이터의 기초 분석과 시각화, 특성 변수 도출 및 예측 모형의 선정 및 예측 등으로 기계학습 수행의 표준적인 절차에 따라 연구를 수행하였다. 종속변수는 2014년도부터 2018년까지 과거 5년 동안 지도점검 적발 건수로 설정하였고, 목적함수는 실제 부적합업체를 사전에 판정하여 단속활동이 이루어지는 것을 최대화하는 것으로 하였다. 제조가공업소의 매출액, 영업일수, 종업원 수 등 기본속성뿐만 아니라 과거 지도점검 단속 이력 정보를 반영하여 자료를 재구성하였다. 특성 변수 추출 방법을 적용하여 부적합 판정에 영향을 미치는 업체 위험, 품목 위험, 환경 위험 및 과거 위반 이력 등을 특성 변수로 도출하여 머신러닝 알고리즘을 데이터에 적용하였다. 랜덤포레스트 모형이 식품의약품안전처 지도점검 업무 목적에 가장 적합한 것으로 나타났다. 본 연구결과를 바탕으로 식품안전 관리 국가 사무가 데이터기반의 과학적인 행정 체계로 발전할 수 있는 기반이 되기를 기대한다.

국공유지 필지 관리의 문제점 및 개선 방안 (A Study on the Problem and Improvement Plan of Management of Public Land Parcels)

  • 김진;정영진;김준호;이현준;홍성언
    • 한국산학기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.136-145
    • /
    • 2015
  • 본 연구에서는 현행 국공유지 필지 관리에 관한 현황 및 문제점을 분석하고, 이를 기초로 국공유지 필지의 효율적 관리를 위한 개선방안을 제시하고자 하였다. 이를 위해 국공유지 관리의 현황과 문제점을 분석하였다. 분석된 문제점으로, 필지 관리 미흡에 따라 필지 수가 지속적으로 증가하고 있는 것으로 나타났다. 증가량은 2008년 기준으로 매년 평균적으로 128,520필이 증가하고 있는 것으로 분석되었다. 그리고 현황과 지적공부의 토지이용상황이 불일치하는 문제가 나타나고 있는 것으로 분석되었다. 이와 같은 문제점에 기초해 군소필지가 난립되고, 이는 필지 관련 통계자료 조사 산정시 오류가 포함되어 통계정보의 신뢰성에 문제가 있을 수 있는 것으로 나타났다. 연구에서는 이러한 문제점을 개선하기 위한 방안으로 합병을 통한 필지수 감소, 지적확정측량을 통한 지적정보 관리의 신뢰성 확보, 현황 중심의 국공유지 필지의 등록 관리를 제시하였다.

디지털 특수자료를 위한 XML 스키마 기반의 메타데이터 표현 체계 (A Metadata Representation Scheme based on XML Schema for Special Digital Collections)

  • 오삼균;채진석
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.109-131
    • /
    • 2004
  • 정보자원의 전달 매체와 형태가 다양화됨에 따라서 이에 대한 관리방법 또한 다양화되어 왔다. 도서관 환경에서는 정보자원를 위한 관리방법으로서 AACR, KCR 등의 목록규칙이 정립되었으며 이러한 목록규칙에 근거한 정보자원관리를 자동화하고자 하는 노력의 결과로서 MARC가 개발되었다. 하지만, MARC 레코드는 서지 레코드가 지니고 있는 의미적 관계의 표현을 지원하지 못하는 구조적 경직성으로 인해 다양하고 상이한 기술적 특성을 지니는 정보자원들을 적절히 기술하는데 제약이 따른다. 즉, MARC의 기본 설계 목적이 몇몇 정보유형에는 비교적 적합하더라도 새로운 형태의 정보유형의 다양성을 지원하는데 어려움이 있다. 또한 MARC를 활용한 정보자원 관리 방식에서는 정보자원 간 연결 관계의 표현을 지원하지 못한다. 즉, MARC의 데이터 모델은 자원기술의 대상을 단일의 객체로 파악하는 단층 데이터 모델이기 때문에 여러 객체들 간의 연결 관계를 설정할 수 있는 다층 데이터 모델을 이용한 정보자원 기술이 필요한 경우는 적절치 못하다. 본 연구에서는 다층 데이터 모델을 지원하는 IFLA FRBR 기본 모델을 기초로 하여 전자도서관에서 사용되는 고서, 고문서, 음악 자료, 학술회의 및 세미나 자료의 관리에 있어서 이용자의 정보요구를 최대한 수용할 수 있는 최적의 메타데이터 모델과 이에 대한 XML 스키마 기반의 표현 체계를 제시하고자 한다.

Cumulative survival rate and associated risk factors of Implantium implants: A 10-year retrospective clinical study

  • Park, Jin-Hong;Kim, Young-Soo;Ryu, Jae-Jun;Shin, Sang-Wan;Lee, Jeong-Yol
    • The Journal of Advanced Prosthodontics
    • /
    • 제9권3호
    • /
    • pp.195-199
    • /
    • 2017
  • PURPOSE. The objective of this study was to determine the cumulative survival rate (CSR) and associated risk factors of Implantium implants by retrospective clinical study. MATERIALS AND METHODS. Patients who received Implantium implants (Dentium Co., Seoul, Korea) at Korea University Guro Hospital from 2004 to 2011 were included. The period between the first surgery and the last hospital visit until December 2015 was set as the observation period for this study. Clinical and radiographic data were collected from patient records, including all complications observed during the follow-up period. Kaplan-Meier analysis was performed to examine CSR. Multiple Cox proportional hazard model was employed to assess the associations between potential risk factors and CSR. RESULTS. A total of 370 implants were placed in 121 patients (mean age, 56.1 years; range, 19 to 75 years). Of the 370 implants, 13 failed, including 7 implants that were lost before loading. The 10-year cumulative survival rate of implants was 94.8%. The multiple Cox proportional hazard model revealed that significant risk factor of implant failure were smoking and maxillary implant (P<.05). CONCLUSION. The 10-year CSR of Implantium implants was 94.8%. Risk factors of implant failure were smoking and maxillary implant.

관상동맥우회술의 중증도 측정과 병원 사망률 비교에 관한 연구 (Severity Measurement Methods and Comparing Hospital Death Rates for Coronary Artery Bypass Graft Surgery)

  • 안형식;신영수;권영대
    • Journal of Preventive Medicine and Public Health
    • /
    • 제34권3호
    • /
    • pp.244-252
    • /
    • 2001
  • Objective : Health insurers and policy makers are increasingly examining the hospital mortality rate as an indicator of hospital quality and performance. To be meaningful, a risk-adjustment of the death rates must be implemented. This study reviewed 5 severity measurement methods and applied them to the same data set to determine whether judgments regarding the severity-adjusted hospital mortality rates were sensitive to the specific severity measure. Methods : The medical records of 584 patients who underwent coronary artery bypass graft surgery in 6 general hospitals during 1996 and 1997 were reviewed by trained nurses. The MedisGroups, Disease Staging, Computerized Severity Index, APACHE III and KDRG were used to quantify severity of the patients. The predictive probability of death was calculated for each patient in the sample from a multivariate logistic regression model including the severity score, age and sex to evaluate the hospitals' performance, the ratio of the observed number of deaths to the expected number for each hospital was calculated. Results : The overall in-hospital mortality rate was 7.0%, ranging from 2.7% to 15.7% depending on the particular hospital. After the severity adjustment, the mortality rates for each hospital showed little difference according to the severity measure. The 5 severity measurement methods varied in their statistical performance. All had a higher c statistic and $R^2$ than the model containing only age and sex. There was a little difference in the relative hospital performance evaluation by the severity measure. Conclusion : These results suggest that judgments regarding a hospital's performance based on severity adjusted mortality can be sensitive to the severity measurement method. Although the 5 severity measures regarding hospital performance concurred, more often than would be expected by chance, the assessment of an individual hospital mortality rates varied by the different severity measurement method used.

  • PDF

BioPebble: 개인화된 해석을 지원하는 돌 타입 휴대용 생체신호 측정센서 (BioPebble: Stone-type physiological sensing device Supporting personalized physiological signal analysis)

  • 최아영;박고은;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.13-18
    • /
    • 2008
  • 최근 건강 관리에 대한 관심이 증가하면서 착용형 생체 신호 센서, 재택형 무구속계측 센서에 관한 연구가 활발하게 진행되고 있다. 그러나, 측정 기술의 발전과 달리 측정결과를 제공하는 단계에서는 심장 박동수, 체온 등의 값을 단일된 임계치 기반으로 판단하며, 분석된 결과가 사용자에게 어떤 의미를 주는지에 대한 해석은 제공하지 않고 있다. 따라서 본 논문에서는 사용하기 편한 돌 형태의 휴대형 생체신호 측정센서를 기반으로 사용자 별로 적합한 생체신호 해석 방법을 제안한다. 개인화된 생체 신호 해석을 위해 1 주일간 사용자의 시간대별 데이터를 획득하고 사용자 별 특성에 따라 모델링을 한 후, 모델에 기반하여 사용자에게 맞는 생체 신호 범위를 정하고 이를 판단하는 근거로 활용한다, 센서는 기존의 착용형 생체 신호 센서 및 이를 이용한 응용에 폭넓게 사용될 수 있다.

  • PDF

언해의서 비교고찰을 통한 한의학용어의 번역표준안 - 『언해두창집요』, 『언해구급방』, 『언해태산집요』를 중심으로 (Standard Translation of Terms of Korean Medicine through Consideration of Chinese-Korean Collated Medical Classics - With focus on 『Eonhaegugeupbang』, 『Eonhaetaesanjipyo』 and 『Eonhaetaesanjipyo』 -)

  • 구현희;김현구;이정현;오준호;권오민
    • 한국한의학연구원논문집
    • /
    • 제18권3호
    • /
    • pp.49-61
    • /
    • 2012
  • This article set out to develop an old Chinese - modern Korean collated terminology by analyzing and paralleling Chinese-Korean translational terms relevant to Korean medicine at a minimum meaning unit from "Eonhaegugeupbang", "Eonhaetaesanjipyo" and "Eonhaetaesanjipyo". Those are composed of original Chinese texts and their subsequent corresponding Korean translations. It tries to make a list of translational standards of Korean medicine terms by classifying the cases of translational ambiguity in terms of disease, body position, thumbnail-pressing acupuncture method, and disease-curing method. The above-mentioned ancient books are medical classics written by Huh Jun, the representative medical physician, and published by the Joseon government. Thus, they are appropriate enough as historically legitimate medical documents, from which are drawn out words and terms to form an old Chinese - modern Korean collation dictionary. This collation glossary will contribute to the increased relevance of data ming, or information retrieval. in a database system and information search engine of massive Korean medical records, by means of providing a novel way to obtaining synchronized results between the original writings of old Chinese and the secondary translated ones of modern Korean. The glossary will promote the collective but consistent translation of numerous old archives of Korean medicine and in other related fields as well.

Molecular biomarkers in extrahepatic bile duct cancer patients undergoing chemoradiotherapy for gross residual disease after surgery

  • Koh, Hyeon Kang;Park, Hae Jin;Kim, Kyubo;Chie, Eui Kyu;Min, Hye Sook;Ha, Sung W.
    • Radiation Oncology Journal
    • /
    • 제30권4호
    • /
    • pp.197-204
    • /
    • 2012
  • Purpose: To analyze the outcomes of chemoradiotherapy for extrahepatic bile duct (EHBD) cancer patients who underwent R2 resection or bypass surgery and to identify prognostic factors affecting clinical outcomes, especially in terms of molecular biomarkers. Materials and Methods: Medical records of 21 patients with EHBD cancer who underwent R2 resection or bypass surgery followed by chemoradiotherapy from May 2001 to June 2010 were retrospectively reviewed. All surgical specimens were reevaluated by immunohistochemical staining using phosphorylated protein kinase B (pAKT), CD24, matrix metalloproteinase 9 (MMP9), survivin, and ${\beta}$-catenin antibodies. The relationship between clinical outcomes and immunohistochemical results was investigated. Results: At a median follow-up of 20 months, the actuarial 2-year locoregional progression-free, distant metastasis-free and overall survival were 37%, 56%, and 54%, respectively. On univariate analysis using clinicopathologic factors, there was no significant prognostic factor. In the immunohistochemical staining, cytoplasmic staining, and nuclear staining of pAKT was positive in 10 and 6 patients, respectively. There were positive CD24 in 7 patients, MMP9 in 16 patients, survivin in 8 patients, and ${\beta}$-catenin in 3 patients. On univariate analysis, there was no significant value of immunohistochemical results for clinical outcomes. Conclusion: There was no significant association between clinical outcomes of patients with EHBD cancer who received chemoradiotherapy after R2 resection or bypass surgery and pAKT, CD24, MMP9, survivin, and ${\beta}$-catenin. Future research is needed on a larger data set or with other molecular biomarkers.

3-점 평균 피벗 퀵정렬 (3-Points Average Pivot Quicksort)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.295-301
    • /
    • 2014
  • 데이터를 정렬하는 방법들 중 O(n log n)보다 빠른 방법은 알려져 있지 않고 있으며, 가장 빠른 방법으로 퀵정렬이 있다. n개의 데이터에 대해 퀵정렬은 최적의 경우 O(n log n), 최악의 경우 $O(n^2)$ 수행 복잡도를 갖고 있다. 본 논문에서는 퀵정렬보다 빠르게 정렬하는 방법으로, 분할된 리스트의 첫 번째 L=a[s], 마지막 H=a[e]과 중간 $M=[{\lfloor}(s+e)/2{\rfloor}]$에 대해 P=(L+M+H)/3의 3-점 평균을 피벗값으로 결정하는 방법을 제안하였다. 실험 결과 제안된 3-점 평균 피벗 퀵정렬은 최적, 평균, 최악 모두 수행 복잡도가 O(n log n)으로 퀵정렬의 $O(n^2)$ 정렬 시간을 단축시킬 수 있었다.