• 제목/요약/키워드: Model Validation

검색결과 3,195건 처리시간 0.029초

기업부도 예측 앙상블 모형의 최적화 (The Optimization of Ensembles for Bankruptcy Prediction)

  • 김명종;윤우섭
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.39-57
    • /
    • 2022
  • 본 연구에서는 범주 불균형 문제가 내재된 기업부도 예측 AdaBoost 앙상블 모형의 성과를 개선하기 위하여 GMOPTBoost 알고리즘을 제안한다. AdaBoost 알고리즘은 오분류 표본에 대하여 강건한 학습기회를 제공한다는 장점이 있지만, 산술평균 정확도에 기반하기 때문에 범주 불균형 문제를 효과적으로 해결하지 못한다는 한계점이 존재한다. GMOPTBoost는 가우시안 경사하강법(Gaussian gradient descent)을 적용하여 기하평균 정확도를 최적화하고 범주 불균형 문제를 효과적으로 해결할 수 있다는 장점이 있다. 본 연구에서는 첫째, 범주 불균형 문제가 예측 모형의 성과에 미치는 효과와 GMOPTBoost의 성과 개선 효과를 검증하기 위하여 5개의 범주 불균형 데이터를 구성하였으며, 둘째, 범주 균형 데이터에 대한 GMOPTBoost의 성과 개선 효과를 검증하기 위하여 데이터 샘플링 기법을 통하여 구성된 균형 데이터를 구성하였다. 30회의 교차타당성 분석의 주요 결과는 다음과 같다. 첫째, 범주 불균형 문제는 예측 성과에 부정적인 영향을 미친다. 둘째, GMOPTBoost는 불균형 데이터에 적용된 AdaBoost의 성과를 유의적으로 개선시키는 긍정적인 효과를 제공한다. 셋째, 데이터 샘플링 기법은 성과 개선에 긍정적인 영향을 미친다. 마지막으로 데이터 샘플링 기법을 적용한 범주 균형 데이터에서도 GMOPTBoost는 유의적인 성과 개선에 기여한다.

방울토마토에서 잎 표면온도를 적용한 아메리카잎굴파리(Liriomyza trifolii) 개체군 밀도변동 모형작성 및 평가 (Modeling and Validation of Population Dynamics of the American Serpentine Leafminer (Liriomyza trifolii) Using Leaf Surface Temperatures of Greenhouses Cherry Tomatoes)

  • 박정준;모형호;이두형;신기일;조기종
    • 한국응용곤충학회지
    • /
    • 제51권3호
    • /
    • pp.235-243
    • /
    • 2012
  • 중요 시설해충인 아메리카잎굴파리(Liriomyza trifolii (Burgess))의 개체군 밀도변동모형을 방울토마토 온실내 대기온도와 잎 표면온도를 이용하여 모형 정확성을 비교하였다. 모형 개발에 이용된 생물적 변수들은 기존 발표된 자료들을 사용하였고 모형 작성은 DYMEX$^{(R)}$ 프로그램을 이용하였다. 온도에 따라 상이한 발육기간과 산란수는 생리적 연령으로 표준화시킨 발육완료 분포모형, 연령 특이적 산란수 및 생존율을 비선형회귀 모형에 적합시켜 밀도변동 모형을 개발하였다. 줄내림방식의 방울토마토에서 식물체를 3개의 위치(상단: 지상 1.6 m 이상, 중단: 지상 0.9 - 1.2 m 사이, 하단: 지상 0.3 - 0.5 m 사이)로 나누고 각 위치별로 온실 내 대기 온도와 잎 표면 온도를 기록하였다. 온실 내 잎 표면 최대온도는 대기중 최대온도보다 항상 낮게 유지되고 있었으며, 하단, 상단, 중단의 순으로 온도가 낮아지는 경향을 보였다. 개발된 모형검정을 위한 초기이입 시기와 밀도는 6월초 성충 5마리가 총 50개의 알을 잎에 산란한 것으로 설정하였다. 온실 내 대기 온도와 잎 표면 온도를 이용하여 아메리카잎굴파리 유충 발육모형과 성충의 산란모형을 DYMEX로 프로그래밍하고 모의실험을 하였다. 모의실험결과를 평가하기 위해 기상자료를 수집한 동일한 온실에서 아메리카잎굴파리 유충 밀도를 육안조사 하였으나, 알, 번데기, 성충의 경우 육안조사가 어려워 대상에서 제외하였다. 육안조사결과 밀도변동패턴이 방울토마토 잎 표면 온도를 이용한 모의실험결과 밀도변동패턴과 유사하였다. 육안조사결과와 육안조사시기의 DYMEX모의실험 결과값을 상관분석 한 결과, 육안조사결과와 잎 표면 온도를 이용한 모의실험 결과가 유의한 양의 상관관계를 보였다(r = 0.97, p < 0.01). 대기 온도를 이용한 모의실험 결과와는 유의하지 않은 상관관계를 보였다(r = 0.40, p = 0.18). 본 연구결과 방울토마토 온실에서 아메리카잎굴파리 개체군 밀도변동의 적절한 예측을 위해서는 잎 표면 온도를 고려해야 하는 것으로 나타났다.

정보시스템의 지속적 사용에서 경험의 역할에 대한 분석 (An Analysis of the Roles of Experience in Information System Continuance)

  • 이웅규
    • Asia pacific journal of information systems
    • /
    • 제21권4호
    • /
    • pp.45-62
    • /
    • 2011
  • The notion of information systems (IS) continuance has recently emerged as one of the most important research issues in the field of IS. A great deal of research has been conducted thus far on the basis of theories adapted from various disciplines including consumer behaviors and social psychology, in addition to theories regarding information technology (IT) acceptance. This previous body of knowledge provides a robust research framework that can already account for the determination of IS continuance; however, this research points to other, thus-far-unelucidated determinant factors such as habit, which were not included in traditional IT acceptance frameworks, and also re-emphasizes the importance of emotion-related constructs such as satisfaction in addition to conscious intention with rational beliefs such as usefulness. Experiences should also be considered one of the most important factors determining the characteristics of information system (IS) continuance and the features distinct from those determining IS acceptance, because more experienced users may have more opportunities for IS use, which would allow them more frequent use than would be available to less experienced or non-experienced users. Interestingly, experience has dual features that may contradictorily influence IS use. On one hand, attitudes predicated on direct experience have been shown to predict behavior better than attitudes from indirect experience or without experience; as more information is available, direct experience may render IS use a more salient behavior, and may also make IS use more accessible via memory. Therefore, experience may serve to intensify the relationship between IS use and conscious intention with evaluations, On the other hand, experience may culminate in the formation of habits: greater experience may also imply more frequent performance of the behavior, which may lead to the formation of habits, Hence, like experience, users' activation of an IS may be more dependent on habit-that is, unconscious automatic use without deliberation regarding the IS-and less dependent on conscious intentions, Furthermore, experiences can provide basic information necessary for satisfaction with the use of a specific IS, thus spurring the formation of both conscious intentions and unconscious habits, Whereas IT adoption Is a one-time decision, IS continuance may be a series of users' decisions and evaluations based on satisfaction with IS use. Moreover. habits also cannot be formed without satisfaction, even when a behavior is carried out repeatedly. Thus, experiences also play a critical role in satisfaction, as satisfaction is the consequence of direct experiences of actual behaviors. In particular, emotional experiences such as enjoyment can become as influential on IS use as are utilitarian experiences such as usefulness; this is especially true in light of the modern increase in membership-based hedonic systems - including online games, web-based social network services (SNS), blogs, and portals-all of which attempt to provide users with self-fulfilling value. Therefore, in order to understand more clearly the role of experiences in IS continuance, analysis must be conducted under a research framework that includes intentions, habits, and satisfaction, as experience may not only have duration-based moderating effects on the relationship between both intention and habit and the activation of IS use, but may also have content-based positive effects on satisfaction. This is consistent with the basic assumptions regarding the determining factors in IS continuance as suggested by Oritz de Guinea and Markus: consciousness, emotion, and habit. The principal objective of this study was to explore and assess the effects of experiences in IS continuance, with special consideration given to conscious intentions and unconscious habits, as well as satisfaction. IN service of this goal, along with a review of the relevant literature regarding the effects of experiences and habit on continuous IS use, this study suggested a research model that represents the roles of experience: its moderating role in the relationships of IS continuance with both conscious intention and unconscious habit, and its antecedent role in the development of satisfaction. For the validation of this research model. Korean university student users of 'Cyworld', one of the most influential social network services in South Korea, were surveyed, and the data were analyzed via partial least square (PLS) analysis to assess the implications of this study. In result most hypotheses in our research model were statistically supported with the exception of one. Although one hypothesis was not supported, the study's findings provide us with some important implications. First the role of experience in IS continuance differs from its role in IS acceptance. Second, the use of IS was explained by the dynamic balance between habit and intention. Third, the importance of satisfaction was confirmed from the perspective of IS continuance with experience.

근적외선 분광광도계를 이용한 벼 유전자원 아밀로스 및 단백질 함량분석을 위한 모델개발 (Development of Near-Infrared Reflectance Spectroscopy (NIRS) Model for Amylose and Crude Protein Contents Analysis in Rice Germplasm)

  • 오세종;이명철;최유미;이수경;오명원;;채병수;현도윤
    • 한국자원식물학회지
    • /
    • 제30권1호
    • /
    • pp.38-49
    • /
    • 2017
  • 본 연구에서는 벼 유전자원의 이화학적 대량 분석체계 구축을 위하여 비파괴 분석 방법 중의 하나인 근적외선 분광분석(NIRS) 예측모델을 개발하고, 미지 시료 적용 시 분석 정확도와 실재 적용가능성을 평가하기 위해 교차 검정과 외부 검정을 수행하였다. NIRS 예측모델 개발을 위해 농업유전자원센터 보유자원 중 511자원을 사용하였고, 그 중 아밀로스 농도 대표자원 200점을 추가 선정하여 보존자원과 증식자원의 아밀로스 및 단백질 성분 변화를 비교하였다. 습식분석 상호비교, t-Test를 통한 통계처리 결과로 볼 때 저장고 보존자원과 증식자원 간의 중대한 이화학적 성질의 변이 현상은 관측되지 않았으므로 NIRS 예측모델 개발에 보존자원을 사용하는 것은 가능할 것으로 판단되었다. 511 자원의 습식분석 결과 아밀로스 농도는 6.15-32.25%, 단백질 농도는 4.72-14.81%였다. 현미와 현미가루의 두 가지 시료 형태에 대한 NIR 스펙트럼을 얻었고 일련의 통계적 처리를 이용하여 NIRS 예측모델을 얻었다. 현미의 $R^2$, SEC, Slope 값은 아밀로스 농도의 경우 0.906, 1.741, 0.995였고, 단백질 농도의 경우 0.941, 0.276, 1.011 이었다. 현미가루의 $R^2$, SEC, Slope 값은 아밀로스 농도의 경우 0.956, 1.159, 1.001이었고, 단백질 농도의 경우 0.982, 0.164, 1.003이었다. 이와 같은 결과로 NIRS 예측모델 개발에는 가루형태의 시료가 효율적임을 알 수 있었다. 아밀로스 농도의 경우 9.62-16.58%의 자원밀도가 상대적으로 낮은 구간에 대한 보완을 위해 추가 200자원의 습식분석, NIRS 측정 수행하였으며, 보완된 최적 NIRS 예측모델의 $R^2$, SEC, Slope 값은 아밀로스 농도의 경우 0.970, 1.010, 1.000 이었고 단백질 농도의 경우 0.983, 0.158, 0.998이었다. 최적 NIRS 예측모델의 미지시료 적용 시 정확도를 평가하기 위해 아밀로스는 132자원, 조단백질은 124자원을 검정자원으로 사용하여 외부 검정과정을 거친 결과 $R^2$, SEP 값은 아밀로스 농도의 경우 0.962, 2.349였고, 단백질 농도의 경우 0.986, 0.415였다. 이상의 결과를 종합해 볼 때 본 연구에서 개발된 NIRS 예측모델은 습식분석방법을 대체하여 벼 유전자원의 아밀로스 및 단백질 농도의 대량 분석에 효율적으로 적용 가능할 것으로 판단된다.

ERP 도입 전 구성원의 저항 (A Study on Users' Resistance toward ERP in the Pre-adoption Context)

  • 박재성;조용수;고준
    • Asia pacific journal of information systems
    • /
    • 제19권4호
    • /
    • pp.77-100
    • /
    • 2009
  • Information Systems (IS) is an essential tool for any organizations. The last decade has seen an increasing body of knowledge on IS usage. Yet, IS often fails because of its misuse or non-use. In general, decisions regarding the selection of a system, which involve the evaluation of many IS vendors and an enormous initial investment, are made not through the consensus of employees but through the top-down decision making by top managers. In situations where the selected system does not satisfy the needs of the employees, the forced use of the selected IS will only result in their resistance to it. Many organizations have been either integrating dispersed legacy systems such as archipelago or adopting a new ERP (Enterprise Resource Planning) system to enhance employee efficiency. This study examines user resistance prior to the adoption of the selected IS or ERP system. As such, this study identifies the importance of managing organizational resistance that may appear in the pre-adoption context of an integrated IS or ERP system, explores key factors influencing user resistance, and investigates how prior experience with other integrated IS or ERP systems may change the relationship between the affecting factors and user resistance. This study focuses on organizational members' resistance and the affecting factors in the pre-adoption context of an integrated IS or ERP system rather than in the context of an ERP adoption itself or ERP post-adoption. Based on prior literature, this study proposes a research model that considers six key variables, including perceived benefit, system complexity, fitness with existing tasks, attitude toward change, the psychological reactance trait, and perceived IT competence. They are considered as independent variables affecting user resistance toward an integrated IS or ERP system. This study also introduces the concept of prior experience (i.e., whether a user has prior experience with an integrated IS or ERP system) as a moderating variable to examine the impact of perceived benefit and attitude toward change in user resistance. As such, we propose eight hypotheses with respect to the model. For the empirical validation of the hypotheses, we developed relevant instruments for each research variable based on prior literature and surveyed 95 professional researchers and the administrative staff of the Korea Photonics Technology Institute (KOPTI). We examined the organizational characteristics of KOPTI, the reasons behind their adoption of an ERP system, process changes caused by the introduction of the system, and employees' resistance/attitude toward the system at the time of the introduction. The results of the multiple regression analysis suggest that, among the six variables, perceived benefit, complexity, attitude toward change, and the psychological reactance trait significantly influence user resistance. These results further suggest that top management should manage the psychological states of their employees in order to minimize their resistance to the forced IS, even in the new system pre-adoption context. In addition, the moderating variable-prior experience was found to change the strength of the relationship between attitude toward change and system resistance. That is, the effect of attitude toward change in user resistance was significantly stronger in those with prior experience than those with no prior experience. This result implies that those with prior experience should be identified and provided with some type of attitude training or change management programs to minimize their resistance to the adoption of a system. This study contributes to the IS field by providing practical implications for IS practitioners. This study identifies system resistance stimuli of users, focusing on the pre-adoption context in a forced ERP system environment. We have empirically validated the proposed research model by examining several significant factors affecting user resistance against the adoption of an ERP system. In particular, we find a clear and significant role of the moderating variable, prior ERP usage experience, in the relationship between the affecting factors and user resistance. The results of the study suggest the importance of appropriately managing the factors that affect user resistance in organizations that plan to introduce a new ERP system or integrate legacy systems. Moreover, this study offers to practitioners several specific strategies (in particular, the categorization of users by their prior usage experience) for alleviating the resistant behaviors of users in the process of the ERP adoption before a system becomes available to them. Despite the valuable contributions of this study, there are also some limitations which will be discussed in this paper to make the study more complete and consistent.

유탕 과자 모델에서 결합형 3-monochloropropane-1,2-diol 생성에 영향을 미치는 요인 (Factors affecting the formation of bound 3-monochloropropane-1,2-diol in a fried snack model)

  • 강준혁;정우영;노회진;백형희
    • 한국식품과학회지
    • /
    • 제52권6호
    • /
    • pp.565-572
    • /
    • 2020
  • 본 연구에서는 유탕 과자 모델에서 4가지 요인(유화제 종류, 유탕 온도, 소금 함량, 유지 함량)이 결합형 3-MCPD의 생성에 미치는 영향에 대해 알아보았다. 먼저 3-MCPD 분석법 검증을 위해 검출한계, 정량한계, 직선성, 정밀성 및 정확성을 구하였고, 분석 시 흡착 컬럼으로 사용한 aluminum oxide와 Extrelut® NT-3 컬럼을 비교하였다. Aluminum oxide에 비해 Extrelut® NT-3 컬럼으로 추출하였을 때 피크 면적이 약 5배 더 높아, 흡착 컬럼으로 Extrelut® NT-3를 사용하는 방법이 3-MCPD 분석에 더 적합할 것으로 생각되었다. 직선성은 3-MCPD 표준용액 검량선의 상관계수가 0.9997 이상의 양호한 직선성을 보였다. 기기의 검출한계는 0.86 ng/mL, 정량 한계는 2.61 ng/mL이었다. 분석법의 정밀성 및 정확성은 과자 반죽을 이용하여 비교하였다. 3-MCPD 분석법의 일내 정확성은 81.3-94.0%, 일간 정확성은 82.1-89.0% 수준이었으며, 결합형 3-MCPD 분석법의 일내 정확성은 84.1-99.3%, 일간 정확성은 87.7-91.1% 수준이었다. 3-MCPD 분석법의 일내 정밀성은 1.5-7.8% RSD, 일간 정밀성은 1.1-5.6% RSD 수준이었으며, 결합형 3-MCPD 분석법의 일내 정밀성은 2.8-8.9% RSD, 일간 정밀성은 5.0-6.8% RSD 수준이었다. 유탕 과자 모델에서 유화제 종류는 결합형 3-MCPD 생성에 영향을 주어 유화제 6종 중 글리세린지방산에스테르를 첨가한 시료에서 가장 많은 결합형 3-MCPD가 검출되었다. 유탕 온도에 따른 결합형 3-MCPD 생성량을 분석한 결과 온도가 증가함에 따라 결합형 3-MCPD의 함량도 증가하였다. 190℃로 가열하였을때 145℃에 비해 결합형 3-MCPD 함량은 약 24배 높았다. 소금 함량 또한 결합형 3-MCPD 생성에 영향을 주어 소금 함량에 비례하여 결합형 3-MCPD의 생성량이 유의적으로 증가하였다. 유지 함량에 따른 결합형 3-MCPD 생성량을 분석한 결과 유지 함량이 증가하여도 결합형 3-MCPD의 생성량에는 유의적인 차이가 없었다. 본 연구를 통해 유탕 과자에서 유화제 종류, 유탕 온도와 소금 함량이 결합형 3-MCPD의 생성에 영향을 미치는 것으로 확인되었다.

터널 내 딥러닝 객체인식 오탐지 데이터의 반복 재학습을 통한 자가 추론 성능 향상 방법에 관한 연구 (A study on improving self-inference performance through iterative retraining of false positives of deep-learning object detection in tunnels)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제26권2호
    • /
    • pp.129-152
    • /
    • 2024
  • 터널 내 CCTV를 통한 딥러닝 객체인식 적용에 있어서 터널의 열악한 환경조건, 즉 낮은 조도 및 심한 원근현상으로 인해 오탐지가 대량 발생한다. 이 문제는 객체인식 성능에 기반한 영상유고시스템의 신뢰성 문제로 직결되므로 정탐지 향상과 더불어 오탐지의 저감 방안이 더욱 필요한 상황이다. 이에 본 논문은 딥러닝 객체인식 모델을 기반으로, 오탐지 데이터의 재학습을 통해 오탐지의 저감뿐만 아니라 정탐지 성능 향상도 함께 추구하는 오탐지 학습법을 제안한다. 본 논문의 오탐지 학습법은 객체인식 단계를 기반으로 진행되며, 학습용 데이터셋 초기학습 - 검증용 데이터셋 추론 - 오탐지 데이터 정정 및 데이터셋 구성 - 학습용 데이터셋에 추가 후 재학습으로 이어진다. 본 논문은 이에 대한 성능을 검증하기 위해 실험을 진행하였으며, 우선 선행 실험을 통해 본 실험에 적용할 딥러닝 객체인식 모델의 최적 하이퍼파라미터를 결정하였다. 그리고 본 실험에서는 학습영상 포맷을 결정하기 위한 실험, 반복적인 오탐지 데이터셋의 재학습을 통해 장기적인 성능향상을 확인하기 위한 실험을 순차적으로 진행하였다. 그 결과, 첫 번째 본 실험에서는 추론된 영상 내에서 객체를 제외한 배경을 제거시키는 경우보다 배경을 포함시키는 경우가 객체인식 성능에 유리한 것으로 나타났으며, 두 번째 본 실험에서는 재학습 차수별 독립적으로 오탐지 데이터를 재학습시키는 경우보다 차수마다 발생하는 오탐지 데이터를 누적시켜 재학습 시키는 경우가 지속적인 객체인식 성능 향상 측면에서 유리한 것으로 나타났다. 두 실험을 통해 결정된 방법으로 오탐지 데이터 재학습을 진행한 결과, 차량 객체 클래스는 1차 재학습 이후부터 AP값이 0.95 이상 우수한 추론 성능이 발현되었으며, 5차 재학습까지 초기 추론 대비 약 1.06배 추론성능이 향상되었다. 보행자 객체 클래스는 재학습이 진행됨에 따라 지속적으로 추론 성능이 향상되었으며, 18차 재학습까지 초기 추론대비 2.3배 이상 추론성능이 자가 향상될 수 있음을 보였다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

국가 감염병 공동R&D전략 수립을 위한 분류체계 및 정보서비스에 대한 연구: 해외 코로나바이러스 R&D과제의 분류모델을 중심으로 (The Classification System and Information Service for Establishing a National Collaborative R&D Strategy in Infectious Diseases: Focusing on the Classification Model for Overseas Coronavirus R&D Projects)

  • 이도연;이재성;전승표;김근환
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.127-147
    • /
    • 2020
  • 세계는 신형 코로나바이러스 감염증(COVID-19)으로 수 많은 인명 피해와 경제적 손실을 기록하고 있는 상황이다. 우리나라 정부는 연구개발(Research & Development)을 통해 국가 감염병 위기를 극복하려는 전략을 수립하고 실행하기 위한 투자방향을 수립하였다. 기존 기술분류나 과학기술 표준분류에 따른 통계를 활용하면 특정 R&D 분야의 특이점 및 변화를 발견하기 어렵다는 한계가 존재해왔다. 최근 우리나라 감염병 연구개발 과제를 대상으로 수요자의 목적에 맞게 분류체계를 수립하고 연구비 비교 분석을 통해 투자가 요구되는 연구 분야를 제시하는 연구들이 진행되었다. 하지만 현재 국가 보건 안보와 신성장 산업육성이라는 목표를 달성하기 위한 실행방안으로 요구되고 있는 전염병 연구분야의 국가간 협력전략 수립에 필요한 정보를 체계적으로 제공하고 있지 못한 상황이다. 따라서 국가 공동 연구개발 전략 수립을 위한 분류체계와 분류모델기반의 정보서비스에 대한 연구가 요구되고 있다. 우선 감염병관련 NTIS 과제데이터를 기반으로 정성분석을 통해 7개의 분류체계를 도출하였다. 스코퍼스(Scopus) 데이터와 양방향 RNN모델을 사용하여, 분류체계 모델을 학습시켰다. 최종적인 모델의 분류 성능은 90%이상의 높은 정확도와 강건성을 확보하였다. 실증연구를 위해 주요 국가의 코로나바이러스 연구개발 과제를 대상으로 전염병 분류체계를 적용하였다. 주요 국가의 감염병(코로나바이러스) 연구개발 과제를 분류체계별로 분석한 결과, 세계적으로 유행하는 바이러스의 예상치 못한 창궐이 확산되는 속도에 비해 백신과 치료제 개발이 제대로 이뤄지지 않는 원인의 배경을 간접적으로 확인할 수 있었다. 국가별 비교분석을 통해 미국과 일본은 상대적으로 모든 영역에 골고루 연구개발 투자를 하고 있는 것으로 나타난 반면, 유럽은 상대적으로 특정 연구분야에 많은 투자를 하는 집중화 전략을 취하는 것으로 나타났다. 동시에 주요 국가의 코로나 바이러스 주요 연구조직에 대한 정보를 분류체계별로 제공하여 국제 공동R&D 전략의 기초정보를 제공하였다. 본 연구 결과를 통해 세 가지 정책적 의미를 도출할 수 있다. 첫째, 데이터기반 과학기술정책 관점에서 수요자 관심분야에 대한 국가 R&D사업의 정보를 글로벌 기준으로 문서를 분류하는 방안을 제시하였다. 둘째, 감염병관련 국가 R&D사업 영역에 대한 정보분석 서비스 기획의 기반을 마련하였다. 마지막으로 국가 감염병 R&D 분류체계 수립을 통해 분류 체계의 궁극적 목표인 산업, 기업, 정책 정보를 제공할 수 있는 기반을 마련한 것이다.

Prediction of Growth of Escherichia coli O157 : H7 in Lettuce Treated with Alkaline Electrolyzed Water at Different Temperatures

  • Ding, Tian;Jin, Yong-Guo;Rahman, S.M.E.;Kim, Jai-Moung;Choi, Kang-Hyun;Choi, Gye-Sun;Oh, Deog-Hwan
    • 한국식품위생안전성학회지
    • /
    • 제24권3호
    • /
    • pp.232-237
    • /
    • 2009
  • 본 연구는 오염된 양상치를 알카리전해수로 세척한 처리구와 비처리구에 오염된 E. coli O157 : H7균이 다양한 온도 (4, 10, 15, 20, 25, 30, $35^{\circ}C$)에 저장할 경우 이균의 specific growth rate (SCR) 과 lag time (LT) 생육변수에 미치는 영향을 조사하기 위한 모델을 개발하기 위하여 수행되었다. E. coli O157 : H7의 specific growth rate (SGR) 과 lag time (LT)를 결정하기 위해 생육도를 Gompertz 식을 사용하여 fitting한 결과, $R^2$값이 0.994로 나타났다. 실험값으로부터 얻은 SGR과 LT는 저장온도에 의존하는 것으로 나타났으며 $4^{\circ}C$에서 $35^{\circ}C$까지 온도가 증가할수록 성장 속도가 증가하는 것으로 나타났다. AIEW 처리구 또는 비처리구의 양상치 에서 E. coli O157 : H7의 성장 kinetics에 대한 저장 온도의 효과를 평가하기 위해 SRG에 대한 두개의 모델을 개발하였다. 유도된 2개의 모델 검증은 $R^2$, $R^2_{Adj}$ (adjusted determination coefficient) 및 MSE (mean square error)를 적용하였으며, 그 결과 $R^2$, $R^2_{Adj}$가 1 (>0.93)에 근접하였으며, 알카리 전해수 처리구 및 비처리구 양상치 모델의 MSE는 각각 0.031, 0.025로 나타났다. 따라서, 본연구에서 개발된 모델의 생육변수는 실험 치에서 얻은 E. coli O157 : H7의 생육변수 결과와 매우 유사한 것으로 나타났다.