• 제목/요약/키워드: Feature Importance Analysis

검색결과 135건 처리시간 0.031초

사회공헌관리 시스템의 프로토타입 설계 및 구현 (Design and Implementation of Prototype System for Management of Social Contribution)

  • 석윤영;최선오
    • 문화기술의 융합
    • /
    • 제5권1호
    • /
    • pp.319-325
    • /
    • 2019
  • 사회공헌활동의 중요성이 대두되고 사회적인 인식의 전환으로 많은 대학과 기관에서 사회봉사 활동이 이뤄지고 있다. 자원봉사 포털 사이트는 성능이 우수하고 접근성이 좋지만 개인정보로 인해 특정 조직 구성원의 봉사실적을 종합적으로 관리할 수 없다. 조직의 사회봉사 담당자들은 대부분 사회봉사활동 관리 프로그램이 없이 수작업으로 구성원들의 사회봉사 활동을 관리하고 있다. 본 연구에서는 기존의 사회봉사 관리 포털 사이트의 특징을 분석하고, 사회공헌 관리 시스템에 대한 설문조사를 토대로 대학이나 기관이 구성원들의 사회봉사 활동을 체계적으로 지원하고 관리할 수 있도록 사회공헌 관리 시스템의 모델로서 프로토타입을 설계하고 개발하였다.

Application of Statistical and Machine Learning Techniques for Habitat Potential Mapping of Siberian Roe Deer in South Korea

  • Lee, Saro;Rezaie, Fatemeh
    • Proceedings of the National Institute of Ecology of the Republic of Korea
    • /
    • 제2권1호
    • /
    • pp.1-14
    • /
    • 2021
  • The study has been carried out with an objective to prepare Siberian roe deer habitat potential maps in South Korea based on three geographic information system-based models including frequency ratio (FR) as a bivariate statistical approach as well as convolutional neural network (CNN) and long short-term memory (LSTM) as machine learning algorithms. According to field observations, 741 locations were reported as roe deer's habitat preferences. The dataset were divided with a proportion of 70:30 for constructing models and validation purposes. Through FR model, a total of 10 influential factors were opted for the modelling process, namely altitude, valley depth, slope height, topographic position index (TPI), topographic wetness index (TWI), normalized difference water index, drainage density, road density, radar intensity, and morphological feature. The results of variable importance analysis determined that TPI, TWI, altitude and valley depth have higher impact on predicting. Furthermore, the area under the receiver operating characteristic (ROC) curve was applied to assess the prediction accuracies of three models. The results showed that all the models almost have similar performances, but LSTM model had relatively higher prediction ability in comparison to FR and CNN models with the accuracy of 76% and 73% during the training and validation process. The obtained map of LSTM model was categorized into five classes of potentiality including very low, low, moderate, high and very high with proportions of 19.70%, 19.81%, 19.31%, 19.86%, and 21.31%, respectively. The resultant potential maps may be valuable to monitor and preserve the Siberian roe deer habitats.

쾌삭 303계 스테인리스강 소형 압연 선재 제조 공정의 생산품질 예측 모형 (Quality Prediction Model for Manufacturing Process of Free-Machining 303-series Stainless Steel Small Rolling Wire Rods)

  • 서석준;김흥섭
    • 산업경영시스템학회지
    • /
    • 제44권4호
    • /
    • pp.12-22
    • /
    • 2021
  • This article suggests the machine learning model, i.e., classifier, for predicting the production quality of free-machining 303-series stainless steel(STS303) small rolling wire rods according to the operating condition of the manufacturing process. For the development of the classifier, manufacturing data for 37 operating variables were collected from the manufacturing execution system(MES) of Company S, and the 12 types of derived variables were generated based on literature review and interviews with field experts. This research was performed with data preprocessing, exploratory data analysis, feature selection, machine learning modeling, and the evaluation of alternative models. In the preprocessing stage, missing values and outliers are removed, and oversampling using SMOTE(Synthetic oversampling technique) to resolve data imbalance. Features are selected by variable importance of LASSO(Least absolute shrinkage and selection operator) regression, extreme gradient boosting(XGBoost), and random forest models. Finally, logistic regression, support vector machine(SVM), random forest, and XGBoost are developed as a classifier to predict the adequate or defective products with new operating conditions. The optimal hyper-parameters for each model are investigated by the grid search and random search methods based on k-fold cross-validation. As a result of the experiment, XGBoost showed relatively high predictive performance compared to other models with an accuracy of 0.9929, specificity of 0.9372, F1-score of 0.9963, and logarithmic loss of 0.0209. The classifier developed in this study is expected to improve productivity by enabling effective management of the manufacturing process for the STS303 small rolling wire rods.

머신러닝 기반 생애주기별 고혈압 위험 요인 분석 (Analysis of Hypertension Risk Factors by Life Cycle Based on Machine Learning)

  • 강성안;김소희;류민호
    • 한국산업정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.73-82
    • /
    • 2022
  • 고혈압과 같은 만성질환은 발병의 원인은 다양한 요인들이 복합적으로 작용하기 때문에 생애주기에 따라 차별화된 관리가 필요하다. 본 연구는 머신러닝을 이용해 고혈압 발병에 영향을 미치는 요인들의 생애주기별로 차이를 분석한다. 이를 위해, 질병관리청의 국민건강영양조사 데이터에 대한 전처리 및 변수 선택 과정을 거쳐 총 35개의 변수를 활용했다. 분석결과, 트리기반 머신러닝 모델 중 XGBoost가 중년과 노년 모두 예측 성능이 높은 모델로 나타났다. 변수중요도를 통해 도출된 생애주기별 고혈압 위험요인을 살펴보면 중년의 경우 개인특성 요인, 유전적 요인, 영양섭취 요인이 고혈압 위험요인으로 나타났고, 노년의 경우 영양섭취 요인, 식생활 요인, 생활습관 요인이 고혈압 위험요인으로 도출되었다. 본 연구 결과는 생애주기별 고혈압 관리에 유용한 기초자료로 사용될 수 있을 것으로 기대된다.

텔레비전 드라마의 간호사 이미지에 대한 분석 (Contents Analysis on the Image of Nurses in the Television Drama)

  • 문영임;임미림;윤경이
    • 대한간호
    • /
    • 제37권2호
    • /
    • pp.44-52
    • /
    • 1998
  • The purpose of this study is to inquire the people's views on nursing for nurses, correct the image of nurse and take it as basis to be applied on nursing education examining the image of nursing on Television drama playing important role of mass media. 22 nurses of the characters in drama is applied to the analysis object of this study by selecting 6 dramas of Television ones the nurse play on the prime time from June 1 to August 31 in 1997. Contents analysis method was used in Data Analysis, 4 items was used after Coders previously modify and compensate it based on research documents of 1m Milim(1996) 2 Coders made the Coding the article on each person by them seeing the recorded film making the Coding Paper each items is written by the character. The average of reliability degree was 90% which measured the reliability degree by the mathod of Holsti. The statisic method of frequency, percentage was used SPSS Program in data processing The results were as follows. 1. Relative importance of 86.2% nurses in drama was depicted as extra characters 2. The affair attitude of nurses shown on drama was revealed as mechanical(84.7%), passive(45.5%), dependent(54.4%) unkind(68.2%). 3. The activity of nurses was classified with professional! simple affair. The professional affairs such as I.V., Blood Pressure Check, Rounding, Nursing Recording, Patient Education, Assist of Operation, Assistant meal of Patient, etc is mainly depicted and the screen of simple affair such as Receiving telephone, Carrying Tray or Dragging, Stretcher Car, Dressing Car and or Wheel Chair than professional affair. 4. The appearance feature of nurses was shown on thin physique(68.2%), common stature(68.2), dirty costume(45.4%), common appearance(81.9%), unnoble action(63.6%). The image of nurses is illuminated as the exterial scene of technical affair such as assisting the doctors and affair focused on accident and educational activity of nureses or extended role is nor depicted on Television drama. Therefore, the people regard the nurse as sexual object with good appearance than professional worker working professional nursing We want the following, epigraph based on above conclusion. 1. The continuous research is required on the image of nurse shown on various mass media. 2. The later research is required on appliction strategy of mass media for advancing the image of nurse. 3. The research to strengthen the objectivity by comparing analyzed data on drama & analyzing it is required 4. Through the deep study, the standard to show a concrete and professional work of nurses to scenario writers of TV drama is suggested by the association. 5. The monitoring about the mass media must be activated, not by some nurses, on a national scale and much study on the basis of this is needed.

  • PDF

Improvement of crossflow model of MULTID component in MARS-KS with inter-channel mixing model for enhancing analysis performance in rod bundle

  • Yunseok Lee;Taewan Kim
    • Nuclear Engineering and Technology
    • /
    • 제55권12호
    • /
    • pp.4357-4366
    • /
    • 2023
  • MARS-KS, a domestic regulatory confirmatory code of Republic of Korea, had been developed by integrating RELAP5/MOD2 and COBRA-TF. The integration of COBRA-TF allowed to extend the capability of MARS-KS, limited to one-dimensional analysis, to multi-dimensional analysis. The use of COBRA-TF was mainly focused on subchannel analyses for simulating multi-dimensional behavior within the reactor core. However, this feature has been remained as a legacy without ongoing maintenance. Meanwhile, MARS-KS also includes its own multidimensional component, namely MULTID, which is also feasible to simulate three-dimensional convection and diffusion. The MULTID is capable of modeling the turbulent diffusion using simple mixing length model. The implementation of the turbulent mixing is of importance for analyzing the reactor core where a disturbing cross-sectional structure of rod bundle makes the flow perturbation and corresponding mixing stronger. In addition, the presence of this turbulent behavior allows the secondary transports with net mass exchange between subchannels. However, a series of assessments performed in previous studies revealed that the turbulence model of the MULTID could not simulate the aforementioned effective mixing occurred in the subchannel-scale problems. This is obvious consequence since the physical models of the MULTID neglect the effect of mass transport and thereby, it cannot model the void drift effect and resulting phasic distribution within a bundle. Thus, in this study, the turbulence mixing model of the MULTID has been improved by means of the inter-channel mixing model, widely utilized in subchannel analysis, in order to extend the application of the MULTID to small-scale problems. A series of assessments has been performed against rod bundle experiments, namely GE 3X3 and PSBT, to evaluate the performance of the introduced mixing model. The assessment results revealed that the application of the inter-channel mixing model allowed to enhance the prediction of the MULTID in subchannel scale problems. In addition, it was indicated that the code could not predict appropriate phasic distribution in the rod bundle without the model. Considering that the proper prediction of the phasic distribution is important when considering pin-based and/or assembly-based expressions of the reactor core, the results of this study clearly indicate that the inter-channel mixing model is required for analyzing the rod bundle, appropriately.

트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법의 성능분석 (Performance analysis of Frequent Itemset Mining Technique based on Transaction Weight Constraints)

  • 윤은일;편광범
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2015
  • 최근, 아이템들의 가치를 고려한 빈발 아이템셋 마이닝 방법은 데이터 마이닝 분야에서 가장 중요한 이슈 중 하나로 활발히 연구되어왔다. 아이템들의 가치를 고려한 마이닝 기법들은 적용 방법에 따라 크게 가중화 빈발 아이템셋 마이닝, 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝, 유틸리티 아이템셋 마이닝으로 구분된다. 본 논문에서는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝들에 대해 실증적인 분석을 수행한다. 일반적으로 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법들은 데이터베이스 내 아이템들의 가치를 고려함으로써 트랜잭션 가중치를 계산한다. 또한, 그 기법들은 계산된 각 트랜잭션의 가중치를 바탕으로 가중화 빈발 아이템셋들을 마이닝 한다. 트랜잭션 가중치는 트랜잭션 내에 높은 가치의 아이템이 많이 포함 될수록 높은 값으로 나타나기 때문에 우리는 각 트랜잭션의 가중치의 분석을 통해 그 가치를 파악할 수 있다. 우리는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법 중에서 가장 유명한 알고리즘인 WIS와 WIT-FWIs, IT-FWIs-MODIFY, WIT-FWIs-DIFF의 장 단점을 분석하고 각각의 성능을 비교한다. WIS는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝의 개념과 그 기법이 처음 제안된 알고리즘이며, 전통적인 빈발 아이템셋 마이닝 기법인 Apriori를 기반으로 하고 있다. 또 다른 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 방법인 WIT-FWIs와 WIT-FWIs-MODIFY, WIT-FWIs-DIFF는 가중화된 빈발 아이템셋 마이닝을 더 효율적으로 수행하기 위해 격자구조(Lattice) 형태의 특별한 저장구조인 WIT-tree를 이용한다. WIT-tree의 각 노드에는 아이템셋 정보와 아이템셋이 포함된 트랜잭션의 ID들이 저장되며, 이 구조를 사용함으로써 아이템셋 마이닝 과정에서 발생되는 다수의 데이터베이스 스캔 과정이 감소된다. 특히, 전통적인 알고리즘들이 수많은 데이터베이스 스캔을 수행하는 반면에, 이 알고리즘들은 WIT-tree를 이용해 데이터베이스를 오직 한번만 읽음으로써 마이닝과정에서 발생 가능한 오버헤드 문제를 해결한다. 또한, 공통적으로 길이 N의 두 아이템셋을 이용해 길이 N+1의 새로운 아이템셋을 생성한다. 먼저, WIT-FWIs는 각 아이템셋이 동시에 발생되는 트랜잭션들의 정보를 활용하는 것이 특징이다. WIT-FWIs-MODIFY는 조합되는 아이템셋의 정보를 이용해 빈도수 계산에 필요한 연산을 줄인 알고리즘이다. WIT-FWIs-DIFF는 두 아이템셋 중 하나만 발생한 트랜잭션의 정보를 이용한다. 우리는 다양한 실험환경에서 각 알고리즘의 성능을 비교분석하기 위해 각 트랜잭션의 형태가 유사한 dense 데이터와 각 트랜잭션의 구성이 서로 다른 sparse 데이터를 이용해 마이닝 시간과 최대 메모리 사용량을 평가한다. 또한, 각 알고리즘의 안정성을 평가하기 위한 확장성 테스트를 수행한다. 결과적으로, dense 데이터에서는 WIT-FWIs와 WIT-FWIs-MODIFY가 다른 알고리즘들보다 좋은 성능을 보이고 sparse 데이터에서는 WIT-FWI-DIFF가 가장 좋은 효율성을 갖는다. WIS는 더 많은 연산을 수행하는 알고리즘을 기반으로 했기 때문에 평균적으로 가장 낮은 성능을 보인다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

근접사진측량과 Total Least Squares를 활용한 VLBI 안테나 형상 변형 모니터링 방안 연구 (Shape Deformation Monitoring for VLBI Antenna Using Close-Range Photogrammetry and Total Least Squares)

  • 김혁길;윤홍식
    • 한국측량학회지
    • /
    • 제34권1호
    • /
    • pp.99-107
    • /
    • 2016
  • VLBI 시스템의 정밀측위 정확도 유지를 위하여 안테나 구조물에서 발생하는 형상 변형을 분석할 수 있는 모니터링 연구가 반드시 수행되어야 한다. 특히, VLBI 안테나 주 반사경의 형상 변화로 인하여 퀘이사로부터 전자기파 수신에 대한 안테나 이득이 감소할 것으로 예상됨에 따라, 주 반사경을 대상으로 하는 형상 변형 모니터링에 대한 중요성이 증대되고 있다. 이에 따라, 본 연구에서는 향후 상시적이고 자동화된 구조 변형 모니터링 시스템으로 활용될 수 있는 근접사진측량 방법과 연계한 효율적인 알고리즘 구축을 통해 VLBI 구조물 중 가장 변형 가능성이 높은 주 반사경을 모니터링하기 위한 기반연구를 수행하였다. 이를 위해, VLBI 안테나 주 반사경의 전 방향에 분포된 특징점을 대상으로 토털최소제곱법을 활용하여 총 10개의 fitting line을 추정하고, 비교차 선들 간의 근접점 계산 알고리즘을 활용하여 추정된 fitting line들의 교차점을 계산하였다. 본 연구결과는 향후 시계열 분석을 통해 3축으로 표현된 교차점의 수치변동량을 계산함으로써 변형률뿐만 아니라 변형방향까지 예측할 수 있는 직관적인 근거자료로 활용 가능할 것으로 판단된다.

유아교육 박람회에서 데이터마이닝 기법을 이용한 전시 관람 행동 패턴 분석 (The Behavior Analysis of Exhibition Visitors using Data Mining Technique at the KIDS & EDU EXPO for Children)

  • 정민규;김혜경;최일영;이경전;김재경
    • 지능정보연구
    • /
    • 제17권2호
    • /
    • pp.77-96
    • /
    • 2011
  • 전시회는 전시업체가 새로운 상품이나 서비스를 관람객에게 알리기 위해 개최되는 것으로 효과적인 마케팅 수단으로 중요한 역할을 수행한다. 이처럼 전시회의 중요성이 점점 커짐에 따라, 국내 전시 산업은 많은 양적 성장을 이뤄왔다. 그러나, 양적 성장에 비해 전시 산업의 질적 성장은 이에 미치지 못하는 실정이다. 따라서 전시회의 질정 성장을 이루기 위해서는 관람객의 행동 패턴을 이해하여 관람객들의 전시 관람 수준과 만족도를 높일 필요성이 있다. 본 연구에서는 관람객들의 전시 관람 행동 패턴을 분석하기 위해 다음과 같은 연구 프레임워크를 사용한다. 첫 번째 단계는 본 연구의 방법론을 적용하기 적합한 전시회를 선정하는 단계이다. 두 번째 단계는 관찰 조사 방법을 수행하는 단계이다. 마지막 세 번째 단계는 수집된 자료들을 분석하는 단계이다. 분석 단계에서는 부스들의 개별 특성을 파악하였고, 더 나아가 관람객들의 전시 관람 행동 패턴을 분석하기 위해 데이터마이닝 기법을 사용하였다. 본 연구의 결과는 전시 기획자에게 유용한 정보를 제공할 뿐만 아니라 참관객들이 원하는 정보를 원하는 방식으로 제공하는 개인화서비스를 가능하게 하여 궁극적으로 전시회 관람의 질과 만족도를 크게 향상시킬 수 있을 것이라고 기대한다.