• 제목/요약/키워드: Domain classification

검색결과 553건 처리시간 0.026초

머신러닝을 이용한 빅데이터 품질진단 자동화에 관한 연구 (A Study on Automation of Big Data Quality Diagnosis Using Machine Learning)

  • 이진형
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.75-86
    • /
    • 2017
  • 본 연구에서는 빅데이터의 품질을 진단하는 방법을 자동화하는 방법을 제안하고 있다. 빅데이터의 품질진단을 자동화해야 하는 이유는 4차 산업혁명이 이슈화 되면서 과거보다 더 많은 볼륨의 데이터를 발생시키고 이 데이터들을 활용 하려는 요구가 증가하기 때문이다. 데이터는 급증하지만 데이터의 품질을 진단하기 위해 많은 시간이 소비된다면 데이터를 활용하기 위해 많은 시간이 걸리거나 데이터의 품질이 낮아질 수 있다. 그러면 이러한 낮은 품질의 데이터로부터 의사결정이나 예측을 한다면 그 결과 또한 잘못된 방향을 제시할 것이다. 이러한 문제를 해결하기 위해 많은 데이터를 신속하게 진단하고 개선할 수 있는 머신러닝 이용한 빅데이터 품질 향상을 위한 진단을 자동화 할 수 있는 모델을 개발하였다. 머신러닝을 이용하여 도메인 분류 작업을 자동화하여 도메인 분류 작업 시 발생할 수 있는 오류를 예방하고 작업 시간을 단축시켰다. 연구 결과를 토대로 데이터 변환의 중요성, 학습되지 않은 데이터에 대한 학습 시킬 수 있는 방안 모색, 도메인별 분류 모델을 개발에 대한 연구를 지속적으로 진행한다면 빅데이터를 활용하기 위한 데이터 품질 향상에 기여할 수 있을 것이다.

  • PDF

신생아 간호단위 간호중재 분석 - 3차 개정 Nursing Intervention Classification(NIC)을 적용하여 - (A Survey of the Nursing Interventions Performed by Neonatal Nursing Unit Nurses Using the NIC)

  • 오원옥;석민현;윤영미
    • Child Health Nursing Research
    • /
    • 제7권2호
    • /
    • pp.161-178
    • /
    • 2001
  • The purpose of this study was to identify nursing interventions performed by neonatal nursing unit nurses. For data collection this study used the taxonomy of Nursing Intervention Classification(NIC : 486 nursing intervention) which was modified by McCloskey & Bulecheck(2000). The new 58 nursing interventions was translated into Korean, and then modified by pannel group, which consist of clinical experts and nursing scholars and finally the 419 nursing interventions was selected. The data were collected from 112 nurses. 168 nursing interventions were performed at least monthly by 50% or more of the nurses. The high frequency of performed nursing interventions were Family domain. 37 nursing interventions were performed at least once a day. The nursing interventions receiving the highest item mean score were neonatal care, neonatal monitoring, photo-therapy; neonate, bottle feeding and temperature regulation. 56 nursing interventions were rarely performed by 90% or more of the nurses. Most of them were in the behavioral domain. The rarely used interventions were urinary bladder training, art therapy, religious addiction prevention, religious ritual enhancement and bladder irrigation. Therefore, neonatal nursing units nurses used interventions in the Physiological: basic domain most often on a daily basis and the interventions in the behavioral domain least often. These findings will help in building of a standardized language for the neonatal nursing units and enhance the quality of nursing care. Further study will be needed to classify each intervention class and nursing activity and validate NIC in pediatric care unit.

  • PDF

Word Embedding 자질을 이용한 한국어 개체명 인식 및 분류 (Korean Named Entity Recognition and Classification using Word Embedding Features)

  • 최윤수;차정원
    • 정보과학회 논문지
    • /
    • 제43권6호
    • /
    • pp.678-685
    • /
    • 2016
  • 한국어 개체명 인식에 다양한 연구가 있었지만, 영어 개체명 인식에 비해 자질이 부족한 문제를 가지고 있다. 본 논문에서는 한국어 개체명 인식의 자질 부족 문제를 해결하기 위해 word embedding 자질을 개체명 인식에 사용하는 방법을 제안한다. CBOW(Continuous Bag-of-Words) 모델을 이용하여 word vector를 생성하고, word vector로부터 K-means 알고리즘을 이용하여 군집 정보를 생성한다. word vector와 군집 정보를 word embedding 자질로써 CRFs(Conditional Random Fields)에 사용한다. 실험 결과 TV 도메인과 Sports 도메인, IT 도메인에서 기본 시스템보다 각각 1.17%, 0.61%, 1.19% 성능이 향상되었다. 또한 제안 방법이 다른 개체명 인식 및 분류 시스템보다 성능이 향상되는 것을 보여 그 효용성을 입증했다.

클래스 다이어그램 이미지의 자동 분류에 관한 연구 (A Study on Automatic Classification of Class Diagram Images)

  • 김동관
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.1-9
    • /
    • 2022
  • UML(Unified Modeling Language) 클래스 다이어그램은 시스템의 정적인 측면을 표현하며 분석 및 설계부터 문서화, 테스팅까지 사용된다. 클래스 다이어그램을 이용한 모델링이 소프트웨어 개발에 있어 필수적이지만, 경험이 많지 않은 모델러에게 쉽지 않은 작업이다. 도메인 카테고리별로 분류된 클래스 다이어그램 데이터 세트가 제공된다면, 모델링 작업의 생산성을 높일 수 있을 것이다. 본 논문은 클래스 다이어그램 이미지 데이터를 구축하기 위한 자동 분류 기술을 제공한다. 추가 정보 없이 단지 UML 클래스 다이어그램 이미지를 식별하고 도메인 카테고리에 따라 자동 분류한다. 먼저, 웹상에서 수집된 이미지들이 UML 클래스 다이어그램 이미지인지 여부를 판단한다. 그리고, 식별된 클래스 다이어그램 이미지에서 클래스 이름을 추출하여 도메인 카테고리에 따라 분류한다. 제안된 분류 모델은 정밀도, 재현율, F1점수, 정확도에서 각각 100.00%, 95.59%, 97.74%, 97.77%를 달성했으며, 카테고리별 분류에 대한 정확도는 81.1%와 95.2% 사이에 분포한다. 해당 실험에 사용된 클래스 다이어그램 이미지 개수가 충분히 크지 않지만, 도출된 실험 결과는 제안된 자동 분류 방식이 고려할 만한 가치가 있음을 나타낸다.

고속 푸리에 변환 및 심층 신경망을 사용한 전력 품질 외란 감지 및 분류 (Power Quality Disturbances Detection and Classification using Fast Fourier Transform and Deep Neural Network)

  • 첸센폰;임창균
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.115-126
    • /
    • 2023
  • 무작위 및 주기적인 변동하는 재생에너지 발전 전력 품질 교란으로 인해 발전 변환 송전 및 배전에서 더 자주 발생하게 된다. 전력 품질 교란은 장비 손상 또는 정전으로 이어질 수 있다. 따라서 서로 다른 전력 품질 외란을 실시간으로 자동감지하고 분류하는 것이 필요하다. 전통적인 PQD 식별 방법은 특징 추출 특징 선택 및 분류의 세 단계로 구성된다. 그러나 수동으로 생성한 특징은 선택 단계에서 정확성을 보장하기 힘들어서 분류 정확도를 향상하는 데에는 한계가 있다. 본 논문에서는 16가지 종류의 전력 품질 신호를 인식하기 위해 CNN(Convolution Neural Networ)과 LSTM(Long Short Term Memory)을 기반으로 시간 영역과 주파수 영역의 특징을 결합한 심층 신경망 구조를 제안하였다. 주파수 영역 데이터는 주파수 영역 특징을 효율적으로 추출할 수 있는 FFT(Fast Fourier Transform)로 얻었다. 합성 데이터와 실제 6kV 전력 시스템 데이터의 성능은 본 연구에서 제안한 방법이 다른 딥러닝 방법보다 일반화되었음을 보여주었다.

Gamma/neutron classification with SiPM CLYC detectors using frequency-domain analysis for embedded real-time applications

  • Ivan Rene Morales;Maria Liz Crespo;Mladen Bogovac;Andres Cicuttin;Kalliopi Kanaki;Sergio Carrato
    • Nuclear Engineering and Technology
    • /
    • 제56권2호
    • /
    • pp.745-752
    • /
    • 2024
  • A method for gamma/neutron event classification based on frequency-domain analysis for mixed radiation environments is proposed. In contrast to the traditional charge comparison method for pulse-shape discrimination, which requires baseline removal and pulse alignment, our method does not need any preprocessing of the digitized data, apart from removing saturated traces in sporadic pile-up scenarios. It also features the identification of neutron events in the detector's full energy range with a single device, from thermal neutrons to fast neutrons, including low-energy pulses, and still provides a superior figure-of-merit for classification. The proposed frequency-domain analysis consists of computing the fast Fourier transform of a triggered trace and integrating it through a simplified version of the transform magnitude components that distinguish the neutron features from those of the gamma photons. Owing to this simplification, the proposed method may be easily ported to a real-time embedded deployment based on Field-Programmable Gate Arrays or Digital Signal Processors. We target an off-the-shelf detector based on a small CLYC (Cs2LiYCl6:Ce) crystal coupled to a silicon photomultiplier with an integrated bias and preamplifier, aiming at lightweight embedded mixed radiation monitors and dosimeter applications.

A Novel RGB Channel Assimilation for Hyperspectral Image Classification using 3D-Convolutional Neural Network with Bi-Long Short-Term Memory

  • M. Preethi;C. Velayutham;S. Arumugaperumal
    • International Journal of Computer Science & Network Security
    • /
    • 제23권3호
    • /
    • pp.177-186
    • /
    • 2023
  • Hyperspectral imaging technology is one of the most efficient and fast-growing technologies in recent years. Hyperspectral image (HSI) comprises contiguous spectral bands for every pixel that is used to detect the object with significant accuracy and details. HSI contains high dimensionality of spectral information which is not easy to classify every pixel. To confront the problem, we propose a novel RGB channel Assimilation for classification methods. The color features are extracted by using chromaticity computation. Additionally, this work discusses the classification of hyperspectral image based on Domain Transform Interpolated Convolution Filter (DTICF) and 3D-CNN with Bi-directional-Long Short Term Memory (Bi-LSTM). There are three steps for the proposed techniques: First, HSI data is converted to RGB images with spatial features. Before using the DTICF, the RGB images of HSI and patch of the input image from raw HSI are integrated. Afterward, the pair features of spectral and spatial are excerpted using DTICF from integrated HSI. Those obtained spatial and spectral features are finally given into the designed 3D-CNN with Bi-LSTM framework. In the second step, the excerpted color features are classified by 2D-CNN. The probabilistic classification map of 3D-CNN-Bi-LSTM, and 2D-CNN are fused. In the last step, additionally, Markov Random Field (MRF) is utilized for improving the fused probabilistic classification map efficiently. Based on the experimental results, two different hyperspectral images prove that novel RGB channel assimilation of DTICF-3D-CNN-Bi-LSTM approach is more important and provides good classification results compared to other classification approaches.

신경망을 이용한 효율적인 비디오 컨텐츠 분류 방법 (An Effective Classification Method of Video Contents Using a Neural-Network)

  • 이후형;전승철;박성한
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.109-112
    • /
    • 2001
  • This paper proposes a method to classify different video contents using features of digital video. Classified video types are the news, drama, show, sports, and talk program. Features, such as intra-coded macroblock number St motion vector in P-picture in MPEG domain are used. The frame difference of YCbCr is also employed as a measure of classification. We detect the occurrences of cuts in a video for a measure of classification. Finally, back-propagation neural-network of 3 layers is used to classify video contents.

  • PDF

실제 해상 실험 데이터를 이용한 능동소나 표적/비표적 식별 (Active Sonar Target/Nontarget Classification Using Real Sea-trial Data)

  • 석종원
    • 한국멀티미디어학회논문지
    • /
    • 제20권10호
    • /
    • pp.1637-1645
    • /
    • 2017
  • Target/Nontarget classification can be divided into the study of shape estimation of the target analysing reflected echo signal and of type classification of the target using acoustical features. In active sonar system, the feature vectors are extracted from the signal reflected from the target, and an classification algorithm is applied to determine whether the received signal is a target or not. However, received sonar signals can be distorted in the underwater environments, and the spatio-temporal characteristics of active sonar signals change according to the aspect of the target. In addition, it is very difficult to collect real sea-trial data for research. In this paper, target/non-target classification were performed using real sea-trial data. Feature vectors are extracted using MFCC(Mel-Frequency Cepstral Coefficients), filterbank energy in the Fourier spectrum and wavelet domain. For the performance verification, classification experiments were performed using backpropagation neural network classifiers.

개념 및 관계 분류를 통한 분야 온톨로지 구축 (Building Domain Ontology through Concept and Relation Classification)

  • 황금하;신지애;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.562-571
    • /
    • 2008
  • 본 논문에서는 분야 온톨로지 구축을 위하여 분야 상위 온톨로지를 구축한 다음, 분야 시소러스의 개념과 관계를 이용하여 분야 상위 온톨로지를 확장하는 방법을 제안한다. 이를 위하여 우선 일반분야 시소러스와 분야 사전을 이용하여 분야 상위 개념 분류체계를 구축한다. 다음, 분야 시소러스의 개념을 분야 상위 온톨로지의 상위 개념으로 분류하고, 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT) 사이의 관계를 분야 상위 온톨로지에서 정의한 의미관계로 분류한다. 개념 분류는 두 단계로 진행되는데, 1단계에서는 빈도수 기반 방법, 2단계에서는 유사도 기반방법을 적용하여 시소러스 개념을 분야 상위 온톨로지의 개념으로 분류한다. 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이타가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 iso와 기타 관계(non-isa관계)로 분류하고, 다시 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이타를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 특징기반 분류 기법을 사용하되, k-Nearest Neighbors(k-NN)방법으로 훈련데이타를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과 사람에 의한 판단 결과와 비교 가능한 성능을 보여 주었다.