• 제목/요약/키워드: 이종데이터학습

검색결과 128건 처리시간 0.022초

특징점 선택방법과 SVM 학습법을 이용한 당뇨병 데이터에서의 당뇨병성 신장합병증의 예측 (Prediction of Diabetic Nephropathy from Diabetes Dataset Using Feature Selection Methods and SVM Learning)

  • 조백환;이종실;지영준;김광원;김인영;김선일
    • 대한의용생체공학회:의공학회지
    • /
    • 제28권3호
    • /
    • pp.355-362
    • /
    • 2007
  • Diabetes mellitus can cause devastating complications, which often result in disability and death, and diabetic nephropathy is a leading cause of death in people with diabetes. In this study, we tried to predict the onset of diabetic nephropathy from an irregular and unbalanced diabetic dataset. We collected clinical data from 292 patients with type 2 diabetes and performed preprocessing to extract 184 features to resolve the irregularity of the dataset. We compared several feature selection methods, such as ReliefF and sensitivity analysis, to remove redundant features and improve the classification performance. We also compared learning methods with support vector machine, such as equal cost learning and cost-sensitive learning to tackle the unbalanced problem in the dataset. The best classifier with the 39 selected features gave 0.969 of the area under the curve by receiver operation characteristics analysis, which represents that our method can predict diabetic nephropathy with high generalization performance from an irregular and unbalanced dataset, and physicians can benefit from it for predicting diabetic nephropathy.

확률신경회로망에 의한 냉연 강판 표면결함의 분류 (Classification of Surface Defects on Cold Rolled Strips by Probabilistic Neural Networks)

  • 송성진;김학준;최세호;이종학
    • 비파괴검사학회지
    • /
    • 제17권3호
    • /
    • pp.162-173
    • /
    • 1997
  • 최근 산업 발전에 따라 철강 제품의 수요 증가와 함께 품질의 고급화에 대한 요구도 점차 증가하고 있는데, 이러한 수요자의 요구에 부응하기 위해 철강업계는 냉연 강판 표면결함검출기(surface defect detector; SDD)를 도입 운용하고 있다. 그러나 현재 국내 철강 제조업체들이 보유하고 있는 상용 SDD는 결함의 검출에는 매우 효율적이지만 결함의 분류에는 아직 만족할만한 성능을 보여주지 못하고 있다. 그 이유는 SDD가 결함 분류를 위해 채택한 분류표분류기(classification table; CT)는 시험 표본의 모든 특징값들이 분류표의 범위 내에 있을 때만 결함의 분류를 정확히 수행하기 때문에 결함 분류 정확도가 낮을 뿐 아니라, 분류 법칙의 설정을 작업자의 수작업에 의존하고 있어 현장 적용을 더욱 어렵게 하고 있다. 이러한 단점을 극복하기 위해 본 연구에서 학습 표본으로부터 확률밀도함수를 추정하고 여기에서 분류 법칙을 자동적으로 결정하는 방법을 제시하였고, 강화분류표분류기(enhanced classification table; ECT)와 확률신경회로망분류기(probabilistic neural network; PNN)를 새롭게 제안하여 이들 분류기를 실제적인 문제에 적용하였다. 그 결과 ECT와 PNN 모두 결함 분류 성능을 획기적으로 높일 수 있는 좋은 방법이며, 특히 PNN은 아주 구별하기 어려운 결함도 구별해내는 능력이 있을 뿐 아니라, 병렬 처리 능력을 가지고 있기 때문에 다량의 데이터를 실시간으로 처리해야 하는 경우에 적용할 수 있는 매우 효율적인 분류기임을 확인하였다.

  • PDF

다중속성 LSTM 모델 기반 TV 시청 패턴 분석 시스템 (TV Watching Pattern Analysis System based on Multi-Attribute LSTM Model)

  • 이종원;성미경;정회경
    • 한국정보통신학회논문지
    • /
    • 제25권4호
    • /
    • pp.537-542
    • /
    • 2021
  • 스마트 TV는 인터넷을 기반으로 기존의 TV에 비해 다양한 서비스와 정보를 제공하고 있다. 보다 개인화된 서비스나 정보를 제공하기 위해서는 사용자의 시청 패턴을 분석하고 이를 기반으로 맞춤형 서비스나 정보를 제공해야한다. 제안하는 시스템은 사용자의 TV 시청 패턴을 입력받고 이를 분석하여 사용자에게 맞춤형 정보로써 TV 프로그램이나 영화를 추천한다. 이를 위해 전처리기와 딥러닝(deep learning) 모델로 시스템을 구성하였다. 전처리기는 사용자가 시청한 TV 프로그램의 이름과 해당 TV 프로그램을 시청한 날짜, 시청한 시간 등을 입력하면 이를 정제한다. 그리고 정제된 데이터를 다중속성 LSTM 모델이 학습하고 예측을 수행하게 된다. 제안하는 시스템은 사용자에게 맞춤형 정보를 제공하는 시스템으로써 기존의 IoT 기술과 딥러닝 기술을 융합한 디지털 컨버전스(convergence)의 선도 기술이 될 것으로 사료된다.

NTIS 시스템에서 딥러닝과 형태소 분석 기반의 대화형 검색 서비스 설계 및 구현 (Design and Implementation of Interactive Search Service based on Deep Learning and Morpheme Analysis in NTIS System)

  • 이종원;김태현;최광남
    • 융합정보논문지
    • /
    • 제10권12호
    • /
    • pp.9-14
    • /
    • 2020
  • 현재 NTIS(National Technology Information Service)는 인공지능 기술을 기반으로 대화형 검색 서비스를 구축하고 있다. 이용자의 검색 의도를 파악하고 과제정보를 제공하기 위해 딥러닝 모델과 형태소 분석기를 기반으로 대화형 검색 서비스를 구축한다. 딥러닝 모델은 NTIS와 대화형 검색 서비스를 활용할 때 적재되는 로그 데이터를 기반으로 학습을 진행하고 이용자의 검색 의도를 파악한다. 그리고 단계별 검색을 통해 과제정보를 제공한다. 검색 의도 파악은 예외처리를 용이하게 해주며 단계별 검색은 통합검색보다 쉽고 빠르게 원하는 정보를 얻을 수 있도록 한다. 향후연구로는 인공지능 기술이 접목된 성장형 대화형 검색 서비스로써 이용자에게 제공하는 정보의 범위를 확대해야 한다.

Attention 기법을 적용한 LSTM-s2s 모델 기반 댐유입량 예측 연구 (Prediction of dam inflow based on LSTM-s2s model using luong attention)

  • 이종혁;최수연;김연주
    • 한국수자원학회논문집
    • /
    • 제55권7호
    • /
    • pp.495-504
    • /
    • 2022
  • 최근 인공지능의 발전으로 시계열 자료 분석에 효과적인 Long Short-Term Memory (LSTM) 모델이 댐유입량 예측의 정확도를 높이는 데 활용되고 있다. 본 연구에서는 그 중 LSTM의 성능을 더욱 향상할 수 있는 Sequence-to-Sequence (s2s) 구조에 Attention 기법을 LSTM 모델에 첨가하여 소양강댐 유역의 유입량을 예측하였다. 분석 데이터는 2013년부터 2020년까지의 유입량 시자료와 종관기상관측기온 및 강수량 자료를 학습, 검증, 평가로 나누어 훈련한 후, 모델의 성능 평가를 진행하였다. 분석 결과, LSTM-s2s 모델보다 attention까지 첨가한 모델이 일반적으로 더 좋은 성능을 보였으며, attention 첨가 모델이 첨두값도 더 잘 예측하는 모습을 보였다. 그리고 두 모델 모두 첨두값 발생 동안 유량 패턴을 잘 반영하였지만 세밀한 시간 단위 변화량에는 어려움이 있었다. 이를 통해 시간 단위 예측의 어려움에도 불구하고, LSTM-s2s에 attention까지 첨가한 모델이 기존 LSTM-s2s의 예측 성능을 향상할 수 있음을 알 수 있었다.

상품에 대한 공급자 검색 문제 해결하기 위한 지능형 상품 에이전트 개발

  • 채상용;김경필;김우주;김창욱
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.475-480
    • /
    • 2005
  • 인터넷상에 존재하는 수 많은 웹 페이지들에는 정형화되지 않은 각종 정보들이 이종의 형태로 산재되어 있다. 현재의 검색 기술을 통하여 필요한 정보를 찾아내는 것은 시간과 비용이 많이 소요되는 비효율적인 방법으로 이뤄지고 있다. 이러한 상황에서 사용자가 원하는 정보를 검색 및 추출해내어 정형화시키는 것은 매우 중요하다. 전자상거래의 폭발적 성장에도 불구하고 전자상거래 표준 활용 및 적용이 미비하여 e- Procurement, e-Marketplace, on-Line Shopping Mall 등에서 소비자가 원하는 상품 정보를 손쉽게 획득하지 못하고 있다. 이는 공급자에게는 보다 많은 매출의 기회를 구매자에게는 보다 좋은 자재 및 상품을 저렴한 가격에 소싱 할 수 있는 기회를 제공하지 못하는 문제점이 발생한다. 본 연구에서 제안하고자 하는 지능형 상품 에이전트는 소비자가 구매하고자 하는 특정 상품에 대한 공급자 검색 문제를 해결하기 위하여, 시스템 내부 정보의 확장 및 지식화 뿐만 아니라 웹 상의 다양한 상품 정보를 자동적으로 수집 및 가공하여 저장하는 역할을 수행한다. 이러한 연구를 위해서 사용한 기술은 우선 database 의 schema 를 읽어 들일 수 있는 DB schema reader, 인터넷 웹 페이지(웹문서)를 방문해서 다양한 정보들의 URL을 수집하는 일을 하는 Meta Search Engine 과 Focused Crawler, 그리고 다른 형태의 데이터 구조를 특정 목적에 따라 표준화된 형태로 바꾸는 Wrapper가 있다. 이러한 기술들을 연동하여 필요한 정보들을 추출 공급자 검색 문제를 해결하고자 하는 것이 연구의 목적이다. 정보추출은 사용자의 관심사에 적합한 문서들로부터 어떤 구체적인 사실이나 관계를 정확히 추출하는 작업을 가리킨다.앞으로 e-메일, 매신저, 전자결재, 지식관리시스템, 인터넷 방송 시스템의 기반 구조 역할을 할 수 있다. 현재 오픈웨어에 적용하기 위한 P2P 기반의 지능형 BPM(Business Process Management)에 관한 연구와 X인터넷 기술을 이용한 RIA (Rich Internet Application) 기반 웹인터페이스 연구를 진행하고 있다.태도와 유아의 창의성간에는 상관이 없는 것으로 나타났고, 일반 유아의 아버지 양육태도와 유아의 창의성간의 상관에서는 아버지 양육태도의 성취-비성취 요인에서와 창의성제목의 추상성요인에서 상관이 있는 것으로 나타났다. 따라서 창의성이 높은 아동의 아버지의 양육태도는 일반 유아의 아버지와 보다 더 애정적이며 자율성이 높지만 창의성이 높은 아동의 집단내에서 창의성에 특별한 영향을 더 미치는 아버지의 양육방식은 발견되지 않았다. 반면 일반 유아의 경우 아버지의 성취지향성이 낮을 때 자녀의 창의성을 향상시킬 수 있는 것으로 나타났다. 이상에서 자녀의 창의성을 향상시키는 중요한 양육차원은 애정성이나 비성취지향성으로 나타나고 있어 정서적인 측면의 지원인 것으로 밝혀졌다.징에서 나타나는 AD-SR맥락의 반성적 탐구가 자주 나타났다. 반성적 탐구 척도 두 그룹을 비교 했을 때 CON 상호작용의 특징이 낮게 나타나는 N그룹이 양적으로 그리고 내용적으로 더 의미 있는 반성적 탐구를 했다용을 지원하는 홈페이지를 만들어 자료 제공 사이트에 대한 메타 자료를 데이터베이스화했으며 이를 통해 학생들이 원하는 실시간 자료를 검색하여 찾을 수 있고 홈페이지를 방분했을 때 이해하기 어려운 그래프나 각 홈페이지가 제공하는 자료들에 대한 처리 방법을 도움말로 제공받을 수 있게 했다. 실시간 자료들을 이용한 학습은 학생들의 학습 의욕과 탐구 능력을 향상시켰으

  • PDF

SVR에 기반한 개선된 네이버 임베딩 (Advanced Neighbor Embedding based on Support Vector Regression)

  • 엄경배;전창우;최영희;남승태;이종찬
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.733-735
    • /
    • 2014
  • 표본기반 초해상도(Super Resolution 이하 SR) 기법은 데이터베이스에 저장된 고해상도 영상의 패치와 저해상도 영상의 패치 사이에 대응관계를 이용하여, 저해상도의 입력영상에 가장 유사한 고해상도 패치를 덧붙여서 고해상도를 구성하는 방식이다. 이러한 방식은 한 장의 영상만으로 고해상도 영상을 얻을 수 있고, 위의 과정을 반복하여 2배 이상의 확대된 영상을 얻을 수 있어서 기존의 고전적 SR의 문제점을 해결할 수 있다. 표본기반 SR의 방법들 중 네이버 임베딩(Neighbor Embedding 이하 NE) 기법의 기본 원리는 지역적 선형 임베딩이라는 매니폴드 학습방법의 개념과 같다. 그러나 네이버 임베딩의 빈약한 일반화 능력으로 인하여 알고리즘의 성능을 크게 저하시킨다. 이유는 국부학습 데이터 집합의 크기가 너무 작아서 NE 알고리즘의 성능을 현저히 저하시킨다. 본 논문에서는 이와 같은 문제점을 해결하기 위해서 일반화 능력이 뛰어난 Support Vector Regression(이하 SVR)기반 개선된 NE를 제안하였다. 저해상도 입력 패치가 주어지면 SVR 기반 개선된 NE를 이용하여 고해상도의 해당 화소 값을 예측하였다. 실험을 통하여 제안된 기법이 기존의 보간법 및 NE 기법 등에 비해 정량적인 척도 및 시각적으로 향상된 결과를 보여 주었다.

  • PDF

ICT 인프라 이상탐지를 위한 조건부 멀티모달 오토인코더에 관한 연구 (A Study of Anomaly Detection for ICT Infrastructure using Conditional Multimodal Autoencoder)

  • 신병진;이종훈;한상진;박충식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.57-73
    • /
    • 2021
  • ICT 인프라의 이상탐지를 통한 유지보수와 장애 예방이 중요해지고 있다. 장애 예방을 위해서 이상탐지에 대한 관심이 높아지고 있으며, 지금까지의 다양한 이상탐지 기법 중 최근 연구들에서는 딥러닝을 활용하고 있으며 오토인코더를 활용한 모델을 제안하고 있다. 이는 오토인코더가 다차원 다변량에 대해서도 효과적으로 처리가 가능하다는 것이다. 한편 학습 시에는 많은 컴퓨터 자원이 소모되지만 추론과정에서는 연산을 빠르게 수행할 수 있어 실시간 스트리밍 서비스가 가능하다. 본 연구에서는 기존 연구들과 달리 오토인코더에 2가지 요소를 가미하여 이상탐지의 성능을 높이고자 하였다. 먼저 다차원 데이터가 가지고 있는 속성별 특징을 최대한 부각하여 활용하기 위해 멀티모달 개념을 적용한 멀티모달 오토인코더를 적용하였다. CPU, Memory, network 등 서로 연관이 있는 지표들을 묶어 5개의 모달로 구성하여 학습 성능을 높이고자 하였다. 또한, 시계열 데이터의 특징을 데이터의 차원을 늘리지 않고 효과적으로 학습하기 위하여 조건부 오토인코더(conditional autoencoder) 구조를 활용하는 조건부 멀티모달 오토인코더(Conditional Multimodal Autoencoder, CMAE)를 제안하였다. 제안한 CAME 모델은 비교 실험을 통해 검증했으며, 기존 연구들에서 많이 활용된 오토인코더와 비교하여 AUC, Accuracy, Precision, Recall, F1-score의 성능 평가를 진행한 결과 유니모달 오토인코더(UAE)와 멀티모달 오토인코더(Multimodal Autoencoder, MAE)의 성능을 상회하는 결과를 얻어 이상탐지에 있어 효과적이라는 것을 확인하였다.

한국표준산업분류를 기준으로 한 문서의 자동 분류 모델에 관한 연구 (A Study on Automatic Classification Model of Documents Based on Korean Standard Industrial Classification)

  • 이재성;전승표;유형선
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.221-241
    • /
    • 2018
  • 지식사회에 들어서며 새로운 형태의 자본으로서 정보의 중요성이 강조되고 있다. 그리고 기하급수적으로 생산되는 디지털 정보의 효율적 관리를 위해 정보 분류의 중요성도 증가하고 있다. 본 연구에서는 기업의 기술사업화 의사결정에 도움이 될 수 있는 맞춤형 정보를 자동으로 분류하여 제공하기 위하여, 기업의 사업 성격을 나타내는 한국표준산업분류(이하 'KSIC')를 기준으로 정보를 분류하는 방법을 제안하였다. 정보 혹은 문서의 분류 방법은 대체로 기계학습을 기반으로 연구되어 왔으나 KSIC를 기준으로 분류된 충분한 학습데이터가 없어, 본 연구에서는 문서간 유사도를 계산하는 방식을 적용하였다. 구체적으로 KSIC 각 코드별 설명문을 수집하고 벡터 공간 모델을 이용하여 분류 대상 문서와의 유사도를 계산하여 가장 적합한 KSIC 코드를 제시하는 방법과 모델을 제시하였다. 그리고 IPC 데이터를 수집한 후 KSIC를 기준으로 분류하고, 이를 특허청에서 제공하는 KSIC-IPC 연계표와 비교함으로써 본 방법론을 검증하였다. 검증 결과 TF-IDF 계산식의 일종인 LT 방식을 적용하였을 때 가장 높은 일치도를 보였는데, IPC 설명문에 대해 1순위 매칭 KSIC의 일치도는 53%, 5순위까지의 누적 일치도는 76%를 보였다. 이를 통해 보다 정량적이고 객관적으로 중소기업이 필요로 할 기술, 산업, 시장정보에 대한 KSIC 분류 작업이 가능하다는 점을 확인할 수 있었다. 또한 이종 분류체계 간 연계표를 작성함에 있어서도 본 연구에서 제공하는 방법과 결과물이 전문가의 정성적 판단에 도움이 될 기초 자료로 활용될 수 있을 것으로 판단된다.

RFM 다차원 분석 기법을 활용한 암시적 사용자 피드백 기반 협업 필터링 개선 연구 (A Study on Improvement of Collaborative Filtering Based on Implicit User Feedback Using RFM Multidimensional Analysis)

  • 이재성;김재영;강병욱
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.139-161
    • /
    • 2019
  • 전자상거래 시장의 이용이 보편화 되며 고객들에게 좋은 품질의 물건을 어디서, 얼마나 합리적으로 구매할 수 있는지가 중요해졌다. 이러한 구매 심리의 변화는 방대한 정보 속에서 오히려 고객들의 구매 의사결정을 어렵게 만드는 경향이 있다. 이때 추천 시스템은 고객의 구매 행동을 분석하여 정보 검색에 드는 비용을 줄이고 만족도를 높이는 효과가 있다. 하지만 대부분 추천 시스템은 책이나 영화 등 동종 상품 분류 내에서만 추천이 이뤄진다. 왜냐하면 추천 시스템은 특정 상품에 매긴 구매 평점 데이터를 기반으로 해당 상품 분류 내 유사한 상품에 대한 구매 만족도를 추정하기 때문이다. 그밖에 추천 시스템에서 사용하는 구매 평점의 신뢰성에 대한 문제도 제시되고 있으며 오프라인에선 평점 확보 자체가 어렵다. 이에 본 연구에서는 일련의 문제를 개선하기 위해 RFM 다차원 분석 기법을 활용하여 기존에 사용하던 고객의 구매 평점을 객관적으로 대체할 수 있는 새로운 지표의 활용 가능성을 제안하는 바이다. 실제 기업의 구매 이력 데이터에 해당 지표를 적용해서 검증해본 결과 높게는 약 55%에 해당하는 정확도를 기록했다. 이는 총 4,386종에 달하는 이종 상품들 중 한번도 이용해 본 적 없는 상품을 추천한 결과이기 때문에 검증 결과는 상대적으로 높은 정확도와 활용가치를 의미한다. 그리고 본 연구는 오프라인의 다양한 상품데이터에서도 적용할 수 있는 범용적인 추천 시스템의 가능성을 시사한다. 향후 추가적인 데이터를 확보한다면 제안하는 추천 시스템의 정확도 향상도 기대할 수 있다.