• 제목/요약/키워드: NMF

검색결과 157건 처리시간 0.024초

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.

자원회복계획 하에서의 총허용어획량(TAC) 어업정책 효과에 관한 생물경제학적 분석 -미국 멕시코만의 Yellowedge Grouper 어업을 사례로- (A Bioeconomic Analysis on the Effectiveness of Total Allowable Catch(TAC) Policy under the Rebuilding Plan)

  • 김도훈
    • 자원ㆍ환경경제연구
    • /
    • 제12권4호
    • /
    • pp.663-686
    • /
    • 2003
  • 본 연구는 미국 멕시코만의 Yellowedge Grouper 어업을 사례로 생물경제학 모델을 이용하여 자원회복계획 하의 총 허용어획량(TAC) 어업관리정책 효과를 분석하였다. 생물학적 자원평가모델인 잉여생산량 모델의 추정 결과 자원이 남획상태인 것으로 나타났고, 그 결과 10년 기간 동안 TAC제도를 이용하여 목표 자원량 달성을 위한 자원회복계획이 수립되어졌다. 모델 분석 결과, 통제관리가 잘 이루어진다면 자원회복기간 이후에 목표 자원량 수준이 달성되는 것으로 분석되었다. 하지만, 목표 자원량 달성을 위해서는 자원회복기간 동안의 어획량이 크게 감소되어야 하는 것으로 나타났는데, 특히 NMFS가 권고한 연간 342톤 어획량보다 더 크게 어획량이 감소해야 하는 것으로 분석되었다. 향후 25년 동안 발생할 어업 이익은 자원회복기간 동안의 어획량 감소로 인하여 현 상태유지 하에서보다 적은 것으로 나타났다. 그리고 사회적 할인율이 낮을 때는 변동어획량 TAC제도 하에서 고정어획량 TAC재도 하에서보다 큰 어업이익이 발생하였지만, 할인율이 높아질수록 고정어획량 TAC제도 하에서 변동어획량 TAC제도 하에서보다 큰 어업이익이 발생하였다.

  • PDF

시각 자극 복원을 위한 비음수 행렬 분해 기반의 영상 기저 자동 추출 (Automatic Extraction of Image Bases Based on Non-Negative Matrix Factorization for Visual Stimuli Reconstruction)

  • 조성식;박영묘;이성환
    • 인지과학
    • /
    • 제22권4호
    • /
    • pp.347-364
    • /
    • 2011
  • 본 논문에서는 fMRI를 사용하여 뇌신경 반응을 측정한 후, 자극으로 주어진 $10{\times}10$ 크기의 이진 영상을 사전 정보 없이 복원하기 위해 비음수 행렬 분해를 이용한 자동화된 영상 기저 추출 방법을 제안한다. 영상 기저란 영상을 표현하는 기본 단위로, 기존 연구에서는 사전에 정의된 $1{\times}1$, $2{\times}1$, $1{\times}2$, $2{\times}2$의 크기를 갖는 총 361개의 영상 기저에 반응하는 뇌 신호를 분석하여 기저 영상으로 복원하고, 모든 기저에 대한 복원 결과를 선형 결합하여 최종복원 영상을 획득하였다. 사람이 사전에 정의한 영상 기저를 필요로 하는 기존 연구와는 달리, 본 연구에서는 비음수 행렬 분해를 기반으로 학습 데이터로 주어진 이진 영상을 가장 잘 표현하는 영상 기저를 자동 추출하였다. 자동으로 추출된 영상 기저를 사용하여 이진 영상을 복원한 결과, 기존 연구 방법보다 개선된 복원 정확도를 보였다.

  • PDF

SNS대상의 지능형 자연어 수집, 처리 시스템 구현을 통한 한국형 감성사전 구축에 관한 연구 (Research on Designing Korean Emotional Dictionary using Intelligent Natural Language Crawling System in SNS)

  • 이종화
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제29권3호
    • /
    • pp.237-251
    • /
    • 2020
  • Purpose The research was studied the hierarchical Hangul emotion index by organizing all the emotions which SNS users are thinking. As a preliminary study by the researcher, the English-based Plutchick (1980)'s emotional standard was reinterpreted in Korean, and a hashtag with implicit meaning on SNS was studied. To build a multidimensional emotion dictionary and classify three-dimensional emotions, an emotion seed was selected for the composition of seven emotion sets, and an emotion word dictionary was constructed by collecting SNS hashtags derived from each emotion seed. We also want to explore the priority of each Hangul emotion index. Design/methodology/approach In the process of transforming the matrix through the vector process of words constituting the sentence, weights were extracted using TF-IDF (Term Frequency Inverse Document Frequency), and the dimension reduction technique of the matrix in the emotion set was NMF (Nonnegative Matrix Factorization) algorithm. The emotional dimension was solved by using the characteristic value of the emotional word. The cosine distance algorithm was used to measure the distance between vectors by measuring the similarity of emotion words in the emotion set. Findings Customer needs analysis is a force to read changes in emotions, and Korean emotion word research is the customer's needs. In addition, the ranking of the emotion words within the emotion set will be a special criterion for reading the depth of the emotion. The sentiment index study of this research believes that by providing companies with effective information for emotional marketing, new business opportunities will be expanded and valued. In addition, if the emotion dictionary is eventually connected to the emotional DNA of the product, it will be possible to define the "emotional DNA", which is a set of emotions that the product should have.

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

보행 과정에서 발생하는 복합 근육 활성의 양성 및 음성 공변 메커니즘 (Positive and Negative Covariation Mechanism of Multiple Muscle Activities During Human Walking)

  • 김유신;홍영기
    • 한국콘텐츠학회논문지
    • /
    • 제18권1호
    • /
    • pp.173-184
    • /
    • 2018
  • 보행 과정에서 여러 근육이 동시에 수축하는 운동 모듈 또는 근육 시너지는 매우 중요한 중추신경계 운동조절 메커니즘이다. 본 연구는 걷는 동안 근육 간 양성 및 음성 공변 패턴을 이해하는 것을 목표로 한다. 본 연구에서는 트레드밀 보행 시 발생하는 다리 근육 활성을 근전도 검사를 통해 측정하였다. 동시 수축근육 그룹, 즉 운동 모듈을 확인하기 위해 우리는 양쪽 4 개의 다리 근육(전경골근, 내측 비복근, 대퇴직근, 내측 슬괵근)에서 근전도 데이터를 수집하였고, 이를 바탕으로 비음수행렬분해 및 주성분 분석을 수행하였다. 이후 근육 또는 운동 모듈 간의 다양한 조합으로부터 공변이 값을 계산하였고, 이원배치분산분석을 이용하여 각 조합들에서 발생하는 공변이 패턴을 비교하였다. 그 결과, 다양한 조합 사이에 유의미한 공변이 값의 차이가 발견되었다(p < 0.05). 같은 운동 모듈로 정의된 특정 근육 사이에서 발생하는 근 활성은 양성공변이를 보여주었으나 운동 모듈 사이에서는 음성 공변이를 보여주었다. 모든 근육 조합들 사이에서는 음성 공변이가 발생하였다. 운동 모듈 사이에서 안정적으로 발생하는 음성 공변이는 운동 모듈이 복잡한 운동 조정의 제어 단위(control unit) 일 수 있음을 암시하고 있다.

비음수행렬분해와 위키피디아를 이용한 사용자기반의 문서요약 (User-based Document Summarization using Non-negative Matrix Factorization and Wikipedia)

  • 박선;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 본 논문은 위키피디아의 외부지식을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 문서집합의 내부구조를 표현하는 의미특징을 이용하여 문서를 요약하는 새로운 방법을 제안한다. 제안된 방법은 사용자의 초기 질의에 위키피디아 기반의 연관 피드백을 적용하여 사용자가 요구하는 요약문장을 추출할 수 있도록 질의를 확장하며, 비음수 분해된 문서의 의미특징을 이용함으로써 문서의 내부 구조를 잘 표현 할 수 있다. 확장된 질의와 의미특징을 이용하여 의미 있는 문장을 추출함으로써 사용자의 요구사항과 제안방법의 요약결과 사이의 의미적 차이를 감소시킨다. 실험결과 제안방법이 기존방법에 비해서 문서요약에 대해 더 좋은 성능을 보인다.

생체 모사수 화장품이 세포 활성과 피부에 미치는 효과 (Effect of Cosmetics Contained Isotonic Water Mimicked Body Fluid on Cell Activities and Skin)

  • 박선영;이성훈;김은주;최소웅;김지영;조성아;조준철;이해광
    • 대한화장품학회지
    • /
    • 제40권2호
    • /
    • pp.195-201
    • /
    • 2014
  • 생체수는 링거액, 인공관절액, 세포 배양 등 다양한 분야에서 연구되어 왔다. 이는 생체수가 체온을 조절하는데 결정적인 역할을 하고, 생체 내 다양한 대사 과정에서 용매로 사용되며, 삼투압이나 능동적 섭취를 통한 혈액 또는 림프액을 통해 세포에서 세포로 전달되는 미네랄, 에너지원, 호르몬, 시그널과 약물의 전달 물질로 이용되기 때문이다. 세포외 지질과 자연보습성분(natural moisturizing factor, NMF)을 함유하는 각질층은 외부의 수분을 끌어들여 내부 수화에 이용하며, 이러한 과정들은 피부 장벽 기능과의 연관성이 높다. 본 연구에서는 피부 장벽 기능을 강화하는 아미노산, 펩타이드, 단당류를 포함한 생체모사수(Cell Bio Fluid SyncTM)를 인체 피부에 처리하여 세포활성을 관찰하고, 생체 모사수를 함유한 제품을 피부에 도포하여 인체피부 개선 효과를 연구 하였다. 피부 세포 활성을 보기 위해 각질세포인 HaCaT 세포를 이용하였고, 에너지 고갈상태로 만들기 위해 3시간 동안 PBS에 전 처리한 후 이후 세포 배양액인 DMEM 및 등장액인 PBS, 생체 모사수(Cell Bio Fluid $Sync^{TM}$)에 각각 3시간 처리하였다. 이후 MTT assay와 이미지 분석을 수행하였다. 인체의 피부 개선 효능을 위한 임상 연구에 21명의 여성이 참여하였다. 생체 모사수를 함유한 제품을 1주일간 안면에 도포하였고, 수분량, 피부결, 밝기 그리고 피부 균일도를 측정하였다. 모든 측정은 피험자가 세안 후 항온항습조건($22{\pm}2^{\circ}C$, $50{\pm}5%$)에서 20분 간 대기하고 수행하였다. 모든 데이터는 SPSS ver. 21을 이용하여 분석하였다. 그 결과, 생체 모사수(Cell Bio Fluid $Sync^{TM}$)가 세포 활성을 높이고 인체의 피부에서 수분, 거칠기, 밝기, 균일도, 투명도 등의 개선 효과가 있음을 확인할 수 있었다.

Emodin의 항염 및 피부장벽개선 활성 연구 (Emodin Studies on Anti-inflammatory and Skin Barrier Improvement Activities)

  • 김세기;최재근;장영아
    • 한국응용과학기술학회지
    • /
    • 제38권6호
    • /
    • pp.1383-1392
    • /
    • 2021
  • 호장근, 적하수오, 대황, 알로에 등과 같은 생약재의 주요 약리 활성 성분인 emodin은 항산화, 항균, 항염, 항암, 간보호 등에 효능이 있는 것으로 보고되었다. 본 연구에서는 emodin의 피부 질환 및 기능성 소재로서의 활용 가능성을 알아보기 위해 염증 개선과 피부장벽기능 개선 관련 활성을 확인하였다. human keratinocyte인 HaCaT 세포에 대하여 항염효과를 관찰하기 위해 cytokine억제능은 ELISA kit로, 단백질 발현은 western blot으로 확인하였다. TNF-α (10 ng/mL)/IFN-γ (10 ng/mL)로 활성화된 HaCaT 세포에서 emodin을 농도별(5, 10, 20, 40) µM로 처리한 결과 TNF-α, IL-1β 및 IL-6의 생성량은 emodin의 농도가 증가함에 따라 감소됨을 확인하였다. 염증관련 단백질인 iNOS, COX-2 발현량에 대한 실험결과에서도 emodin 20 µM 농도에서 control 대비 iNOS는 48%, COX-2는 29%가 저해됨을 확인하였다. 피부장벽기능 개선의 지표로써 filaggrin, involucrin, loricirn의 mRNA 발현 정도와 filaggrin, involucrin, loricirn의 생성량을 확인한 결과 에모딘 농도에 의존적으로 증가하는 우수한 결과가 얻어졌다. 특히 20 µM 농도에서 대조군 대비 2배의 생성량 증가를 보인 filaggrin은 천연보습인자인 NMF의 형성에 관계되는 단백질로 각질층의 보습에 중요한 역할을 하는 것으로 알려져 있다. 결론적으로 emodin의 피부 질환 및 기능성 소재로서의 활용 가능성 중 염증 개선 및 피부장벽기능 개선 소재로 활용될 수 있음을 확인하였으며 향후 추가적인 연구가 수행되면 그 활용 범위가 더 넓어질 수 있을 것으로 사료된다.

주파수 특성 기저벡터 학습을 통한 특정화자 음성 복원 (Target Speaker Speech Restoration via Spectral bases Learning)

  • 박선호;유지호;최승진
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.179-186
    • /
    • 2009
  • 본 논문에서는 학습이 가능한 특정화자의 발화음성이 있는 경우, 잡음과 반향이 있는 실 환경에서의 스테레오 마이크로폰을 이용한 특정화자 음성복원 알고리즘을 제안한다. 이를 위해 반향이 있는 환경에서 음원들을 분리하는 다중경로 암묵음원분리(convolutive blind source separation, CBSS)와 이의 후처리 방법을 결합함으로써, 잡음이 섞인 다중경로 신호로부터 잡음과 반향을 제거하고 특정화자의 음성만을 복원하는 시스템을 제시한다. 즉, 비음수 행렬분해(non-negative matrix factorization, NMF) 방법을 이용하여 특정화자의 학습음성으로부터 주파수 특성을 보존하는 기저벡터들을 학습하고, 이 기저벡터들에 기반 한 두 단계의 후처리 기법들을 제안한다. 먼저 본 시스템의 중간단계인 CBSS가 다중경로 신호를 입력받아 독립음원들을(두 채널) 출력하고, 이 두 채널 중 특정화자의 음성에 보다 가까운 채널을 자동적으로 선택한다(채널선택 단계). 이후 앞서 선택된 채널의 신호에 남아있는 잡음과 다른 방해음원(interference source)을 제거하여 특정화자의 음성만을 복원, 최종적으로 잡음과 반향이 제거된 특정화자의 음성을 복원한다(복원 단계). 이 두 후처리 단계 모두 특정화자 음성으로부터 학습한 기저벡터들을 이용하여 동작하므로 특정화자의 음성이 가지는 고유의 주파수 특성 정보를 효율적으로 음성복원에 이용 할 수 있다. 이로써 본 논문은 CBSS에 음원의 사전정보를 결합하는 방법을 제시하고 기존의 CBSS의 분리 결과를 향상시키는 동시에 특정화자만의 음성을 복원하는 시스템을 제안한다. 실험을 통하여 본 제안 방법이 잡음과 반향 환경에서 특정화자의 음성을 성공적으로 복원함을 확인할 수 있다.