• 제목/요약/키워드: Neural Network Modeling

검색결과 749건 처리시간 0.026초

X선 토모그램의 Smoothing 효과가 암석의 물성 예측에 미치는 영향 분석 (Smoothing Effect in X-ray Microtomogram and Its Influence on the Physical Property Estimation of Rocks)

  • 이민희;김영석
    • 지구물리와물리탐사
    • /
    • 제12권4호
    • /
    • pp.347-354
    • /
    • 2009
  • 암석의 물성을 정확히 예측하기 위해서는 물성에 일차적인 효과를 미치는 공극구조에 대한 이해가 매우 중요하며, 정확한 공극구조와 물성시뮬레이션을 이용한 다양한 물성예측 및 변화양상의 정량적 상관관계는 많은 지구물리분야에 응용할 수 있다. 최근 비파괴 구조해석방법, 특히 X선 토모그래피를 이용한 고분해능 스캔 등이 상용화되고 컴퓨터의 성능이 향상됨에 따라 실제의 공극구조를 이용하여 투수율을 예측하는 연구가 시도되고 있다. 본 연구에서는 이러한 연구를 투수율뿐만 아니라 속도와 전기전도도의 영역으로 확장하려는 시도를 하였다. 하지만 토모그래피 방법에서 발생하는 smoothing 효과에 의해 공극구조가 왜곡되고 계산된 물성에 오차가 발생하여, 영상처리기법(sharpening filtering 및 인공신경망 분류법)을 사용하여 smoothing 효과를 제거하는 방법을 시도하였다. 그 결과 가시적으로 향상된 공극구조를 얻을 수 있었고, 투수율 및 전기전도도의 계산값도 이론적 모델링과 유사한 정도의 정확도를 얻을 수 있었다. 하지만 속도의 경우에는 smoothing 효과의 제거에도 불구하고 오차도 상대적으로 크고 향상정도도 매우 미미하였다. 박편과 토모그래피에서 얻어진 공극구조의 비교 연구를 통하여 본 연구에서 사용된 사암의 경우에는 토모그래피에서 얻어진 해상도가 너무 낮은 것을 확인할 수 있었으며, 이러한 이유로 smoothing 효과가 제거되어도 속도예측의 향상은 그리 크지 않은 것으로 나타났다. 결론적으로 본 연구에서 제시된 방법은 토모그램의 smoothing 효과를 효율적으로 제거하였으며 이는 토모그래피방법으로 공극구조를 획득할 때 유용하게 사용될 것으로 기대된다. 또한 속도예측의 경우 토모그램의 해상도가 매우 중요한 인자로 판명되었으며 투수율 예측에 일반적으로 사용되는 해상도보다 최소 세 배 이상의 높은 해상도가 요구되는 것으로 파악되었다.

라벨이 없는 데이터를 사용한 종단간 음성인식기의 준교사 방식 도메인 적응 (Semi-supervised domain adaptation using unlabeled data for end-to-end speech recognition)

  • 정현재;구자현;김회린
    • 말소리와 음성과학
    • /
    • 제12권2호
    • /
    • pp.29-37
    • /
    • 2020
  • 최근 신경망 기반 심층학습 알고리즘의 적용으로 고전적인 Gaussian mixture model based hidden Markov model (GMM-HMM) 음성인식기에 비해 성능이 비약적으로 향상되었다. 또한 심층학습 기법의 장점을 더욱 잘 활용하는 방법으로 언어모델링 및 디코딩 과정을 통합처리 하는 종단간 음성인식 시스템에 대한 연구가 매우 활발히 진행되고 있다. 일반적으로 종단간 음성인식 시스템은 어텐션을 사용한 여러 층의 인코더-디코더 구조로 이루어져 있다. 때문에 종단간 음성인식 시스템이 충분히 좋은 성능을 내기 위해서는 많은 양의 음성과 문자열이 함께 있는 데이터가 필요하다. 음성-문자열 짝 데이터를 구하기 위해서는 사람의 노동력과 시간이 많이 필요하여 종단간 음성인식기를 구축하는 데 있어서 높은 장벽이 되고 있다. 그렇기에 비교적 적은 양의 음성-문자열 짝 데이터를 이용하여 종단간 음성인식기의 성능을 향상하는 선행연구들이 있으나, 음성 단일 데이터나 문자열 단일 데이터 한쪽만을 활용하여 진행된 연구가 대부분이다. 본 연구에서는 음성 또는 문자열 단일 데이터를 함께 이용하여 종단간 음성인식기가 다른 도메인의 말뭉치에서도 좋은 성능을 낼 수 있도록 하는 준교사 학습 방식을 제안했으며, 성격이 다른 도메인에 적응하여 제안된 방식이 효과적으로 동작하는지 확인하였다. 그 결과로 제안된 방식이 타깃 도메인에서 좋은 성능을 보임과 동시에 소스 도메인에서도 크게 열화되지 않는 성능을 보임을 알 수 있었다.

k-NN을 활용한 터보팬 엔진의 잔여 유효 수명 예측 모델 제안 (A Proposal of Remaining Useful Life Prediction Model for Turbofan Engine based on k-Nearest Neighbor)

  • 김정태;서양우;이승상;김소정;김용근
    • 한국산학기술학회논문지
    • /
    • 제22권4호
    • /
    • pp.611-620
    • /
    • 2021
  • 정비 산업은 사후정비, 예방정비를 거쳐, 상태기반 정비를 중심으로 진행되고 있다. 상태기반 정비는 장비의 상태를 파악하여, 최적 시점에서의 정비를 수행한다. 최적의 정비 시점을 찾기 위해서는 장비의 상태, 즉 잔여 유효 수명을 정확하게 파악하는 것이 중요하다. 이에, 본 논문은 시뮬레이션 데이터(C-MAPSS)를 사용한 터보팬 엔진의 잔여 유효수명(RUL, Remaining Useful Life) 예측 모델을 제시한다. 모델링을 위해 C-MAPSS(Commercial Modular Aero-Propulsion System Simulation) 데이터를 전처리, 변환, 예측하는 과정을 거쳤다. RUL 임계값 설정, 이동평균필터 및 표준화를 통해 데이터 전처리를 수행하였고, 주성분 분석(Principal Component Analysis)과 k-NN(k-Nearest Neighbor)을 활용하여 잔여 유효 수명을 예측하였다. 최적의 성능을 도출하기 위해, 5겹 교차검증기법을 통해 최적의 주성분 개수 및 k-NN의 근접 데이터 개수를 결정하였다. 또한, 사전 예측의 유용성, 사후 예측의 부적합성을 고려한 스코어링 함수(Scoring Function)를 통해 예측 결과를 분석하였다. 마지막으로, 현재까지 제시되어온 뉴럴 네트워크 기반의 알고리즘과 예측 성능 비교 및 분석을 통해 k-NN 활용 모델의 유용성을 검증하였다.

재입원 예측 모형 개발에 관한 연구 (A Study on the Development of Readmission Predictive Model)

  • 조윤정;김유미;함승우;최준영;백설경;강성홍
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.435-447
    • /
    • 2019
  • 불필요한 재입원을 예방하기 위해서는 재입원 확률이 높은 집단을 집중적으로 관리할 필요가 있다. 이를 위해서는 재입원 예측모형의 개발이 필요하다. 재원예측 모형을 개발하기 위해 1개 대학병원의 2016년에서 2017년의 2년간의 퇴원요약환자 데이터를 수집하였다. 이때 재입원 환자는 연구 기간 내에 2번 이상 퇴원한 환자라 정의 하였다. 재입원환자의 특성을 파악하기 위해 기술통계와 교착분석을 실시하였다. 재입원 예측 모형개발은 데이터마이닝 기법인 로지스틱회귀모형, 신경망, 의사결정모형을 이용하였다. 모형평가는 AUC(Area Under Curve)를 이용하였다. 로지스틱회귀모형이 AUC가 0.81로 가장 우수하게 나옴에 따라 본 연구에서는 로지스틱 회귀모형을 최종 재입원 예측 모형으로 선정을 하였다. 로지스틱회귀모형에서 선정된 재입원에 영향을 끼치는 주요한 변수는 성별, 연령, 지역, 주진단군, Charlson 동반질환지수, 퇴원과, 응급실 경유 여부, 수술여부, 재원일수, 총비용, 보험종류 등이었다. 본 연구에서 개발한 모형은 1개병원의 2년치 자료이므로 일반화하기에는 제한점이 있다. 추후에 여러 병원 장기간의 데이터를 수집하여 일반화 할 수 있는 모형을 개발하는 것이 필요하다. 더 나아가 계획에 없던 재입원 까지 예측을 할 수 있는 모형을 개발하는 것이 필요하다.

용어 사전의 특성이 문서 분류 정확도에 미치는 영향 연구 (Analyzing the Effect of Characteristics of Dictionary on the Accuracy of Document Classifiers)

  • 정해강;김남규
    • 경영과정보연구
    • /
    • 제37권4호
    • /
    • pp.41-62
    • /
    • 2018
  • 다양한 소셜 미디어 활동과 인터넷 뉴스 기사, 블로그 등을 통해 유통되는 비정형 데이터의 양이 급증함에 따라 비정형 데이터를 분석하고 활용하기 위한 연구가 활발히 진행되고 있다. 텍스트 분석은 주로 특정 도메인 또는 특정 주제에 대해 수행되므로, 도메인별 용어 사전의 구축과 적용에 대한 중요성이 더욱 강조되고 있다. 용어 사전의 품질은 비정형 데이터 분석 결과의 품질에 직접적인 영향을 미치게 되며, 분석 과정에서 정제의 역할을 수행함으로써 분석의 관점을 정의한다는 측면에서 그 중요성이 더욱 강조된다. 이렇듯 용어 사전의 중요성은 기존의 많은 연구에서도 강조되어 왔으나, 용어 사전이 분석 결과의 품질에 어떤 방식으로 어떤 영향을 미치는지에 대한 엄밀한 분석은 충분히 이루어지지 않았다. 따라서 본 연구에서는 전체 문서에서의 용어 빈도수에 기반을 두어 사전을 구축하는 일괄 구축 방식, 카테고리별 주요 용어를 추출하여 통합하는 용어 통합 방식, 그리고 카테고리별 주요 특질(Feature)을 추출하여 통합하는 특질 통합 방식의 세 가지 방식으로 사전을 구축하고 각 사전의 품질을 비교한다. 품질을 간접적으로 평가하기 위해 각 사전을 적용한 문서 분류의 정확도를 비교하고, 각 사전에 고유율의 개념을 도입하여 정확도의 차이가 나타나는 원인을 심층 분석한다. 본 연구의 실험에서는 5개 카테고리의 뉴스 기사 총 39,800건을 분석하였다. 실험 결과를 심층 분석한 결과 문서 분류의 정확도가 높게 나타나는 사전의 고유율이 높게 나타남을 확인하였으며, 이를 통해 사전의 고유율을 높임으로써 분류의 정확도를 더욱 향상시킬 수 있는 가능성을 발견하였다.

주기성을 갖는 입출력 데이터의 연관성 분석을 통한 회귀 모델 학습 방법 (Learning Method for Regression Model by Analysis of Relationship Between Input and Output Data with Periodicity)

  • 김혜진;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권7호
    • /
    • pp.299-306
    • /
    • 2022
  • 최근 로봇이나 설비, 회로 등에 센서 내장이 보편화 되고, 측정된 센서 데이터를 학습하여 기기의 고장을 진단하기 위한 연구가 활발하게 수행되고 있다. 이러한 고장 진단 연구는 고장 상황이나 종류를 예측하기 위한 분류(Classification) 모델 개발과 정량적으로 고장 상황을 예측하기 위한 회귀(Regression) 모델 개발로 구분된다. 분류 모델의 경우, 단순히 고장이나 결함의 유무(Class)를 확인하는 반면, 회귀 모델은 무수히 많은 수치 중에 하나의 값(Value)을 예측해야 하므로 학습 난이도가 더 높다. 즉, 입력과 출력을 대응시켜 고장을 예측을 할 때, 유사한 입력값이 동일한 출력을 낸다고 결정하기 어려운 불규칙한 상황이 다수 존재하기 때문이다. 따라서 본 논문에서는 주기성을 지닌 입출력 데이터에 초점을 맞추어, 입출력 관계를 분석하고, 슬라이딩 윈도우 기반으로 입력 데이터를 패턴화 하여 입출력 데이터 간의 규칙성을 확보하도록 한다. 제안하는 방법을 적용하기 위해, 본 연구에서는 MMC(Modular Multilevel Converter) 회로 시스템으로부터 주기성을 지닌 전류, 온도 데이터를 수집하여 ANN을 이용하여 학습을 진행하였다. 실험 결과, 한 주기의 2% 이상의 윈도우를 적용하였을 때, 적합도 97% 이상의 성능이 확보될 수 있음을 확인하였다.

점진적 기계학습 기반의 레이더 위협체 역추정 모델 생성 및 갱신 (Managing the Reverse Extrapolation Model of Radar Threats Based Upon an Incremental Machine Learning Technique)

  • 김철표;노상욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권4호
    • /
    • pp.29-39
    • /
    • 2017
  • 다양한 전자전 상황에서 단위 위협체에 대하여 전자전 모델링과 시뮬레이션을 수행할 수 있는 통합 전자전 시뮬레이터의 개발 필요성이 대두되고 있다. 본 논문에서는 전자전 상황에서 전자정보 수집신호의 변수를 기반으로 전자파 신호를 발산하는 레이더 위협을 역추정하기 위한 시뮬레이션 시스템의 구성요소를 분석하고, 역추정 모델을 점진적으로 유지할 수 있는 방법을 제안한다. 또한, 실험을 통하여 점진적 역추정 모델 갱신 기법의 유효성 및 개별 역추정 결과의 통합 기법을 평가한다. 개별 역추정 모델의 생성을 위하여 의사결정트리, 베이지안 분류기, 인공신경망 및 유클리디안 거리 측정방식과 코사인 유사도 측정방식을 활용하는 군집화 알고리즘을 이용하였다. 첫 번째 실험에서 레이더 위협체에 대한 역추정 모델을 구축하기 위한 위협 예제의 크기를 점진적으로 증가시키면 역추정 모델의 정확도는 향상되었으며, 이러한 과정이 반복되면 역추정 모델에 대한 정확도는 일정한 값으로 수렴하였다. 두 번째 실험에서는 개별 역추정 모델의 결과를 통합하기 위하여 투표, 가중투표 및 뎀스터-쉐이퍼 알고리즘을 이용하였으며, 역추정 모델의 통합 결과는 뎀스터-쉐이퍼 알고리즘에 의한 역추정 정확도가 가장 좋은 성능을 보였다.

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF

중소기업 조직구성원의 자기효능감이 직무열의와 직무성과에 미치는 영향: 구조모형분석-인공신경망 분석의 적용 (The Impact of Self-efficacy on Job Engagement and Job Performance of SMEs' Members: SEM-ANN Analysis)

  • 강태원;이용기;이용숙
    • 벤처창업연구
    • /
    • 제13권6호
    • /
    • pp.155-166
    • /
    • 2018
  • 본 연구의 목적은 중소기업 조직구성원의 자기효능감이 직무열의와 직무성과에 미치는 영향을 연구하고 SEM-ANN (Structural Equation Modeling-Artificial Neural Network) 분석을 적용하여 성별 (Ggender)과 결혼 여부의 변수에 따른 차이를 분석하기 위한 것이다. 연구목적의 달성을 위하여 400명의 중소기업 조직구성원들로부터 자료를 수집하여 285명의 유효표본이 분석에 이용되었다. 본 연구에서 자기효능감은 자신감, 자기조절효능감, 그리고 과제난이도 선호의 세 가지 하위차원으로 구성되었다. 분석 결과, 자신감, 자기조절효능감, 그리고 과제난이도 선호 등의 자기효능감은 직무열의에 직접적으로 유의한 정(+)의 영향을 미치는 것으로 나타났다. 그리고 자기효능감 중 자신감과 자기조절효능감은 직무성과에 정(+)의 유의한 영향을 미치나, 과제난이도 선호는 유의한 영향을 미치지 않는 것으로 나타났다. 또한, 직무열의는 직무성과에 정(+)의 유의한 영향을 미치는 것으로 나타났으며, 자기효능감과 직무성과 간의 관계에서 매개역할을 하는 것으로 나타났다. 또한 미혼 남성은 과제난이도 선호, 기혼 남성은 자기조절효능감을 가장 중요시하나, 여성은 결혼 여부에 관계없이 자신감과 자기조절효능감을 중시하는 것으로 나타났다. 본 연구는 주로 교육 및 서비스업종 등에서 이루어지고 있는 자기효능감 관련 연구를 다차원으로 측정하여, 중소기업 구성원들을 대상으로 하여 자기효능감-직무열의-직무성과 간의 프레임워크를 제시하고, 기업들이 조직구성원의 성별, 결혼 여부에 따른 조직구성원 관리의 근거를 찾는데 도움을 줄 수 있다는데 의의가 있다. 또한, 본 연구의 SEM-ANN 분석 과정은 지금까지 SEM을 이용한 선형적(보상적) 관계에서 영향 또는 기준 변수들의 조합을 분석할 수 있는 비선형적 (비보상적) 관계를 설명한다는 점에서 차별성이 있다.