• 제목/요약/키워드: 기계학습 모델

검색결과 1,145건 처리시간 0.03초

EfficientNet 모델을 사용한 목조 문화재의 크랙 감지 (A Crack Detection of Wooden Cultural Assets using EfficientNet model)

  • 강재용;김인기;임현석;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.125-127
    • /
    • 2021
  • 본 논문에서는 목조 문화재의 변위 현상 중 하나인 크랙 현상을 감지할 수 있는 EfficientNet 기반 모델을 제안한다. 우선 사전 학습된 EfficientNet모델을 통해 학습 이미지로부터 심층 특징을 추출하고 크랙이 존재하는지 아닌지에 대해 분류하기 위한 완전 연결 신경망을 학습한다. 그런 다음 새로운 목조 문화재 이미지가 들어왔을 때 학습한 모델을 통해서 크랙이 존재하는지에 대해 최종적으로 판별하게 된다. 데이터 셋으로는 충주시 근처의 문화재에 방문해서 수집한 목조 이미지를 가지고 정상 및 비정상으로 구분한 데이터 셋을 사용하였다. 실험 결과 EfficientNet을 사용한 딥 러닝 기반 모델이 다른 사전 학습된 합성 곱 신경망 모델보다 더 좋은 성능을 나타냄을 확인하였다. 이러한 결과로부터 우리가 제안한 방법이 목재 문화재에서의 크랙 검출에 있어서 적합함을 보여준다.

  • PDF

문학 텍스트를 활용한 머신러닝 언어모델 구현 (Machine Learning Language Model Implementation Using Literary Texts)

  • 전현구;정기철;권경아;이인성
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.427-436
    • /
    • 2021
  • 본 연구의 목적은 문학 텍스트를 학습한 머신 러닝 언어 모델을 구현하는데 있다. 문학 텍스트는 일상 대화문처럼 질문에 대한 답변이 분명하게 구분되지 않을 때가 많고 대명사와 비유적 표현, 지문, 독백 등으로 다양하게 구성되어 있다는 특징이 있다. 이런 점들이 알고리즘의 학습을 용이하지 않게 하여 문학 텍스트를 활용하는 기계 학습의 필요성을 저해시킨다. 문학 텍스트를 학습한 알고리즘이 일반 문장을 학습한 알고리즘에 비해 좀 더 인간 친화적인 상호작용을 보일 가능성이 높다. 본 논문은 '문학 텍스트를 학습한 머신 러닝 언어 모델 구현'에 관한 연구로서, 대화형 기계 학습에 문학 텍스트를 활용하는 연구에서 필수적으로 선행되어야 할 세 가지 텍스트 보정 작업을 제안한다: 대명사 처리, 대화쌍 늘리기, 데이터 증폭 등에 대한 내용으로 기계 학습이 용이하고 그 효과도 높다고 판단됩니다. 인공지능을 위한 학습용 데이터는 그 의미가 명료해야 기계 학습이 용이하고 그 효과도 높게 나타난다. 문학과 같은 특수한 장르의 텍스트를 자연어 처리 연구에 도입하는 것은 새로운 언어 학습 방식의 제안과 함께 머신 러닝의 학습 영역도 확장시켜 줄 것이다.

기계학습 모델과 설문결과를 융합한 공격적 성향 운전자 탐색 연구 (A Study of Aggressive Driver Detection Combining Machine Learning Model and Questionnaire Approaches)

  • 박귀우;박찬식
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권3호
    • /
    • pp.361-370
    • /
    • 2017
  • 본 논문에서는 공격적 성향의 운전자를 판단할 수 있는 기계학습 방식과 설문지 방식을 융합한 운전자 성향 판단 연구의 일환으로 두 방법으로 결정된 운전자 성향정보의 상관성을 분석하였다. 30명의 운전자를 대상으로 설문지를 이용한 주관적 성향을 정보를 수집하고 기계학습 기반의 성향판단 시스템을 이용하여 객관적 성향을 취득하였다. 이 중에서 기계학습 기반의 성향판단 시스템은 운전자행위 성향 분류 모델을 기반으로 설계되었다. 모델을 도출하기 위하여 운전자의 가속 패달과 브레이크 패달 조작 데이터와 HMM 기법을 이용한 기계학습을 수행하였다. 두 가지 방법으로 추정한 공격적 성향정보를 Pearson 방식으로 상관관계를 분석한 결과 높은 상관관계가 있음을 확인하였다. 뿐만 아니라 객관적 성향은 동일한 운전자에 대하여 고유한 특성이 있음을 확인하였다. 본 논문의 실험결과는 향후 두 방법을 융합하는 연구를 수행하기 위한 참고자료가 될 것이다. 또한 운전자의 공격적 성향이 주의어시스트, 운전자 식별, 도난방지 등 지능형 운전자 보조시스템에도 응용 될 수 있음을 확인하였다.

기계학습 기반 전력망 상태예측 모델 성능 유지관리 자동화 기법 (Management Automation Technique for Maintaining Performance of Machine Learning-Based Power Grid Condition Prediction Model)

  • 이해성;이병성;문상근;김준혁;이혜선
    • KEPCO Journal on Electric Power and Energy
    • /
    • 제6권4호
    • /
    • pp.413-418
    • /
    • 2020
  • 초기 학습 데이터의 과적합으로 인한 전력망 상태예측 모델의 성능 감소를 방지하고 예측모델의 예측 정확도 유지를 통한 계속적인 현장활용을 위해서는 기계학습 모델의 예측 정확도를 지속적으로 관리할 필요가 있다. 이를 위해, 본 논문에서는 다양한 요인에 의해 끊임없이 변화하는 전력망 상태 데이터의 특성을 고려하여 예측모델의 정확성과 신뢰성을 높이고 현장 적용 가능한 수준의 품질을 유지하기 위한 기계학습 기반 전력망 상태예측 모델의 성능 유지관리 자동화 기법을 제안한다. 제안 기법은 워크플로우 관리 기술의 적용을 통해 전력망 상태예측 모델 성능 유지관리를 위한 일련의 태스크들을 워크플로우의 형태로 모델링하고 이를 자동화하여 업무를 효율화 하였다. 또한, 기존 기술에서는 시도되지 않았던 학습데이터의 통계적 특성 변화 정도와 예측의 일반화 수준을 모두 고려한 예측모델의 성능 평가를 통해 성능 결과의 신뢰성을 확보하고 이를 통해 예측 모델의 정확도를 일정 수준으로 유지관리하고 더욱 성능이 우수한 예측모델의 신규 개발이 가능하다. 결과적으로 본 논문에서 제안하는 전력망 상태예측 모델 성능 유지관리 자동화 기법을 통해 예측모델의 성능 저하문제를 해결하여 분산자원 연계 등 외부 환경의 변화에 유연한 예측모델 관리를 통해 정확성과 신뢰성이 보장된 예측 모델의 지속적인 활용이 가능하다.

딥러닝 기반 탄성파 단층 해석을 위한 합성 학습 자료 생성 (Synthetic Training Data Generation for Fault Detection Based on Deep Learning)

  • 최우창;편석준
    • 지구물리와물리탐사
    • /
    • 제24권3호
    • /
    • pp.89-97
    • /
    • 2021
  • 탄성파 자료에서의 단층 해석은 기계학습을 적용하기 매우 적합한 분야라고 할 수 있다. 결과적으로 다양한 형태의 기계학습 기반 단층 해석 기술들이 개발되고 있으며, 특히 합성 자료를 사용해 기계학습 모델을 훈련시키는 연구들이 중점적으로 수행되고 있다. 합성 자료를 사용할 경우 기계학습 모델을 훈련시키기 위한 대량의 자료를 확보하기가 용이하고, 정확한 단층 구조 라벨을 함께 제작할 수 있다는 장점이 있다. 합성 자료로 훈련시킨 모델을 사용해 현장 자료를 해석하기 위해서는 모델 훈련에 사용한 합성 자료가 지질학적으로 현실적이어야 한다. 이 연구에서는 실제 현장 자료와 유사한 합성 자료 제작을 위한 기술을 소개한다. 먼저 현실적인 단층 구조가 포함된 반사계수 모델을 제작한 후 일방향 파동 방정식 모델링을 적용해 효율적으로 겹쌓기 단면을 생성한다. 생성된 겹쌓기 단면에 참반사보정을 적용해 회절파의 영향을 제거하고, 무작위 잡음을 추가함으로써 현장 자료와 비슷한 형태의 합성 자료를 생성할 수 있다. 생성한 합성 자료를 U-Net 구조의 합성곱 신경망 모델에 적용하여 검증한 결과, 현실적으로 만들어진 합성 자료는 현장 자료에 적용이 가능한 딥러닝 모델을 효과적으로 훈련시킬 수 있다는 것을 확인하였다.

건설현장 정형·비정형데이터를 활용한 기계학습 기반의 건설재해 예측 모델 개발 (Development of Machine Learning-based Construction Accident Prediction Model Using Structured and Unstructured Data of Construction Sites)

  • 조민건;이동환;박주영;박승희
    • 대한토목학회논문집
    • /
    • 제42권1호
    • /
    • pp.127-134
    • /
    • 2022
  • 현재 국내 건설업에서는 꾸준히 증가하는 건설재해를 예방하기 위해 다양한 정책적 노력과 연구가 활발하게 진행되고 있다. 기존 연구에서 건설재해 예방을 위해 개발한 예측 모델의 경우, 주로 정형데이터만을 활용하였기에 건설현장의 다양한 특성을 충분히 고려하지 못한 예측 결과가 도출되었다. 따라서, 본 연구에서는 정형데이터와 텍스트 형식의 비정형데이터를 동시에 활용하여 건설현장의 특성을 충분히 고려할 수 있는 기계학습 기반 건설재해 사전 예측 모델을 개발하였다. 본 연구는 기계학습을 위해 건설공사 안전관리 종합정보망(CSI)의 최근 3년간 건설재해 데이터 6,826건을 수집하였다. 수집된 데이터 중 정형데이터의 학습은 5가지 알고리즘의 성능 분석을 통해 Decision forest 알고리즘을 사용하였고 비정형데이터의 학습은 BERT 언어모델을 사용하였다. 정형 및 비정형데이터를 동시에 활용한 건설재해 예측 모델의 성능 비교 결과, 정형데이터만을 활용한 경우보다 약 20 % 향상된 95.41 %의 예측정확도가 도출되었다. 본 연구 결과, 비정형데이터를 동시에 활용함으로써 예측 모델의 효과적인 성능 향상을 확인하였으며, 보다 정확한 예측을 통한 건설재해 저감을 기대할 수 있다.

수문 시계열 예측을 위한 LSTM의 다지점 통합 학습 방안 평가 (Evaluation of multi-basin integrated learning method of LSTM for hydrological time series prediction)

  • 최정현;원정은;정하은;김상단
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.366-366
    • /
    • 2022
  • 유역의 하천유량과 같은 수문 시계열을 모의 또는 예측하기 위한 수문 모델링에서 최근 기계 학습 방법을 활용한 연구가 활발하게 적용되고 있는 추세이다. 이러한 데이터 기반 모델링 접근법은 입출력 자료에서 관찰된 패턴을 학습하며, 특히, 장단기기억(Long Short-Term Memory, LSTM) 네트워크는 많은 연구에서 수문 시계열 예측에 대한 적용성이 검증되었으나, 장기간의 고품질 관측자료를 활용할 때 더 나은 예측성능을 보인다. 그러나 우리나라의 경우 장기간 관측된 고품질의 하천유량 자료를 확보하기 어려운 실정이다. 따라서 본 연구에서는 LSTM 네트워크의 학습 시 가용한 모든 유역의 자료를 통합하여 학습시켰을 때 하천유량 예측성능을 개선할 수 있는지 판단해보고자 하였다. 이를 위해, 우리나라 13개 댐 유역을 대상으로 대상 유역의 자료만을 학습한 모델의 예측성능과 모든 유역의 자료를 학습한 모델의 예측성능을 비교해 보았다. 학습은 2001년부터 2010년까지 기상자료(강우, 최저·최고·평균기온, 상대습도, 이슬점, 풍속, 잠재증발산)를 이용하였으며, 2011년부터 2020년에 대해 테스트 되었다. 다지점 통합학습을 통해 테스트 기간에 대해 예측된 각 유역의 일 하천유량의 KGE 중앙값이 0.74로 단일지점 학습을 통해 예측된 KGE(0.72)보다 다소 개선된 결과를 보여주었다. 다지점 통합학습이 하천유량 예측에 큰 개선을 달성하지는 못하였으며, 추가적인 가용 자료 확보와 LSTM 구성의 개선을 통해 추가적인 연구가 필요할 것으로 판단된다.

  • PDF

한국어 기계 독해를 위한 언어 모델의 효과적 토큰화 방법 탐구 (Exploration on Tokenization Method of Language Model for Korean Machine Reading Comprehension)

  • 이강욱;이해준;김재원;윤희원;유원호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.197-202
    • /
    • 2019
  • 토큰화는 입력 텍스트를 더 작은 단위의 텍스트로 분절하는 과정으로 주로 기계 학습 과정의 효율화를 위해 수행되는 전처리 작업이다. 현재까지 자연어 처리 분야 과업에 적용하기 위해 다양한 토큰화 방법이 제안되어 왔으나, 주로 텍스트를 효율적으로 분절하는데 초점을 맞춘 연구만이 이루어져 왔을 뿐, 한국어 데이터를 대상으로 최신 기계 학습 기법을 적용하고자 할 때 적합한 토큰화 방법이 무엇일지 탐구 해보기 위한 연구는 거의 이루어지지 않았다. 본 논문에서는 한국어 데이터를 대상으로 최신 기계 학습 기법인 전이 학습 기반의 자연어 처리 방법론을 적용하는데 있어 가장 적합한 토큰화 방법이 무엇인지 알아보기 위한 탐구 연구를 진행했다. 실험을 위해서는 대표적인 전이 학습 모형이면서 가장 좋은 성능을 보이고 있는 모형인 BERT를 이용했으며, 최종 성능 비교를 위해 토큰화 방법에 따라 성능이 크게 좌우되는 과업 중 하나인 기계 독해 과업을 채택했다. 비교 실험을 위한 토큰화 방법으로는 통상적으로 사용되는 음절, 어절, 형태소 단위뿐만 아니라 최근 각광을 받고 있는 토큰화 방식인 Byte Pair Encoding (BPE)를 채택했으며, 이와 더불어 새로운 토큰화 방법인 형태소 분절 단위 위에 BPE를 적용하는 혼합 토큰화 방법을 제안 한 뒤 성능 비교를 실시했다. 실험 결과, 어휘집 축소 효과 및 언어 모델의 퍼플렉시티 관점에서는 음절 단위 토큰화가 우수한 성능을 보였으나, 토큰 자체의 의미 내포 능력이 중요한 기계 독해 과업의 경우 형태소 단위의 토큰화가 우수한 성능을 보임을 확인할 수 있었다. 또한, BPE 토큰화가 종합적으로 우수한 성능을 보이는 가운데, 본 연구에서 새로이 제안한 형태소 분절과 BPE를 동시에 이용하는 혼합 토큰화 방법이 가장 우수한 성능을 보임을 확인할 수 있었다.

  • PDF

Generative Adversarial Network 학습을 통한 감정 텍스트 생성에 관한 연구 (A Study on the Emotional Text Generation using Generative Adversarial Network)

  • 김우성;김현철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.380-382
    • /
    • 2019
  • GAN(Generative Adversarial Network)은 정해진 학습 데이터에서 정해진 생성자와 구분자가 서로 각각에게 적대적인 관계를 유지하며 동시에 서로에게 생산적인 관계를 유지하며 가능한 긍정적인 영향을 주며 학습하는 기계학습 분야이다. 전통적인 문장 생성은 단어의 통계적 분포를 기반으로 한 마르코프 결정 과정(Markov Decision Process)과 순환적 신경 모델(Recurrent Neural Network)을 사용하여 학습시킨다. 이러한 방법은 문장 생성과 같은 연속된 데이터를 기반으로 한 모델들의 표준 모델이 되었다. GAN은 표준모델이 존재하는 해당 분야에 새로운 모델로써 다양한 시도가 시도되고 있다. 하지만 이러한 모델의 시도에도 불구하고, 지금까지 해결하지 못하고 있는 다양한 문제점이 존재한다. 이 논문에서는 다음과 같은 두 가지 문제점에 집중하고자 한다. 첫째, Sequential 한 데이터 처리에 어려움을 겪는다. 둘째, 무작위로 생성하기 때문에 사용자가 원하는 데이터만 출력되지 않는다. 본 논문에서는 이러한 문제점을 해결하고자, 부분적인 정답 제공을 통한 조건별 생산적 적대 생성망을 설계하여 이 방법을 사용하여 해결하였다. 첫째, Sequence to Sequence 모델을 도입하여 Sequential한 데이터를 처리할 수 있도록 하여 원시적인 텍스트를 생성할 수 있게 하였다. 둘째, 부분적인 정답 제공을 통하여 문장의 생성 조건을 구분하였다. 결과적으로, 제안하는 기법들로 원시적인 감정 텍스트를 생성할 수 있었다.

블록체인 기반 연합학습을 위한 레퍼런스 아키텍처 (A Reference Architecture for Blockchain-based Federated Learning)

  • 고은수;문종현;이광기;손채봉
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.119-122
    • /
    • 2022
  • 연합학습은, 데이터 샘플을 보유하는 다수의 분산 에지 디바이스 또는 서버들이 원본 데이터를 공유하지 않고 기계학습 문제를 해결하기 위해 협력하는 기술로서, 각 클라이언트는 소유한 원본 데이터를 로컬모델 학습에만 사용함으로써, 데이터 소유자의 프라이버시를 보호하고, 데이터 소유 및 활용의 파편화 문제를 해결할 수 있다. 연합학습을 위해서는 통계적 이질성 및 시스템적 이질성 문제 해결이 필수적이며, 인공지능 모델 정확도와 시스템 성능을 향상하기 위한 다양한 연구가 진행되고 있다. 최근, 중앙서버 의존형 연합학습의 문제점을 극복하고, 데이터 무결성 및 추적성과 데이터 소유자 및 연합학습 참여자에게 보상을 효과적으로 제공하기 위한, 블록체인 융합 연합학습기술이 주목받고 있다. 본 연구에서는 이더리움 기반 블록체인 인프라와 호환되는 연합학습 레퍼런스 아키텍처를 정의 및 구현하고, 해당 아키텍처의 실용성과 확장성을 검증하기 위하여 대표적인 연합학습 알고리즘과 데이터셋에 대한 실험을 수행하였다.

  • PDF