• 제목/요약/키워드: 기계학습 구조

검색결과 314건 처리시간 0.031초

기계학습 알고리즘의 컴퓨팅시간 단축을 위한 새로운 통계적 샘플링 기법 (A New Statistical Sampling Method for Reducing Computing time of Machine Learning Algorithms)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제21권2호
    • /
    • pp.171-177
    • /
    • 2011
  • 기계학습에서 모형의 정확도와 컴퓨팅시간은 중요하게 다루어지는 부분이다. 일반적으로 모형을 구축하는 데 사용되는 컴퓨팅시간은 분석에 사용되는 데이터의 크기에 비례하여 커진다. 따라서 컴퓨팅시간 단축을 위하여 분석에 사용되는 데이터의 크기를 줄이는 샘플링전략이 필요하다. 하지만 학습데이터의 크기가 작게 되면 구축된 모형의 정확도도 함께 떨어지게 된다. 본 논문에서는 이와 같은 문제를 해결하기 위하여 전체데이터를 분석하지 않아도 전체를 분석할 때와 비슷한 모형성능을 유지할 수 있는 새로운 통계적 샘플링방법을 제안한다. 주어진 데이터의 구조에 따라 최선의 통계적 샘플링기법을 선택할 수 있는 기준을 제시한다. 군집, 층화, 계통추출에 의한 통계적 샘플링기법을 사용하여 정확도를 최대한 유지하면서 컴퓨팅시간을 단축할 수 있는 방법을 보인다. 제안방법의 성능을 평가하기 위하여 객관적인 기계학습 데이터를 이용하여 전체데이터와 샘플데이터 간의 정확도와 컴퓨팅시간을 비교하였다.

다양한 동작 학습을 위한 깊은신경망 구조 비교 (A Comparison of Deep Neural Network Structures for Learning Various Motions)

  • 박수환;이제희
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권5호
    • /
    • pp.73-79
    • /
    • 2021
  • 최근 컴퓨터 애니메이션 분야에서는 기존의 유한상태기계나 그래프 기반의 방식들에서 벗어나 딥러닝을 이용한 동작 생성 방식이 많이 연구되고있다. 동작 학습에 요구되는 네트워크의 표현력은 학습해야하는 동작의 단순한 길이보다는 그 안에 포함된 동작의 다양성에 더 큰 영향을 받는다. 본 연구는 이처럼 학습해야하는 동작의 종류가 다양한 경우에 효율적인 네트워크 구조를 찾는것을 목표로 한다. 기본적인 fully-connected 구조, 여러개의 fully-connected 레이어를 병렬적으로 사용하는 mixture of experts구조, seq2seq처리에 널리 사용되는 순환신경망(RNN), 그리고 최근 시퀀스 형태의 데이터 처리를 위해 자연어 처리 분야에서 사용되고있는 transformer구조의 네트워크들을 각각 학습하고 비교한다.

진화신경망을 이용한 프로그램 행위학습 및 비정상행위탐지 (Anomaly Detection and Learning of Program Behaviors with Evolutionary Neural Networks)

  • 한상준;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.262-264
    • /
    • 2004
  • 시스템 호출 감사자료기반 기계학습기법을 사용한 프로그램 행위 학습방법은 효과적인 호스트기반 침입탐지 방법이며, 특히 신경망은 기존 연구 중 가장 좋은 성능을 보였다. 하지만 보통의 신경망은 그 구조를 찾기 위한 방법이 알려져 있지 않아 침입탐지에 효과적인 구조를 찾기 위해서는 많은 시간이 요구된다. 본 논문에서는 기존 신경망 기반 침입탐지시스템의 단점을 보완하고 성능을 향상시키기 위해 진화신경망을 이용한 방법을 제안한다. 진화 신경망은 신경망의 구조와 가중치를 동시에 학습하기 때문에 일반 신경망보다 빠른 시간 내에 더 좋은 성능의 신경망을 얻을 수 있다는 장점이 있다. 1999년의 DARPA IDEVAL자료로 실험한 결과 기존의 연구보다 좋은 성능을 보여 진화신경망이 침입탐지에 효과적임을 확인할 수 있었다.

  • PDF

생의학 분야 학술 논문에서의 개체명 인식 및 관계 추출을 위한 언어 자원 수집 및 통합적 구조화 방안 연구 (A Study on Collecting and Structuring Language Resource for Named Entity Recognition and Relation Extraction from Biomedical Abstracts)

  • 강슬기;최윤수;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.227-248
    • /
    • 2017
  • 본 논문에서는 급격히 증가하는 생의학 분야 비정형 텍스트에서 핵심적 내용을 추출할 수 있는 기계학습 기반 정보 추출시스템을 구축하기 위한 언어자원 수집 및 통합적 구조화 방안을 제안한다. 제안된 방법은 정보 추출 시스템을 크게 개체명 인식과 개체명 간 관계 추출 시스템으로 구분하고, 각각의 시스템에 적합한 학습데이터를 구성하기 위해 생의학 분야 개체명 사전과 학습 집합을 수집한다. 그리고 수집된 해당 자원들의 특성을 분석하여 개체 구별을 위해 필수적으로 포함시켜야 할 항목들을 도출하고 이를 통해 시스템 학습과정에서 사용될 학습 데이터를 구성하기 위한 항목을 선정한다. 이와 같이 선정된 학습데이터의 구성 내용에 따라 수집된 자원들을 가공하여 학습 데이터를 구축한다. 본 연구에서는 생의학 분야의 하위 분야인 유전자, 단백질, 질병, 약물 4개 분야에 대한 개체명 사전과 학습 집합을 수집하여 각각을 학습 데이터로 구축하였으며, 개체명 사전을 통해 구축된 개체명 인식용 학습 데이터를 대상으로 개체명 수용 범위를 측정하기 위한 검증 과정을 수행하였다.

기계학습 기반 회절파 분리 적용을 통한 GPR 탐사 자료의 도로 하부 공동 및 구조물 탐지 성능 향상 (Improvement of Underground Cavity and Structure Detection Performance Through Machine Learning-based Diffraction Separation of GPR Data)

  • 김수윤;변중무
    • 지구물리와물리탐사
    • /
    • 제26권4호
    • /
    • pp.171-184
    • /
    • 2023
  • 최근 도심지 도로에서 빈번하게 발생하는 도로 파임의 주원인인 지하 공동의 발생을 파악하기 위해, 차량 부착형 지표투과레이더(GPR)를 통해 얻은 대량의 취득 자료를 효율적으로 처리하기 위한 기계학습 기반 공동 탐지 기술이 활발하게 연구되고 있다. 그러나 기계학습 자료 생성 시 단순한 영상 처리 기법들만 활용되고 있고, 탄성파 탐사나 GPR 자료 처리에 시도되었던 여러 기법들은 충분히 활용되지 못하고 있다. 이 연구에서는 지하 공동의 탐지가 대부분 회절파의 탐지에 의해 이루어진다는 점에 착안하여 GPR 자료로부터 회절파를 분리하여 YOLO v5 모델을 이용한 도로 하부 공동 탐지 모델의 성능을 향상시켰다. 탄성파에서 개발된 기계학습 기반 회절파 분리 기법을 GPR 자료에 맞게 변형한 후, GPR 현장 자료에서 회절파를 분리하여 공동 탐지 모델의 입력으로 사용하였다. 서울시 공공 개방 GPR 자료를 이용하여 제안된 방법의 성능을 검증한 결과, 회절파 분리를 이용했을 때 더 정확하게 공동 및 지하 구조물을 탐지하는 것을 확인하였다. 또한 제안된 회절파 분리 기법은 향후 GPR 탐사가 이용되는 다양한 분야에서 활용될 수 있을 것으로 기대된다.

실시간 현장관측과 기계학습을 이용한 토양수분 예측기술의 개발 및 적용 (Development and application of soil moisture prediction using real-time in-situ observation and machine learning)

  • 우현아;이예원;김민영;노성진
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.286-286
    • /
    • 2023
  • 물의 전체 순환 구조에서 토양수분이 차지하는 정량적 비중은 상대적으로 작지만, 강우-유출 과정의 비선형에 영향을 미치는 지배적 요인 중 하나이고, 토양 침식과 산사태, 농업생산량, 기후 변화 대응 등 광범위한 주제와 연관되어 있어, 토양수분의 물리과정에 대한 이해 증진과 예측 기술의 지속적인 개선이 필요하다. 본 연구에서는 금오공과대학교 유역 내에서 토양수분과 기상 요소를 실시간 관측하고, 기계학습 기법을 이용하여 토양수분을 단기 예측하는 기술을 개발하고 평가한다. 구체적으로는, 토양 관측 장비인 TEROS를 사용하여 표층 지점의 10cm, 심층 지점의 40cm에서의 토양수분, 토양장력과 토양온도를, 기상 관측 장비인 ATMOS를 사용하여 태양복사, 강수량, 기온, 풍속, 대기압 등 다양한 기상 요소를, 실시간 클라우드 방식으로 1여 년간 수집한 데이터를 활용한다. 또한, 과거 및 실시간 데이터를 기반으로 LSTM(Long-Short Term Memory) 기법을 사용하여 토양수분 예측 모형을 구축하고, 선행 예측 시간에 따른 모의 정확도를 평가한다. 기상 요소의 누적 등 자료 분석 방법이 표층 및 심층 토양수분 예측에 미치는 영향, 그리고 예측 모형 개선 방향에 대해 토의한다. 실시간 현장 관측 자료 및 인공지능 기반 단기 토양수분 예측 모의 기술은 소규모 유역의 수문순환 분석 및 물리기반 모형의 개선 등 다양한 분야에서 활용할 수 있을 것으로 기대된다.

  • PDF

분류 알고리즘과 NCA를 활용한 기계학습 기반 구조건전성 모니터링 시스템 (Machine Learning Based Structural Health Monitoring System using Classification and NCA)

  • 신창교;권현석;박유림;김천곤
    • 한국항행학회논문지
    • /
    • 제23권1호
    • /
    • pp.84-89
    • /
    • 2019
  • 본 연구는 복합재 항공기의 비행 데이터를 활용한 기계학습 기반 구조건전성 모니터링 시스템 연구의 예비 연구이다. 본 연구에서는 구조건전성 모니터링에 이용되기에 가장 적합한 기계학습 알고리즘을 선별하고, 실 기체 데이터에 대한 적용을 위해 차원 축소를 수행하였다. 이를 위해 외팔보를 통해 모사된 항공기 날개 구조와 부가 질량을 통해 손상 모사 실험을 진행하고, 분류 알고리즘을 통해 데이터를 손상의 위치와 정도에 따라 구분하였다. 이를 위해 FBG (fiber bragg grating) 센서를 부착한 외팔보의 진동 실험을 통해 정상상태와 12개의 손상상태에 대한 데이터를 취득하고, MATLAB 환경에서 tree, discriminant, SVM (support vector machine), kNN, ensemble 알고리즘의 비교와 파라미터 튜닝을 통해 가장 적합한 알고리즘을 도출하였다. 또한 NCA (neighborhood component analysis)를 이용한 특징 선택을 통해, 실 기체에서 나올 수 있는 고차원 데이터의 관리를 위해 필요한 차원 축소를 수행하였다. 그 결과, quadratic SVM이 NCA를 적용하지 않은 모델에서 98.7%, NCA를 적용한 모델에서 95.9%로 가장 높은 정답률을 보였다. 또한 NCA 적용 후 모델의 예측 속도, 학습 시간, 용량이 모두 향상되었다.

골프공 인식을 위한 OpenCV 기반 신경망 최적화 구조 (Optimal Structures of a Neural Network Based on OpenCV for a Golf Ball Recognition)

  • 김강철
    • 한국전자통신학회논문지
    • /
    • 제10권2호
    • /
    • pp.267-274
    • /
    • 2015
  • 본 논문은 OpenCV 라이브러리를 기반으로 골프공 인식을 위한 신경망의 최적화 구조와 관심영역의 빛의 명도를 계산한다. 개발된 시스템은 전처리, 영상처리, 기계 학습 과정으로 구성되며, 기계 학습과정은 테스트 영상으로부터 골프공과 다른 오브젝트에 대한 Hu의 7 불변 모멘트, 가로 및 세로 비율 또는 면적으로부터 계산된 ${\pi}$를 입력으로 사용하여 다층 퍼셉트론을 기반으로 학습모델을 구한다. 다층 퍼셉트론에 대한 최적의 은닉층과 노드의 수를 결정하도록 모의 실험한 결과 2개의 은닉층과 각 은닉층에 9개의 노드를 가질 때 최대의 인식율과 최소 실행 시간을 얻었다. 그리고 관심영역의 최적 명도는 200으로 계산되었다.

특허분석을 위한 빅 데이터학습 (A Big Data Learning for Patent Analysis)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.406-411
    • /
    • 2013
  • 빅 데이터는 여러 분야에서 다양한 개념으로 사용된다. 예를 들어, 컴퓨터학과 사회학에서 빅 데이터에 대한 접근방법에 차이가 있지만, 데이터분석 관점에서는 공통적인 부분을 갖는다. 즉, 공학이든 사회과학이든 빅 데이터에 대한 분석은 반드시 필요하다. 통계학과 기계학습은 빅 데이터의 분석을 위한 대표적인 분석도구이다. 본 논문에서는 빅 데이터분석을 위한 학습도구에 대하여 알아보고 검색된 빅 데이터 원천에서부터 분석을 거쳐 최종적으로 분석결과를 사용하는 전체과정에 대하여 효율적인 빅 데이터학습 절차에 대하여 제안한다. 특히, 대표적인 빅 데이터 구조를 갖고 있는 특허문서에 대하여 빅데이터학습을 적용하여 특허분석을 수행하고 이 결과를 기술예측에 적용하는 방법에 대하여 연구한다. 제안방법에 대한 실제적용을 위하여 전 세계 특허청으로부터 빅 데이터 관련 특허문서를 검색하여 텍스트 마이닝의 전처리와 통계학의 다중선형회귀분석을 이용한 구체적인 빅 데이터학습에 대한 사례연구를 수행하였다.

Word2Vec 모델을 활용한 한국어 문장 생성 (Generating Korean Sentences Using Word2Vec)

  • 남현규;이영석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-212
    • /
    • 2017
  • 고도화된 머신러닝과 딥러닝 기술은 영상처리, 자연어처리 등의 분야에서 많은 문제를 해결하고 있다. 특히 사용자가 입력한 문장을 분석하고 그에 따른 문장을 생성하는 자연어처리 기술은 기계 번역, 자동 요약, 자동 오류 수정 등에 널리 이용되고 있다. 딥러닝 기반의 자연어처리 기술은 학습을 위해 여러 계층의 신경망을 구성하여 단어 간 의존 관계와 문장 구조를 학습한다. 그러나 학습 과정에서의 계산양이 방대하여 모델을 구성하는데 시간과 비용이 많이 필요하다. 그러나 Word2Vec 모델은 신경망과 유사하게 학습하면서도 선형 구조를 가지고 있어 딥러닝 기반 자연어처리 기술에 비해 적은 시간 복잡도로 고차원의 단어 벡터를 계산할 수 있다. 따라서 본 논문에서는 Word2Vec 모델을 활용하여 한국어 문장을 생성하는 방법을 제시하였다. 본 논문에서는 지정된 문장 템플릿에 유사도가 높은 각 단어들을 적용하여 문장을 구성하는 Word2Vec 모델을 설계하였고, 서로 다른 학습 데이터로부터 생성된 문장을 평가하고 제안한 모델의 활용 방안을 제시하였다.

  • PDF