• 제목/요약/키워드: machine learning

검색결과 5,297건 처리시간 0.041초

이산화 알고리즘을 이용한 계층적 클러스터링의 실험적 성능 평가 (Performance Comparison of Clustering using Discritization Algorithm)

  • 원재강;이정찬;정용규;이영호
    • 서비스연구
    • /
    • 제3권2호
    • /
    • pp.53-60
    • /
    • 2013
  • 데이터로부터 의미있는 형태의 정보를 얻기 위한 여러 가지 기법들이 개발되어 왔지만, 최근 들어 가장 각광받는 분야 중 하나는 패턴인식과 기계학습 방법이다. 기존의 학습 알고리즘은 대부분 범주 형 속성에 기반 한 규칙 또는 의사 결정 모델을 생성한다. 그런데, 실세계의 데이터는 보통 범주 형 속성 외에도 수치 값을 갖는 속성을 포함하고, 또 많은 경우에 있어 수치 형 속성으로만 구성되기도 한다. 따라서 이러한 경우, 데이터를 학습에 사용하기 위해서는 수치형 속성에 대한 적절한 처리 과정이 필요하다. 본 논문에서는, 수치형 속성의 도메인을 여러 개의 분절된 부분으로 나누어 학습 알고리즘에 사용하는 방법인 이산화 기법을 설명하고 또한 데이터마이닝의 기법으로 사용되는 클러스터링(Clustering)을 사용한다. 클러스터란 대량의 데이터베이스로부터 유사한 레코드 특성을 지닌 작은 그룹으로 여러 개를 분할하는 것으로 패턴 공간에 주어진 유한 개의 패턴들이 서로 가깝게 모여서 무리를 이루고 있는 패턴 집합이다. 그 집합들 중에서 특정한 카테고리를 지정하지 않고 주어진 데이터들에서 어떤 패턴을 추출하여, 비슷한 데이터들을 묶어서 데이터를 분류하는 기법인 클러스터링에 대해 실험한다.

  • PDF

딥러닝을 이용한 소규모 지역의 영상분류 적용성 분석 : UAV 영상을 이용한 농경지를 대상으로 (Applicability of Image Classification Using Deep Learning in Small Area : Case of Agricultural Lands Using UAV Image)

  • 최석근;이승기;강연빈;성선경;최도연;김광호
    • 한국측량학회지
    • /
    • 제38권1호
    • /
    • pp.23-33
    • /
    • 2020
  • 최근 UAV (Unmanned Aerial Vehicle)를 이용하여 고해상도 영상을 편리하게 취득할 수 있게 되면서 저비용으로 소규모 지역의 관측 및 공간정보 제작이 가능하게 되었다. 특히, 농업환경 모니터링을 위하여 작물생산 지역의 피복지도 생성에 대한 연구가 활발히 진행되고 있으며, 랜덤 포레스트와 SVM (Support Vector Machine) 및 CNN(Convolutional Neural Network) 을 적용하여 분류 성능을 비교한 결과 영상분류에서 딥러닝 적용에 대하여 활용도가 높은 것으로 나타났다. 특히, 위성영상을 이용한 피복분류는 위성영상 데이터 셋과 선행 파라메터를 사용하여 피복분류의 정확도와 시간에 대한 장점을 가지고 있다. 하지만, 무인항공기 영상은 위성영상과 공간해상도와 같은 특성이 달라 이를 적용하기에는 어려움이 있다. 이러한 문제점을 해결하기 위하여 위성영상 데이터 셋이 아닌 UAV를 이용한 데이터 셋과 국내의 소규모 복합 피복이 존재하는 농경지 분석에 활용이 가능한 딥러닝 알고리즘 적용 연구를 수행하였다. 본 연구에서는 최신 딥러닝의 의미론적 영상분류인 DeepLab V3+, FC-DenseNet (Fully Convolutional DenseNets), FRRN-B (Full-Resolution Residual Networks) 를 UAV 데이터 셋에 적용하여 영상분류를 수행하였다. 분류 결과 DeepLab V3+와 FC-DenseNet의 적용 결과가 기존 감독분류보다 높은 전체 정확도 97%, Kappa 계수 0.92로 소규모 지역의 UAV 영상을 활용한 피복분류의 적용가능성을 보여주었다.

원형 근전도 센서 어레이 시스템의 센서 틀어짐에 강인한 손 제스쳐 인식 (Hand Gesture Recognition Regardless of Sensor Misplacement for Circular EMG Sensor Array System)

  • 주성수;박훈기;김인영;이종실
    • 재활복지공학회논문지
    • /
    • 제11권4호
    • /
    • pp.371-376
    • /
    • 2017
  • 본 논문에서는 원형 근전도 시스템 장비를 사용하여 근전도 패턴인식을 할 때, 장비의 센서 위치와 무관하게 패턴 인식이 가능한 알고리즘을 제안한다. 6가지 동작의 8채널 근전도 신호를 1초간 측정한 데이터를 이용하여 14개의 특징점을 추출하였다. 또한 8개의 채널에서 추출된 112개의 특징점을 나열하여 주성분분석을 하고 영향력이 높은 데이터만을 추려내어 8개의 입력 신호로 줄였다. 모든 실험은 k-NN 분류기를 이용하여 데이터를 학습시키고 5-fold 교차 검증을 사용하여 데이터를 검증하였다. 기계학습에서 데이터를 학습시킬 때, 어떤 데이터를 학습하느냐에 따라 그 결과가 크게 달라진다. 기존의 연구들에서 사용하는 학습 데이터를 사용 할 경우 99.3%의 정확도를 확인하였다. 그러나 센서의 위치가 22.5도 정도만 틀어지더라도 67.28%의 정확도로 명확하게 떨어짐을 보았다. 본 논문에서 제안하는 학습 방법을 사용 할 경우 98%의 정확도를 보이고 장비의 센서의 위치가 바뀌더라도 98% 근처의 정확도를 유지함을 보였다. 이러한 결과를 사용하여 원형 근전도 시스템을 사용하는 사용자들의 편의성을 크게 증대시켜 줄 수 있을 것으로 보인다.

메모리 추가 신경망을 이용한 희소 악성코드 분류 (Rare Malware Classification Using Memory Augmented Neural Networks)

  • 강민철;김휘강
    • 정보보호학회논문지
    • /
    • 제28권4호
    • /
    • pp.847-857
    • /
    • 2018
  • 악성코드의 수가 가파르게 증가하면서 기업 및 공공기관, 금융기관, 병 의원 등을 타깃으로 한 사이버 공격 피해 사례가 늘어나고 있다. 이러한 흐름에 따라 학계와 보안 업계에서는 악성코드 탐지를 위한 다양한 연구를 진행하고 있다. 최근 들어서는 딥러닝을 비롯해 머신러닝 기법을 적용하는 형태의 연구가 많이 진행되는 추세다. 이 중 합성곱 신경망(CNN: Convolutional Neural Network), ResNet 등을 이용한 악성코드 분류 연구의 경우에는 기존의 분류 방법에 비해 정확도가 크게 향상된 것을 확인할 수 있다. 그러나 타깃 공격의 특징 중 하나는 사용된 악성코드가 불특정 다수를 상대로 광범위하게 퍼뜨리는 형태가 아닌, 특정 대상을 타깃으로 한 맞춤형 악성코드라는 점이다. 이러한 유형의 악성코드는 그 수가 많지 않기 때문에 기존에 연구되어온 머신러닝이나 딥러닝 기법을 적용하기에 한계가 있다. 본 논문은 타깃형 악성코드와 같이 샘플의 양이 부족한 상황에서 악성코드를 분류하는 방법에 대해 다루고 있다. 메모리가 추가된 신경망(MANN: Memory Augmented Neural Networks) 모델을 이용하였고 각 그룹별 20개의 소량 데이터로 구성되어 있는 악성코드 데이터셋에 대해 최대 97%까지 정확도로 분류할 수 있음을 확인하였다.

초·중·고 교육분야의 인공지능(AI) 관련 해외 연구동향 분석 (Analysis of Overseas Research Trends Related to Artificial Intelligence (AI) in Elementary, Middle and High School Education)

  • 정영주;김혜진
    • 한국도서관정보학회지
    • /
    • 제52권3호
    • /
    • pp.313-334
    • /
    • 2021
  • 본 연구는 초·중·고 교육분야 인공지능과 관련된 해외 연구동향을 분석하기 위해 SCOPUS 데이터베이스를 대상으로 관련 문헌을 수집하였다. 수집된 문헌의 발행 기간은 1974년부터 2021년 3월까지이며, 학술지 논문이 154건, 컨퍼런스 논문은 571건으로 나타났다. 이들 논문에 포함된 저자 키워드 및 인덱스 키워드 4,521개의 단어들의 동시출현(co-occurrences) 분석기법을 바탕으로 연구 동향을 분석하였다. 분석결과 machine learning을 주축으로 big data, data mining, data science, deep learning이 최신 연구 동향으로 나타났고, 초·중·고등교육 간에는 차이가 있는 것으로 나타났다. 초등은 로봇 관련 연구가 많이 있었으며, 중등은 게임과 데이터 관련 연구가 많이 있었고, 고등은 다양하고 심도 있는 연구가 이루어졌음을 알 수 있었다. 마지막으로 결과분석에서 우리나라 교육부에서 2020년 9월 발표된 '인공지능 기초' 교육과정과 미국 AK4K12의 '5 Big Ideas'와 초·중·고 공통 상위 50단어와 매핑하여 우리나라 초·중·고 인공지능 교육에 시사점을 제시하였다.

딥뉴럴네트워크 기반의 흡연 탐지기법 설계 (Design of detection method for smoking based on Deep Neural Network)

  • 이상현;윤현수;권현
    • 융합보안논문지
    • /
    • 제21권1호
    • /
    • pp.191-200
    • /
    • 2021
  • 컴퓨팅 기술의 발전과 데이터를 저장할 수 있는 클라우드 환경, 그리고 스마트폰의 보급으로 인하여 많은 데이터가 생산되는 환경에서 인공지능 기술이 발전되고 있다. 이러한 인공지능 기술 중에서 딥뉴럴네트워크는 이미지 인식, 이미지 분류 등에서 탁월한 성능을 제공하고 있다. 기존에는 이러한 딥뉴럴네트워크를 이용하여 산불 및 화재 예방을 위한 이미지 탐지에 대해 많은 연구가 있었지만 흡연 탐지에 대한 연구는 미흡한 실정이었다. 한편 군 부대에서는 각종 시설에 대한 감시체계를 CCTV를 통해 구축하고 있는데 화재, 폭발사고 예방을 위해 탄약고 주변에서의 흡연이나 금연구역에서의 흡연을 CCTV로 탐지하는 것이 필요한 상황이다. 본 논문에서는 딥뉴럴네트워크를 이용하여 흡연 여부를 탐지하는 방법에 대한 성능 분석을 하였으며 활성화함수, 학습률 등 실험적으로 최적화된 수치를 반영하여 흡연사진과 비흡연사진을 두 가지 경우로 탐지하는 것을 하였다. 실험 데이터로는 인터넷 상에 공개되어 있는 흡연 및 비흡연 사진을 크롤링하여 데이터를 구축하였으며, 실험은 머신러닝 라이브러리를 이용하였다. 실험결과로 학습률 0.004로 최적화 알고리즘 Adam을 사용하였을 때, 93%의 accuracy와 92%의 F1-score를 갖는 것을 볼 수 있었다. 또한 이로써 이미지의 연속인 CCTV 영상도 딥뉴럴네트워크를 이용하여 흡연 여부를 탐지할 수 있음을 알 수 있었다.

RNN을 이용한 제2형 당뇨병 예측모델 개발 (Development of T2DM Prediction Model Using RNN)

  • 장진수;이민준;이태노
    • 디지털융복합연구
    • /
    • 제17권8호
    • /
    • pp.249-255
    • /
    • 2019
  • 제2형 당뇨병은 고혈당이 특징인 대사성 분비 장애로 여러 합병증을 야기하는 질병이며, 장기적인 치료가 필요하기 때문에 매년 많은 의료비를 지출한다. 이를 해결하기 위해 많은 연구들이 있어왔지만, 기존의 연구들은 한 시점에서의 데이터를 학습시켜 예측함으로써 정확도가 높지 않았다. 그래서 본 연구는 제2형 당뇨병 발생 예측에 대한 정확도를 높이기 위하여 RNN을 이용한 모델을 제안하였다. 본 모델을 개발하기 위해 한국인유전체역학조사 지역사회 코호트(안산 안성) 데이터를 이용하였으며, 시간의 흐름에 따른 데이터들을 모두 학습시켜 당뇨병 발생 예측모델을 만들었다. 예측 모델의 성능을 검증하기 위해 기존의 기계 학습 방법인 LR, k-NN, SVM과 정확도를 비교하였다. 비교한 결과 제안한 예측모델의 accuracy는 0.92, AUC는 0.92로 다른 기계 학습 방법보다 높은 정확도를 보였다. 따라서 본 연구에서 제안한 제2형 당뇨병 발생 예측 모델을 활용하여 발병을 조기 예측함으로써 생활습관 개선 및 혈당조절을 통해 당뇨병 발병을 예방하고 늦출 수 있을 것이다.

인공지능을 이용한 영화제작 : 시각효과를 중심으로 (Film Production Using Artificial Intelligence with a Focus on Visual Effects)

  • 유태경
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권1호
    • /
    • pp.53-62
    • /
    • 2021
  • 영화는 대중에게 처음 소개된 이래로 테크놀로지의 발전과 변화 과정을 함께하고 있다. 영화 제작 과정에 시각효과를 중심으로 한 포스트 프로덕션과 디지털 기술들이 본격적으로 적용되면서 영화 산업은 제작 방식에 있어서 큰 변화를 겪었을 뿐만 아니라 최신 기술들을 폭넓게 수용하며 산업적 기회의 폭을 넓혀가고 있다. 디지털 영화로 변화한 지 오래지 않은 지금, 영화의 디지털화가 시작되기도 전인 1956년 다트머스 회의에서 처음 알려진 인공지능이란 개념이 다시 영화 산업의 큰 변화를 가져올 것으로 예상된다. 디지털 영화의 제작 파이프라인은 거대한 디지털 데이터를 체계적으로 운용하고 만들어 내기 때문에 머신러닝과 딥러닝으로 대표되는 최근 인공지능 기술들을 적용하기 용이하고 시각효과 제작 과정에는 반복적인 작업과 분석을 통한 재현이 많고 계산 시간이 오래 걸리는 과정들이 있기 때문에 최근 주요 시각효과 스튜디오들을 중심으로 인공지능 기술의 활용이 두드러지고 있다. 본 연구에서는 제작 도구로서 인공지능 기술을 이용한 영화 시각효과 제작 사례에 대한 분석을 통해서 향후 인공지능 기술이 영화 산업을 어떻게 바꿔놓을지 예측하고 시각효과 기술로서 인공지능의 산업적 가능성을 조망해 보고자 한다.

기계학습 기반 고해상도 토양수분 복원을 위한 Sentinel-1 SAR의 자립형 활용성 평가 (Assessment of Stand-alone Utilization of Sentinel-1 SAR for High Resolution Soil Moisture Retrieval Using Machine Learning)

  • 정재환;조성근;전현호;이슬찬;최민하
    • 대한원격탐사학회지
    • /
    • 제38권5_1호
    • /
    • pp.571-585
    • /
    • 2022
  • 기후변화로 인한 가뭄, 홍수, 산불, 산사태 등 자연재해의 위협이 증가함에 따라, 합성개구레이더(Synthetic Aperture Radar, SAR)와 같이 고해상도 토양수분 복원에 대한 사회적 수요도 증가하고 있다. 하지만 국내 환경은 산림 지형의 비율이 높아, 식생과 지형의 영향을 크게 받는 SAR 자료에서 토양수분을 복원하는데 많은 어려움을 겪고 있다. 이에 본 연구에서는 기계학습의 일종인 인공신경망(Artificial Neural Network, ANN) 기법을 활용하여, Sentinel-1 SAR 영상의 자립형 활용성을 평가하였다. Sentinel-1에서 얻을 수 있는 이중편파 산란계수는 토양수분 거동과 유의미한 상관성을 가지고 있음을 확인할 수 있었으며, 다른 위성이나 지점에서 관측된 보조자료를 사용하지 않고도 식생의 효과 등을 보정할 수 있는 자립형 활용 가능성도 확인할 수 있었다. 하지만 각 지점별, 지형 그룹별 특성에 의한 차이가 크게 나타났으며, 특히 산지와 평지에서 학습된 모형을 교차적용하였을 때 토양수분을 제대로 모의할 수 없는 현상이 발생하였다. 또한 이러한 문제를 해결하고자 학습 지점의 수를 늘리는 경우에는 토양수분 복원 모형이 평활화되어 상관계수는 증가하였으나, 지점에서의 오차는 점점 증가하였다. 따라서 고해상도 SAR 토양수분 자료를 광범위하게 적용하기 위해서는 체계적 연구 수행이 선행되어야 하며, 목적에 따른 학습 지점의 선정, 적용 지역의 범위 등을 구체적으로 제한하여 활용한다면 다양한 분야에서 효과적으로 활용할 수 있을 것으로 기대된다.

딥러닝 모형 기반 진해만 용존산소농도 재현을 위한 기초연구 (Preliminary Study on the Reproduction of Dissolved Oxygen Concentration in Jinhae Bay Based on Deep Learning Model)

  • 박성식;김경회
    • 해양환경안전학회지
    • /
    • 제28권2호
    • /
    • pp.193-200
    • /
    • 2022
  • 본 연구에서는 진해만의 DO 농도 재현을 목표로 LSTM 모형의 최적 매개변수 조건과 예측변수를 선별하기 위한 Case study를 진행하였다. 모형 매개변수 Case study 결과, 가장 적은 Hidden node와 Epoch인 Hidden node=10, Epoch=100에서 가장 낮은 정확도를 보였다. 이는 모형이 과소적합(Underfitting) 상태인 것으로 판단된다. Hidden node=80, Epoch=1200에서 R2 값은 0.99로 가장 높은 정확도를 보였다. 예측변수 Case study 결과, 1개의 환경변수만을 예측변수로 사용한 Step 1에서 수온을 예측변수로 했을 때 저층 DO 농도 재현의 R2 값은 0.81로 가장 높은 정확도를 보였다. 이후 2개의 환경변수를 사용한 Step 2에서는 수온과 SiO2를 예측변수로 했을 때 R2 값은 0.92로 수온만 사용했을 때보다 정확도가 급격히 증가하였다. 이는 저층 DO 농도와 SiO2 농도간의 높은 상관성$({\mid}R{\mid}=0.70)$에 기인한 것으로 판단된다. 상기 결과로부터 진해만의 DO 농도 재현에 적합한 LSTM 모형의 매개변수와 예측변수를 찾을 수 있었다.