• Title/Summary/Keyword: deep-learning

검색결과 5,450건 처리시간 0.03초

텍스트 마이닝을 통한 우리나라의 벼 도열병 발생 개황 분석 (Analysis of Rice Blast Outbreaks in Korea through Text Mining)

  • 송성민;정현정;김광형;김기태
    • 식물병연구
    • /
    • 제28권3호
    • /
    • pp.113-121
    • /
    • 2022
  • 벼 도열병은 전 세계적으로 발병하여 쌀 수확량을 크게 감소시키는 주요 식물병이다. 벼 도열병은 한국에서도 주기적으로 대발생하여 사회경제적으로 큰 피해를 입힌다. 이를 예방하기 위해서는 병 발생 예찰 시스템이 필요하다. 또한 병 발생에 대한 역학 조사는 식물병 관리를 위한 의사결정을 내릴 때 도움을 줄 수 있다. 현재 도열병 예찰 및 역학 조사는 주로 작물의 생육량, 기상 환경 요인 등 정량적으로 측정 가능한 정형 데이터를 기반으로 수행되고 있다. 정형 데이터와 함께 도열병 발생과 관련한 텍스트 자료들도 많이 축적되고 있다. 그러나 이러한 비정형 데이터를 이용한 역학 조사는 이루어지지 않고 있다. 비정형 데이터를 활용하여 유용한 정보를 추출한다면 도열병을 포함한 앞으로의 식물병 관리에 사용할 수 있을 것이다. 이 연구는 텍스트 마이닝을 통해 도열병 관련 뉴스 기사를 분석하여 우리나라에서 벼 도열병이 다발생한 연도와 지역을 조사하였고, 해당 지역의 평균 기온, 합계 강수량, 일조시간, 공급된 벼 품종을 분석하였다. 이를 통해 2020년 평년에 비해 낮은 기온과 일조시간 및 높은 강수량이 전국적인 도열병 다발생의 원인에 기여했고, 2021년 전라북도와 경상북도 일부 지역의 다발생은 비슷한 기상학적 요인에 의한 것으로 추측할 수 있었다. 더하여 같은 벼 품종의 연작에 의한 도열병 다발생 가능성과 질소 비료의 시비량이 병 발생에 미치는 영향에 대한 추후 연구가 필요하다. 결론적으로, 쏟아지는 정보의 홍수속에서 관련 기사를 종합적으로 보기 어렵다. 따라서, 텍스트 마이닝을 통해 얻은 결과로 특정 키워드들이 많이 관찰될 때 적극적 방제에 대한 의사결정을 할 수 있는 시스템이 구축될 필요가 있다. 이는 추후 딥러닝 기술과 접목되어 벼 도열병 역학 조사 도구로 사용될 수도 있을 것이다. 텍스트 마이닝을 통해 얻은 유의미한 정보를 기존의 정형 데이터 기반의 모델과 결합한다면 농업현장에서 병발생 예측 또는 방제기술 개선에 필요한 고품질 정보를 제공해줄 수 있을 것이라고 예상한다.

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.

도메인 특수성이 도메인 특화 사전학습 언어모델의 성능에 미치는 영향 (The Effect of Domain Specificity on the Performance of Domain-Specific Pre-Trained Language Models)

  • 한민아;김윤하;김남규
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.251-273
    • /
    • 2022
  • 최근 텍스트 분석을 딥러닝에 적용한 연구가 꾸준히 이어지고 있으며, 특히 대용량의 데이터 셋을 학습한 사전학습 언어모델을 통해 단어의 의미를 파악하여 요약, 감정 분류 등의 태스크를 수행하려는 연구가 활발히 이루어지고 있다. 하지만 기존 사전학습 언어모델이 특정 도메인을 잘 이해하지 못한다는 한계를 나타냄에 따라, 최근 특정 도메인에 특화된 언어모델을 만들고자 하는 방향으로 연구의 흐름이 옮겨가고 있는 추세이다. 도메인 특화 추가 사전학습 언어모델은 특정 도메인의 지식을 모델이 더 잘 이해할 수 있게 하여, 해당 분야의 다양한 태스크에서 성능 향상을 가져왔다. 하지만 도메인 특화 추가 사전학습은 해당 도메인의 말뭉치 데이터를 확보하기 위해 많은 비용이 소요될 뿐 아니라, 고성능 컴퓨팅 자원과 개발 인력 등의 측면에서도 많은 비용과 시간이 투입되어야 한다는 부담이 있다. 아울러 일부 도메인에서 추가 사전학습 후의 성능 개선이 미미하다는 사례가 보고됨에 따라, 성능 개선 여부가 확실하지 않은 상태에서 도메인 특화 추가 사전학습 모델의 개발에 막대한 비용을 투입해야 하는지 여부에 대해 판단이 어려운 상황이다. 이러한 상황에도 불구하고 최근 각 도메인의 성능 개선 자체에 초점을 둔 추가 사전학습 연구는 다양한 분야에서 수행되고 있지만, 추가 사전학습을 통한 성능 개선에 영향을 미치는 도메인의 특성을 규명하기 위한 연구는 거의 이루어지지 않고 있다. 본 논문에서는 이러한 한계를 극복하기 위해, 실제로 추가 사전학습을 수행하기 전에 추가 사전학습을 통한 해당 도메인의 성능 개선 정도를 선제적으로 확인할 수 있는 방안을 제시한다. 구체적으로 3개의 도메인을 분석 대상 도메인으로 선정한 후, 각 도메인에서의 추가 사전학습을 통한 분류 정확도 상승 폭을 측정한다. 또한 각 도메인에서 사용된 주요 단어들의 정규화된 빈도를 기반으로 해당 도메인의 특수성을 측정하는 지표를 새롭게 개발하여 제시한다. 사전학습 언어모델과 3개 도메인의 도메인 특화 사전학습 언어모델을 사용한 분류 태스크 실험을 통해, 도메인 특수성 지표가 높을수록 추가 사전학습을 통한 성능 개선 폭이 높음을 확인하였다.

강유위(康有爲) 사상의 과학적 배경과 '천유경계(天遊境界)' (A study on the scientific background of thinking of Kang Youwei and a stage of 'Tianyou')

  • 한성구
    • 한국철학논집
    • /
    • 제27호
    • /
    • pp.197-222
    • /
    • 2009
  • 강유위는 근대 중국 변법파의 대표적 인물로 동서고금을 가로지르는 그의 학문적 열정과 구세정신(救世精神)은 다양한 영역에서 괄목할 만한 성과를 만들어 냈다. 특히 전통을 비판적으로 수용하는 과정 속에서 그가 무기로 삼았던 서양 근대과학은 전통 '천도(天道)' 관념을 비판하는 데 매우 효과적이었으며, 이를 기초로 발전시킨 변화관과 연화(演化)사상은 그가 궁극적으로 추구하는 '대동사회(大同社會)'를 그려내는 데 막대한 영향을 미쳤다. 그는 서양의 근대 과학과 학술에 대해 강렬한 지적(知的) 욕구를 가지고 있었지만 체계적인 서학(西學) 교육을 받지 못했기에 여러 한계를 드러냈다. 그럼에도 불구하고 그의 사상역정은 양무운동 시기의 "기물(器物)"적 과학인식 태도를 벗어나 보편적 가치 체계로서 과학을 인식할 수 있는 계기를 마련했다는 점에서 매우 중요한 의의가 있다 강유위(康有爲)는 서양 진화론의 영향을 받아 비록 대동 이상을 제시하긴 하였지만 "대동극락(大同極樂)"이 "차안세계(此岸世界)"에서 절대로 실현될 수 없음을 잘 알고 있었기에 대동(大同)의 이상으로부터 이탈해 "천유(天遊)"경지로 관심을 돌리게 되었다. 즉 이상과 현실의 괴리, 그리고 그가 가정한 단선적(單線的) 대동주의(大同主義)의 실현 불가능에 대한 생각이 그를 "천유(天遊)" 경계로 나아가게 한 것이다. 강유위(康有爲)는 젊은 시절 그가 찬탄해 마지않았던 과학 기구가 사람의 인식능력을 확대시켜 "대도(大道)"에 가까이 가도록 해 준다는 점에는 여전히 동의하고 있었다. 하지만 "기물(器物)"과 인간 감관(感官)의 유한한 능력이 "천(天)"의 무한함에 비추어볼 때 보잘 것 없다는 것은 그를 절망적으로 만드는 점이었다. 그는 현실 사회와 정치를 개혁하는 데 있어서도 이런 비관적인 현실에 깊은 절망감을 느꼈다. 이런 비관주의적 경향은 그가 대동(大同) 이상을 추구하기보다 "천유(天遊)"경지에 경도되게 된 이유이며, 『대동서(大同書)』를 완성함과 동시에 곧바로 『제천강(諸天講)』을 저술함으로써 사람들이 혼란된 사회 속에서 인생 위안을 얻을 수 있는 "천유지학(天遊之學)"을 제창한 원인이라 할 수 있다.

미세먼지 예측 성능 개선을 위한 시공간 트랜스포머 모델의 적용 (Application of spatiotemporal transformer model to improve prediction performance of particulate matter concentration)

  • 김영광;김복주;안성만
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.329-352
    • /
    • 2022
  • 미세먼지는 폐나 혈관에 침투해 각종 심장 질환이나 폐암 등의 호흡기 질환을 일으키는 것으로 보고되고 있다. 지하철은 일 평균 천만 명이 이용하는 교통수단으로, 깨끗하고 쾌적한 환경조성이 중요하나 지하터널을 통과하는 지하철의 운행 특성과 터널에 갇힌 미세먼지가 열차 풍으로 인해 지하역사로 이동하는 등의 문제로 지하역사의 미세먼지 오염도는 높은 것으로 나타나고 있다. 환경부와 서울시는 지하역사 공기질 개선대책을 수립하여 다양한 미세먼지 저감 노력을 기울이고 있다. 스마트 공기질 관리 시스템은 공기질 데이터 수집 및 미세먼지 농도를 예측하여 공기질을 관리하는 시스템으로 미세먼지 농도 예측 모델이 중요한 구성 요소이다. 그동안 시계열 데이터 예측에 관한 다양한 연구가 진행되어왔지만, 지하철 역사의 미세먼지 농도 예측과 관련해서는 통계나 순환신경망 기반의 딥러닝 모델 연구에 국한되어 있다. 이에 본 연구에서는 시공간 트랜스포머를 포함한 4개의 트랜스포머 기반 모델을 제안한다. 서울시 지하철 역사의 대합실을 대상으로 한 시간 후의 미세먼지 농도 예측실험을 수행한 결과, 트랜스포머 기반 모델들의 성능이 기존의 ARIMA, LSTM, Seq2Seq 모델들에 비해 우수한 성능을 나타냄을 확인하였다. 트랜스포머 기반 모델 중에서는 시공간 트랜스포머의 성능이 가장 우수하였다. 데이터 기반의 예측을 통하여 운영되는 스마트 공기질 관리 시스템은 미세먼지 예측의 정확도가 향상될수록 더욱더 효과적이고 에너지 효율적으로 운영될 수 있다. 본 연구 결과는 스마트 공기질 관리 시스템의 효율적 운영에 기여할 수 있을 것으로 기대된다.

Swin Transformer와 Sentinel-1 영상을 이용한 우리나라 저수지의 수체 탐지 (Waterbody Detection for the Reservoirs in South Korea Using Swin Transformer and Sentinel-1 Images)

  • 최소연;윤유정;강종구;김서연;정예민;임윤교;서영민;김완엽;최민하;이양원
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.949-965
    • /
    • 2023
  • 본 연구에서는 Sentinel-1 synthetic aperture radar 영상을 활용하여 딥러닝 모델인 Swin Transformer로 국내 농업용 저수지의 수표면적을 모니터링 하는 방법을 제시한다. Google Earth Engine 플랫폼을 이용하여 70만톤 급, 90만톤급, 150만톤급 저수지 7개소에 대한 2017년부터 2021년 데이터셋을 구축하였다. 저수지 4개소에 대한 영상 1,283장에 대해서 셔플링(suffling) 및 5-폴드(fold) 교차검증 기법을 적용하여 모델을 학습하였다. 시험평가 결과 모델의 윈도우 크기를 12로 설정한 Swin Transformer Large 모델은 각 폴드에서 평균적으로 99.54%의 정확도와 95.15%의 mean intersection over union (mIoU)을 기록하여 우수한 의미론적 분할 성능을 보여주었다. 최고 성능을 보여준 모델을 나머지 3개소 저수지 데이터셋에 적용하여 성능을 검증한 결과, 모든 저수지에서 정확도 99% 및 mIoU 94% 이상을 달성함을 확인했다. 이러한 결과는 Swint Transformer 모델이 국내의 농업용 저수지의 수표면적 모니터링에 효과적으로 활용될 수 있음을 보여준다.

YOLO를 이용한 SAR 영상의 선박 객체 탐지: 편파별 모델 구성과 정확도 특성 분석 (Ship Detection from SAR Images Using YOLO: Model Constructions and Accuracy Characteristics According to Polarization)

  • 임윤교;윤유정;강종구;김서연;정예민;최소연;서영민;이양원
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.997-1008
    • /
    • 2023
  • 해상의 선박탐지는 다양한 방법으로 수행될 수 있는데, 위성은 광역적인 감시가 가능하고, 특히 합성개구레이더(Synthetic Aperture Radar, SAR) 영상은 주야간 및 전천후로 활용될 수 있다. 본 연구에서는 SAR 영상으로부터 효율적인 선박 탐지 방법을 제시하기 위하여, Sentinel-1 영상에 You Only Look Once Version 5 (YOLOv5) 모델을 적용하여 선박 탐지를 수행하고, 편파별 개별 모델과 통합 모델의 차이 및 편파별 정확도 특성을 분석하였다. 파라미터가 작고 가벼운 YOLOv5s와 파라미터가 많지만 정확도가 높은 YOLOv5x 두가지 모델에 대하여 각각 (1) HH, HV, VH, VV 각 편파별로 나누어 학습/검증 및 평가 그리고 (2) 모든 편파의 영상을 사용하여 학습/검증 및 평가를 실시한 결과, 네 가지 실험에서 모두 0.977 ≤ AP@0.5 ≤ 0.998의 비슷하면서 매우 높은 정확도를 나타냈다. 이러한 결과를 현업시스템의 관점에서 보면, 가벼운 YOLO 모델(YOLOv5s, YOLOv8s 등)로 4개 편파 통합 모델을 구축하는 것이 실시간 선박탐지에 효과적임을 시사하는 것이다. 이 실험에서 사용한 영상은 19,582장이었지만, Sentinel-1 이외에도 Capella, ICEYE 등 다른 SAR 영상을 추가적으로 활용한다면, 보다 더 유연하고 정확한 선박 탐지 모델이 구축될 수 있을 것이다.

폐용적과 폐기능 환기장애에 대한 유의성 평가 (Significance Evaluation of Lung Volume and Pulmonary Dysfunction)

  • 김지율;예수영
    • 한국방사선학회논문지
    • /
    • 제17권5호
    • /
    • pp.767-773
    • /
    • 2023
  • 본 연구에서는 폐용적에 영향을 미치는 관련 인자들과 폐기능 환기장애에 대한 유의성을 평가하고자 하였다. 실험대상으로는 저선량 흉부 CT검사와 폐활량검사를 동시에 수행한 정상 성인 남·여 206명을 선정하였으며 실험방법으로는 저선량 흉부 CT검사로 획득한 폐 CT 영상을 이용하여 폐용적을 딥러닝 기반의 AVIEW LCS 자동진단 프로그램을 이용하여 측정하였다. 그리고 폐활량계를 이용하여 폐기능을 측정한 결과를 획득하였으며 폐용적에 영향을 미치는 관련 인자로 성별 및 BMI를 선정하여 폐용적과의 독립표본 T-test를 통하여 유의성을 평가하고자 하였다. 실험결과 성별에 따른 폐용적의 평가에서 남성의 모든 폐용적이 여성의 모든 폐용적보다 크다는 것을 확인할 수 있었다. 성별 및 폐용적에 대한 각각의 평균값을 이용한 독립표본 T-test 결과 남성이 여성보다 모든 폐용적이 더 크다는 결과는 유의한 결과를 나타내었다(p<0.001). 그리고 BMI 지수에 따른 폐용적의 평가에서 BMI 지수 24 이상의 성인의 모든 폐용적이 BMI 지수 24 미만의 모든 폐용적보다 크다는 것을 확인할 수 있었다. 그러나 BMI 지수 및 폐용적에 대한 각각의 평균값을 이용한 독립표본 T-test 결과 BMI 지수 24 이상이 BMI 지수 24 미만보다 모든 폐용적이 더 크다는 결과는 유의한 결과를 나타내지 않았다(p<0.055). 폐기능 환기장애 유무에 따른 폐용적의 평가에서 폐기능 환기 정상성인의 모든 폐용적이 폐기능 환기 장애성인의 모든 폐용적보다 크다는 것을 확인할 수 있었다. 그리고 폐기능 환기장애 유무 및 폐용적에 대한 각각의 평균값을 이용한 독립표본 T-test 결과 폐기능 환기 정상성인이 폐기능 환기 장애성인보다 모든 폐용적이 더 크다는 결과는 유의한 결과를 나타내었다(p<0.001). 폐용적과 폐활량 검사 결과는 폐 건강을 평가하는데 가장 중요한 지표이며, 이 두 지표를 함께 사용하여 폐 기능을 평가하는 것이 가장 정확한 평가 방법이다. 그러므로 본 연구에서는 폐용적과 폐활량 검사에 대한 향후 유사 연구 시 폐기능 환기 정상 성인과 폐기능 환기 장애 성인에 대한 폐용적 평균값을 제시하여 기초자료로 활용될 것이라고 사료된다.

비접촉 데이터 사회와 아카이브 재영토화 (Contactless Data Society and Reterritorialization of the Archive )

  • 조민지
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.5-32
    • /
    • 2024
  • 한국 정부가 UN의 2022년 전자정부 발전 지수에서 UN가입 193개국 중 3위에 랭크됐다. 그동안 꾸준히 상위국으로 평가된 한국은 분명 세계 전자정부의 선도국이라 할 수 있다. 전자정부의 윤활유는 데이터다. 데이터는 그 자체로 정보가 아니고 기록도 아니지만 정보와 기록의 원천이며 지식의 자원이다. 전자적 시스템을 통한 행정 행위가 보편화된 이후 당연히 데이터에 기반한 기록의 생산과 기술이 확대되고 진화하고 있다. 기술은 가치중립적인 듯 보이지만 사실 그 자체로 특정 세계관을 반영하고 있다. 더구나 비물질적 유통을 기반으로 하는 디지털 세계, 온라인 네트워크의 또 다른 아이러니는 반드시 물리적 도구를 통해서만 접속하고 접촉할 수 있다는 점이다. 디지털 정보는 논리적 대상이지만 반드시 어떤 유형이든 그것을 중계할 장치 없이는 디지털 자원을 읽어 내거나 활용할 수 없다. 초연결, 초지능을 무기로 하는 새로운 기술의 디지털 질서는 전통적인 권력 구조에 깊은 영향력을 끼칠 뿐만 아니라 기존의 정보 및 지식 전달 매개체에도 마찬가지의 영향을 미치고 있다. 더구나 데이터에 기반한 생성형 인공지능을 비롯해 새로운 기술과 매개가 단연 화두다. 디지털 기술의 전방위적 성장과 확산이 인간 역능의 증강과 사유의 외주화 상황까지 왔다고 볼 수 있을 것이다. 여기에는 딥 페이크를 비롯한 가짜 이미지, 오토 프로파일링, 사실처럼 생성해 내는 AI 거짓말(hallucination), 기계 학습데이터의 저작권 침해에 이르기까지 다양한 문제점 또한 내포하고 있다. 더구나 급진적 연결 능력은 방대한 데이터의 즉각적 공유를 가능하게 하고 인지 없이 행위를 발생시키는 기술적 무의식에 의존하게 된다. 그런 점에서 지금의 기술 사회의 기계는 단순 보조의 수준을 넘어서고 있으며 기계의 인간 사회 진입은 고도의 기술 발전에 따른 자연적인 변화 양상이라고 하기에는 간단하지 않은 지점이 존재한다. 시간이 지나며 기계에 대한 관점이 변화하게 될 것이기 때문이다. 따라서 중요한 것은 기계를 통한 커뮤니케이션, 행위의 결과로서의 기록이 생산되고 사용되는 방식의 변화가 의미하는 사회문화적 함의에 있다. 아카이브 영역에서도 초지능, 초연결사회를 향한 기술의 변화로 인해 데이터 기반 아카이브 사회는 어떤 문제에 직면하게 될 것인지, 그리고 그 속에서 누가 어떻게 기록과 데이터의 지속적 활동성을 입증하고 매체 변화의 주요 동인이 될 것인가에 대한 연구가 필요한 시점이다. 본 연구는 아카이브가 행위의 결과인 기록뿐만 아니라 데이터를 전략적 자산으로 인식할 필요성에서 시작했다. 이를 통해 전통적 경계를 확장하고 데이터 중심 사회에서 어떻게 재영토화를 이룰 수 있을지를 알아보았다.

Ensemble of Nested Dichotomies 기법을 이용한 스마트폰 가속도 센서 데이터 기반의 동작 인지 (Ensemble of Nested Dichotomies for Activity Recognition Using Accelerometer Data on Smartphone)

  • 하으뜸;김정민;류광렬
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.123-132
    • /
    • 2013
  • 최근 스마트 폰에 다양한 센서를 내장할 수 있게 되었고 스마트폰에 내장된 센서를 이용항 동작 인지에 관한 연구가 활발히 진행되고 있다. 스마트폰을 이용한 동작 인지는 노인 복지 지원이나 운동량 측정. 생활 패턴 분석, 운동 패턴 분석 등 다양한 분야에 활용될 수 있다. 하지만 스마트 폰에 내장된 센서를 이용하여 동작 인지를 하는 방법은 사용되는 센서의 수에 따라 단일 센서를 이용한 동작인지와 다중 센서를 이용한 동작인지로 나눌 수 있다. 단일 센서를 이용하는 경우 대부분 가속도 센서를 이용하기 때문에 배터리 부담은 줄지만 다양한 동작을 인지할 때에 특징(feature) 추출의 어려움과 동작 인지 정확도가 낮다는 문제점이 있다. 그리고 다중 센서를 이용하는 경우 대부분 가속도 센서와 중력센서를 사용하고 필요에 따라 다른 센서를 추가하여 동작인지를 수행하며 다양한 동작을 보다 높은 정확도로 인지할 수 있지만 다수의 센서를 사용하기 때문에 배터리 부담이 증가한다는 문제점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 스마트 폰에 내장된 가속도 센서를 이용하여 다양한 동작을 높은 정확도로 인지하는 방법을 제안한다. 서로 다른 10가지의 동작을 높을 정확도로 인지하기 위해 원시 데이터로부터 17가지 특징을 추출하고 각 동작을 분류하기 위해 Ensemble of Nested Dichotomies 분류기를 사용하였다. Ensemble of Nested Dichotomies 분류기는 다중 클래스 문제를 다수의 이진 분류 문제로 변형하여 다중 클래스 문제를 해결하는 방법으로 서로 다른 Nested Dichotomy 분류기의 분류 결과를 통해 다중 클래스 문제를 해결하는 기법이다. Nested Dichotomy 분류기 학습에는 Random Forest 분류기를 사용하였다. 성능 평가를 위해 Decision Tree, k-Nearest Neighbors, Support Vector Machine과 비교 실험을 한 결과 Ensemble of Nested Dichotomies 분류기를 사용하여 동작 인지를 수행하는 것이 가장 높은 정확도를 보였다.