• 제목/요약/키워드: 알고리즘 개발

검색결과 8,243건 처리시간 0.041초

기상청 수원기상대 농업기상 관측요소의 품질관리 (Quality Control of Agro-meteorological Data Measured at Suwon Weather Station of Korea Meteorological Administration)

  • 오규림;이승재;최병철;김준;김규랑;최성원;이병렬
    • 한국농림기상학회지
    • /
    • 제17권1호
    • /
    • pp.25-34
    • /
    • 2015
  • 농업기상 관측자료의 QC는 원자료의 튀는 값을 의심자료로 분류하거나 제거하는 사후 성격의 작업이다. 본 연구에서는 수원기상대의 2012, 2013년 농업기상 관측요소에 대하여 처음으로 QC를 시행하고, 관련 절차를 문서화하였다. QC 방법은 기상청의 실시간 품질관리 시스템을 참고하였고, 토양수분은 국제 토양수분관측망 QC 모듈을 참고하였으며, 그 외의 경우는 경험에 근거하여 자체적으로 고안한 기준을 적용하였다. 농업기상 관측자료에 이상의 품질검사 알고리즘들을 적용한 결과, 튀는 값과 비정상적인 값들이 사라지고, 보다 신뢰할 수 있는 시계열 자료가 확보되었으며, 보다 정확한 통계값이 산출되었다. 연직 기온, 토양온도 등의 온도 요소는 품질관리가 상대적으로 용이하게 이루어졌다. 그러나 토양온도의 튀는 값이 여름철에 집중된 것으로 볼 때, 강우에 따른 대비와 관측 장비의 철저한 관리가 필요하다고 사료된다. 한편, 온도 요소를 제외한 나머지 요소에는 각각의 자료 특성에 맞는 품질관리 방법의 개발이 시급하다. 특히 토양수분은 연직으로 깊이 들어가더라도 그 정도에 차이가 있을 뿐 강수량의 영향을 받음에도 불구하고, 앞에 제시한 일부 QC 방법은 0.10m 토양수분에 한정되어 있는 점이 한계로 작용하였다. 수원기상대에서 나타나는 토양수분의 겨울철 이상 변동은 ISMN 방식의 QC 모듈로도 걸러지지 않았으므로, 이에 대한 원인 분석이 이루어져야 할 것이다. 또한, 토양수분 QC에서 플래그가 부여된 의심자료들을 오류값으로 분류하기 위해서는 더욱 확실한 근거가 필요하다. 예를 들어 수원기상대의 경우, 여러 해 동안 측정된 토양수분 관측자료를 종합적으로 분석하여 수원기상대에서의 토양수분의 변화 양상이 매년 어떻게 반복되고 있는지 파악하는 것이 중요하다. 향후 단기적으로는 이번 QC 연구에서 자료의 신뢰도가 낮아 제외되었던 복사 변수와 지면온도 변수에 대한 QC가 이루어져야 하며, 수원 이외의 다른 농관 지점의 관측자료에 대해서도 QC가 속히 실시되어야 할 것이다. 중기적으로는 QC된 자료를 바탕으로 농업기상 정기보고서 작성 및 배포가 가능하다. 장기적으로는 기상청 및 KoFlux의 자동화 QC 프로그램, 수치모형을 이용한 비선형 변분 QC(예로, Lee et al., 2011) 등을 기반으로 농업기상 관측요소별 QC 수행의 고도화 및 자동화가 필요하다. 이러한 체계적인 개선을 통해 농업기상 관측자료의 품질경영이 한층 더 성취되면, 지상기상 관측자료에 버금가는 고품질의 농업기상 관측자료가 생산되어, 국내 유관기관, 학술 연구자, 농림업 현장 종사자 등 많은 이용자들에게 제공 및 활용될 것으로 기대된다. 이 연구에서 사용된 원자료 및 품질관리 결과 자료는 국가농림기상센터의 웹사이트(http://ncam.kr/page/req/agri_weather.php)에서 소정의 절차를 거쳐 이용할 수 있다.

HS 코드 분류를 위한 CNN 기반의 추천 모델 개발 (CNN-based Recommendation Model for Classifying HS Code)

  • 이동주;김건우;최근호
    • 경영과정보연구
    • /
    • 제39권3호
    • /
    • pp.1-16
    • /
    • 2020
  • 현재 운영되고 있는 관세신고납부제도는 납세의무자가 세액 산정을 스스로하고 그 세액을 본인 책임으로 납부하도록 하는 제도이다. 다시 말해, 관세법상 신고 납부제도는 납세액을 정확히 계산해서 납부할 의무와 책임이 온전히 납세의무자에게 무한정으로 부과하는 것을 원칙으로 하고 있다. 따라서, 만일 납세의무자가 그 의무와 책임을 제대로 행하지 못했을 경우에는 부족한 만큼의 세액 추징과 그에 대한 제제로 가산세를 부과하고 있다. 이러한 이유로 세액 산정의 기본이 되는 품목분류는 관세평가와 함께 가장 어려운 부분이며 잘못 분류하게 되면 기업에게도 큰 리스크가 될 수도 있다. 이러한 이유로 관세전문가인 관세사에게 상당한 수수료를 지불하면서 수입신고를 위탁하여 처리하고 있는 실정이다. 이에 본 연구에서는 수입신고 시 신고하려는 품목이 어떤 것인지 HS 코드 분류를 하여 수입신고 시 기재해야 할 HS 코드를 추천해 주는데 목적이 있다. HS 코드 분류를 위해 관세청 품목분류 결정 사례를 바탕으로 사례에 첨부된 이미지를 활용하여 HS 코드 분류를 하였다. 이미지 분류를 위해 이미지 인식에 많이 사용되는 딥러닝 알고리즘인 CNN을 사용하였는데, 세부적으로 CNN 모델 중 VggNet(Vgg16, Vgg19), ResNet50, Inception-V3 모델을 사용하였다. 분류 정확도를 높이기 위해 3개의 dataset을 만들어 실험을 진행하였다. Dataset 1은 HS 코드 이미지가 가장 많은 5종을 선정하였고 Dataset 2와 Dataset 3은 HS 코드 2단위 중 가장 데이터 샘플의 수가 많은 87류를 대상으로 하였으며, 이 중 샘플 수가 많은 5종으로 분류 범위를 좁혀 분석하였다. 이 중 dataset 3로 학습시켜 HS 코드 분류를 수행하였을 때 Vgg16 모델에서 분류 정확도가 73.12%로 가장 높았다. 본 연구는 HS 코드 이미지를 이용해 딥러닝에 기반한 HS 코드 분류를 최초로 시도하였다는 점에서 의의가 있다. 또한, 수출입 업무를 하고 있는 기업이나 개인사업자들이 본 연구에서 제안한 모델을 참조하여 활용할 수 있다면 수출입 신고 시 HS 코드 작성에 도움될 것으로 기대된다.

국립수목원의 전나무(Abies holophylla) 조림지의 물 이용 효율의 계절 및 경년 변동 (Seasonal and Inter-annual Variability of Water Use Efficiency of an Abies holophylla Plantation in Korea National Arboretum)

  • 빈두 말라 타쿠리;강민석;장용휘;천정화;김준
    • 한국농림기상학회지
    • /
    • 제18권4호
    • /
    • pp.366-377
    • /
    • 2016
  • 물 이용 효율(water use efficiency, WUE)은 생태계의 에너지-물질-정보의 흐름과 연관된 프로세스-구조 사이의 관계에 대한 정보를 제공하는 중요한 생태학적 지표로 간주된다. 생태계 단위의 WUE 는 총일차생산량(gross primary productivity, GPP)과 증발산(evapotranspiration, ET)의 비로 정의될 수 있다. 이 연구에서는 국립수목원에 위치한 전나무(Abies holophylla) 조림지의 WUE 를 조사하기 위해 KoFlux 에서 장기간(2007-2015) 에디공분산 방법으로 관측된 이산화탄소와 수증기 플럭스를 사용하였다. 연구의 목적은 전나무 조림지의 WUE의 계절 및 경년 변동을 규명하여 탄력(resilience) 평가를 위한 총체적인 생태학적 지표의 개발에 활용하는 것이다. 분석 결과에 따르면, 전나무 조림지의 WUE는 8월에 최소값($1.8-3.3g\;C{\cdot}(kg\;H_2O)^{-1}$), 2월에 최대값($5.1-11.4g\;C\;(kg\;H_2O)^{-1}$)을 갖는 오목한 형태의 계절 변동을 보였다. 성장기(4 월-10 월)의 WUE 는 평균 $3.5{\pm}0.3g\;C{\cdot}(kg\;H_2O)^{-1}$ 이었고, 휴면기(11 월-3 월)의 WUE는 평균 $7.4{\pm}1.0g\;C{\cdot}(kg\;H_2O)^{-1}$로서 경년 변동의 폭이 컸다. 이 전나무 조림지의 WUE 는 문헌에 보고된 다른 온대 지역 침엽수림의 WUE 와 비교했을 때, 상대적으로 높은 범위에 속한다. 성장기는 4 월부터 10 월까지의 기간으로 정의하였으나, 실제 성장기의 길이(growing season length, GSL)는 매년 변화하였고, 이러한 GSL의 변화가 성장기 WUE의 경년 변동의 62%를 설명하였다. 이 연구는 생태계 단위 WUE의 장기 변동을 정량화 한 국내 첫 결과로서, 산림생태계 모형, 위성 알고리즘 및 탄력을 시험하는 데 활용할 수 있다.

불균형 데이터 환경에서 변수가중치를 적용한 사례기반추론 기반의 고객반응 예측 (Response Modeling for the Marketing Promotion with Weighted Case Based Reasoning Under Imbalanced Data Distribution)

  • 김은미;홍태호
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.29-45
    • /
    • 2015
  • 고객반응 예측모형은 마케팅 프로모션을 제공할 목표고객을 효과적으로 선정할 수 있도록 하여 프로모션의 효과를 극대화 할 수 있도록 해준다. 오늘날과 같은 빅데이터 환경에서는 데이터 마이닝 기법을 적용하여 고객반응 예측모형을 구축하고 있으며 본 연구에서는 사례기반추론 기반의 고객반응 예측모형을 제시하였다. 일반적으로 사례기반추론 기반의 예측모형은 타 인공지능기법에 비해 성과가 낮다고 알려져 있으나 입력변수의 중요도에 따라 가중치를 상이하게 적용함으로써 예측성과를 향상시킬 수 있다. 본 연구에서는 프로모션에 대한 고객의 반응여부에 영향을 미치는 중요도에 따라 입력변수의 가중치를 산출하여 적용하였으며 동일한 가중치를 적용한 예측모형과의 성과를 비교하였다. 목욕세제 판매데이터를 사용하여 고객반응 예측모형을 개발하고 로짓모형의 계수를 적용하여 입력변수의 중요도에 따라 가중치를 산출하였다. 실증분석 결과 각 변수의 중요도에 기반하여 가중치를 적용한 예측모형이 동일한 가중치를 적용한 예측모형보다 높은 예측성과를 보여주었다. 또한 고객 반응예측 모형과 같이 실생활의 분류문제에서는 두 범주에 속하는 데이터의 수가 현격한 차이를 보이는 불균형 데이터가 대부분이다. 이러한 데이터의 불균형 문제는 기계학습 알고리즘의 성능을 저하시키는 요인으로 작용하며 본 연구에서 제안한 Weighted CBR이 불균형 환경에서도 안정적으로 적용할 수 있는지 검증하였다. 전체데이터에서 100개의 데이터를 무작위로 추출한 불균형 환경에서 100번 반복하여 예측성과를 비교해 본 결과 본 연구에서 제안한 Weighted CBR은 불균형 환경에서도 일관된 우수한 성과를 보여주었다.

NIST SP 800-90B의 최소 엔트로피 추정 알고리즘에 대한 고속 구현 및 효율적인 메모리 사용 기법 (High-Speed Implementation and Efficient Memory Usage of Min-Entropy Estimation Algorithms in NIST SP 800-90B)

  • 김원태;염용진;강주성
    • 정보보호학회논문지
    • /
    • 제28권1호
    • /
    • pp.25-39
    • /
    • 2018
  • 최근 NIST에서는 암호학적 난수발생기의 핵심 요소인 엔트로피 소스의 안전성을 평가하기 위한 방법을 다루고 있는 SP 800-90B 문서의 두 번째 수정안과 이를 Python으로 구현한 코드를 제공하였다. SP 800-90B에서의 엔트로피 소스에 대한 안전성 평가는 엔트로피 소스의 출력 표본 수열로부터 도출한 여러 가지 추정량(estimator)에 기반 하여 최소 엔트로피를 추정하는 과정이다. 최소 엔트로피 추정 과정은 IID 트랙과 non-IID 트랙으로 대별되어 진행된다. IID 트랙의 경우 MCV 추정량만을 사용하여 속도 측면에서 무리가 없다. 반면 non-IID 트랙에서는 MCV를 포함한 총 10 가지의 추정량을 적용해 최소 엔트로피를 추정하게 된다. NIST의 코드에서 non-IID 트랙의 1 회 구동 시간은 약 20 분이 소요되고, 사용되는 메모리는 5.5 GB를 넘긴다. 이는 다양한 잡음원으로 반복적인 평가를 수행해야 하는 평가 기관 또는 여러 환경에서 실험을 수행해야 하는 개발자나 연구자 입장에서는 NIST에서 제공한 Python 코드를 이용하는 것이 불편할 수 있으며, 환경에 따라 실행이 불가할 수도 있다. 본 논문에서는 SP 800-90B의 최소 엔트로피 추정 방법에 대한 고속 구현과 효율적인 메모리 사용 기법을 제시한다. 주요 연구 결과로 MultiMCW 추정 방법에 C++ 코드의 장점을 적용한 고속화 방법, MultiMMC 추정 방법의 데이터 저장 방식을 재구성하여 메모리 사용량을 현저하게 감소시킴과 동시에 고속화한 방법, LZ78Y 추정 방법에 데이터 저장 방식의 재구성을 통한 고속화 기법 등을 제안한다. 우리의 개선된 방법이 종합적으로 적용된 C++ 코드는 NIST에서 제공한 기존의 Python 코드와 비교할 때, 속도는 14 배 빠르고 메모리 사용량은 1/13로 감소하는 효과를 보인다.

인공위성 합성개구레이더 영상 자료의 해양 활용 - 해상풍 산출을 중심으로 - (Oceanic Application of Satellite Synthetic Aperture Radar - Focused on Sea Surface Wind Retrieval -)

  • 장재철;박경애
    • 한국지구과학회지
    • /
    • 제40권5호
    • /
    • pp.447-463
    • /
    • 2019
  • 해상풍은 해양 현상을 이해하고, 지구 온난화에 의한 지구 환경의 변화를 분석하기 위한 필수 요소이다. 전세계 연구 기관은 해상풍을 정확하고 지속적으로 관측하기 위해 산란계(scatterometer)를 개발하여 운영해오고 있으며, 정확도는 풍향이 ${\pm}20^{\circ}$, 풍속이 ${\pm}2m\;s^{-1}$ 안팎이다. 하지만, 산란계의 해상도는 12.5-25.0 km로, 해안선이 복잡하고 섬이 많은 한반도 근해에서는 자료의 결측이 빈번하게 발생하여 활용도가 감소한다. 그에 반해, Synthetic Aperture Radar (SAR, 합성개구레이더)는 마이크로파를 활용하는 전천후 센서로, 1 km 이하의 고해상도 해상풍이 산출이 가능하여 산란계의 단점 보완이 가능하다. 본 연구에서는 일반적으로 활용되는 SAR 자료 기반 해상풍 산출 알고리즘인 Geophysical Model Function (GMF, 지구 물리 모델 함수)를 밴드별로 분류하여 조사하였다. 상대 풍향, 입사각, 풍속에 따른 후방산란계수를 L-band Model (LMOD, L 밴드 모델), C-band Model (CMOD, C 밴드 모델), X-band Model (XMOD, X 밴드 모델)에 적용하여 모의하였고, 각 GMF의 특성을 분석하였다. 이러한 GMF를 SAR 탑재 인공위성 자료에 적용하여 산출한 해상풍의 정확도 검증 연구에 대해 조사하였다. SAR 자료 기반 해상풍의 정확도는 영상 관측 모드, 적용한 GMF의 종류, 정확도 비교 기준 자료, SAR 자료 전처리 방법, 상대 풍향 정보 산출 방법 등에 따라 변하는 것으로 나타났다. 본 연구를 통해 국내 연구자들의 SAR 자료 기반 해상풍 산출 방법에 대한 접근성이 향상되고, 고해상도 해상풍 자료를 활용한 한반도 근해 분석에 이바지할 것으로 기대된다.

최근 12년간 아까시나무 만개일의 변화와 과정기반모형을 활용한 지역별 만개일 예측 (Recent Changes in Bloom Dates of Robinia pseudoacacia and Bloom Date Predictions Using a Process-Based Model in South Korea)

  • 김수경;김태경;윤석희;장근창;임혜민;이위영;원명수;임종환;김현석
    • 한국산림과학회지
    • /
    • 제110권3호
    • /
    • pp.322-340
    • /
    • 2021
  • 최근 급격한 봄철 기온 상승과 기후변화의 영향으로 한반도에 분포하고 있는 아까시나무의 개화 시기가 변화하면서 지역간에 동시 개화 현상(simultaneous blooming)이 관측되고 있다. 이러한 변화는 국내 양봉 산업에 큰 변화를 초래하였고, 이로 인해 정확도 높은 아까시나무 개화시기 정보에 대한 수요가 증가하고 있다. 따라서, 본 연구를 통해 아까시나무의 지역별 개화 시기 변화를 잘 설명할 수 있는 신뢰도 높은 개화 시기 예측 모형을 개발하고자 하였다. 이를 위해 지난 12년(2006~2017년)간 전국 26개 지점에서 관측된 아까시나무 만개일 자료와 과거 일기온 복원 자료를 활용하여 봄철 기온 및 아까시나무 만개일 변화의 경향성을 권역별로 파악하고, 과정기반모형을 활용하여 지역 통합 모형(SM)과 함께 지역적 특성을 반영하는 세 모형-SM에 지점별 보정계수를 도입한 수정 통합 모형(MSM), 권역별로 모수를 추정하는 권역별 통합 모형(GM), 관측 지점별로 모수를 추정하는 지역 모형(LM)-을 도출, 성능을 비교하였다. 기온 및 만개일의 경향 분석 결과, 남부 지역에 비해 봄철 기온 상승률이 2배 이상 높았던 중북부 내륙 지역의 경우 만개일이 빠른 속도로 앞당겨져, 결과적으로 남서부 해안 지역과의 만개일 차이는 1년에 0.7098일씩 감소하였다(p-value=0.0417). 전체 지역에 대한 모형의 성능 비교 결과, 지역 특이성이 반영되지 않은 SM에 비해서 MSM은 24% 이상, LM은 15% 이상 감소한 RMSE 값을 나타냈다. 또한 LM과 MSM의 예측 알고리즘을 전국 범위로 확대하여 4년 간(2014~2017년) 16개의 추가 관측 지점을 대상으로 검증한 결과, LM에 코크리깅(Co-kriging)기법을 적용한 방법이 보정계수 전국 분포도를 추정하여 SM을 보정하는 방법보다 예측력이 더 뛰어났으며, 오차의 분포는 두 모형 간에 통계적으로 유의한 차이를 보였다(RMSE: p-value=0.0118, Bias: p-value=0.0471). 본 연구는 아까시나무의 개화 시기 예측에 있어 지역 단위 예측의 신뢰도를 향상시키고 모형을 넓은 지역 범위로 확대, 적용하기 위한 방안을 제시하였다.

텍스트마이닝을 활용한 공개데이터 기반 기업 및 산업 토픽추이분석 모델 제안 (Development of Topic Trend Analysis Model for Industrial Intelligence using Public Data)

  • 박선영;이진무;김유일;서진이
    • 기술혁신연구
    • /
    • 제26권4호
    • /
    • pp.199-232
    • /
    • 2018
  • 빅데이터 분석을 통한 기업 경영환경에 대한 이해와 통찰을 구하고자 하는 요구가 산업 및 기업 경영 전반에 증가하고 있다. 이러한 사회적 요구에 따라 산업의 이해와 기업 경영의 이해를 위하여 기업의 경영실적 및 향후 계획을 포괄적으로 담고 있는 기업공시정보를 활용한 연구가 주목을 받고 있다. 이러한 기업공시정보는 대표적인 비정형 데이터로써 텍스트마이닝 방법론을 적용하여 그 범위와 수준에 대한 다양한 접근을 통하여 산업 수준 및 기업 수준에서 다양한 활용이 가능하다. 그러나 아직은 이러한 기업공시자료를 활용한 산업 및 기업 레벨에서 적용가능한 수준의 분석모델이 부족한 것으로 파악된다. 따라서 본 연구에서는 실제 활용 가능한 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 제안하고자 한다. 미국상장기업의 공시자료인 미국 SEC EDGAR 자료를 기반으로 텍스트마이닝 알고리즘을 적용하여 산업 및 기업 수준의 경영주제(토픽)에 대한 추이분석이 가능한 모델을 제안하고자한다. SEC EDGAR의 10-K 문서를 대상으로 LDA 토픽 모델링을 통하여 산업 수준에서 전체 산업의 주제분야 분류를 파악하였고, 산업간 비교 측면에서 소프트웨어 산업과 하드웨어 산업 분야의 사례를 통해 최근 20년간의 토픽추이를 비교분석 하였다. 또한 최근 20년간의 기업의 경영주제 변화를 소프트웨어 산업에 속한 2개 기업을 중심으로 살펴보았다. 이를 통해 산업 및 기업 수준에서의 경영주제의 추이 변화를 파악하여 쇠퇴 및 성장 추세에 있는 경영주제를 확인 할 수 있었다. 한편 word2vec 워드 임베딩 모델과 주성분분석을 통한 차원 축약을 통해 소프트웨어 산업분야의 기업 및 특정 제품(혹은 서비스)에 대한 매핑을 통해 유사한 경영주제(토픽)를 가지는 기업 및 제품(서비스)을 사례를 통해 파악하였으며, 이를 시간적 흐름에 따른 변화 양상도 관찰할 수 있었다. 본 연구의 목적이 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 개발하기 위한 방법론을 제안한 측면에서, 해외 데이터를 사용하여 산업의 경영주제 변화 추이, 기업의 경영주제 변화 추이를 거시적으로 조망할 수 있는 실무적인 방법론의 제안에서 의의가 있을 수 있다. 한편 기업의 기술경영전략 측면에서 기업의 경영토픽의 잦은 변화, 경영주제의 변화의 속도 등 다양한 변화 양상의 차이에 따른 기업의 매출 등의 경영성과와의 연관성 분석, 실제 기업의 제품포트폴리오의 구성에 따른 기업 간의 경쟁상황 등을 파악하는 미시적 모델 제안을 위한 추가 연구가 요구된다.

해양 이상 자료 탐지를 위한 오토인코더 활용 기법 최적화 연구 (An Outlier Detection Using Autoencoder for Ocean Observation Data)

  • 김현재;김동훈;임채욱;신용탁;이상철;최영진;우승범
    • 한국해안·해양공학회논문집
    • /
    • 제33권6호
    • /
    • pp.265-274
    • /
    • 2021
  • 해양 이상 자료 탐지의 연구는 이전부터 활발하게 이루어지고 있으며, 통계 및 거리 기반의 기계 학습 알고리즘을 활용하는 기법들이 개발되었다. 최근에는 AI 기반의 해양 자료 이상 탐지 기법이 많은 관심을 받고 있으며, AI를 활용한 해양 이상 자료 탐지 기법은 정답이 주어지는 지도학습 기법이 주를 이루고 있다. 이러한 방법은 학습에 필요한 모든 자료에 수작업으로 분류 정보(라벨)를 지정해야 한다는 점에서 많은 시간과 비용이 요구된다. 본 연구에서는 이러한 문제를 극복하기 위해 비지도학습 기반의 오토인코더를 이상 자료 탐지 기법에 사용하였다. 실험으로는 오토인코더의 평가를 위해 단변수·다변수학습 두가지 실험을 구성하였고, 단변수 학습은 기상청에서 제공하는 덕적도 부이 정점 관측 자료 중 수온만 사용하였으며, 다변수 학습은 수온과 기온, 풍향, 풍속, 기압, 습도 등을 사용하였다. 사용기간은 1996~2020년의 25년간이며 학습 자료에 해양-기상 자료의 특성을 고려한 전처리 기법을 적용하였다. 학습된 다변수와 단변수 오토인코더를 활용하여 실제 표층 수온에 대한 이상 탐지를 시도하였다. 모델성능 비교를 위해 오차를 삽입한 합성 자료에 다변수와 단변수 오토인코더를 포함한 여러 이상 탐지 기법을 적용하여 정량적으로 평가하였으며, 다변수/단변수의 정확도가 각각 약 96%/91%로써 다변수 오토인코더가 더 나은 이상자료 탐지 성능을 보였다. 오토인코더를 이용한 비지도학습 기반 이상 탐지 기법은 주관적 판단에 의한 오류와 자료 라벨링에 필요한 시간과 비용을 줄일 수 있다는 점에서 다양하게 활용될 것으로 판단된다.

빅데이터와 AI를 활용한 의료영상 정보 시스템 발전 방향에 대한 연구 (A Study on the Development Direction of Medical Image Information System Using Big Data and AI)

  • 유세종;한성수;전미향;한만석
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권9호
    • /
    • pp.317-322
    • /
    • 2022
  • 정보기술의 급격한 발달은 의료 환경에서도 많은 변화를 가져오고 있다. 특히 빅데이터와 인공지능(AI)을 활용한 의료영상 정보 시스템의 빠른 변화를 견인하고 있다. 전자의무기록(EMR)과 의료영상저장전송시스템(PACS)으로 구성된 처방전달시스템(OCS)은 의료 환경을 아날로그에서 디지털로 빠르게 바꾸어 놓았다. PACS는 여러 솔루션과 결합하여 호환, 보안, 효율성, 자동화 등 새로운 발전 방향을 보여주고 있다. 그 중, 영상의 질적 개선을 할 수 있는 빅데이터를 활용한 인공지능(AI)과의 결합이 활발히 진행되고 있다. 특히 딥러닝 기술을 활용하여 의료 영상 판독을 보조할 수 있는 시스템인 AI PACS가 대학과 산업체의 협력으로 개발되어 병원에서 활용되고 있다. 이처럼 의료 환경에서 의료영상 정보 시스템의 빠른 변화에 맞추어 의료시장의 구조적인 변화와 이에 대처할 수 있는 의료정책의 변화도 필요하다. 한편, 의료영상정보는 디지털 의료영상 전송 장치에서 생성되는 DICOM 방식을 기본으로 하고, 생성하는 방법의 차이에 따라 Volume 영상, 단면 영상인 2차원적 영상으로 구분된다. 또한, 최근 많은 의료기관에서는 스마트 병원 서비스를 내세우며 차세대 통합 의료정보시스템의 도입을 서두르고 있다. 차세대 통합 의료정보시스템은 EMR을 바탕으로 전자동의서, AI와 빅데이터를 활용한 정밀의료, 외부기관 등을 통합한 솔루션으로 구축하며, 이를 바탕으로 환자 정보 DB 구축과 데이터의 표준화를 통한 의료 빅데이터 기반의 의학 연구를 목적으로 한다. 우리나라의 의료영상 정보 시스템은 앞선 IT 기술력과 정부의 정책에 힘입어 세계적인 수준에 있으며, 특히 PACS 관련 프로그램은 의료 영상정보 기술에서 세계로 수출을 하고 있는 한 분야이다. 본 연구에서는 빅데이터를 활용한 의료영상 정보 시스템의 분석과 함께 의료영상 정보 시스템이 국내에 도입되게 된 역사적 배경을 바탕으로 현재의 흐름을 파악하고 나아가 미래의 발전 방향을 예측하였다. 향후, 20여 년 동안 축적된 DICOM 빅데이터를 기반으로 AI, 딥러닝 알고리즘을 활용하여 영상 판독률을 높일 수 있는 연구를 진행하고자 한다.