• 제목/요약/키워드: 알고리즘 개발

검색결과 8,236건 처리시간 0.037초

텍스트마이닝을 활용한 공개데이터 기반 기업 및 산업 토픽추이분석 모델 제안 (Development of Topic Trend Analysis Model for Industrial Intelligence using Public Data)

  • 박선영;이진무;김유일;서진이
    • 기술혁신연구
    • /
    • 제26권4호
    • /
    • pp.199-232
    • /
    • 2018
  • 빅데이터 분석을 통한 기업 경영환경에 대한 이해와 통찰을 구하고자 하는 요구가 산업 및 기업 경영 전반에 증가하고 있다. 이러한 사회적 요구에 따라 산업의 이해와 기업 경영의 이해를 위하여 기업의 경영실적 및 향후 계획을 포괄적으로 담고 있는 기업공시정보를 활용한 연구가 주목을 받고 있다. 이러한 기업공시정보는 대표적인 비정형 데이터로써 텍스트마이닝 방법론을 적용하여 그 범위와 수준에 대한 다양한 접근을 통하여 산업 수준 및 기업 수준에서 다양한 활용이 가능하다. 그러나 아직은 이러한 기업공시자료를 활용한 산업 및 기업 레벨에서 적용가능한 수준의 분석모델이 부족한 것으로 파악된다. 따라서 본 연구에서는 실제 활용 가능한 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 제안하고자 한다. 미국상장기업의 공시자료인 미국 SEC EDGAR 자료를 기반으로 텍스트마이닝 알고리즘을 적용하여 산업 및 기업 수준의 경영주제(토픽)에 대한 추이분석이 가능한 모델을 제안하고자한다. SEC EDGAR의 10-K 문서를 대상으로 LDA 토픽 모델링을 통하여 산업 수준에서 전체 산업의 주제분야 분류를 파악하였고, 산업간 비교 측면에서 소프트웨어 산업과 하드웨어 산업 분야의 사례를 통해 최근 20년간의 토픽추이를 비교분석 하였다. 또한 최근 20년간의 기업의 경영주제 변화를 소프트웨어 산업에 속한 2개 기업을 중심으로 살펴보았다. 이를 통해 산업 및 기업 수준에서의 경영주제의 추이 변화를 파악하여 쇠퇴 및 성장 추세에 있는 경영주제를 확인 할 수 있었다. 한편 word2vec 워드 임베딩 모델과 주성분분석을 통한 차원 축약을 통해 소프트웨어 산업분야의 기업 및 특정 제품(혹은 서비스)에 대한 매핑을 통해 유사한 경영주제(토픽)를 가지는 기업 및 제품(서비스)을 사례를 통해 파악하였으며, 이를 시간적 흐름에 따른 변화 양상도 관찰할 수 있었다. 본 연구의 목적이 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 개발하기 위한 방법론을 제안한 측면에서, 해외 데이터를 사용하여 산업의 경영주제 변화 추이, 기업의 경영주제 변화 추이를 거시적으로 조망할 수 있는 실무적인 방법론의 제안에서 의의가 있을 수 있다. 한편 기업의 기술경영전략 측면에서 기업의 경영토픽의 잦은 변화, 경영주제의 변화의 속도 등 다양한 변화 양상의 차이에 따른 기업의 매출 등의 경영성과와의 연관성 분석, 실제 기업의 제품포트폴리오의 구성에 따른 기업 간의 경쟁상황 등을 파악하는 미시적 모델 제안을 위한 추가 연구가 요구된다.

해양 이상 자료 탐지를 위한 오토인코더 활용 기법 최적화 연구 (An Outlier Detection Using Autoencoder for Ocean Observation Data)

  • 김현재;김동훈;임채욱;신용탁;이상철;최영진;우승범
    • 한국해안·해양공학회논문집
    • /
    • 제33권6호
    • /
    • pp.265-274
    • /
    • 2021
  • 해양 이상 자료 탐지의 연구는 이전부터 활발하게 이루어지고 있으며, 통계 및 거리 기반의 기계 학습 알고리즘을 활용하는 기법들이 개발되었다. 최근에는 AI 기반의 해양 자료 이상 탐지 기법이 많은 관심을 받고 있으며, AI를 활용한 해양 이상 자료 탐지 기법은 정답이 주어지는 지도학습 기법이 주를 이루고 있다. 이러한 방법은 학습에 필요한 모든 자료에 수작업으로 분류 정보(라벨)를 지정해야 한다는 점에서 많은 시간과 비용이 요구된다. 본 연구에서는 이러한 문제를 극복하기 위해 비지도학습 기반의 오토인코더를 이상 자료 탐지 기법에 사용하였다. 실험으로는 오토인코더의 평가를 위해 단변수·다변수학습 두가지 실험을 구성하였고, 단변수 학습은 기상청에서 제공하는 덕적도 부이 정점 관측 자료 중 수온만 사용하였으며, 다변수 학습은 수온과 기온, 풍향, 풍속, 기압, 습도 등을 사용하였다. 사용기간은 1996~2020년의 25년간이며 학습 자료에 해양-기상 자료의 특성을 고려한 전처리 기법을 적용하였다. 학습된 다변수와 단변수 오토인코더를 활용하여 실제 표층 수온에 대한 이상 탐지를 시도하였다. 모델성능 비교를 위해 오차를 삽입한 합성 자료에 다변수와 단변수 오토인코더를 포함한 여러 이상 탐지 기법을 적용하여 정량적으로 평가하였으며, 다변수/단변수의 정확도가 각각 약 96%/91%로써 다변수 오토인코더가 더 나은 이상자료 탐지 성능을 보였다. 오토인코더를 이용한 비지도학습 기반 이상 탐지 기법은 주관적 판단에 의한 오류와 자료 라벨링에 필요한 시간과 비용을 줄일 수 있다는 점에서 다양하게 활용될 것으로 판단된다.

빅데이터와 AI를 활용한 의료영상 정보 시스템 발전 방향에 대한 연구 (A Study on the Development Direction of Medical Image Information System Using Big Data and AI)

  • 유세종;한성수;전미향;한만석
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권9호
    • /
    • pp.317-322
    • /
    • 2022
  • 정보기술의 급격한 발달은 의료 환경에서도 많은 변화를 가져오고 있다. 특히 빅데이터와 인공지능(AI)을 활용한 의료영상 정보 시스템의 빠른 변화를 견인하고 있다. 전자의무기록(EMR)과 의료영상저장전송시스템(PACS)으로 구성된 처방전달시스템(OCS)은 의료 환경을 아날로그에서 디지털로 빠르게 바꾸어 놓았다. PACS는 여러 솔루션과 결합하여 호환, 보안, 효율성, 자동화 등 새로운 발전 방향을 보여주고 있다. 그 중, 영상의 질적 개선을 할 수 있는 빅데이터를 활용한 인공지능(AI)과의 결합이 활발히 진행되고 있다. 특히 딥러닝 기술을 활용하여 의료 영상 판독을 보조할 수 있는 시스템인 AI PACS가 대학과 산업체의 협력으로 개발되어 병원에서 활용되고 있다. 이처럼 의료 환경에서 의료영상 정보 시스템의 빠른 변화에 맞추어 의료시장의 구조적인 변화와 이에 대처할 수 있는 의료정책의 변화도 필요하다. 한편, 의료영상정보는 디지털 의료영상 전송 장치에서 생성되는 DICOM 방식을 기본으로 하고, 생성하는 방법의 차이에 따라 Volume 영상, 단면 영상인 2차원적 영상으로 구분된다. 또한, 최근 많은 의료기관에서는 스마트 병원 서비스를 내세우며 차세대 통합 의료정보시스템의 도입을 서두르고 있다. 차세대 통합 의료정보시스템은 EMR을 바탕으로 전자동의서, AI와 빅데이터를 활용한 정밀의료, 외부기관 등을 통합한 솔루션으로 구축하며, 이를 바탕으로 환자 정보 DB 구축과 데이터의 표준화를 통한 의료 빅데이터 기반의 의학 연구를 목적으로 한다. 우리나라의 의료영상 정보 시스템은 앞선 IT 기술력과 정부의 정책에 힘입어 세계적인 수준에 있으며, 특히 PACS 관련 프로그램은 의료 영상정보 기술에서 세계로 수출을 하고 있는 한 분야이다. 본 연구에서는 빅데이터를 활용한 의료영상 정보 시스템의 분석과 함께 의료영상 정보 시스템이 국내에 도입되게 된 역사적 배경을 바탕으로 현재의 흐름을 파악하고 나아가 미래의 발전 방향을 예측하였다. 향후, 20여 년 동안 축적된 DICOM 빅데이터를 기반으로 AI, 딥러닝 알고리즘을 활용하여 영상 판독률을 높일 수 있는 연구를 진행하고자 한다.

저서성 대형무척추동물을 이용한 RIVPACS 유형의 하천생태계 건강성 평가법 국내 하천 적용성 (Development and Testing of a RIVPACS-type Model to Assess the Ecosystem Health in Korean Streams: A Preliminary Study)

  • 이다영;이대성;민중혁;박영석
    • 생태와환경
    • /
    • 제56권1호
    • /
    • pp.45-56
    • /
    • 2023
  • 본 연구는 저서성 대형무척추동물을 이용한 RIVPACS 유형의 국내 실정에 맞는 수생태계 예측 및 평가모델을 구축하기 위한 사전 연구로서 수행되었다. 자연상태의 하천인 887개의 참조하천을 선정하고, 참조하천을 저차하천과 고차하천으로 구분한 뒤 random forest 알고리즘을 이용하여 각각의 과에 대하여 예측모델을 구축하였다. 저차하천은 학습과 검증 데이터를 7 : 3의 비율로 나누어 구축하였으며, 고차하천의 경우에는 leave-one-out 방법을 이용하였다. 예측모델에 사용된 환경변수는 비계량 다차원 척도법(NMDS)을 이용하여 선정되었으며, 고도, 경사각, 평년평균기온, 숲의 비율, 하폭, 여울 비율, 하상 구조의 큰돌의 비율로 7개의 변수가 선택되었다. 3,224개의 조사대상 지점을 하천차수에 따른 유형에 따라 구분한 뒤, 각각의 유형에 해당하는 모델을 이용하여 30개 과에 대한 과 단위의 생물상을 예측하였다. 예측된 생물상(E)은 실제 생물상(O)과 생물지수를 이용하여 비교되었다. 생물지수는 BMWPK 지수를 과의 수로 나눈 ASPT를 이용하였다. 그 이후 EQR 지수(O/E)를 이용하여 각 조사지점의 건강성을 평가하였다. 마지막으로, EQR 값을 기존에 이용되고 있는 BMI 값과 비교하였다. 건강성 점수 평가 결과, 실제 군집은 0~20과, 예측된 군집은 0~19과 범위로 예측되어 유사하게 나타났다. 실제 ASPT는 평균 4.82 (±2.04 SD), 예측된 ASPT는 6.30 (±0.79 SD)으로 예측된 값이 더 높게 나타났다. ASPT와 BMI의 비교 결과, 대체로 EQR이 BMI 지수보다 높은 값을 보였다. 이는 참조하천 선정에 있어서 조금 교란된 지점도 자연상태로 가정하여 참조하천으로 이용되었기 때문으로 보인다. RIVPACS 모델은 생태학적 상태에 대한 단순하지만 명확한 진단을 제공해줌으로써 국내 하천 관리에 도움이 될 것으로 기대된다. 본 연구는 연구가 미진하였던 우리나라 실정에 맞는 RIVPACS 유형의 평가법을 개발하는 선행 연구로서의 의의가 있다.

인공지능 기반 음성비서 서비스의 지속이용 의도에 미치는 영향: 인공지능에 대한 신뢰와 프라이버시 염려의 상호작용을 중심으로 (Effects on the continuous use intention of AI-based voice assistant services: Focusing on the interaction between trust in AI and privacy concerns)

  • 장창기;허덕원;성욱준
    • 정보화정책
    • /
    • 제30권2호
    • /
    • pp.22-45
    • /
    • 2023
  • AI 기반 음성비서 서비스 이용에 관한 연구에서는 서비스 이용 경험으로 인한 이용자의 신뢰 및 프라이버시 보호와 관련된 문제가 지속적으로 제기되고 있다. 본 연구의 목적은 AI에 대한 개인의 신뢰와 온라인 프라이버시 염려가 AI 기반 음성비서의 지속적인 사용에 미치는 영향, 특히 상호 작용의 영향을 실증적으로 분석하는 것이다. 본 연구에서는 선행연구를 바탕으로 설문문항을 구성하고 응답자 405명을 대상으로 온라인 설문조사를 실시하였다. 인공지능에 대한 사용자의 신뢰와 개인정보보호 관심이 인공지능 기반 음성비서 서비스 도입 및 지속 이용의도에 미치는 영향을 Heckman 선택모형을 이용하여 분석하였다. 연구의 주요 결과로 첫째, 인공지능 기반 음성비서 서비스 이용행태는 기술수용 촉진요인인 지각된 유용성, 지각된 이용편의성, 사회적 영향에 의해 긍정적인 영향을 받았다. 둘째, 인공지능에 대한 신뢰는 인공지능 기반 음성비서 서비스 이용행태에 통계적으로 유의한 영향을 미치지 않았으나 지속 이용의도에는 정(+)의 영향을 미쳤다. 셋째, 프라이버시 염려 수준은 AI에 대한 신뢰와의 상호작용을 통해 지속적인 이용의도를 억제하는 효과(β=-0.153)가 있음을 확인하였다. 이러한 연구 결과는 디지털 정부를 구현하기 위한 거버넌스로서 기술에 대한 신뢰를 높이고 프라이버시에 대한 사용자의 우려를 완화할 수 있는 이용자 의견수렴과 조치를 통한 이용자 경험을 강화할 필요가 있음을 시사한다. 이러한 수단으로서 인공지능 기반의 정책서비스를 도입할 때, 인공지능 기술의 적용 범위를 공론화 과정을 통해 투명하게 공개하고, 프라이버시 문제가 사후적으로 추적 및 평가될 수 있는 제도의 마련과 프라이버시의 보호를 고려한 알고리즘의 개발이 필요하다.

하이퍼스펙트럴영상 분류에서 정준상관분류기법의 유용성 (Usefulness of Canonical Correlation Classification Technique in Hyper-spectral Image Classification)

  • 박민호
    • 대한토목학회논문집
    • /
    • 제26권5D호
    • /
    • pp.885-894
    • /
    • 2006
  • 본 논문의 의도는 하이퍼스펙트럴 영상의 다량의 밴드를 사용하면서도 효율적인 분류기법의 개발에 초점을 두고 있다. 본 연구에서는 하이퍼스펙트럴 영상의 분류에 있어 이론적으로 밴드수가 많아질수록 분류정확도가 높을 것이라 예상되는, 다변량 통계분석기법중의 하나인 정준상관분석을 적용한 분류기법을 제안한다. 그리고 기존의 대표적인 전통적 분류기법인 최대 우도분류 방법과 비교한다. 사용되는 하이퍼스펙트럴 영상은 2001년 9월 2일 취득된 EO1-Hyperion 영상이다. 실험을 위한 밴드수는 LANDSAT TM 영상에서 열밴드를 제외한 나머지 데이터의 파장대와 일치하는 부분을 감안하여 30개 밴드로 선정하였다. 지상실제데이터로서 비교기본도를 채택하였다. 이 비교기본도와 시각적으로 윤곽을 비교하고, 중첩분석하여 정확도를 평가하였다. 최대우도분류의 경우 수역 분류를 제외하고는 전혀 분류기법으로서의 역할을 하지 못하는 것으로 판단되며, 수역의 경우도 큰 호수 외에 작은 호수나 골프장내 연못, 부분적으로 물이 존재하는 작은 영역 등은 전혀 분류하지 못하고 있는 것으로 나타났다. 그러나 정준상관분류결과는 비교기본도와 형태적으로 시각적 비교를 해볼 때 골프장잔디를 거의 명확히 분류해 내고 있으며, 도시역에 대해서도 고속도로의 선형 등을 상당히 잘 분류해내고 있음을 알 수 있다. 또한 수역의 경우도 골프장 연못이나 대학교내 연못, 기타지역의 연못, 웅덩이 등 까지도 잘 분류해내고 있음을 확인할 수 있다. 결과적으로 정준상관분석 알고리즘의 개념상 트레이닝 영역 선정시 시행착오를 겪지 않고도 정확한 분류를 할 수 있었다. 또한 분류항목 중에서 잔디와 그 외 식물을 구분해 내는 능력과 수역을 추출해 내는 능력이 최대우도분류기법에 비해 우수하였다. 이상의 결과로 판단해 볼 때 하이퍼스펙트럴영상에 적용되는 정준상관분류기법은 농작물 작황 예측과 지표수 탐사에 매우 유용하리라 판단되며, 나아가서는 분광적 고해상도 영상인 하이퍼스펙트럴 데이터를 이용한 GIS 데이터베이스 구축에 중요한 역할을 할 수 있을 것으로 기대된다.

무인기 기반 초분광영상을 이용한 배나무 엽록소 함량 추정 (Estimation of Chlorophyll Contents in Pear Tree Using Unmanned AerialVehicle-Based-Hyperspectral Imagery)

  • 강예성;박기수;김은리;정종찬;유찬석;조정건
    • 대한원격탐사학회지
    • /
    • 제39권5_1호
    • /
    • pp.669-681
    • /
    • 2023
  • 과일 나무의 생육을 평가하는 중요한 지표인 엽록소 함량을 추정하는데 비교적 많은 노동력의 투입이 요구되고 오랜 시간이 소요되는 기존의 파괴 조사 대신 비파괴적 조사 방식인 원격탐사기술을 적용하기 위한 연구가 시도되고 있다. 이 연구에서는 2년(2021, 2022) 간 무인기 기반의 초분광 영상을 이용하여 배나무 잎의 엽록소 함량을 비파괴적으로 추정하는 연구를 수행하였다. 영상 처리로 추출된 배나무 캐노피(canopy)의 단일 band 반사율은 시간 변화에 따라 불안정한 복사 효과를 최소화하기 위해 밴드비화(band rationing) 되었다. 밴드비(band ratios)를 입력 변수로 머신러닝 알고리즘인 elastic-net, k-nearest neighbors (KNN)과 support vector machine을 사용하여 추정(calibration, validation) 모델들을 개발하였다. Full band ratios 기반 추정 모델들의 성능과 비교하여 계산 비용 절감과 재현성 향상에 유리한 key band ratios를 선정하였다. 결과적으로 모든 머신러닝 모델에서 full band ratios를 이용한 calibration에 coefficient of determination (R2)≥0.67, root mean squared error (RMSE)≤1.22 ㎍/cm2, relative error (RE)≤17.9%)와 validation에 R2≥0.56, RMSE≤1.41 ㎍/cm2, RE≤20.7% 성능을 비교하였을 때, key band ratios 네 개가 선정되었다. 머신러닝 모델들 사이에 validation 성능에는 비교적 큰 차이가 없어 calibration 성능이 가장 높았던 KNN 모델을 기준으로 삼았으며, 그 key band ratios는 710/714, 718/722, 754/758, 758/762 nm가 선정되었다. Calibration에서 R2=0.80, RMSE=0.94 ㎍/cm2, RE=13.9%와 validation에서 R2=0.57, RMSE=1.40 ㎍/cm2, RE=20.5%를 나타내었다. Validation의 기준으로 한 성능 결과는 배나무 잎 엽록소 함량을 추정하기에 충분하지 않았지만, 앞으로의 연구에 기준이 될 key band ratios를 선정했다는 것에 의미가 있다. 추후 연구에서는 추정 성능을 향상하기 위해 지속적으로 추가 데이터세트를 확보하여 선정된 key band ratios의 신뢰성 검증과 함께 실제 과원에 재현 가능한 추정 모델로 고도화할 필요가 있다.

GOCI-II 기반 저염분수 산출과 태풍 힌남노에 의한 시간별 염분 변화 (GOCI-II Based Low Sea Surface Salinity and Hourly Variation by Typhoon Hinnamnor)

  • 김소현;김대원;조영헌
    • 대한원격탐사학회지
    • /
    • 제39권6_2호
    • /
    • pp.1605-1613
    • /
    • 2023
  • 해양 내의 다양한 물리적 변화는 수온과 염분의 지속적인 변동에 의해 결정된다. 수온과 더불어 넓은 영역의 염분 변화를 파악하기 위해서는 인공위성 자료에 의존할 수밖에 없다. 그럼에도 불구하고 염분을 관측하는 위성인 Soil Moisture Active Passive (SMAP)는 낮은 시·공간 해상도로 인해 연안 근처에서 빠르게 변화하는 해양환경을 관측하기에는 어렵다는 한계가 존재한다. 이러한 한계를 극복하기 위해 본 연구에서는 천리안 해양 관측 위성의 정지궤도 해색 센서인 Geostationary Ocean Color Imager-II (GOCI-II) 원격반사도 자료를 입력자료로 하여 고해상도 표층 염분을 산출하는 Multi-layer Perceptron Neural Network (MPNN) 기반의 알고리즘을 개발하였다. SMAP과 비교한 결과 coefficient of determination (R2)는 0.94, root mean square error (RMSE)는 0.58 psu 그리고 relative root mean square error (RRMSE)는 1.87%였으며, 공간적인 분포 또한 매우 유사한 결과를 나타냈다. R2의 공간 분포는 0.8 이상을 보여주었으며 RMSE는 전반적으로 1 psu 이하의 낮은 값을 보여주었다. 이어도 과학기지에서의 실측 염분값과도 비교하였지만 상대적으로 조금 낮은 결과를 보여주었다. 이에 대한 원인을 분석하였으며, 산출된 GOCI-II 기반 고해상도 염분 자료를 활용하여 2022년 11호 태풍 힌남노에 의한 하루 동안의 동중국해 표층 염분 변화를 표준편차로 계산하였다. 그 결과 SMAP에서 관측할 수 없는 시공간의 염분 변화를 고해상도의 GOCI-II 기반 염분 산출물을 통해 확인할 수 있었다. 따라서 본 연구를 통해 시간 단위로 변화하는 해양환경 모니터링에 큰 기여를 할 것으로 기대된다.

머신러닝&딥러닝 모델을 활용한 댐 일유입량 예측시 융적설을 고려하기 위한 데이터 전처리에 대한 방법 연구 (Study on data preprocessing methods for considering snow accumulation and snow melt in dam inflow prediction using machine learning & deep learning models)

  • 조영식;정관수
    • 한국수자원학회논문집
    • /
    • 제57권1호
    • /
    • pp.35-44
    • /
    • 2024
  • 댐유입량 예측에 대하여 데이터 기반 머신러닝 및 딥러닝(Machine Learning & Deep Learning, ML&DL) 분석도구들이 공개되어 다양한 분야에서 ML&DL의 적용연구가 활발히 진행되고 있으며, 모델의 자체 성능향상 뿐만 아니라 모델의 특성을 고려한 데이터의 전처리도 댐유입량을 정확하게 예측하게 하는 중요한 모델성능 향상의 요소라고 할 수 있다. 특히 기존 강우자료는 적설량을 열선 설비를 통하여 녹여 강우량으로 환산되어 있으므로, 융적설에 따른 강우와 유입량의 상관관계를 왜곡하게 된다. 따라서 본연구에서는 소양강댐과 같이 융적설의 영향을 받는 댐유역에 대한 댐일유입량 예측시 겨울에 강설량이 적설이 되어 적게 유출되는 현상과, 봄에 융설로 인하여 무강우나 적은 비에도 많은 유출이 일어나는 물리적 현상을 ML&DL모델로 적용하기 위하여 필요한 강우 데이터의 전처리에 대한 연구를 수행 하였다. 강우계열, 유입량계열을 조합하여 3가지 머신러닝(SVM, RF, LGBM)과 2가지 딥러닝(LSTM, TCN) 모델을 구축하고, 최적 하이퍼파라메터 튜닝을 통하여 적합 모델을 적용하고 한 결과, NSE 0.842~0.894로 높은 수준의 예측성능을 나타내었다. 또한 융적설을 반영한 강우보정 데이터를 만들기 위하여 융적설 모의 알고리즘을 개발하고, 이를 통하여 산정된 보정강우를 머신러닝 및 딥러닝 모델에 적용한 결과 NSE 0.841~0.896 으로 융적설 적용전과 비슷한 높은 수준의 예측 성능을 나타내었으나, 융적설 기간에는 조정된 강우로 학습되어 예측되었을 때 실측유입량에 근접하는 모의결과를 나타내었다. 결론적으로, 융적설이 영향을 미치는 유역에서의 데이터 모델 적용시에는 입력자료 구축시 적설 및 융설이 물리적으로 타당한 강우-유출 반응에 적합하도록 전처리과정이 중요함을 밝혔다.

이물 객체 탐지 성능 개선을 위한 딥러닝 네트워크 기반 저품질 영상 개선 기법 개발 (Development of deep learning network based low-quality image enhancement techniques for improving foreign object detection performance)

  • 엄기열;민병석
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.99-107
    • /
    • 2024
  • 경제성장과 산업 발전에 따라 반도체 제품부터 SMT 제품, 전기 배터리 제품에 이르기 까지 많은 전자통신 부품들의 제조과정에서 발생하는 철, 알루미늄, 플라스틱 등의 이물질로 인해 제품이 제대로 동작하지 않거나, 전기 배터리의 경우 화재를 발생하는 문제까지 심각한 문제로 이어질 가능성이 있다. 이러한 문제를 해결하기 위해 초음파나 X-ray를 이용한 비파괴 방법으로 제품 내부에 이물질이 있는지 판단하여 문제의 발생을 차단하고 있으나, X-ray 영상을 취득하여 이물질이 있는지 판정하는 데에도 여러 한계점이 존재한다. 특히. 크기가 작거나 밀도가 낮은 이물질들은 X-Ray장비로 촬영을 하여도 보이지 않는 문제점이 있고, 잡음 등으로 인해 이물들이 잘 안 보이는 경우가 있으며, 특히 높은 생산성을 가지기 위해서는 빠른 검사속도가 필요한데, 이 경우 X-ray 촬영시간이 짧아지게 되면 신호 대비 잡음비율(SNR)이 낮아지면서 이물 탐지 성능이 크게 저하되는 문제를 가진다. 따라서, 본 논문에서는 저화질로 인해 이물질을 탐지하기 어려운 한계를 극복하기 위한 5단계 방안을 제안한다. 첫번째로, Global 히스토그램 최적화를 통해 X-Ray영상의 대비를 향상시키고, 두 번째로 고주파 영역 신호의 구분력을 강화하기 위하여 Local contrast기법을 적용하며, 세 번째로 Edge 선명도 향상을 위해 Unsharp masking을 통해 경계선을 강화하여 객체가 잘 구분되도록 한다, 네 번째로, 잡음 제거 및 영상향상을 위해 Resdual Dense Block(RDB)의 초고해상화 방법을 제안하며, 마지막으로 Yolov5 알고리즘을 이용하여 이물질을 학습한 후 탐지한다. 본 연구에서 제안하는 방식을 이용하여 실험한 결과, 저밀도 영상 대비 정밀도 등의 평가기준에서 10%이상의 성능이 향상된다.