• 제목/요약/키워드: Deep-Learning

검색결과 5,313건 처리시간 0.034초

KOMPSAT-3A 전정색 영상의 윤곽 정보를 이용한 중적외선 영상 시인성 개선 (Improvement of Mid-Wave Infrared Image Visibility Using Edge Information of KOMPSAT-3A Panchromatic Image)

  • 이진민;김태헌;김한울;이홍탁;한유경
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1283-1297
    • /
    • 2023
  • 중적외선(mid-wave infrared, MWIR) 영상은 피복 및 객체의 온도를 파악할 수 있어 환경, 국방 등 다양한 분야에서 핵심 데이터로 사용된다. KOMPSAT-3A 위성은 타 위성에 비해 높은 공간해상도의 MWIR 영상을 제공하지만, 광학(electro-optical, EO) 영상에 비해 상대적으로 낮은 시인성을 가져 활용성의 확대에 어려움을 겪는다. 이에 본 연구에서는 KOMPSAT-3A 전정색(panchromatic, PAN) 영상의 윤곽 정보를 기반으로 시인성이 높은 MWIR 융합 영상을 제작하고자 한다. 먼저, 이종 센서에서 취득된 PAN 영상과 MWIR 영상의 상대 기하오차를 제거하는 전처리를 수행하고, 딥러닝 기반 윤곽 정보 추출 기술인 Pixel difference network (PiDiNet)의 사전 학습 모델을 이용하여 PAN 영상에 대한 윤곽 정보를 추출한다. 이후 전처리된 MWIR 영상과 추출된 윤곽 정보를 중첩하여 객체 경계면이 강조된 MWIR 융합 영상을 제작한다. 제안 방법을 이용하여 서로 다른 세 지역에 대한 MWIR 융합 영상을 제작하였으며, 이를 시각적으로 분석하였다. 본 기법을 통해 제작된 MWIR 융합 영상은 지형 및 지물의 경계면이 강조되어 시인성이 개선되었으며, 세부적으로 관심 지역에 대한 열 정보를 전달할 수 있었다. 특히, MWIR 융합 영상에서는 저해상도의 원본 MWIR 영상에서 식별할 수 없었던 비행기, 선박 등의 객체를 육안으로 판독할 수 있었다. 본 연구는 가시적인 정보와 열 정보를 동시에 고려할 수 있는 단일 영상 제작 방법론을 제시하였으며, 이는 MWIR 영상의 활용성 확대에 이바지할 수 있을 것으로 사료된다.

RNN(Recurrent Neural Network)을 이용한 기업부도예측모형에서 회계정보의 동적 변화 연구 (Dynamic forecasts of bankruptcy with Recurrent Neural Network model)

  • 권혁건;이동규;신민수
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.139-153
    • /
    • 2017
  • 기업의 부도는 이해관계자들뿐 아니라 사회에도 경제적으로 큰 손실을 야기한다. 따라서 기업부도예측은 경영학 연구에 있어 중요한 연구주제 중 하나로 다뤄져 왔다. 기존의 연구에서는 부도 예측을 위해 다변량판별분석, 로짓분석, 신경망분석 등 다양한 방법론을 이용하여 모형의 부도 예측력을 높이고 과적합의 문제를 해결하고자 시도하였다. 하지만 기존의 연구들이 시간적 요소를 고려하지 않아 발생할 수 있는 문제점들을 갖고 있음에도 불구하고 부도 예측에 있어서 동적 모형을 이용한 연구는 활발히 진행되고 있지 않으며 따라서 동적 모형을 이용하여 부도예측모형이 더욱 개선될 여지가 있다는 점을 확인할 수 있었다. 이에 본 연구에서는 RNN(Recurrent Neural Network)을 이용하여 시계열 재무 데이터의 동적 변화를 반영한 모형을 만들었으며 기존의 부도예측모형들과의 비교분석을 통해 부도 예측력의 향상에 도움이 된다는 것을 확인할 수 있었다. 모형의 유용성을 검증하기 위해 KIS Value의 재무 데이터를 이용하여 실험을 수행하였고 비교모형으로는 다변량판별분석, 로짓분석, SVM, 인공신경망을 선정하였다. 실험 결과 제안된 모형이 비교 모형에 비해 우수한 예측력을 보이는 것으로 나타났다. 따라서 본 연구는 변수들의 변화를 포착하는 동적 모형을 부도예측에 새롭게 제안하여 부도예측 연구의 발전에 기여할 수 있을 것으로 기대된다.

StyleGAN Encoder를 활용한 표정 이미지 생성에서의 연령 왜곡 감소에 대한 연구 (A study on age distortion reduction in facial expression image generation using StyleGAN Encoder)

  • 이희열;이승호
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.464-471
    • /
    • 2023
  • 본 논문에서는 StyleGAN Encoder를 활용한 표정 이미지 생성에서의 연령 왜곡을 감소시키는 방법을 제안한다. 표정 이미지 생성 과정은 StyleGAN Encoder를 사용하여 얼굴 이미지를 생성하고, SVM을 이용하여 학습된 boundary를 잠재 벡터에 적용하여 표정을 변화시킨다. 그러나 웃는 표정의 boundary를 학습할 때 표정 변화에 따른 연령 왜곡이 발생한다. 웃는 표정에 대한 SVM 학습에서 생성된 smile boundary는 표정 변화로 인해 생긴 주름이 학습 요소로 포함되어 있으며 연령에 대한 특성도 함께 학습된 것으로 판단한다. 이를 해결하기 위해, 제안된 방법에서는 smile boundary와 age boundary의 상관계수를 계산하고, 이를 이용하여 smile boundary에서 age boundary를 상관계수에 비례하여 조절하는 방식을 도입한다. 제안된 방법의 효과를 확인하기 위해 공개된 표준 얼굴 데이터셋인 FFHQ 데이터셋을 사용하고 FID score를 측정하여 실험한 결과는 다음과 같다. Smile 이미지에서는 기존 방법에 비하여, Ground Truth와 제안된 방법으로 생성된 smile 이미지의 FID score가 약 0.46 향상되었다. 또한, Smile 이미지에서 기존 방법에 비하여, StyleGAN Encoder로 생성된 이미지와 제안된 방법으로 생성된 smile 이미지의 FID score가 약 1.031 향상되었다. Non-smile 이미지에서는 기존 방법에 비하여, Ground Truth와 본 논문에서 제안된 방법으로 생성된 non-smile 이미지의 FID score가 약 2.25 향상되었다. 또한, Non-smile 이미지에서 기존 방법에 비하여, StyleGAN Encoder로 생성된 이미지와 제안된 방법으로 생성된 non-smile 이미지의 FID score가 약 약 1.908 향상됨을 확인하였다. 한편, 각 생성된 표정 이미지의 연령을 추정하여 StyleGAN Encoder로 생성된 이미지의 추정된 연령과 MSE를 측정한 결과, 기존방법 대비 제안하는 방법이 smile 이미지에서 약 1.5, non-smile 이미지에서 약 1.63의 성능 향상되어 제안한 방법에 대한 성능의 효율성이 입증되었다.

집행관배훈안례연구(阐述工商业背景下的有限合理性):집행관배훈안례연구(执行官培训案例研究) (Interpreting Bounded Rationality in Business and Industrial Marketing Contexts: Executive Training Case Studies)

  • Woodside, Arch G.;Lai, Wen-Hsiang;Kim, Kyung-Hoon;Jung, Deuk-Keyo
    • 마케팅과학연구
    • /
    • 제19권3호
    • /
    • pp.49-61
    • /
    • 2009
  • 本文为执行官提供了他们在处理日常业务问题和市场机会时如何阐述自己思考过程的培训. 本研究建立在Schank提出的教学基础上, 包括: (1)经验学习和最好的指导提供给学习者从诸如全球背景, 团队项目和专家经历等的互动的故事提炼知识和技能的机会. (2) 告诉不会导致学习, 因为在学习需要的行动训练环境中, 应强调积极使用故事, 案例和项目. 每个培训案例包括执行官解释自己的决策系统分析(DSA, 还需要执行官做DSA简报. 在训练时要求执行官写DSA简报. 在执行官学员写书面报告的说明中包括(1) DSA路线图的本质的细节(2) 警告和机会的陈述, 读者的行政地图及图内的DSA解释. 该报告的最大长度为500字, 其规则就是使行政人员培训课程行之有效. 引言之后是第二部分文献综述, 简要地总结了有关人们在对问题和机会的背景下的想法及文献. 第三部分通过使用对不同的贴牌生产客户定价相同的化学产品的培训练习来解释DSA的起源和过程, 第四部分展示一个炼油设备公司订价决策的培训练习. 第五部分提供一个商业客户办公家具采购的市场策略案例. 第六部分是结论和建议. 这些建议是关于使用培训课程和发展其他培训课程来磨练执行官制定决策的能力. 文章引导读者利用工具箱研究综合的报告, (DSA)路线图根据生态合理性理论将战略与环境相匹配. 这三个案例的研究让学习者在意愿层面征求建议来作出决策. Todd and Gigerenzer 提出人们使用简单启发式,因为他们在自然的决策环境中通过探索信息的结构使适应性行为有可能产生. "简单是一种美德, 而不是诅咒", 有限理性理论强调了西蒙的命题中心, "人类理性的行为仿佛一把剪刀, 其刀片则是任务环境的结构和执行者的计算能力". Gigerenzer的观点和西蒙的环境的危害相关, 也和本文中三个环境结构的案例相关. "环境这个词, 在这里, 并不是指总的物理和生理的环境, 而只是指被给予需要和目标的重要有机体 本文关注了结合任务环境的结构和使用适应的工具箱启发的报告. (DSA)路线图根据生态理性理论将战略与环境相匹配. 渴望适应理论是这一方针的核心. 渴望适应理论将决策制定作为一个没有把目标整合的多目标问题模拟成一个把所有决策选项进行完全的优先顺序化. 这三个案例研究让学习者在意愿层面征求建议来作出决策. 渴望适应用一系列的调整步骤的形式. 一个调整步骤通过仅一个目标变量的变化就可以改变在渴望网格上邻近点当前的渴望水平. 上调步骤是目标变量的提高, 下调步骤是目标变量的下降. 创造和使用渴望适应水平是对有限理性理论的整合. 文章通过提供学习者经验和实践环节增加了意愿采纳和有限合理性的理解和特点. 利用DSA图排列CTSs和撰写TOP可以清晰和深化Selten的观点 "清晰, 意愿采纳必须作为研究的解决方案整合到整个蓝图中". 这些有限理性的研究许可了在现实生活中为什么, 如何作决策的理论和在自然的环境中利用启发式的学习训练两方面的发展. 本文中的练习鼓励根据不同使用目的学习快速而简洁的启发式技巧和原则. 这也正回应了Schank的思想 "从本质上来看, 教育不是让学生们知道发生了什么, 而是让他们感受到所发生的事情. 这不容易做到. 在如今的学校教育是没有情感的, 这是一个很大的问题". 这三个案例和附加的练习问题遵守了Schank的观点. "这种教育过程最好是通过参与他们其中来实现, 也可以这样认为, 精神层面的积极讨论".

  • PDF

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.

YOLO 알고리즘 기반 국토위성영상의 선박 모니터링 가능성 평가 연구: 부산 신항과 캘리포니아 오클랜드항을 대상으로 (A Study on Evaluating the Possibility of Monitoring Ships of CAS500-1 Images Based on YOLO Algorithm: A Case Study of a Busan New Port and an Oakland Port in California)

  • 박상철;박영빈;장소영;김태호
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1463-1478
    • /
    • 2022
  • 한국 수출입의 99.7%는 해상운송이 차지하고 있으며, 항만의 효율적 운영을 위해 해운 물류 모니터링 시스템 개발 필요성이 대두되고 있다. 현재 automatic identification system (AIS)를 기반으로 선박의 정보를 조회하여 해상 물동량 추정 연구가 진행되고 있지만, AIS를 운영하지 않는 선박들에 대한 모니터링은 불가능하다는 한계가 있다. 고해상도 광학 위성 영상은 광역의 범위에서 AIS 미운영 선박 및 소형 선박을 식별할 수 있기 때문에 AIS 기반 물동량 모니터링의 공백을 보완할 수 있다. 그러므로 선박 및 물동량 모니터링에 활용하기 위해, 고해상도 광학 위성영상에서 선박을 탐지하고 화물선 및 소형 선박을 분류하는 연구가 필요하다. 본 연구는 초기 국토위성영상을 이용하여 생산된 학습 자료 기반으로 인공지능 모델을 훈련시키고 다른 영상에서 탐지를 수행함으로써, 국토위성영상의 딥러닝 학습 자료 생산 및 선박 모니터링 활용 가능성을 알아보고자 하였다. 학습 자료는 황해 및 황해 주요 항만 구역 내 선박들을 추출하여 제작했으며, You Only Look Once (YOLO) 알고리즘을 사용하여 탐지 모델은 구축하고 국내외 주요 항만 각 1개소를 대상으로 선박 탐지 성능을 평가하였다. 항만 접안 및 해상 정박중인 선박을 대상으로 탐지 모델에 적용한 결과를 AIS의 선종 정보와 비교하였고, 국내 항만에서 85.5%와 89%, 국외 항만에서 70%의 선종 분류 정확도를 확인하였다. 본 연구 결과는 정박중인 선박을 중심으로 고해상도 국토위성영상을 활용하여 모니터링이 가능함을 확인하였다. 향후 지속적인 학습 자료 구축을 통해 탐지 모델의 정확도를 향상시킨다면 전세계 주요 항만에서 선박 및 물동량 모니터링 분야에 활용할 수 있을 것으로 기대된다.

기계학습을 이용한 수출신용보증 사고예측 (The Prediction of Export Credit Guarantee Accident using Machine Learning)

  • 조재영;주지환;한인구
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 2021
  • 2020년 8월 정부는 한국판 뉴딜을 뒷받침하기 위한 공공기관의 역할 강화방안으로서 각 공공기관별 역량을 바탕으로 5대 분야에 걸쳐 총 20가지 과제를 선정하였다. 빅데이터(Big Data), 인공지능 등을 활용하여 대국민 서비스를 제고하고 공공기관이 보유한 양질의 데이터를 개방하는 등의 다양한 정책을 통해 한국판 뉴딜(New Deal)의 성과를 조기에 창출하고 이를 극대화하기 위한 다양한 노력을 기울이고 있다. 그중에서 한국무역보험공사(KSURE)는 정책금융 공공기관으로 국내 수출기업들을 지원하기 위해 여러 제도를 운영하고 있는데 아직까지는 본 기관이 가지고 있는 빅데이터를 적극적으로 활용하지 못하고 있는 실정이다. 본 연구는 한국무역보험공사의 수출신용보증 사고 발생을 사전에 예측하고자 공사가 보유한 내부 데이터에 기계학습 모형을 적용하였고 해당 모형 간에 예측성과를 비교하였다. 예측 모형으로는 로지스틱(Logit) 회귀모형, 랜덤 포레스트(Random Forest), XGBoost, LightGBM, 심층신경망을 사용하였고, 평가 기준으로는 전체 표본의 예측 정확도 이외에도 표본별 사고 확률을 구간으로 나누어 높은 확률로 예측된 표본과 낮은 확률로 예측된 경우의 정확도를 서로 비교하였다. 각 모형별 전체 표본의 예측 정확도는 70% 내외로 나타났고 개별 표본을 사고 확률 구간별로 세부 분석한 결과 양 극단의 확률구간(0~20%, 80~100%)에서 90~100%의 예측 정확도를 보여 모형의 현실적 활용 가능성을 보여주었다. 제2종 오류의 중요성 및 전체적 예측 정확도를 종합적으로 고려할 경우, XGBoost와 심층신경망이 가장 우수한 모형으로 평가되었다. 랜덤포레스트와 LightGBM은 그 다음으로 우수하며, 로지스틱 회귀모형은 가장 낮은 성과를 보였다. 본 연구는 한국무역보험공사의 빅데이터를 기계학습모형으로 분석해 업무의 효율성을 높이는 사례로서 향후 기계학습 등을 활용하여 실무 현장에서 빅데이터 분석 및 활용이 활발해지기를 기대한다.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

CNN 기반 위장관 랜드마크 분류기를 이용한 위장관 교차점 추정 (Estimating Gastrointestinal Transition Location Using CNN-based Gastrointestinal Landmark Classifier)

  • 장현웅;임창남;박예슬;이광재;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권3호
    • /
    • pp.101-108
    • /
    • 2020
  • 최근의 영상 처리 분야는 딥러닝 기법들의 성능이 입증됨에 따라 다양한 분야에서 이와 같은 기법들을 활용해 영상에 대한 분류, 분석, 검출 등을 수행하려는 시도가 활발하다. 그중에서도 의료 진단 보조 역할을 할 수 있는 의료 영상 분석 소프트웨어에 대한 기대가 증가하고 있는데, 본 연구에서는 데이터 셋이 방대하고 판단에 시간이 오래 걸리는 캡슐내시경 영상에 주목하였다. 본 논문의 목적은 캡슐내시경 영상의 판독에서 모든 환자에 대해 공통으로 수행되고, 판독하는 데 많은 시간을 차지하는 위장관 랜드마크를 구별하고 위장관 교차점을 추정하는 것이다. 이를 위해, 위장관 랜드마크를 식별할 수 있는 CNN 학습 모델을 설계하였으며, 이를 이용하여 결괏값을 필터링해 위장관 교차점을 추정하였다. 무작위로 환자 데이터를 샘플링한 모델을 이용해서 나온 결과를 필터링 후에 위장관 교차점을 추정하였을 때, 88% 환자는 위장에서 소장으로 변화하는 위장관 교차점(유문판) 의심 구역 안에 들어왔으며, 소장에서 대장으로 변화하는 위장관 교차점(회맹판)의 경우 100% 환자가 위장관 교차점 의심 구역 안에 들어온 것을 확인할 수 있었다. 100프레임 범위로 위장관 교차점 의심 구역을 찾을 수 있었으며, 판독자가 초당 10프레임의 속도로 판독을 진행한다면 10초안에 위장관 교차점을 찾아낼 수 있다.