• 제목/요약/키워드: Learning Structure

검색결과 2,192건 처리시간 0.03초

기술력 평가항목을 이용한 고안정성 중소기업 판별력 검증 (Verification Test of High-Stability SMEs Using Technology Appraisal Items)

  • 이준원
    • 경영정보학연구
    • /
    • 제20권4호
    • /
    • pp.79-96
    • /
    • 2018
  • 본 연구는 기술력 평가항목 중 기업의 재무안정성과 관련된 항목을 신용평가모형에 반영하여 중소기업뿐만이 아닌 전체 기업을 대상으로 한 신용평가모형의 부도변별력을 높이기 위한 기술력 평가모형의 신용평가모형 내 내재화에 착안하여 시작되었다. 따라서 기술력 평가모형이 부채비율 기준의 고안정성 중소기업을 사전에 판별하는 데 적용될 수 있는지 검증하는 것을 목표로 한다. 대상 기업을 업종(제조업 vs. 비(非)제조업)과 업력(창업기업 vs. 비(非)창업기업)으로 구분하고, 3개년 동안 해당 군집의 평균 부채비율 1/2 이하를 달성한 기업에 대해 고안정성 중소기업으로 정의한 후, C5.0 기법을 적용하여 모형의 판별력을 검증하였다. 분석결과 소항목 수준에서는 업종과 업력에 따라 중요도 간 차이가 있지만, 중항목 수준에서는 기술개발역량이 고안정성 중소기업을 판별하는 중요변수로 도출되었으며, 기업의 업력에 따라 창업 초기에는 자금조달능력(수익창출능력을 고려한 자본구조, 자본비용 및 자금조달 방법의 다양성)이 미래 고안정성 중소기업 여부를 결정하는 중요변수이지만, 업력이 증가함에 따라 지속적인 성과를 가능하게 하는 기술개발 인프라가 재무안정성에 영향을 미치는 중요 변수로 변화한다는 결론을 도출하였다. 업종과 업력에 따른 모형의 분류 정확도는 71~91% 수준이며, 기술력 평가항목을 이용하여 고안정성 중소기업을 판별할 수 있다는 가능성을 확인하였다.

Random Forest를 활용한 고속도로 교통사고 심각도 비교분석에 관한 연구 (Studying the Comparative Analysis of Highway Traffic Accident Severity Using the Random Forest Method.)

  • 이선민;윤병조;웃위린
    • 한국재난정보학회 논문집
    • /
    • 제20권1호
    • /
    • pp.156-168
    • /
    • 2024
  • 연구목적: 고속도로 교통사고의 추세는 증감을 반복하며 도로 종류 중 고속도로에서의 치사율은 최고치를 나타내고 있다. 따라서 국내 실정을 반영한 개선대책 수립이 필요하다. 연구방법: Random Forest를 활용해 2019년부터 2021년까지 전국 고속도로 노선 중 사고 다발 10개 노선에서 발생한 교통사고 자료로 사고 심각도 분석 및 사고 심각도에 미치는 영향요인을 도출하였다. 연구결과: SHAP 패키지를 활용해 상위 10개의 변수 중요도를 분석한 결과, 고속도로 교통사고 중 사고 심각도에 높은 영향을 미치는 변수는 가해자 연령이 20세 이상 39세 미만, 시간대가 주간(06:00-18:00), 주말(토~일), 계절이 여름과 겨울, 법규위반이 안전운전불이행, 도로 형태가 터널, 기하구조상 차로 수가 많고 제한속도가 높은 경우로 총 10개의 독립변수에서 고속도로 교통사고 심각도와 양(+)의 상관관계를 가지는 것으로 분석되었다. 결론:고속도로에서의 사고 발생은 매우 다양한 요인의 복합적인 작용으로 인해 발생하므로 사고 예측에 많은 어려움이 있지만 본 연구로 도출된 결과를 활용해 고속도로 교통사고 심각도에 영향을 주는 요인을 심층적으로 분석해 효율적이고 합리적인 대응책 수립을 위한 노력이 필요하다.

대학혁신지원사업에서 '혁신'은 어디에 있는가? :부·울·경 지역 대학혁신전략을 중심으로 (Study on the 'innovation' in higher education under the national university innovation support project)

  • 조원겸;조연교
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.519-531
    • /
    • 2024
  • 본 연구의 목적은 부·울·경 지역대학을 대상으로 대학현장에서 계획되고 실행되는 교육혁신의 양상과 특징을 분석하고 그 한계와 과제를 탐색하는데 있다. 이를 위하여 부·울·경 지역 대학 17개교의 대학혁신지원사업의 2020년 사업계획 중 혁신 전략 프로그램을 질적 내용 분석하였다. 분석의 기준은 투입, 프로세스, 인프라, 기타 요인으로 프로세스 요인은 교육영역, 연구영역, 산학협력영역으로 나누어 혁신의 양상과 특징을 살펴보았다. 연구 결과, 부·울·경 지역 대학의 대학혁신의 양상이 교육과 연구, 산학협력 영역에서 분석되었으며 그 특징으로는 융복합 교육 강조, 역량개발, 스마트기반, 학습자중심 교수법, 학생맞춤형 지원, 지역연계로 나타났다. 연구를 통하여 나타난 대학혁신의 한계와 과제는 다음과 같다. 첫째, 지역대학이 맥락을 고려한 특성화된 대학혁신의 사업구조가 마련되어야 한다. 둘째, 수립된 혁신성이 높은 전략들이 실행되고 지속될 수 있어야 하며 이를 위해서는 구성원들의 합의가 필요하다. 셋째, 대학의 혁신이 학문의 편중화를 의미해서는 안되고 연구기관으로서 대학의 역할 제고와 노력이 필요하다. 넷째, 대학혁신의 가시적인 혁신전략보다 더 중요한 것이 교육의 효과로 대학혁신은 궁극적으로 학생들에게 직접적으로 발생하는 교육의 혁신이라는 점이 간과되어서는 안된다.

사춘기 자녀를 둔 부모의 양육경험에 관한 주관성 연구 (A Study on the Subjectivity of Parenting Experience of Parents with Adolescent Children)

  • 김영희;최향
    • 문화기술의 융합
    • /
    • 제10권4호
    • /
    • pp.373-381
    • /
    • 2024
  • 우리는 최근 상담 현장에서 이슈가 되고 있는 아동학대 피해 아동이 10~17세가 가장 높았고, 부모에 의한 발생 건수가 가장 많음을 확인하였다. 우리는 자녀성장에 중요한 역할을 하는 사춘기 부모 양육경험의 어려움에 대해 이해하기 위해 상담 및 부모교육을 진행하면서 사춘기 자녀를 둔 부모의 고충을 이해하고자 하였다. 따라서 본 연구에서는 Q 방법론을 활용하여 사춘기 자녀를 둔 부모의 양육경험에 관한 주관적 인식유형과 유형별 특성을 분석하고자 하였다. Q 모집단을 구성하여 Q 표본 33문항 진술문을 추출한 후, P 표본 사춘기 자녀를 둔 부모 35명을 대상으로 Q 표본 분류하여, QUANL 프로그램으로 인식유형 분석을 실시하였다. 우리의 연구결과, 유형 1은 자녀를 끝없이 이해하는 과정이라고 인식하는 '무조건적인 사랑과 이해형', 유형 2는 자녀와의 공감, 소통과 부모의 성찰 및 변화에 대해 인식하는 '성찰과 변화형', 유형 3은 자녀양육에 대해 배우며 자녀의 심리적 독립과 성장을 돕고 자신도 행복해야 한다고 인식하는 '학습과 심리적 독립 조력형', 유형 4는 어린시절 자녀양육에 대한 후회와 부모로서 정체성 혼란에 대해 인식하는 '후회와 정체성 혼란형' 으로 나타났다. 우리의 연구는 실제 사춘기 자녀를 둔 부모가 지각하는 양 육경험에 대해 주관적 인식구조를 유형별로 분류하였다는데 의의가 있다. 이러한 양육경험에 관한 주관성 연구는 사춘기 자녀를 양육하는 부모교육과 부모상담의 기초자료로 활용될 것을 기대한다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.

한국산(韓國産) 주요수피(主要樹皮)의 해부학적(解剖學的) 연구(硏究) - 제2보(第二報) 참나무속(屬) 수피(樹皮)의 해부(解剖) (Anatomical Studies of Major Tree Barks Grown in Korea - II. Anatomy of Quercus Barks)

  • 이화형;이필우
    • Journal of the Korean Wood Science and Technology
    • /
    • 제5권1호
    • /
    • pp.3-8
    • /
    • 1977
  • 수피(樹皮)는 원목체적(原木體積)의 약 10~20%를 차지하고 있으며 일반적(一般的)으로 운반(運搬), 제거(除去), 처리(處理)에 따른 비용에 비(比)해 효용가치(效用價値)는 적다. 뿐만아니라 세계적(世界的)으로 임산자원(林産資源)의 부족(不足)함에 따라 Full tree Utilization의 개념(槪念)이 점고(漸高)되면서 수피(樹皮)의 이용(利用)에 많은 관심(觀心)을 갖게 되었다. 본(本) 연구(硏究)는 국내(國內) 참나무속(屬) 수피(樹皮)의 해부학적(解剖學的) 성질(性質)과 그 구조(構造)를 밝혀 수피(樹皮)의 가능(可能)한 이용책(利用策)을 위(爲)한 기본적(基本的) 성질(性質)을 구명(究明)하고자 하는 바이다. 해부학적(解剖學的) 성질(性質)은 일반적(一般的) 특성(特性)으로서 표피(表皮)의 색(色), 탈락의 형태(形態), 주피(周皮)의 색(色)과 배열형태(配列形態), 수피(樹皮) 두께등(等)을 다루었고 현미경적(顯微鏡的) 특성(特性)으로 사관절(篩管節), 반세포(伴細胞), 사부유세포(篩部柔細胞), 사부섬유(篩部纖維), 방사조직(放射組織), 주피조직(周皮組織), 석세포(石細胞)의 유무(有無), 보강세포(保强細胞)의 유무(有無)와 크기, 결정체등(結晶體等)에 대(對)하여 조사(調査) 연구(硏究)하였다. 본(本) 연구(硏究)에서 얻은 결론(結論)은 다음과 같다. 1. 일반적(一般的)으로 수피(樹皮)의 박락(剝落)은 어렵고 내피(內皮)와 외피(外皮)가 쉽게 분리(分離)되지 않으며 수피내(樹皮內)의 보강세포(保强細胞)는 쉽게 육안(肉眼)으로 관찰(觀察)된다. 2. 참나무속(屬) 주피조직(周皮組織)에서 콜크형성층(形成層)과 콜크피층(皮層)의 구별(區別)이 명확(明確)치 않고 굴참나무는 콜크조직(組織)이 가장 잘 발달(發達)되어 있으며 상수리나무 수피(樹皮)는 박막(薄膜)콜크조직(組織)과 후막(厚膜)콜크조직(組織)으로 구성(構成)되어 있다. 3. 참나무속수피(屬樹皮) 사관절(篩管節), 반세포(伴細胞), 사부섬유(篩部纖維)와 보강세포(保强細胞) 및 결정체등(結晶體等)을 가지고 있으며 특(特)히 보강세포(保强細胞)는 소나무속(屬)이나 사시나무속(屬)고 달리 가장 잘 발달(發達)되어 있어 많이 분포(分布)되어 있고 사부섬유(篩部纖維)보다 더 많은 체적점유율을 보이고 있다. 4. 방사조직(放射組織)은 보통 1~3열(列) 조직(組織)이고 간혹 15~20열(列)의 다층방사조직(多層放射組織)이 나타난다. 5. 유세포(柔細胞) 및 보강세포내(保强細胞內)에 다각형(多角形)의 결정체(結晶體)와 생기(生氣)있는 유세포내(柔細胞內)에 괴상화형결정체(塊狀花形結晶體) 존재(存在)한다.

  • PDF

미암(眉巖) 유희춘(柳希春)의 한시(漢詩) 연구(硏究) (Study on The Chinese Poems Composed by Mi-Am Yu Hee Choon)

  • 송재용
    • 동양고전연구
    • /
    • 제57호
    • /
    • pp.383-406
    • /
    • 2014
  • 미암(眉巖) 유희춘(柳希春)(1513~1577)은 시를 생활의 일부로 여겼다. 그러므로 필자는 미암 유희춘의 한시에 초점을 맞추어 살펴보았다. 본고에서 논의한 사항들을 종합하여 결론으로 삼으면 다음과 같다. 미암(眉巖)은 문학을 재도적(載道的) 관점에서 이해하려고 하였다. 미암(眉巖)의 한시는 현재 300여수로 추산되는데, 필자가 파악한 작품은 285수이다. 그리고 미암(眉巖)은 진지한 자세로 작시(作詩)에 임했으며, 형식보다는 내용을 중시하였다. 고시(古詩) 율시(律詩) 절구(絶句) 가운데 絶句(특히 칠언(七言))가 가장 많으며, 오언(五言)보다 칠언(七言)을 더 선호한 것으로 보인다. 고시(古詩)의 경우, 전고(典故)가 비교적 많은 편이다. 절구(絶句)는 미암(眉巖)이 가장 능했던 시체(詩體)로, 주로 생활과 관련된 내용들이 주류를 이루고 있다. 그리고 율시(律詩)는 자기성찰이나 현실세계에 대한 자신의 심정을 표출한 내용의 시들이 많다. 미암(眉巖)의 시는 유배기와 해배 복관 이후기로 나눌 수 있다. 유배기는 학문 연마를 통한 자기수양(自己修養), 우정(友情), 애민(愛民) 등으로, 해배 복관 이후기는 충군(忠君), 지인(知人)들과의 교유, 감회(感懷), 숭조상문(崇祖尙門), 자기성찰(自己省察), 문학적 교감을 통한 부부애(夫婦愛) 등으로 나눌 수 있다. 미암(眉巖)의 시는 시제(詩題)에 음(吟) 송(送) 차운(次韻) 등이 붙은 작품이 많으며, 일상생활이나 체험사실 등과 관련된 시들이 주류를 이루고 있다. 그리고 태반은 담담하게 사실 그대로를 자연스럽게 표현하고 있다. 미암(眉巖)은 시를 생활의 일부로 여겼으며, 부인 송덕봉과 일상생활에서 겪었던 일을 시로써 수창하며 서로 문학적 교감을 하였다는 점에서 주목할 만하다.

인공지능 기술 기반 인슈어테크와 디지털보험플랫폼 성공사례 분석: 중국 평안보험그룹을 중심으로 (Analysis of Success Cases of InsurTech and Digital Insurance Platform Based on Artificial Intelligence Technologies: Focused on Ping An Insurance Group Ltd. in China)

  • 이재원;오상진
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.71-90
    • /
    • 2020
  • 최근 전 세계 보험업계에도 기계학습, 자연어 처리, 딥러닝 등의 인공지능 기술 활용을 통한 디지털 전환이 급속도로 확산하고 있다. 이에 따라 인공지능 기술을 기반으로 한 인슈어테크와 플랫폼 비즈니스 성공을 이룬 해외 보험사들도 증가하고 있다. 대표적으로 중국 최대 민영기업인 평안보험그룹은 '금융과 기술', '금융과 생태계'를 기업의 핵심 키워드로 내세우며 끊임없는 혁신에 도전한 결과, 인슈어테크와 디지털플랫폼 분야에서 괄목할만한 성과를 보이며 중국의 글로벌 4차 산업혁명을 선도하고 있다. 이에 본 연구는 평안보험그룹 인슈어테크와 플랫폼 비즈니스 활동을 ser-M 분석 모델을 통해 분석하여 국내 보험사들의 인공지능 기술기반 비즈니스 활성화를 위한 전략적 시사점을 제공하고자 했다. ser-M 분석 모델은 기업의 경영전략을 주체, 환경, 자원, 메커니즘 관점에서 통합적으로 해석이 가능한 프레임으로, 최고경영자의 비전과 리더십, 기업의 역사적 환경, 다양한 자원 활용, 독특한 메커니즘 관계가 통합적으로 해석되도록 연구하였다. 사례분석 결과, 평안보험은 안면·음성·표정 인식 등 핵심 인공지능 기술을 활용하여 세일즈, 보험인수, 보험금 청구, 대출 서비스 등 업무 전 영역을 디지털로 혁신함으로써 경비 절감과 고객서비스 발전을 이루었다. 또한 '중국 내 온라인 데이터'와 '회사가 축적한 방대한 오프라인 데이터 및 통찰력'을 인공지능, 빅데이터 분석 등 신기술과 결합하여 금융 서비스와 디지털 서비스 사업이 통합된 디지털 플랫폼을 구축하였다. 이러한 평안보험그룹의 성공 배경을 ser-M 관점에서 분석해 보면, 창업자 마밍즈 회장은 4차 산업혁명 시대의 디지털 기술발전, 시장경쟁 및 인구 구조의 변화를 빠르게 포착하여 새로운 비전을 수립하고 디지털 기술중시의 민첩한 리더십을 발휘하였다. 환경변화에 대응한 창업자 주도의 강력한 리더십을 바탕으로 인공지능 기술 투자, 우수 전문인력 확보, 빅데이터 역량 강화 등 내부자원을 혁신하고, 외부 흡수역량의 결합, 다양한 업종 간의 전략적 제휴를 통해 인슈어테크와 플랫폼 비즈니스를 성공적으로 끌어냈다. 이와 같은 성공사례 분석을 통하여 인슈어테크와 디지털플랫폼 도입을 본격 준비하고 있는 국내 보험사들에게 디지털 시대에 필요한 경영 전략과 리더십에 대한 시사점을 줄 수 있다.

불균형 데이터 집합의 분류를 위한 하이브리드 SVM 모델 (A Hybrid SVM Classifier for Imbalanced Data Sets)

  • 이재식;권종구
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.125-140
    • /
    • 2013
  • 어떤 클래스에 속한 레코드의 개수가 다른 클래스들에 속한 레코드의 개수보다 매우 많은 경우에, 이 데이터 집합을 '불균형 데이터 집합'이라고 한다. 데이터 분류에 사용되는 많은 기법들은 이러한 불균형 데이터에 대해서 저조한 성능을 보인다. 어떤 기법의 성능을 평가할 때에 적중률뿐만 아니라, 민감도와 특이도도 함께 측정하여야 한다. 고객의 이탈을 예측하는 문제에서 '유지' 레코드가 다수 클래스를 차지하고, '이탈' 레코드는 소수 클래스를 차지한다. 민감도는 실제로 '유지'인 레코드를 '유지'로 예측하는 비율이고, 특이도는 실제로 '이탈'인 레코드를 '이탈'로 예측하는 비율이다. 많은 데이터 마이닝 기법들이 불균형 데이터에 대해서 저조한 성능을 보이는 것은 바로 소수 클래스의 적중률인 특이도가 낮기 때문이다. 불균형 데이터 집합에 대처하는 과거 연구 중에는 소수 클래스를 Oversampling하여 균형 데이터 집합을 생성한 후에 데이터 마이닝 기법을 적용한 연구들이 있다. 이렇게 균형 데이터 집합을 생성하여 예측을 수행하면, 특이도는 다소 향상시킬 수 있으나 그 대신 민감도가 하락하게 된다. 본 연구에서는 민감도는 유지하면서 특이도를 향상시키는 모델을 개발하였다. 개발된 모델은 Support Vector Machine (SVM), 인공신경망(ANN) 그리고 의사결정나무 기법 등으로 구성된 하이브리드 모델로서, Hybrid SVM Model이라고 명명하였다. 구축과정 및 예측과정은 다음과 같다. 원래의 불균형 데이터 집합으로 SVM_I Model과 ANN_I Model을 구축한다. 불균형 데이터 집합으로부터 Oversampling을 하여 균형 데이터 집합을 생성하고, 이것으로 SVM_B Model을 구축한다. SVM_I Model은 민감도에서 우수하고, SVM_B Model은 특이도에서 우수하다. 입력 레코드에 대해서 SVM_I와 SVM_B가 동일한 예측치를 도출하면 그것을 최종 해로 결정한다. SVM_I와 SVM_B가 상이한 예측치를 도출한 레코드에 대해서는 ANN과 의사결정나무의 도움으로 판별 과정을 거쳐서 최종 해를 결정한다. 상이한 예측치를 도출한 레코드에 대해서는, ANN_I의 출력값을 입력속성으로, 실제 이탈 여부를 목표 속성으로 설정하여 의사결정나무 모델을 구축한다. 그 결과 다음과 같은 2개의 판별규칙을 얻었다. 'IF ANN_I output value < 0.285, THEN Final Solution = Retention' 그리고 'IF ANN_I output value ${\geq}0.285$, THEN Final Solution = Churn'이다. 제시되어 있는 규칙의 Threshold 값인 0.285는 본 연구에서 사용한 데이터에 최적화되어 도출된 값이다. 본 연구에서 제시하는 것은 Hybrid SVM Model의 구조이지 특정한 Threshold 값이 아니기 때문에 이 Threshold 값은 대상 데이터에 따라서 얼마든지 변할 수 있다. Hybrid SVM Model의 성능을 UCI Machine Learning Repository에서 제공하는 Churn 데이터 집합을 사용하여 평가하였다. Hybrid SVM Model의 적중률은 91.08%로서 SVM_I Model이나 SVM_B Model의 적중률보다 높았다. Hybrid SVM Model의 민감도는 95.02%이었고, 특이도는 69.24%이었다. SVM_I Model의 민감도는 94.65%이었고, SVM_B Model의 특이도는 67.00%이었다. 그러므로 본 연구에서 개발한 Hybrid SVM Model이 SVM_I Model의 민감도 수준은 유지하면서 SVM_B Model의 특이도보다는 향상된 성능을 보였다.

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.