• 제목/요약/키워드: 클라우드 시스템

검색결과 1,281건 처리시간 0.035초

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

지자체 부서 간 업무연계성 진단 -부산광역시 정보화사업을 중심으로 - (The Diagnosis of Work Connectivity between Local Government Departments -Focused on Busan Metropolitan City IT Project -)

  • 지상태;남광우
    • 한국지리정보학회지
    • /
    • 제21권3호
    • /
    • pp.176-188
    • /
    • 2018
  • 현대의 도시문제들은 점차 한 부서의 힘만으로 해결이 불가능한 시장혼재(market mix) 상태가 확대되어 부서 간의 데이터 소통을 기반으로 하는 협력체계 구축 필요성이 증대되고 있다. 이에 본 연구는 부서 간의 협력은 공동 활용도가 높은 데이터의 공유에서 시작될 수 있다는 관점에서 부서별 데이터의 활용 및 공유 현황을 파악하고자 2014년부터 2018년까지의 부산광역시 정보화 사업을 분석하였다. 또한, 정보화사업 주관부서 공무원을 대상으로 FGI(Focus Group Interview)를 진행한 결과를 바탕으로 데이터 현황 분석결과에 대한 검증을 실시하였다. 동시에 사회연결망분석(SNA)을 통해 부서 간 데이터 연계 필요성을 파악하고 향후 우선적으로 공유되어야 할 데이터를 제시하였다. 분석한 바, 현재 정보시스템은 데이터 생산부서 내에서만 제한적으로 데이터를 활용하고 있는 경우가 대다수였다. 연계되고 있는 데이터의 대부분은 정보화부서에 집중되고 있었다. 이에 본 연구는 다음과 같은 해결책을 제시하였다. 첫째 개별부서단위의 운영으로 발생하는 중복투자 방지와 정보공유를 위해 정보 간 연계성이 높은 부서들부터 단계적으로 소규모 블록단위로 묶어가는 스몰 플랫폼 구축이 필요하다. 둘째, 다분야에 활용될 정보의 공유 확대를 위해 국가표준의 확대형태로 데이터 표준을 마련하는 지자체 수준의 프로세스가 필요하다. 셋째, 또 하나의 해결책으로는 클라우드 기반의 GIS 플랫폼 적용을 통해 주소 및 위치정보 기반으로 다양한 유형의 정보를 통합하여 활용할 수 있는 체계 구축을 제안하였다. 본 연구 결과는 비용절감과 함께 정보공유 확대를 통한 부서 간 협력체계를 제공하는 데 기여할 것으로 기대된다.

4차 산업혁명시대 가정과교육의 역할 (The Role of Home Economics Education in the Fourth Industrial Revolution)

  • 이은희
    • 한국가정과교육학회지
    • /
    • 제31권4호
    • /
    • pp.149-161
    • /
    • 2019
  • 현재 우리는 지금까지 아무도 예측하지 못할 정도의 인공지능의 발달과 빠른 기술혁신에 따른 4차 산업혁명시대로의 변화시점에 있다. 본 연구는 '4차 산업혁명시대로의 변화에 따라 가정과교육은 어떤 역할을 수행해야 하는가?'의 문제의식에서 출발하였으며, 구체적으로 4차 산업혁명시대의 특징과 교육의 방향에 따른 가정과교육의 역할에 초점을 맞추어 연구를 진행하였다. 4차 산업혁명의 특징은 인공지능(AI), 클라우드 컴퓨팅(Cloud Computing), 사물인터넷(IoT), 빅 데이터(Big Data), O2O(Online to Offline) 등으로, 일상생활뿐만 아니라 사회체제와 과학기술, 그리고 직업의 구조에 급격한 변화를 가져올 것이다. 그 과정에서 비인간화되어가는 현상, 로봇과 인공지능의 발전에 따른 인간의 도덕성과 윤리적인 면에 문제를 줄 수 있기 때문에, 4차 산업혁명 시대 교육의 방향은 미래 공동체를 위해 함께하는 인성과 시민의식을 갖춘 미래 인재를 양성하는 방향으로 총체적인 변화가 모색되어져야 한다. 또한 초지능, 초연결 사회로의 변화를 가져올 4차 산업혁명이 교육에 주는 시사점은 인간이 인간으로서의 가치를 스스로 내면화하도록 교육의 역할이 강조되어져야 한다는 것이다. 인성교육은 교육과정의 통합 속에서 개념이 정립되고 보편타당한 내면화된 의식으로 자리 잡아야 하며 구체적인 실천적 전략들이 마련되어져야 한다. 결론적으로 4차 산업혁명시대 가정과교육의 역할은 다음과 같다. 첫째, 4차 산업혁명시대 가정과교육은 인간의 본성인 인성교육의 중추적 역할을 담당하여야 한다. 인성교육을 주도적으로 담당해야 한다는 것이다. 또한 4차 산업혁명시대 가정과교육은 인간의 다양한 삶의 본질적인 개선에 선도적 역할을 담당하여야 한다. 4차 산업혁명은 인간의 정신적, 육체적 활동뿐만 아니라, 인간의 정체성도 바뀌어 갈 것이다. 3차 산업혁명 이후의 사회에서는 산재해 있는 지식을 얼마나 신속하고 정확하게 습득할 수 있느냐가 중요했다면 4차 산업혁명의 지능정보화사회에서는 빠른 변화 속에서 인간의 본성을 지키기 위해 지식을 어떻게 활용할 것인지를 배우는 것이 요구된다. 이렇듯 4차 산업혁명은 우리 삶을 형성하는 시스템에 영향을 끼침으로써 가족과 조직, 공동체를 긍정적으로 이끌어갈 수 있는 방향성을 모색하게 되는데 가정과교육이 이러한 역할을 선도적으로 담당해야 한다.

정보보호 대책의 성능을 고려한 투자 포트폴리오의 게임 이론적 최적화 (Game Theoretic Optimization of Investment Portfolio Considering the Performance of Information Security Countermeasure)

  • 이상훈;김태성
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.37-50
    • /
    • 2020
  • 사물 인터넷, 빅데이터, 클라우드, 인공지능 등 다양한 정보통신기술이 발전하면서, 정보보호의 대상이 증가하고있다. 정보통신기술의 발전에 비례해서 정보보호의 필요성이 확대되고 있지만, 정보보호 투자에 대한 관심은 저조한 상황이다. 일반적으로 정보보호와 관련된 투자는 효과를 측정하기 어렵기 때문에 적절한 투자가 이루어지지 않고 있으며, 대부분의 조직은 투자 규모를 줄이고 있다. 또한 정보보호 대책의 종류와 특성이 다양하기 때문에 객관적인 비교와 평가가 힘들고, 객관적인 의사결정 방법이 부족한 실정이다. 하지만 조직의 발전을 위해서는 정보보호와 관련된 정책과 의사결정이 필수적이며 적정 수준의 투자와 이에 대한 투자 효과를 측정 할 필요가 있다. 이에 본 연구에서는 게임 이론을 이용하여 정보보호 대책 투자 포트폴리오를 구성하는 방법을 제안하고 선형계획법을 이용하여 최적 방어 확률을 도출한다. 2인 게임 모형을 이용하여 정보보호 담당자와 공격자를 게임의 경기자로 구성한 뒤, 정보보호 대책을 정보보호 담당자의 전략으로, 정보보호 위협을 공격자의 전략으로 각각 설정한다. 게임 모형은 경기자의 보수의 합이 0인 제로섬 게임을 가정하고, 여러개의 전략 사이에서 일정한 확률 분포에 따라 전략을 선택하는 혼합 전략 게임의 해를 도출한다. 여러 종류의 위협이 존재하는 현실에서는 한 개의 정보보호 대책만으로 일정 수준 이상의 방어가 힘들기 때문에, 다수의 정보보호 대책을 고려해야한다. 따라서 다수의 정보보호 위협에 따른 정보보호 대책이 배치된 환경에서 정보보호 대책의 방어 비율을 이용하여 정보보호 대책 투자 포트폴리오를 산출한다. 또한 최적화된 포트폴리오를 이용하여 방어 확률을 최대화하는 게임 값을 도출한다. 마지막으로 정보보호 대책의 실제 성능 데이터를 이용하여 수치 예제를 구성하고, 제안한 게임 모델을 적용하고 평가한다. 본 연구에서 제시한 최적화 모델을 이용하면 조직의 정보보호 담당자는 정보보호 대책의 방어 비율을 고려하여 정보보호 대책의 투자 가중치를 구할 수 있고, 효과적인 투자 포트폴리오를 구성하여 최적의 방어 확률을 도출 할 수 있을 것이다.

트윗 데이터를 활용한 IT 트렌드 분석 (An Analysis of IT Trends Using Tweet Data)

  • 이진백;이충권;차경진
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.143-159
    • /
    • 2015
  • 불확실한 환경변화에 대처하고 장기적 전략수립을 위해 기업에게 있어서 IT 트렌드에 대한 예측은 오랫동안 중요한 주제였다. IT 트렌드에 대한 예측을 기반으로 새로운 시대에 대한 인식을 하고 예산을 배정하여 빠르게 변화하는 기술의 추세에 대비할 수 있기 때문이다. 해마다 유수의 컨설팅업체들과 조사기관에서 차년도 IT 트렌드에 대해서 발표되고는 있지만, 이러한 예측이 실제로 차년도 비즈니스 현실세계에서 나타났는지에 대한 연구는 거의 없었다. 본 연구는 현존하는 빅데이터 기술을 활용하여 서울지역을 중심으로 지난 8개월동안(2013년 5월1일부터 2013년12월31까지) 정보통신산업진흥원과 한국정보화진흥원에서 2012년 말에 발표한 IT 트렌드 토픽이 언급된 21,589개의 트윗 데이터를 수집하여 분석하였다. 또한 2013년에 나라장터에 올라온 프로젝트들이 IT트렌드 토픽과 관련이 있는지 상관관계분석을 실시하였다. 연구결과, 빅데이터, 클라우드, HTML5, 스마트홈, 테블릿PC, UI/UX와 같은 IT토픽은 시간이 지날수록 매우 빈번하게 언급되어졌으며, 이 같은 토픽들은 2013년 나라장터 공고 프로젝트 데이터와도 매우 유의한 상관관계를 가지고 있는 것을 확인할 수 있었다. 이는 전년도(2012년)에 예측한 트렌드들이 차년도(2013년)에 실제로 트위터와 한국정부의 공공조달사업에 반영되어 나타나고 있는 것을 의미한다. 본 연구는 최신 빅데이터툴을 사용하여, 유수기관의 IT트렌드 예측이 실제로 트위터와 같은 소셜미디에서 생성되는 트윗데이터에서 얼마나 언급되어 나타나는지 추적했다는 점에서 중요한 의의가 있고, 이를 통해 트위터가 사회적 트랜드의 변화를 효율적으로 추적하기에 유용한 도구임을 확인하고자 할 수 있었다.

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.

철도 유휴부지 활용방안: 군집분석을 활용한 태양광발전 입지 제안 (Utilizing the Idle Railway Sites: A Proposal for the Location of Solar Power Plants Using Cluster Analysis)

  • 강은경;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.79-105
    • /
    • 2023
  • 지구온난화와 기후변화 등의 유례없는 기상이변으로 전 세계 곳곳이 극심한 몸살을 앓고 있으며, 경제적 손실 또한 눈덩이처럼 불어나고 있다. 이러한 문제를 해결하기 위해 2016년 '파리기후변화협정(The Paris Agreement)'이 체결되어 지구의 평균온도 상승을 1.5℃ 아래로 유지하기 위한 정부간 협의체가 결성되었으며, 우리나라도 2050년 탄소중립을 선언함으로써 기후재앙을 막기 위한 노력을 진행하고 있다. 특히, 온실가스 배출로 인한 기온상승은 수출 의존도가 높은 우리나라 경제는 물론 환경과 사회 전반에 부정적인 영향을 미칠 것으로 예상된다. 또한, 교통수단의 다변화가 가속화되면서 수단선택의 변화도 크게 증가하고 있는 가운데 저성장 시대의 개발 패러다임이 도시재생으로 변화함에 따라, 노선의 수요 감소, 선형 개량, 도심 철도의 외곽 이설 등에 영향을 받아 증가하고 있는 철도 유휴부지 활용에 대한 관심이 높아지고 있다. 한편, 철도 유휴부지를 활용한 태양광발전은 '재생에너지 3020'의 태양광발전 목표를 일부 달성하면서도, 입지를 둘러싼 환경훼손과 주민 수용성 문제에서 자유로워질 수 있는 장점에도 불구하고, 설비실태나 설비계획에 있어 미진한 상황이다. 이에, 본 연구에서는 국가철도공단과 재생에너지클라우드플랫폼에서 제공하는 데이터를 활용하여 태양광발전 설비 설치가 가능한 적합 유휴지를 발굴 및 분석하는 알고리즘을 개발하고, 사용자가 원하는 조건을 고려한 잠재적인 적합 지역을 탐색 및 도출함으로써, 개발 초기 설비나 확충 등에 소요되는 막대한 비용을 절약할 수 있는 방안을 마련하고자 하였다. 본 연구는 다양한 군집분석을 활용하여 철도 유휴부지에 태양광발전 설치입지를 도출할 수 있는 최적의 알고리즘을 개발하고, 면적, 설치용량, 발전량, 예상수익 등이 모두 높은 '태양광발전 설치 적극권장 지역' 202곳을 도출하였다. 이를 바탕으로 경제와 환경을 동시에 고려한 관점에서 의사결정자의 합리적인 판단을 도울 수 있을 것으로 기대한다.

지상형 라이다와 정량적 구조 모델을 이용한 분기별, 종별 나무의 가지 구조 탐구 (Exploring Branch Structure across Branch Orders and Species Using Terrestrial Laser Scanning and Quantitative Structure Model)

  • 조성우;양태강
    • 한국농림기상학회지
    • /
    • 제26권1호
    • /
    • pp.31-52
    • /
    • 2024
  • 나무의 가지 구조와 생리학 사이의 중요한 관계를 고려할 때 가지 구조를 이해하는 것은 수종의 분류나 3D 나무 모델링과 같은 분야에 중요하다. 지상형 라이다는 나무의 구조를 자세히 포착하고 정량적 구조 모델은 지상형 라이다로부터 얻어진 포인트 클라우드에서 가지의 반경과 길이의 계산을 가능하게 한다. 선행 연구에서는 반경 비율이나 길이 비율 등 가지의 구조를 나타내는 인자의 대푯값으로 평균 또는 중앙값에 의존하거나 줄기와 1분기 가지의 관계만을 다루었다. 본 연구는 가시칠엽수, 은행나무, 왕벚나무에서 부모와 자식 가지 사이의 반경 비율, 길이 비율 및 분지각 세 가지 인자에 대해 3분기 가지까지 인자들의 추정 분포를 살펴보고 추정 분포들을 분기별, 종별로 비교하는 것을 목표로 한다. 인자들에 적합한 분포를 알아보기 위해 인자들을 여러 확률 분포로 추정해 보았고, 평균 Kolmogorov-Smirnov 통계량에 의거해 각각 그 수치가 반경의 경우 0.048, 길이의 경우 0.061, 각도의 경우 0.050으로 감마 분포가 최적의 분포로 선택되었다. 추정된 분포 내에서 최빈값과 평균값, 최빈값과 중앙값 사이의 차이를 정규화 한 평균은 반경에 경우 11.2% 및 7.5%, 길이에 경우 17.0% 및 11.5%, 분지각의 경우 8.2% 및 5.5%로 상당한 차이를 보였다. 추정된 분포 사이에서 분기별, 종별 비교 분석을 수행했으며, 그 결과 인자들로부터 추정된 분포는 분기와 종에 따라 다양한 분포 양상을 보였다. 본 연구는 이러한 인자들의 확률 분포를 조사하는 것이 가지 구조에 대해 더 상세한 묘사를 제공할 수 있음 시사한다. 또한 가지 구조의 포괄적인 이해를 위해 더 높은 분기의 가지를 조사하는 것의 중요성을 강조한다.

텍스트마이닝 기법을 활용한 사용후핵연료 건식처리기술 관련 언론 동향 분석 (Analysis of media trends related to spent nuclear fuel treatment technology using text mining techniques)

  • 정지송;김호동
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.33-54
    • /
    • 2021
  • 최근 4차 산업혁명, 코로나로 인한 뉴노멀 시대의 도래 등을 계기로 인공지능, 빅데이터 연구와 같은 언택트 관련 기술의 중요성이 더욱 급상하고 있다. 각 종 연구 분야에서는 이러한 연구 트렌드를 따라가기 위한 융합적 연구가 본격적으로 시행되고 있으나 원자력 분야의 경우 자연어 처리, 텍스트마이닝 분석 등 인공지능 및 빅데이터 관련 기술을 적용한 연구가 많이 수행되지 않았다. 이에 원자력 연구 분야에 데이터 사이언스 분석기술의 적용 가능성을 확인해보고자 본 연구를 수행하였다. 원자로 연료로 사용된 뒤 배출되는 사용후핵연료 인식 동향 파악에 대한 연구는 원자력 산업 정책에 대한 방향을 결정하고 산업정책 변화를 사전에 대응할 수 있다는 측면에서 매우 중요하다. 사용후핵연료 처리기술은 크게 습식 재처리 방식과 건식 재처리 방식으로 나뉘는데, 이 중 환경 친화적이고 핵비확산성 및 경제성이 높은 건식재처리 기술인 '파이로프로세싱'과 그 연계 원자로 '소듐냉각고속로'의 연구개발에 대한 재평가가 현재 지속적으로 검토되고 있다. 따라서 위와 같은 이유로, 본 연구에서는 사용후핵연료 처리기술인 파이로프로세싱에 대한 언론 동향 분석을 진행하였다. 사용후핵연료 처리기술인 '파이로프로세싱' 키워드를 포함하는 네이버 웹 뉴스 기사 전문의 텍스트데이터를 수집하여 기간에 따라 인식변화를 분석하였다. 2016년 발생한 경주 지진, 2017년 새 정부의 에너지 전환정책 시행된 2010년대 중반 시기를 기준으로 전, 후의 동향 분석이 시행되었고, 빈도분석을 바탕으로 한 워드 클라우드 도출, TF-IDF(Term Frequency - Inverse Document Frequency) 도출, 연결정도 중심성 산출 등의 분석방법을 통해 텍스트데이터에 대한 세부적이고 다층적인 분석을 수행하였다. 연구 결과, 2010년대 이전에는 사용후핵연료 처리기술에 대한 사회 언론의 인식이 외교적이고 긍정적이었음을 알 수 있었다. 그러나 시간이 흐름에 따라 '안전(safety)', '재검토(reexamination)', '대책(countermeasure)', '처분(disposal)', '해체(disassemble)' 등의 키워드 출현빈도가 급증하며 사용후핵연료 처리기술 연구에 대한 지속 여부가 사회적으로 진지하게 고려되고 있음을 알 수 있었다. 정치 외교적 기술로 인식되던 사용후핵연료 처리기술이 국내 정책의 변화로 연구 지속 가능성이 모호해짐에 따라 언론 인식도 점차 변화했다는 것을 확인하였다. 이러한 연구 결과를 통해 원자력 분야에서의 사회과학 연구의 지속은 필수불가결함을 알 수 있었고 이에 대한 중요성이 부각되었다. 또한, 현 정부의 원전 감축과 같은 에너지 정책의 영향으로, 사용후핵연료 처리기술 연구개발에 대한 재평가가 시행되는 이 시점에서 해당 분야의 주요 키워드 분석은 향후 연구 방향 설정에 기여할 수 있을 것이라는 측면에서 실무적 의의를 갖는다. 더 나아가 원자력 공학 분야에 사회과학 분야를 폭넓게 적용할 필요가 있으며, 국가 정책적 변화를 고려해야 원자력 산업이 지속 가능할 것으로 사료된다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.