• 제목/요약/키워드: 정보시스템 구축

검색결과 11,570건 처리시간 0.042초

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.

원격.다원 사용자 환경에서의 순차적 이벤트 공유기에 관한 연구 (A Study on the Serialized Event Sharing System for Multiple Telecomputing User Environments)

  • 유영진;오용선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 춘계종합학술대회논문집
    • /
    • pp.344-350
    • /
    • 2003
  • 본 논문에서는 원격ㆍ다원으로 구축된 컴퓨팅 환경에서 공동 사용자간에 발생하는 이벤트를 순서화 하여 공유하는 방법과 이를 멀티미디어 자료에 적용하여 구현함으로써 통신망을 이용한 공동작업의 효과를 향상시키는 공유기술을 제안한다. 이 공유방법은 정보통신망의 서로 다른 지역에 설치된 사용자간의 프리젠테이션, 저작, 활용, 이벤트 발생 등을 원활하게 하여 원격교육, 화상회의, 멀티미디어 콘텐츠 공동저작 둥 원격ㆍ다원 프로젝트의 수행에 있어 효율성을 크게 향상시킨다. 기존의 공동 화이트보드(sharing white board) 시스템에 있어서는, 멀티미디어 단위 콘텐츠를 반드시 전용 프로그램에 의하여 저작하고 이미 저작되어 있는 콘텐츠나 프로그램은 사용할 수 없으며, 원격ㆍ다원으로 접수되는 명령어의 입력순서를 정렬하는 기술이 적용되지 않은 상태였으므로 순서오류에 의한 오동작을 감수해야 하는 문제점을 안고 있었다. 이에, 본 논문은 프로그램의 종류에 관계없이 윈도우 시스템으로부터 입출력 이벤트(event)를 추출하는 기술과 운영체제 내의 프로그램간 전송에 있어 이벤트를 후킹(hooking)하는 기술 및 공유 프로그램의 처리결과를 원격ㆍ다원으로 분산된 환경에 전달하는 알고리듬을 설계하고 이를 구현함으로써 원격ㆍ다원 환경의 모든 참여자가 오류 얼이 동일한 결과를 정확하게 공유할 수 있도록 개선하였다. 본 논문의 공유기술은 멀티미디어 콘텐츠의 공동저작, 원격교육에 있어서 공동칠판의 활용, 화상회의에 있어서 프리젠테이션 화면 제공 등에 활용함으로써 온라인 면대면 효과를 향상시키는 것으로 확인되었다.하였으나(P<0.05), 계란1개당 사료비에서는 18∼20g 공급구간에 유의차가 없었다. (시험 2) 육용종계 하절기 산란피크계의 에너지 공급수준에 관한 연구: 육용종계 산란기의 적정 에너지공급체계를 구명하기 위하여 강원도 홍천군 북방면소재 홍천종계에서 케이지 사양형태의 로스 육용종계 400수를 공시하여 2002년 4월부터 2003년 1월까지 40주간 (24∼64주령) 표2와 같은 4가지 에너지공급체계로 사양시험을 실시한 결과를 요약하면 다음과 같다. 1) 총 산란율, 종란 산란율, 평균난중 및 성계 생존율은 모두 처리간에 유의적인 차이가 인정되지 않았으나, 산란율은 1일 에너지공급량이 많을수록 오히려 저하하는 경향을 보였다. 2) 사료요구율, ME 및 CP요구량과 사료비는 모두 1일 에너지공급량이 많아질수록 증가하는 경향을 보였다(P<0.05).dis에 대한 키토산의 최소저해농도는 각각 0.1461 mg/mL, 0.2419 mg/mL, 0.0980 mg/mL 및 0.0490 mg/mL로 측정되었다. 또한 2%(v/v) 초산 자체의 최소저해농도를 측정한 결과, B. cereus, L. mosocytogenes, E. eoli에 대해서는 control과 비교시 유의적인 항균효과는 나타나지 않았다. 반면에 S. enteritidis의 경우는 배양시간 4시간까지는 항균활성을 나타내었지만, 8시간 이후부터는 S. enteritidis의 성장이 control 보다 높아져 배양시간 20시간에서는 control 보다 약 2배 이상 균주의 성장을 촉진시켰다.차에 따른 개별화 학습을 가능하게 할 뿐만 아니라

  • PDF

쥐불놀이 (논둑태우기)가 해충 및 천적상에 미치는 영향 (Influence of the Levee-burning on the Fauna of Insect Pests and Their Natural Enemies)

  • 김홍선;이영인;이해빈
    • 한국응용곤충학회지
    • /
    • 제29권3호
    • /
    • pp.209-215
    • /
    • 1990
  • 녹둑태우기가 벼해충 및 천적밀도에 미치는 영향을 확인하기 위향 1987년 2월 20일 수원시 서둔동에 위치한 시험포장의 논둑$(72\times1m)$에서 불태운 곳과 태우지 않은곳에서의 해충 및 천적밀도를 조사한 결과 불태운 직후에는 논뚝이다 그 주변에 해충(주로 애멸구약충)도 천적(주로 거미류)도 하나도 없었다. 불태운 후 약 60일이 지난뒤에는 식생과 동물상이 서서히 회복되기 시작하여 불태우지 않은 곳에 비하여 불태운 곳의 초생이 왕성하여졌고 75일이 지난뒤 (5월 상순)에는 해충과 천적의 밀도가 높아졌다. 해충이나 천적밀도를 회복시킨 개체들은 모두 가까운 주변으로부터 확산 되어 온 것으로 추정되며 만일 불태운 면적이 훨씬 더 넓었을 경우에는 곤충류의 밀도회복에 더 긴 시간이 필요할 것이며 날개가 없는 거미류는 날개가 있는 해충류보다 밀도회복에 더 오랜 시간이 필요할 것으로 생각된다. 황산적거미는 $9^{\circ}C$에서 섭식활동이 이루어지는 것으로써 일반 해충류(특히 애멸구)보다 발육임계온도가 낮으므로 이른봄의 영야요구도가 높을 것으로 추정되며 아울러 불태운곳에서 살아남을 확률이 일반 해충류보다 낮을 것으로 생각된다. 쥐불놀이(음력 정월 대보름)를 하는 날짜가 해에 따라 대부분의 차이는 있으나 일반적으로 논둑에서 월동하는 절족동물중 해충류보다 천적류(거미류)의 발육임계온도가 낮기 때문에 쥐불놀이에 의한 천적류의 사망율이 해충류보다 높을 거승로 추정되므로 추후 대규모 시험이 필요할 것이나 현재의 입장에서 볼때 쥐불놀이가 논둑이나 제방에서 월동하는 해충류의 방제에 공헌할 것이라는 논리를 학문적으로 정당화 시키기에는 근거가 미약한 것으로 생각된다.부의 flux를 나타냈다.껍질에서만 검출되었다. $\delta_A=0.30$ 이 값은 A, B자리 모두 $Fe^{3+}$에 해당된다.라 수집하는 것이 최선의 망 운영방법이다. 자동관측시스템(AWS) 설치 시 기존의 무인감시카메라와 무선중계탑을 최대한 활용하되 무인감시카메라 설치위치$(70\siml,245m)$와 무선중계탑의 설치위치 $(299\sim1,573m)$가 산불위험지역에 포함되어 있는지의 면밀한 검토가 요구된다. 산불 등 각종 산림재난 방지와 관련한 정보를 얻을 수 있는 자동기상관측시스템(AWS)의 설치 위치는 산불발생확률모형에서 산정된 위험지역 내에 설치하는 것이 산불발생 위험지역을 판정하는데 매우 효과적일 것으로 판단된다. 기상청과 지자체가 보유하고 있는 기상관측 장비들은 대부분 도시를 중심으로 설치 운영되고 있어 산림 또는 산악에 설치된 기상관측 장비의 수는 적은 편이다. 따라서 산림과 산악에 기상관측 장비의 보강은 필수적이다. 관측망 구성은 기상청의 관측 표준(안)을 준수하며, 설치 지점의 특성에 따라 가장 경제적인 방법을 선택하는 것이 바람직하며, 특히 장비구매 설치 시 다양한 종류의 제품을 선택하는 것은 차후 장비 관리에 어려움을 겪을 소지가 있어 가능한 우수한 제품을 선택하되 동일 제품 사용을 권장한다. 따라서 위의 망구축이 이루어져 현재 기상청이 설치 운영하고 있는 측정 장비에 의해 취득한 기상자료를 공동 활용하여 표출하면 더욱 상세한 자료의 획득과 활용이 기대되어 진다. 또한, 금번 논문에서는 산불위험지역의 격자점(15km)내에 최소한 1대의 AWS 설치방안을 제시하였지만, 금후에는 15km내에서도

  • PDF

고준위 방사성폐기물 처분 종합 성능 평가 (TSPA)를 위한 Cyber R&D Platform 개발 ; 시나리오 도출 과정에서의 품질보증 적용 사례 (Development of Cyber R&D Platform on Total System Performance Assessment for a Potential HLW Repository ; Application for Development of Scenario through QA Procedures)

  • 서은진;황용수;강철형
    • 한국방사성폐기물학회:학술대회논문집
    • /
    • 한국방사성폐기물학회 2005년도 춘계 학술대회
    • /
    • pp.311-318
    • /
    • 2005
  • 고준위 방사성폐기물 처분 연구 사업이 법률적인 인허가 뿐만이 아니라 일반 국민의 동의를 얻기 위해서는 처분 사업의 안전성에 대한 신뢰성 획득이 중요하며 이를 위해 투명하게 공개될 수 있는 종합 성능 평가 (TSPA, Total System Performance Assessment)의 수행이 필요하다. 본 연구에서는 처분 성능 평가 투명성 제고와 신뢰성 향상을 위한 방안의 하나로 처분 종합 성능 평가에 대한 품질 보증 원칙을 도입하여 평가 관련 전체 업무에 관한 투명성 증진을 꾀하고자 한다. 특히 인터넷을 기반으로 하는 품질 보증 시스템의 개발을 통해 실험을 통해서 얻어지는 평가 입력 자료들 뿐 아니라 평가 수행을 위한 계획 수립과 결과물, 그리고 결과물에 대한 검토 등에 이르기까지 안전성 평가 전 과정에서 투명성이 유지된 데이터들이 높은 신뢰성을 가지고 향후에도 활용될 수 있도록 하였다. 본 연구에서 개발한 Cyber R&D Platform은 인터넷을 기반으로 하는 프로그램으로 안전성 평가를 위한 시나리오 개발 관련 데이터인 FEP 목록과 관련 시나리오 정보, 관련 시나리오 도출 과정 및 평가 체계 등을 체계적으로 구축한 FEAS (FEp to Assessment through Scenario development) 프로그램과 안전성 평가에 필요한 입력 데이터들을 분류, 저장해 놓은 PAID (Performance Assessment Input Data) 프로그램, 그리고 이러한 자료들을 입력할 수 있는 품질 보증 시스템으로 구성되어 있으며 이를 통합 운영함으로써 도출된 데이터들의 신뢰성을 높이고자 하였으며 향후 이해 당사자들이 "처분장에서 생태계에 이르는 핵종들의 이동 경로에 대한 시나리오는 어떠한 것이며, 그 평가 결과들과 평가에 이용되는 실제 데이터들은 어떤 것인지" 에 대해 쉽게 이해할 수 있고 또 관련 자료들이 어떠한 원칙에 따른 검토를 거쳤는지에 관해서도 확인할 수 있게 할 것이다.X>, 중환자실 재원기간은 $2.9\pm0.8일(2\~4)$, 그리고 입원기간은 $21.6\pm14.3일(13\~56)$이었다. 수술 후 평균 CK-MB는 $11.3\pm14.1ng/mL$였다. 수술 후 조기 혈관 개존율은 $100\% (24/24)$였다. 모든 환자에서 완전 추적이 가능하였으며 평균 추적기간은 $20.4\pm15.2개월(5\~43)$이었다. 이 기간 중 사망환자나 흉통이 재발한 환자는 없었다. 걸론: 80세 이상 고령의 환자에서 OPCAB은 수술 후 합병증을 줄이고 좋은 결과를 보여 주었다. 그러므로 고령의 환자에서도 관상동맥우회술의 적응증이 되면 적극적으로 수술을 시행할 필요가 있으며, 수술방법은 OPCAB이 좋을 것으로 생각한다서 실용적 개발의 가능성을 보였다.에 따라 현저한 차이가 있었으며 Dimethoate처리$(30^{\circ}C,\; 0.2\%$액에서 24시간)에 의하여 볍씨의 호흡량이 감소되었다. 9) 산소호흡량과 평균발아소요일수와는 $\gamma=-0.945$로 부의 유의한 상관을 보였는데 산소호흡량이 많은 품종은 평균발아소요일수가 짧은 경향을 보였다. 10) 볍씨의 산소호흡량과 Dimethoate 처리에 의한 볍씨의 발아저해도와는 $\gamma=-0,771$의 높은 부의 상관을 보였으며 산색호흡량이 많은 품종이 발아저해도가 낮고 적은 품종에서는 높았다. 현재까지는 그 활동이 11.2년의 주기성을 보여주지만 그 이전에 있어서는 그 활동이 극히 약화되었을 뿐만 아니라 매우 불규칙하다는 것이 Schneider와 Mass(1975)에 의해 밝혀졌다. 결국 1710년대부터 현재까지 우리나라에 있어서 벼멸구와 흰등멸구의 대발생 연도는 1910년, 1921-23년, 1946, 1967-8년, 1975-7년의 5회가 되며 이들 대발

  • PDF

부가가치세 포탈요인과 포탈성향에 관한 실증적 연구 (A Study on the Relationship between the Tax Evasion Factors and the Tax Evasion Inclination of Value Added Tax in Korea)

  • 김범진;함영복
    • 산학경영연구
    • /
    • 제14권
    • /
    • pp.1-30
    • /
    • 2001
  • 수도권에서 사업하는 부가가치세 일반과세자 600명을 대상으로 수집한 자료의 실증분석을 통하여 다음과 같은 결과를 얻을 수 있었다. 첫째, 부가가치세 포탈요인은 재무, 세무행정, 조세지식, 조세윤리, 탈세기대심리, 사회, 제재 요인으로 분류되었다. 둘째, 재무, 조세지식, 사회, 제재 요인이 부가가치세의 포탈성향에 영향을 미치는 것으로 분석되었다. 셋째, 재무 요인에서 납세자의 기업형태와 매출규모에 따른 차이를, 조세지식 요인에서 납세자의 사업기간, 매출규모와 세무조사경험에 따를 차이를 그리고 사회 요인에서 납세자의 세무조사경험에 따른 차이를 확인하였다. 넷째, 포탈성향은 납세자의 기업형태, 업종, 매출규모와 세무조사경험에 따라서 차이를 보였다. 이상의 연구결과는 부가가치세 포탈방지를 위한 조세정책 수립에 다음과 같은 시사점을 줄 것이다. 첫째, 개인 사업자와 매출규모가 작은 사업자에 대해서 세무관리를 강화하여야 할 것이다. 둘째, 유통업인 도 소매업의 포탈정도가 가장 크므로 이에 대한 세무관리의 강화와 함께 유통정보시스템(POS시스템, 거래기록의 전산화, 거래당사자간 EDI 구축 등)의 도입에 대한 세제 및 세정상의 유인책 수립이 요구되어진다. 셋째, 세무조사를 받았던 기업의 포탈성향이 낮으므로 세무조사 경험이 없는 납세자에 대한 세무조사의 확대 실시가 요구되어진다. 넷째, 개인 사업자나 매출 규모가 큰 기업의 경우에 재무 요인이 큰 포탈요인으로 작용하므로 개인 사업자나 매출 규모가 큰 기업을 세무관리를 하는 경우에 재무 요인을 중요하게 인식하여야 할 것이다. 다섯째, 사업기간이 짧을수록, 매출액이 적을 수록, 또한 세무조사 경험이 없는 경우에 조세 지식 요인이 포탈요인으로 크게 작용한다. 따라서 사업기간이 짧거나 매출액이 적거나 세무조사 경험이 없는 납세자를 중심으로 납세교육과 홍보의 강화를 병행하여 세법지식의 부족으로 인한 비자발적 탈세를 예방하여야 할 것이다. 여섯째, 세무조사 경험이 없는 경우에 사회 요인이 포탈요인으로 크게 작용한다. 따라서 세무조사 경험이 없는 납세자를 중심으로 정부와 세무당국에 대한 신뢰도를 높이고 사회적 공평성과 책임성을 높일 수 있는 대안을 마련하도록 하여야 할 것이다.

  • PDF

인도 진출 한국기업의 현지화에 관한 사례 연구 (A Study on Case for Localization of Korean Enterprises in India)

  • 서민교;김희준
    • 통상정보연구
    • /
    • 제16권4호
    • /
    • pp.409-437
    • /
    • 2014
  • 본 논문은 기업의 현지화의 중요성을 주목하여 현지화의 이론적 배경 및 전략적 모형을 도출하고, 모형의 틀 안에서 인도에 진출한 한국 개별기업의 현지화 성공과 실패사례를 비교분석함으로써 성공적인 현지화에 대한 시사점을 제시하고자 하였다. 현지화의 전략적 모형을 생산 및 소싱의 현지화, 인적자원의 현지화, 마케팅의 현지화, R&D의 현지화와 관련한 경영관리 측면과 현지사회와의 융화, 본사의 현지 자회사 권한위양으로 나누었다. 인도에 진출한 한국기업의 성공과 실패사례를 분석한 결과, 생산 및 소싱의 현지화 부분에서는, 현지에서 부품을 조달하고 현지 소비자가 선호하는 모델을 생산하여 성공적으로 정착한 기업과 소비자가 선호하지 않는 모델을 생산하여 실패한 기업도 있었다. 인적자원의 현지화 부분에서는, 성공한 대부분의 기업들이 현지 인력의 중요성을 인지하여 교육을 통하여 인적자원을 적극적으로 활용한 것으로 나타났다. 마케팅의 현지화 부분에서는, 효과적인 마케팅과 AS망을 구축한 기업, 철저한 사전 시장조사와 관리가 가능하고 기술력 있는 현지 파트너를 선정한 기업, 영업활동 및 고객지원, 불만처리를 직접 수행한 기업은 현지화에 성공하였다. R&D의 현지화 부분에서는, 성공한 대기업은 현지 고객에 맞는 제품을 개발하기 위해 현지에서 연구 개발 센터를 운영하고 있는 것으로 나타났다. 현지사회와의 융화 부분에 있어서는, 문화적 환경을 이해하지 못하면 실패하였지만 적극적인 사회공헌활동을 전개하고 지역사회에 봉사하는 기업은 성공적인 현지화가 이루어진다는 것을 보여준다. 본사의 현지 자회사 권한위양 부분에서는, 대부분 기업이 이 부분이 취약했고 본사에 의해 의사결정이 이루어지는 경향이 있었다. 현지화 전략의 시사점은 부품의 현지화, 기업의 경영이념과 시스템을 이해하고 시장 전략 결정에 자율적으로 참여하는 고급 간부직책 인재의 육성, 단독투자 추진, R&D센터의 설치 및 운영, 문화와 제도에 대한 이해 및 기업의 사회적 책임 강화, 현지 경영진의 자율권 부여 등이다.

  • PDF

딥러닝 프레임워크의 비교: 티아노, 텐서플로, CNTK를 중심으로 (Comparison of Deep Learning Frameworks: About Theano, Tensorflow, and Cognitive Toolkit)

  • 정여진;안성만;양지헌;이재준
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.1-17
    • /
    • 2017
  • 딥러닝 프레임워크의 대표적인 기능으로는 '자동미분'과 'GPU의 활용' 등을 들 수 있다. 본 논문은 파이썬의 라이브러리 형태로 사용 가능한 프레임워크 중에서 구글의 텐서플로와 마이크로소프트의 CNTK, 그리고 텐서플로의 원조라고 할 수 있는 티아노를 비교하였다. 본문에서는 자동미분의 개념과 GPU의 활용형태를 간단히 설명하고, 그 다음에 logistic regression을 실행하는 예를 통하여 각 프레임워크의 문법을 알아본 뒤에, 마지막으로 대표적인 딥러닝 응용인 CNN의 예제를 실행시켜보고 코딩의 편의성과 실행속도 등을 확인해 보았다. 그 결과, 편의성의 관점에서 보면 티아노가 가장 코딩 하기가 어렵고, CNTK와 텐서플로는 많은 부분이 비슷하게 추상화 되어 있어서 코딩이 비슷하지만 가중치와 편향을 직접 정의하느냐의 여부에서 차이를 보였다. 그리고 각 프레임워크의 실행속도에 대한 평가는 '큰 차이는 없다'는 것이다. 텐서플로는 티아노에 비하여 속도가 느리다는 평가가 있어왔는데, 본 연구의 실험에 의하면, 비록 CNN 모형에 국한되었지만, 텐서플로가 아주 조금이지만 빠른 것으로 나타났다. CNTK의 경우에도, 비록 실험환경이 달랐지만, 실험환경의 차이에 의한 속도의 차이의 편차범위 이내에 있는 것으로 판단이 되었다. 본 연구에서는 세 종류의 딥러닝 프레임워크만을 살펴보았는데, 위키피디아에 따르면 딥러닝 프레임워크의 종류는 12가지가 있으며, 각 프레임워크의 특징을 15가지 속성으로 구분하여 차이를 특정하고 있다. 그 많은 속성 중에서 사용자의 입장에서 볼 때 중요한 속성은 어떤 언어(파이썬, C++, Java, 등)로 사용가능한지, 어떤 딥러닝 모형에 대한 라이브러리가 잘 구현되어 있는지 등일 것이다. 그리고 사용자가 대규모의 딥러닝 모형을 구축한다면, 다중 GPU 혹은 다중 서버를 지원하는지의 여부도 중요할 것이다. 또한 딥러닝 모형을 처음 학습하는 경우에는 사용설명서가 많은지 예제 프로그램이 많은지 여부도 중요한 기준이 될 것이다.

소셜 네트워크와 데이터 마이닝 기법을 활용한 학문 분야 중심 및 융합 키워드 추천 서비스 (Recommending Core and Connecting Keywords of Research Area Using Social Network and Data Mining Techniques)

  • 조인동;김남규
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.127-138
    • /
    • 2011
  • 대부분의 연구포털 사이트는 관심 분야의 논문을 획득하고자 하는 연구자를 대상으로 한 서비스를 주로 제공하고 있다. 하지만 이러한 서비스는 정확한 서지사항을 알고 있는 일부 사용자의 경우 손쉽게 이용할 수 있지만, 대부분의 이용자는 원하는 자료를 획득하기 위해 키워드 검색을 통한 반복적 시행착오를 겪게 된다. 특히 사용자가 익숙하지 않은 분야의 논문을 검색하는 경우에는, 찾고자 하는 논문의 적절한 키워드 자체를 알지 못하여 검색에 큰 어려움을 겪게 된다. 이러한 한계를 극복하기 위해 일부 연구포털 사이트에서는 온라인 쇼핑몰의 상품 추천에 주로 사용되어온 연관관계 분석 기반 키워드 추천 서비스를 채택하고 있다. 하지만 연관관계 분석에만 기반한 키워드 추천 방식은 두 키워드간의 단편적인 관계만을 알려줄 뿐, 해당 학술 분야와 관련된 전체 키워드 간의 복합적 연결 관계를 보여주기에는 한계가 있다. 따라서 본 논문에서는 연관관계 분석을 통해 빈발 출현 키워드 쌍을 추출하고 이를 근거로 전체 키워드 간 네트워크를 구축함으로써, 학술 분야별 중심 키워드 및 분야 간 융합을 위한 연계 키워드를 추천하기 위한 방법을 제시하고자 한다.

재무예측을 위한 Support Vector Machine의 최적화 (Optimization of Support Vector Machines for Financial Forecasting)

  • 김경재;안현철
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.241-254
    • /
    • 2011
  • Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

대학도서관 업무의 시대별 변천에 따른 특성 연구 (A Study on the Characteristics of Jobs in Academic Libraries According to Different Generations)

  • 조철현
    • 한국비블리아학회지
    • /
    • 제26권1호
    • /
    • pp.135-170
    • /
    • 2015
  • 본 연구는 웹의 진화에 따른 도서관의 대응을 도서관1.0, 도서관2.0, 도서관3.0으로 시대 구분하여 대학도서관 업무의 변화를 알아보고, 시대별 변화에 따른 업무의 특성을 제시하고자 하였다. 선행연구와 사례를 통한 직무분석과 델파이 조사를 통하여 나타난 연구 결과, 첫째, 도서관1.0 시대에서 시작하여 도서관3.0 시대로 계속 이어지는 업무 170개, 도서관2.0 시대에서 시작하여 도서관3.0 시대로 이어지는 업무 58개, 도서관1.0 시대에서 시작하여 도서관2.0 시대로 이어지는 업무 3개, 도서관1.0 시대에만 존재한 업무 3개, 도서관2.0 시대에만 존재한 업무 1개, 도서관3.0 시대에 새롭게 생성된 업무 25개 등으로 나타났다. 둘째, 5개 직무영역의 세부적인 부분을 포괄하는 전체적인 특성을 살펴보면, 경영관리의 경우, 중요도, 난이도, 빈도 모두가 시대별로 유의미하게 상승하는 것으로 밝혀졌다. 장서개발 및 관리의 경우, 중요도, 난이도, 빈도 모두가 도서관2.0 시대에서 도서관3.0 시대로만 유의미하게 상승하는 것으로 밝혀졌다. 자료조직의 경우, 중요도는 도서관1.0 시대에서 도서관2.0 시대로 유의미하게 하락하고, 빈도는 시대별로 유의미하게 하락하며, 난이도는 시대별로 유의미한 변화가 없는 것으로 밝혀졌다. 이용서비스의 경우, 중요도는 시대별로 유의미하게 상승하며, 난이도는 도서관1.0 시대에서 도서관2.0 시대로만 유의미하게 상승하는 것으로 밝혀졌다. 빈도는 시대별로 유의미하게 변화하지 않는 것으로 밝혀졌다. 정보시스템 구축 및 관리의 경우, 중요도 및 빈도는 시대별로 유의미하게 상승하며, 난이도는 시대별로 유의미하게 변화하지 않는 것으로 밝혀졌다.