• 제목/요약/키워드: Hand detection

검색결과 730건 처리시간 0.029초

시계열 고해상도 항공영상을 이용한 소나무재선충병 감염목 탐지 - 강원대학교 학술림 일원을 대상으로 - (Detection of Pine Wilt Disease tree Using High Resolution Aerial Photographs - A Case Study of Kangwon National University Research Forest -)

  • 박정묵;최인규;이정수
    • 한국지리정보학회지
    • /
    • 제22권2호
    • /
    • pp.36-49
    • /
    • 2019
  • 본 연구는 강원대학교 학술림을 대상으로 현장조사 기반(Field Survey Based)에 의한 감염목(FSB_감염목)과 객체분류기반(Object Classification Based)에 의한 감염목(OCB_감염목)을 추출하고 감염목에 대한 공간적 분포특성 및 발생강도 평가를 목적으로 하였다. OCB 최적 가중치는 Scale 11, Shape 0.1, Color 0.9, Compactness 0.9, Smoothness 0.1로 선정되었으며, 전체 분류정확도는 약 94%, Kappa 계수는 0.88로 매우 높았다. OCB_감염목 지역은 약 2.4ha로 전체 면적의 약 0.05% 발생하였다. OCB_감염목와 FSB_감염목의 임분구조 분포특성 및 지형 지리적 요인을 비교 하면, OCB_감염목 영급은 IV영급의 분포비율이 약 44%로 가장 높았으며, FSB_감염목의 영급도 IV영급의 분포비율이 약 55%로 가장 높았다. OCB_감염목의 IV영급 비율은 FSB_감염목보다 약 11% 낮았다. OCB_감염목 경급은 소경목과 중경목이 약 93%로 대부분을 차지한 반면, FSB_감염목 경급은 중경목과 대경목이 약 87%로 전체 대상지의 경급 분포와 상이하였다. 한편, OCB_감염목 표고 분포비율은 401-500m에서 약 30%로 가장 높은 반면, FSB_감염목은 301-400m에서 약 45%로 상이하였으며, 임도로부터 접근성 분포 비율은 OCB_감염목과 FSB_감염목 모두 100m이하에서 각각 약 24%와 31%로 가장 높아 임도로부터 접근성이 높을수록 감염목이 높았다. OCB_감염목 핫스팟은 31임반과 32임반으로 영급과 경급이 높은 지역에서 높게 분포하였다.

기상 데이터를 활용한 LSTM 기반의 해양 혼합층 수온 예측 (LSTM Based Prediction of Ocean Mixed Layer Temperature Using Meteorological Data)

  • 고관섭;김영원;변성현;이수진
    • 대한원격탐사학회지
    • /
    • 제37권3호
    • /
    • pp.603-614
    • /
    • 2021
  • 최근 우리나라 주변 해역의 해수면 온도가 상승하고 있다. 이러한 수온 상승은 어족자원의 변화를 일으켜 낚시와 같은 레저활동에 영향을 미치기도 하며, 특히 고수온은 적조 발생으로 이어져 양식업과 같은 해양산업에 극심한 피해를 유발하기도 한다. 한편 수온 변화는 잠수함을 탐지하는 군사작전과도 밀접하게 연관되어 있다. 이는 잠수함을 탐지하기 위한 음파가 수온층에 따라 회절, 굴절 및 반사되는 정도가 달라지기 때문이다. 이와 같이 해양과 관련된 다양한 분야에서 중요성을 가지는 해양 수온의 변화를 예측하기 위한 연구가 현재 활발하게 진행되고 있다. 그러나 기존 연구들은 대부분 해수면 온도만을 예측하는데 중점을 두고 있어 수심별 어족자원의 변화나 잠수함 탐지와 같은 군사분야 활용이 제한된다. 이에 본 연구에서는 수심별 수온자료 및 해수면 온도와 상관관계를 가지는 기온, 기압, 일조량 등의 기상 데이터를 함께 활용하여 수심 38 m 혼합층의 수온을 예측하였다. 사용된 데이터는 이어도 해양과학기지에서 관측한 2016년부터 2020년까지의 기상 데이터와 수심별 수온 자료이며, 예측의 정확성과 효율성을 높이기 위해 딥러닝 기법 중 시계열 자료에 적합하다고 알려진 LSTM(Long Short-Term Memory)을 사용하였다. 실험 결과 1시간 예측을 기준으로 기온과 기압, 일조량 자료를 함께 활용한 모델의 RMSE(Root Mean Square Error)는 0.473으로 나타났다. 반면 해수면 수온만을 활용한 모델의 RMSE는 0.631로 나타나 기상데이터를 함께 활용한 모델이 상부 혼합층 수온 예측에서 보다 우수한 성능을 보임을 확인하였다.

자항 기뢰와 초공동 어뢰의 융복합 무기체계 연구 (A study on Convergence Weapon Systems of Self propelled Mobile Mines and Supercavitating Rocket Torpedoes)

  • 이은수;신진
    • 해양안보
    • /
    • 제7권1호
    • /
    • pp.31-60
    • /
    • 2023
  • 본 논문은 북한의 SLBM 탑재 신형 잠수함과 핵 무인 수중 공격정 '해일'에 효과적으로 대응하기 위해 자항 기뢰와 초공동 어뢰를 결합한 융복합 무기체계를 제안하고, 그 효과성을 분석하였다. 자항 기뢰와 초공동 어뢰의 융복합 무기체계는 자항 기뢰의 은밀 매복 및 탐지 능력과 초공동 어뢰의 초고속 주행 능력을 결합하여, 각 무기체계의 장점을 극대화하고 단점을 상호 보완한다. 이 무기체계의 효과성을 분석하기 위해 국방전력발전업무훈령의 소요제기서 작성 기준을 참고하여 수중 유도무기의 작전 운용에 요구되는 성능에 적합하게 분석 기준을 선정하고, 기존 무기체계 대비 효과성을 수중 방어 지속성, 전투력 운용 융통성, 생존성, 지휘/통제, 운영 비용 효율성, 기상 영향 요인 등 6가지 측면에서 분석하였다. 또한, 시나리오 구상을 통해 이 무기체계의 실용성을 입증하였다. 자항 기뢰와 초공동 어뢰의 융복합 무기체계가 현실화 된다면 미래의 수중환경에서 한국의 안보에 매우 중요한 역할을 할 수 있을 것으로 기대된다.

  • PDF

핵의학 검체검사 정도관리의 개선을 위한 Westgard Multi-Rules의 적용 (Application of Westgard Multi-Rules for Improving Nuclear Medicine Blood Test Quality Control)

  • 정흥수;배진수;신용환;김지영;석재동
    • 핵의학기술
    • /
    • 제16권1호
    • /
    • pp.115-118
    • /
    • 2012
  • Levey-Jennings 정도관리는 측정치가 관리 허용치(평균 ${\pm}2SD$ 또는 ${\pm}3SD$)를 벗어나는 우연오차만 관리를 했었다면, Westgard Multi-Rules 정도관리는 우연오차와 계통오차의 분리분석을 할 수 있고 복합적용이 가능해 병원 인증 내부정도관리에서도 적극 권장하고 있다. 하지만 검체검사 정도관리에서는 kit 내 같은 기질의 정도관리 물질을 사용해 계통오차의 인지가 쉽지 않고 잦은 농도 변경으로 목표치 설정이 어려워 Westgard Multi-Rules의 적용이 힘들었다. 따라서 본 연구는 정도관리 물질을 상용화된 제 3의 물질을 사용해 신뢰성 있는 목표치를 산출하고 Westgard Multi-Rules을 적용함으로써 정도관리를 개선하고자 한다. 갑상선 검사인 Total T3를 대상으로 정도관리 물질을 B사의 Immunoassay Plus Control Level 1, 2, 3를 사용하여 ${\pm}2SD$를 벗어난 값을 제외한 1개월 동안 295회 데이터의 평균값으로 목표치를 설정하였다. 그리고 20일간 총 194회 실험의 정도관리 물질 측정치를 표준편차 지수를 이용하여 하나의 관리도상에 놓고 Westgard Multi-Rules 중 12s, 22s, 13s, 2 of 32s, R4s, 41s, $10\bar{x}$, 7T의 규칙들을 적용하여 우연오차와 계통오차를 분리하여 분석하였다. Total T3의 목표치는 정도관리 물질 1, 2, 3번이 각각 84.2 ng/dl, 156.7 ng/dl, 242.4 ng/dl로 설정되었고 표준편차는 각각 11.22 ng/dl, 14.52 ng/dl, 14.52 ng/dl로 설정되었다. 설정된 목표치를 기준으로 Westgard Multi-Rules을 적용한 뒤 유형을 분석한 결과 우연오차인 12s가 48회, 13s가 13회, R4s가 6회로 분석되었고 계통오차인 22s는 10회, 41s가 11회, 2 of 32s가 17회, $10\bar{x}$가 10회로 분석되었으며 7T는 적용되어지지 않았다. 통제 불가능한 우연오차의 유형들은 전체실험과정을 재확인하고 재검사 비중을 높이는 등의 조치를 취하였으며 통제 가능한 계통오차의 유형들은 원인을 찾아 조치사항 양식에 기록하고 필요 시 내부정도관리 위원회에 보고하였다. 상용화된 제 3의 물질을 정도관리 물질로 사용하고 목표치를 설정함에 따라 하나의 관리도 상에서 3가지 정도관리 물질에 대한 Westgard Multi-Rules의 적용이 가능하게 되었고, 그 결과 12s, 22s, 13s, 2 of 32s, R4s, 41s, $10\bar{x}$, 7T 규칙들의 분석으로 우연오차와 계통오차의 정밀분석이 가능해 졌다. 또한 ${\pm}3SD$ 내의 모든 데이터를 분석 할 수 있어 Error 검출을 최대화 할 수 있게 되었다. 이와 같이 체계적으로 Westgard Multi-Rules을 적용한 정도관리는 검체검사의 정도관리에 질적 향상을 가져다 줄 것이다.

  • PDF

마비성패류독의 제독방법 및 패류독성과 원인플랑크톤과의 관계에 관한 연구 (Detoxification of PSP and relationship between PSP toxicity and Protogonyaulax sp.)

  • 장동석;신일식;김지회;변재형;최위경
    • 한국수산과학회지
    • /
    • 제22권4호
    • /
    • pp.177-188
    • /
    • 1989
  • 임비성패류독의 제독방법 및 패류독성과 원인 플랑크톤과의 관계를 알아보기 위하여 1987년과 1988년 2월 부터 6월 사이에 마산의 수정, 진동의 양도, 거제도의 하청 해역에시 진주담치의 PSP 함량과 해수의 온도, pH, 염분농도와의 관계와 1989 년 3월부터 6월 사이에 부산의 감천만 해역에서 진주담치의 PSP 함량과 Protogonyaulax sp.의 밀도, 그리고 해역의 무기염(질소와 인) 농도와의 관계를 조사하고 독화된 진주담치의 자숙온도 및 시간에 따른 독력변화를 실험한 결과를 요약하면 다음과 같다. 1. PSP가 빈번히 검출되는 2월과 5월 사이에 있어서 같은 해역이라도 PSP의 검출률이나 독소함양은 연도에 따라 심한 차이가 있었다. 2. 진주담치 서식해역의 수온이 $8.0^{\circ}C$에서 $14.0^{\circ}C$ 사이일 때 PSP가 주로 검출되었다. 3. 부산 감천만 해역에서 진주담치의 PSP 함양과 Protogonyaulax sp.의 밀도 사이에 출현초기에는 상관관계가 있었지만 항상 일정한 상관관계는 나타나지 않았다. 4. Protogonyaulax sp.의 밀도는 $NO_3-N$의 농도와 가장 밀접한 상관관계가 있었다. 5. 진주담치의 PSP는 $70^{\circ}C$ 이하에서는 60분간 자숙에도 거의 변화가 없었으나, $80^{\circ}C$ 이상에서는 온도가 상승함에 따라 감독률도 증가하였다. 6. 독력이 $150{\mu}g/100g$인 진주담치는 자숙 30분만에 동물실험결과 독성이 나타나지 않았으나, $5400{\mu}g/100g$인 진주담치의 경우는 90분 이상 자숙하여도 식품위생상 안전한 수준으로 감독시킬 수 없었다.30 mm로 체측의 흑색소포의 분포상태와 체형이 성어와 닮아 있다. 두개골 및 내흉골은 부화 $9\~10$일째의 전장 6.0mm에서 골화되기 시작하여 치어기에 달한 부화후 $40\~43$일째의 전장 13.50 mm에 이르러 골화가 완전하게 이루어진다. 척추골은 복추골이 먼저 발달하여 미추골쪽으로 골화가 진행되며, 각 추체에 대응하는 배경극과 혈관극이 추체보다 늦게 골화한다. 척추골수는 12+21=33개이다. 요대골은 편수골 중 쇄골의 하단과 접착되어 있다. 미골은 미부봉상골 앞의 추체가 먼저 골화된 후에 골화가 진행된다. 골격은 부화 $9\~10$일째인 전장 6.0 mm의 자어에서 섭이와 호흡에 연관된 부분부터 먼저 골화가 일어나 빠른 속도로 발달이 진행되어 부화 40-43일째인 전장 13.52 mm를 전후하여 대부분의 골격이 완성된다. 체장 9.87cm, 수컷은 9.65cm이었다. 병어는 채집된 최소체장인 암컷 18.6cm, 수컷 16.7cm 이상에서 $100\%$ 전개체가 재생산에 참여하였다.전체의 $80.8\%$를 차지하였다. 고등어분말수우프의 맛성분은 건물량 기준으로 유리아미노산 및 관련화합물이 1,279.4 mg/100g, 불휘발성유기산이 948.1mg/100g, 핵산 관련물질 672.8 mg/100g, 총 creatinine이 430.4 mg/100g, betaine 86.6mg/100g 및 미량의 TMAO로 이루어져 있었고 국물로 우려낼때 맛성분의 추출조건은 $100^{\circ}C$에서 1분간의 고온단시간 추출이 적합하였다. 증가를 나타내었는데, 저장기간에 따른 물성의 변화는 숭어에 비하여 붕장어가 적었다.양식산은 aspartic acid 및 proline이 많았다. 또한

  • PDF

가막만 표층퇴적물중 유기물량의 시.공간적 분포 특성 (The Spatio-temporal Distribution of Organic Matter on the Surface Sediment and Its Origin in Gamak Bay, Korea)

  • 노일현;윤양호;김대일;박종식
    • 한국해양환경ㆍ에너지학회지
    • /
    • 제9권1호
    • /
    • pp.1-13
    • /
    • 2006
  • 가막만 표층퇴적물중 유기물량의 시 공간적 분포 특성 및 기원을 파악하고자 2000년 4윌부터 2002년 3월까지월간격으로 현장조사를 실시하였다. 강열감량(IL)은 $4.6{\sim}11.6%(7.1{\pm}1.6%)$, 화학적산소요구량(CODs)은 $2.25{\sim}99.26mgO_2/g-dry(30.98{\pm}19.09mgO_2/g-dry)$, 총 황화물량(AVS)은 $nd{\sim}10.29mgS/g-dry(1.02{\pm}0.58mgS/g-dry)$, 식물색소량은(phaeopigment) $6.84{\sim}116.18{\mu}g/g-dry(23.72{\pm}21.16{\mu}g/g-dry)$, 입자성유기탄소(POC)는 $5.45{\sim}23.24 mgC/g-dty(10.34{\pm}4.40C\;mgC/g-dry)$, 입자성유기질소(PON)는 $0.71{\sim}2.99mgN/g-dry(1.37{\pm}0.58mgN/g-dry)$, 함수율(water content)은 $43.1{\sim}77.6%(55.8{\pm}5.6%)$의 범위를 나타냈으며 펄 함량(mud content)은 모든 정점에서 95% 이상의 값을 나타냈다. 유기물질의 공간적인 분포는 북서 내만역, 만 중앙부와 동쪽해역 그리고 남쪽만 입구역으로 대별되어, 북서 내만역과 남쪽 만 입구역은 만 중앙부와 동쪽해역 및 백야도 인근해역보다 대부분 항목에서 높은 유기물 농도를 나타내었다. 특히 북서 내만역은 과도한 양식활동에 따른 과잉의 유기물 공급, 육상으로부터 생활하수 및 산업폐수 유입, 분지형태의 지형적 특성에 의한 물질의 장기체류로 유기오염이 매우 심각하게 나타났다. 그리고 그로인한 하계 수온약층에 의한 저층의 무산 소 환경이 형성되고 있다. 경시적인 변동양상은 북서 내만역과 남쪽 만 입구역에서 저수온기보다 고수온기에 주로 높은 농도를 보였다. 반면에 만 중앙부와 동쪽해역은 각 항목에서 변동양상의 일정한 규칙성은 보여지지 않으나 황 화물을 제외하면 주로 저수온기에 더 높은 농도를 나타내었다. 황화물 농도는 모든 정점에서 고수온기에 더 높게 나타났으며, 특히 만 중앙부와 동쪽해역은 화학적산소요구량이 $20mgO_2/g-dry$을 넘는 경우 고수온기를 중심으로 일시적인 황화물 증가양상이 나타났다. 가막만 표층퇴적물중 유기물질의 기원은 C/N 비가 평균 8 이하로, 육상기원보다 해양기원 유기물에 의한 것으로 나타났으나, POC/phaeopigment 비로부터 유기물 조성에 있어서 살아있는 식물플랑크톤보다 유기쇄설물이 우점하며, CODs/IL 비로부터 유기쇄설물은 해양자체 순환에 의해 생산되는 것보다 양식활동에서 발생하는 잉여사료와 생물의 배설물 등 인위적 활동에 의한 부분이 높은 것으로 추정되었다.

  • PDF

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.

Node2vec 그래프 임베딩과 Light GBM 링크 예측을 활용한 식음료 산업의 수출 후보국가 탐색 연구 (A Study on Searching for Export Candidate Countries of the Korean Food and Beverage Industry Using Node2vec Graph Embedding and Light GBM Link Prediction)

  • 이재성;전승표;서진이
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.73-95
    • /
    • 2021
  • 본 연구는 Node2vec 그래프 임베딩 방법과 Light GBM 링크 예측을 활용해 우리나라 식음료 산업의 미개척 수출 후보국가를 탐색한다. Node2vec은 네트워크의 공통 이웃 개수 등을 기반으로 하는 기존의 링크 예측 방법에 비해 상대적으로 취약하다고 알려져 있던 네트워크의 구조적 등위성 표현의 한계를 개선한 방법이다. 따라서 해당 방법은 네트워크의 커뮤니티 탐지와 구조적 등위성 모두에서 우수한 성능을 나타내는 것으로 알려져 있다. 이에 본 연구는 이상의 방법을 우리나라 식음료 산업의 국제 무역거래 정보에 적용했다. 이를 통해 해당 산업의 글로벌 가치사슬 관계에서 우리나라의 광범위한 마진 다각화 효과를 창출하는데 기여하고자 한다. 본 연구의 결과를 통해 도출된 최적의 예측 모델은 0.95의 정밀도와 0.79의 재현율을 기록하며 0.86의 F1 score를 기록해 우수한 성능을 나타냈다. 이상의 모델을 통해 도출한 우리나라의 잠재적 수출 후보국가들의 결과는 추가 조사를 통해 대부분 적절하게 나타난 것을 알 수 있었다. 이상의 내용을 종합하여 본 연구는 Node2vec과 Light GBM을 응용한 링크 예측 방법의 실무적 활용성에 대해 시사할 수 있었다. 그리고 모델을 학습하며 링크 예측을 보다 잘 수행할 수 있는 가중치 업데이트 전략에 대해서도 유용한 시사점을 도출할 수 있었다. 한편, 본 연구는 그래프 임베딩 기반의 링크 예측 관련 연구에서 아직까지 많이 수행된 적 없는 무역거래에 이를 적용했기에 정책적 활용성도 갖고 있다. 본 연구의 결과는 최근 미중 무역갈등이나 일본 수출 규제 등과 같은 글로벌 가치사슬의 변화에 대한 빠른 대응을 지원하며 정책적 의사결정을 위한 도구로써 충분한 유용성이 있다고 생각한다.

Hierarchical Attention Network를 이용한 복합 장애 발생 예측 시스템 개발 (Development of a complex failure prediction system using Hierarchical Attention Network)

  • 박영찬;안상준;김민태;김우주
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.127-148
    • /
    • 2020
  • 데이터 센터는 컴퓨터 시스템과 관련 구성요소를 수용하기 위한 물리적 환경시설로, 빅데이터, 인공지능 스마트 공장, 웨어러블, 스마트 홈 등 차세대 핵심 산업의 필수 기반기술이다. 특히, 클라우드 컴퓨팅의 성장으로 데이터 센터 인프라의 비례적 확장은 불가피하다. 이러한 데이터 센터 설비의 상태를 모니터링하는 것은 시스템을 유지, 관리하고 장애를 예방하기 위한 방법이다. 설비를 구성하는 일부 요소에 장애가 발생하는 경우 해당 장비뿐 아니라 연결된 다른 장비에도 영향을 미칠 수 있으며, 막대한 손해를 초래할 수 있다. 특히, IT 시설은 상호의존성에 의해 불규칙하고 원인을 알기 어렵다. 데이터 센터 내 장애를 예측하는 선행연구에서는, 장치들이 혼재된 상황임을 가정하지 않고 단일 서버를 단일 상태로 보고 장애를 예측했다. 이에 본 연구에서는, 서버 내부에서 발생하는 장애(Outage A)와 서버 외부에서 발생하는 장애(Outage B)로 데이터 센터 장애를 구분하고, 서버 내에서 발생하는 복합적인 장애 분석에 중점을 두었다. 서버 외부 장애는 전력, 냉각, 사용자 실수 등인데, 이와 같은 장애는 데이터 센터 설비 구축 초기 단계에서 예방이 가능했기 때문에 다양한 솔루션이 개발되고 있는 상황이다. 반면 서버 내 발생하는 장애는 원인 규명이 어려워 아직까지 적절한 예방이 이뤄지지 못하고 있다. 특히 서버 장애가 단일적으로 발생하지 않고, 다른 서버 장애의 원인이 되기도 하고, 다른 서버부터 장애의 원인이 되는 무언가를 받기도 하는 이유다. 즉, 기존 연구들은 서버들 간 영향을 주지 않는 단일 서버인 상태로 가정하고 장애를 분석했다면, 본 연구에서는 서버들 간 영향을 준다고 가정하고 장애 발생 상태를 분석했다. 데이터 센터 내 복합 장애 상황을 정의하기 위해, 데이터 센터 내 존재하는 각 장비별로 장애가 발생한 장애 이력 데이터를 활용했다. 본 연구에서 고려되는 장애는 Network Node Down, Server Down, Windows Activation Services Down, Database Management System Service Down으로 크게 4가지이다. 각 장비별로 발생되는 장애들을 시간 순으로 정렬하고, 특정 장비에서 장애가 발생하였을 때, 발생 시점으로부터 5분 내 특정 장비에서 장애가 발생하였다면 이를 동시에 장애가 발생하였다고 정의하였다. 이렇게 동시에 장애가 발생한 장비들에 대해서 Sequence를 구성한 후, 구성한 Sequence 내에서 동시에 자주 발생하는 장비 5개를 선정하였고, 선정된 장비들이 동시에 장애가 발생된 경우를 시각화를 통해 확인하였다. 장애 분석을 위해 수집된 서버 리소스 정보는 시계열 단위이며 흐름성을 가진다는 점에서 이전 상태를 통해 다음 상태를 예측할 수 있는 딥러닝 알고리즘인 LSTM(Long Short-term Memory)을 사용했다. 또한 단일 서버와 달리 복합장애는 서버별로 장애 발생에 끼치는 수준이 다르다는 점을 감안하여 Hierarchical Attention Network 딥러닝 모델 구조를 활용했다. 본 알고리즘은 장애에 끼치는 영향이 클 수록 해당 서버에 가중치를 주어 예측 정확도를 높이는 방법이다. 연구는 장애유형을 정의하고 분석 대상을 선정하는 것으로 시작하여, 첫 번째 실험에서는 동일한 수집 데이터에 대해 단일 서버 상태와 복합 서버 상태로 가정하고 비교분석하였다. 두 번째 실험은 서버의 임계치를 각각 최적화 하여 복합 서버 상태일 때의 예측 정확도를 향상시켰다. 단일 서버와 다중 서버로 각각 가정한 첫 번째 실험에서 단일 서버로 가정한 경우 실제 장애가 발생했음에도 불구하고 5개 서버 중 3개의 서버에서는 장애가 발생하지 않은것으로 예측했다. 그러나 다중 서버로 가정했을때에는 5개 서버 모두 장애가 발생한 것으로 예측했다. 실험 결과 서버 간 영향이 있을 것이라고 추측한 가설이 입증된 것이다. 연구결과 단일 서버로 가정했을 때 보다 다중 서버로 가정했을 때 예측 성능이 우수함을 확인했다. 특히 서버별 영향이 다를것으로 가정하고 Hierarchical Attention Network 알고리즘을 적용한 것이 분석 효과를 향상시키는 역할을 했다. 또한 각 서버마다 다른 임계치를 적용함으로써 예측 정확도를 향상시킬 수 있었다. 본 연구는 원인 규명이 어려운 장애를 과거 데이터를 통해 예측 가능하게 함을 보였고, 데이터 센터의 서버 내에서 발생하는 장애를 예측할 수 있는 모델을 제시했다. 본 연구결과를 활용하여 장애 발생을 사전에 방지할 수 있을 것으로 기대된다.