• 제목/요약/키워드: 계산 복잡성

검색결과 1,094건 처리시간 0.034초

기계학습 기반 모델을 활용한 시화호의 수질평가지수 등급 예측 (WQI Class Prediction of Sihwa Lake Using Machine Learning-Based Models)

  • 김수빈;이재성;김경태
    • 한국해양학회지:바다
    • /
    • 제27권2호
    • /
    • pp.71-86
    • /
    • 2022
  • 해양환경을 정량적으로 평가하기 위해 수질평가지수(water quality index, WQI)가 사용되고 있다. 우리나라는 해양수산부고시 해양환경기준에 따라 WQI를 5개 등급으로 구분하여 수질을 평가한다. 하지만, 방대한 수질 조사 자료에 대한 WQI 계산은 복잡하고 많은 시간이 요구된다. 이 연구는 기존의 조사된 수질 자료를 활용하여 WQI 등급을 예측할 수 있는 기계학습(machine learning, ML) 기반의 모델을 제안하고자 한다. 특별관리해역인 시화호를 모델링 지역으로 선정하였다. AdaBoost와 TPOT 알고리즘을 모델 훈련을 위해 사용하였으며, 분류 모델 평가 지표(정확도, 정밀도, F1, Log loss)로 모델 성능을 평가하였다. 훈련하기 전, 각 알고리즘 모델의 최적 입력자료 조합을 탐색하기 위해 변수 중요도와 민감도 분석을 수행하였다. 그 결과 저층 용존산소(dissolved oxygen, DO)는 모델의 성능에서 가장 중요한 인자였다. 반면, 표층 용존무기질소(dissolved inorganic nitrogen, DIN)와 표층 용존무기인(dissolved inorganic phosphorus, DIP)은 상대적으로 영향이 적었다. 한편, 최적 모델의 시공간적 민감도와 WQI 등급 별 민감도를 비교한 결과 각 조사 정점 및 시기, 등급 별 모델의 예측 성능이 상이하였다. 결론적으로 TPOT 알고리즘이 모든 입력자료 조합에서 성능이 더 우수하여 충분한 자료로 훈련된 최적 모델은 새로운 수질 조사 자료의 WQI 등급을 정확하게 분류할 수 있을 거라 판단된다.

승강기 EDLC 비상전원 전력변환장치 제어 알고리즘 연구 (The Study on Control Algorithm of Elevator EDLC Emergency Power Converter)

  • 이상민;김일송;김남
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권6호
    • /
    • pp.709-718
    • /
    • 2017
  • 최근 정전시에 엘리베이터에 탑승한 승객들을 안전하게 대피시킬 수 있는 비상전원장치가 법제화됨에 따라서 이 시스템에 대한 관심이 증대되고 있다. 본 연구에서는 대용량 커패시터에 필요 전력을 직류로 저장한 상태에서 정전시 교류 380V를 발생시켜 엘리베이터가 일정시간 동안 동작할 수 있는 비상전원장치(PCS : Power Conditioning System) 설계에 대한 내용을 다룬다. PCS에 사용되는 전력변환장치의 제어시스템은 원하는 응답 특성을 얻기 위한 전류제어기로 구성되어져 있다. 전류제어기의 설계 방법에는 일반적으로 빠른 응답 특성을 보여주는 데는 비트 제어기 설계를 사용하고 있지만, 복잡한 계산과정을 요구하기 때문에 고성능의 제어기를 필요로 하게 된다. 본 연구에서는 average 전류 제어기법을 사용한 전류제어기의 설계 방법에 대해서 서술하였다. 먼저 단상 시스템의 전류 제어 기법을 통해 제안된 방법의 적합성을 입증한 후 3상 시스템으로 확장시켜서 시스템에 적용하였다. 모델링을 통한 수학적 해석과 PSIM을 이용한 컴퓨터 시뮬레이션을 이용한 검증방법을 통해 본 연구에서 제안한 제어방법의 성능과 효과를 입증하였다.

3차원 격자 스트럿-타이 모델 방법을 이용한 PSC 박스거더 격벽부의 강도예측 (Strength Prediction of PSC Box Girder Diaphragms Using 3-Dimensional Grid Strut-Tie Model Approach)

  • 박정웅;김태영
    • 대한토목학회논문집
    • /
    • 제26권5A호
    • /
    • pp.841-848
    • /
    • 2006
  • PSC 박스거더 교량의 격벽(diaphragm)은 프리스트레스에 의해 큰 집중하중이 가해지기 때문에 응력의 분포가 매우 교란되며 격벽에 발생하는 과도한 균열은 격벽의 거동을 매우 복잡하게 만든다. AASHTO 설계기준에 따르면 집중 긴장하중에 의한 3차원 효과는 3차원 모델을 이용하거나, 둘 혹은 그 이상의 평면으로 분리된 하위모델(submodel)을 사용하여 근사적으로 계산하는 방법을 허용하고 있다. 이때 하위모델은 각 방향에 대하여 독립적으로 결정할 수 있으나 모델 간의 상호작용이 고려되어야 하며 일관성이 있어야 한다. 그러나 외부 긴장재의 정착을 위한 격벽은 2차원 문제로 간주하기 어려운 3차원 응력교란영역(disturbed region) 구조물이며, 2차원 모델을 이용하여 격벽에 작용하는 힘의 흐름을 표현하는 것은 만족한 결과를 주지 못한다. 본 연구에서는 3차원 응력교란영역 구조부재의 해석/설계를 위해 제안된 컴퓨터에 기반한 3차원 격자 스트럿-타이 모델 방법을 이용하여 Texas대학교에서 실험, 파괴된 PSC 박스거더 격벽의 1/2 축소 모형을 해석하였다. 그리고 그 결과를 기존의 연구결과 및 실험결과와 비교하여 제안된 방법의 타당성과 정확성을 평가함으로서, 포스트텐션 정착부 및 격벽부 설계를 위한 합리적인 컴퓨터 기반의 설계방법을 제시하였다.

이중 해시체인 기반의 명령어 메시지 인증 메커니즘 설계 (Design of Authentication Mechinism for Command Message based on Double Hash Chains)

  • 박왕석;박창섭
    • 융합보안논문지
    • /
    • 제24권1호
    • /
    • pp.51-57
    • /
    • 2024
  • 최근 산업제어시스템은 정보기술과 운영기술을 융합하는 Industrial IoT의 도입과 함께 진화를 계속하고 있지만, 과거에는 경험하지 못한 다양한 사이버 공격 역시 증가하고 있다. 제어센터에서 전송되는 다양한 명령어 메시지를 통해 시스템을 구성하는 필드 디바이스들에 대한 모니터링 및 운영 제어가 행해지기에 명령어 메시지에 대한 무결성과 더불어 제어센터에 대한 인증은 필수 요구사항이 되고 있다. 기존의 대칭키 기반의 메시지인증코드 방식 또는 공개키 기반의 서명 방식은 제어센터 그리고 자원 제약적 필드 디바이스의 비대칭성에 따른 적용상의 제약들이 존재한다. 특히, 대칭키 방식에서는 필드 디바이스에 설치된 대칭키가 공격자에게 노출되면 시스템 전반적인 보안 문제점이 발생한다. 본 논문에서는 명령어 메시지를 구성하는 구성 필드들이 취할 수 있는 데이터 값들이 제한적(낮은 엔트로피)이라는 점에 착안하여 암호해시함수로 구축된 이중 해시체인을 통한 메시지 인증기법을 제안한다. 한 쌍의 이중 해시체인은 오직 한 개의 명령어 메시지에 적용되기에 다중 사용을 위한 Merkle 트리에 기반을 둔 확장 기법 역시 제안한다. 메시지 인증을 위해 암호해시함수 이외의 암호 프리미티브는 사용이 안되기에 계산 복잡도는 매우 낮게 유지될 수 있음을 성능평가를 통해 확인한다.

음료$\cdot$다류 산업

  • 손헌수
    • 좋은식품
    • /
    • 통권180호
    • /
    • pp.27-64
    • /
    • 2004
  • 국내 제조업 전체에서 식음료품은 $6.31\%$를 차지하고 있다. 2000년을 기준으로 식품산업의 총매출실적을 보면 32조 3,463억원을 기록하고 있는데, 이 중 식료품은 26조 921억원, 알콜올음료를 포함한 음료품은 6조 2,516억원을 차지하고 있다. 2001년, 음료시장의 규모는 약 2조 7,900억원 정도였다. 빠르게 성장하던 전체 음료시장의 매출은 IMF 이후 약간 주춤하는 경향을 보였지만 지속적으로 매출액이 상승하여 2002년에는 3조 4천억원의 매출을 기록하였다. 이것은 사이다, 후레바, 정통주스, 냉장주스, 스포츠 음료, 두유 및 기능성음료 등이 성장을 주도하였다. 2003년 상반기, 1조 6,500억원으로 전년 동기대비 $3\%$ 감소하였지만 2003년 전체 실적은 대략 지난해와 비슷한 3조 5,000억원 규모로 전망된다. 내수량의 경우 탄산음료와 과즙음료가 감소하는 경향을 나타냈지만, 전체적으로는 증가하였다. 다류시장의 규모는 약 650억원, 캔커피시장의 규모는 2,400억원 정도로 나타났다. 이처럼 음료$\cdot$다류 시장은 전체적으로 약 4조원의 거대시장규모를 형성하고 있으며 내수가 지속적으로 증가되고 있어, 점차 시장규모도 증가할 것으로 전망되고 있다. 최근에는 기능성 음료 및 다류의 시장규모가 전체의 $20\%$에 달할 정도로 신장하였으며, 기능성음료 및 다류의 특허출원도 지속적으로 증가하고 있는 실정이다. 이는 비단 국내에서 뿐만 아니라 세계적인 현상이며 이러한 추세는 앞으로 지속될 것으로 전망되고 있다. 이처럼 기능성음료 및 다류의 성장이 두드러지고 있는 것은 시대가 변하면서 현대인들의 생활방식과 식생활 변화, 질병형태 다양화 등 여러 사회적 여건이 변화되고 있는데 기인하며, 현대인의 건강에 대한 관심의 증대는 음료시장의 쾌속성장과 틈새수요를 지속적으로 창출하고 있다. 현재 세계 건강기능성 식품의 시장 규모는 약 160조원이며, 국내의 경우 약 1조원에 이르는 실정이다. 이 중 기능성음료 시장은 국내에서 약 4천억원 규모로 기능성식품 시장의 $40\%$를 차지하고 있다. 이처럼 기능성음료 시장은 최근 연간 $7\%$ 정도의 빠른 성장률을 보이고 있으며 향후에도 $6.7\%$의 실질 연간 성장률을 지속할 것으로 전망되고 있다. 전해질(이온)음료나 식이섬유를 포함하는 다이어트음료에서 출발한 기능성음료는 숙취해소, 성인병 예방, 스트레스 해소에 이르기까지 각종 질병의 치료 및 예방으로 확대되고 있다. 앞으로는 BT 및 나노 기술 등을 이용한 신기능 소재들에 대한 다각적인 효능의 규명에 따른 음료$\cdot$다류 소재의 개발과 더불어 체질개선, 다이어트, 숙취해소 등의 특정한 기능성과 관련한 음료$\cdot$다류의 특허출원이 계속될 것으로 전망된다. 복잡한 한약의 제조과정을 단순화하여 티백이나 캔 형태로 만든 맛과 기능이 조화된 음료$\cdot$다류 분야의 연구개발이 지속될 것으로 보이며, 시장 규모의 확대와 더불어 기능성과 간편성을 동시에 추구하는 신세대 소비자들의 성향을 겨냥하여 기존의 음료$\cdot$다류 전문 업체 외에도 제약회사 등의 비음료 업체도 다양한 형태의 음료$\cdot$다류 기술개발을 지속할 것으로 예상되고 있다. 특히 새로운 신기능성 소재를 개발하는 것은 고부가가치 기술로써 BT, NT 등의 최첨단 기술의 발전과 도입으로 인해 그동안 수입에 의존하던 기능성 소재들도 국내 기업들의 축전된 기반기술을 통하여 대거 참입할 것으로 보인다. 하지만, 여러 업체의 음료$\cdot$다류시장 진출에 따라 야기될 수 있는 비위생이고 효능이 불확실한 식품의 유통, 업체간의 과열경쟁에 따른 유통질서 문란 등은 모처럼 활기를 되찾은 음료$\cdot$다류 분야의 기술개발을 위축시킬 수도 있으므로 정부차원에서 체계적이고 효율적인 관리가 조속히 이루어져야 할 것이며 이를 제도적으로 뒷받침하기 위한 정책이 수립되고 시행되어야 할 것으로 보인다. 특히, 원료적인 측면에서의 무역 불균형은 반드시 해소되어야 할 부분이다. 대부분이 수입 기능성 원료에 의존하고 있는 현실에서 국내의 BT 기술 확충에 더욱 많은 투자와 노력이 집중되어야 할 것이다. 세계적으로 경쟁이 될 수 있는 기능성 소재의 개발과 이를 통한 신기능 음료의 개발은 단순한 수학적 계산을 넘어서 국가의 기술력을 홍보할수 있는 좋은 계기가 되기 때문이다. 바야흐로 음료$\cdot$다류 분야에 대한 열기가 식품시장을 주도하면서, 시장이 안정적으로 확대되기 위해서는 지속적인 기술개발이 이루어져야 한다는 것은 재론의 여지가 없다고 하겠다.

  • PDF

지표피복변화 연구에서 최적의 공간스케일의 문제 : 가나 북부지역의 사바나 지역을 사례로 (Optimal Spatial Scale for Land Use Change Modelling : A Case Study in a Savanna Landscape in Northern Ghana)

  • 닉반드기슨;폴플렉;박수진
    • 대한지리학회지
    • /
    • 제40권2호
    • /
    • pp.221-241
    • /
    • 2005
  • 토지이용 및 지표피복변화 (Land Use and land Cover Changes, LUCC)는 지구환경변화의 원인으로 중요한 연구대상이 되고 있다. LUCC는 복잡한 사회적, 경제적, 정치적 상호작용속에서 다양한 시$\cdot$공간적 스케일에서 발생하게 된다. 따라서 LUCC를 모델화하기 위해서는 LUCC를 야기시키는 원인(driving forces)과 제한요인(constraints)들의 시$\cdot$공간적인 다양성을 이해하는 작업이 선행되어야 한다. 특히, 특정 지역에서 나타나는 LUCC의 동인을 파악하기 위해서는 스케일에 따른 그 특성의 변화를 이해하는 것이 급선무이다. 이 연구는 가나(Ghana) 북부지역의 사바나 지역을 대상으로 지난 15년간 나타난 지표피복변화의 공간적인 다양성을 파악한 뒤, 공간적 스케일을 달리하면서 나타나는 LUCC의 원인을 분석하였다. 이 과정을 통해 사바나 지역에서 LUCC 과정을 모형화하기 위한 최적의 공간적인 스케일을 규명하고자 하였다. 연구지역은 지난 15년간 인구증가의 결과로 농업생산활동이 급격하게 증가한 지역이다. 연구지역에서 나타나는 지표피복변화의 정도는 LANDSAT 위성영상에서 추출한 NDVI들을 다변량 통계분석기법을 이용하여 정량화하였다. 그리고 지표피복변화의 원인을 스케일별로 파악하기 위한 도구로 다축척 계층분석기법(multi-scale hierarchical adaptive model)을 개발$\cdot$제안하였다. 개발된 기법은 지표피복의 변화정도와 원인이 될 수 있는 공간변수들간의 상관성을 공간적인 스케일을 달리하면서 순차적으로 계산해낼 수 있는 기법이다. 이 연구에서 지표피복변화의 원인으로는 '도로에서부터의 거리', 하천으로부터의 거리', '지형특성' 의 세가지 변수를 사용하였다. 지표피복 변화정도와 위의 세가지 변수들간의 상관관계는 공간적인 범위가 10$\times$10km 이하인 경우에 높게 나타났다. 하지만 공간범위가 그 이상이 될 경우에는 그 내부에서 나타나는 다양성으로 인해 통계적인 상관성이 현격하게 낮아지는 것을 관찰할 수 있었다. 이러한 결과는 지역 및 국가 단위의 환경변화모델에서 모델의 공간적인 구성범위가 일정한 수준을 넘으면, 그 내부에서 발생하고 있는 다양성이 급격하게 증가하여 지표피복변화의 원인과 결과를 정확하게 파악하기 힘들게 된다는 것을 의미한다. 10$\times$10km의 공간적인 범위는 농업생산이 위주가 되는 사바나 지역에서는 주로 개별 마을이 차지하고 있는 공간적인 범위와 대체적으로 일치한다. 따라서 사바나 지역에서 나타나는 지표피복변화의 다양성을 고려하면서 보다 정확하게 모형화하기 위해서는 마을단위에서 나타나는 지표피복변화과정이 최소의 모델단위가 되어야 함을 시사한다.

근거리 원격탐사 기법을 이용한 총일차생산량 추정 및 순생태계 CO2 교환량 배분의 정확도 평가에 관하여 (On Using Near-surface Remote Sensing Observation for Evaluation Gross Primary Productivity and Net Ecosystem CO2 Partitioning)

  • 박주한;강민석;조성식;손승원;김종호;김수진;임종환;강민구;심교문
    • 한국농림기상학회지
    • /
    • 제23권4호
    • /
    • pp.251-267
    • /
    • 2021
  • 원격 탐사 기반의 식생지수들은 광합성을 조절하는 식물생리적 특성과 경험적 상관관계를 보이며, 여러공간 규모에서의 총일차생산량(GPP) 추정에 활용되고 있다. 하지만 시간 해상도가 높아질수록 식생지수를 이용한 GPP 추정의 불확실성이 커지는 한계가 존재한다. 또한 식생지수 관련 분석에 주로 사용되는 에디공분산법을 이용하여 추정한 GPP 역시 실제 측정한 순생태계교환량(NEE)을 GPP와 생태계 호흡(RE)으로 배분하는 데 사용하는 방법에 따라 추정값이 달라지는 불확실성이 존재한다. 본 연구에서는 플럭스 타워가 설치된 네 곳의 농림생태계를 대상으로 근지표에서 관측한 식생의 분광 특성을 이용한 다양한 식생지수를 계산하였고, 이를 다양한 시간 해상도에서 GPP 추정에 적용가능한 지를 분석하였다. 동시에 이를 이용하여 NEE 배분 방법의 불확실성을 평가하였다. 비교에 사용한 정규식생지수, 개량식생지수, 적외반사식생지수(NIRv)에 비해 적외반사식생지수와 광합성유효광(PAR)을 결합한 NIRvP이 식생 및 지형 조건에 의한 공간 이질성으로 인해 관측지에 따라 약간의 차이가 나타났지만, 농경지와 산림에서 모두 30분과 일 단위 시간 해상도에서 GPP와 높은 상관성(r2 = 0.63, 0.68)을 보였다. 또한 기존 KoFlux 표준 NEE 배분방법에 비해 기계학습 기반의 NEE 배분 방법을 적용할 경우, 산림에서 30분 단위의 GPP와 NIRvP 사이의 상관성이 향상되었지만, 일 단위에는 그 차이가 크지 않았다. 하지만 광조건 이외에 다른 요인에 의해 광합성이 제한되는 경우 NIRvP와 GPP 간의 상관성이 떨어져 NIRvP를 이용해 실제 배분 결과를 직접 평가하긴 어려웠으며, 주로 광 조건에 의해 광합성이 제한되는 흐린 날의 경우 NEE 배분 정확도를 평가할 수 있는 가능성이 존재하였다. 그러나 높은 시간해상도의 Vis 기반의 GPP 추정이 의미를 가지려면, VIs와 GPP간의 경험적 관계를 넘어서는 시스템 사고 및 자기-조직화와 관련된 복잡계 기반의 분석 방법이 요구된다.

영한 기계 번역에서 미가공 텍스트 데이터를 이용한 대역어 선택 중의성 해소 (Target Word Selection Disambiguation using Untagged Text Data in English-Korean Machine Translation)

  • 김유섭;장정호
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.749-758
    • /
    • 2004
  • 본 논문에서는 미가공 말뭉치 데이터를 활용하여 영한 기계번역 시스템의 대역어 선택 시 발생하는 중의성을 해소하는 방법을 제안한다. 이를 위하여 은닉 의미 분석(Latent Semantic Analysis : LSA)과 확률적 은닉 의미 분석(Probabilistic LSA : PLSA)을 적용한다. 이 두 기법은 텍스트 문단과 같은 문맥 정보가 주어졌을 때, 이 문맥이 내포하고 있는 복잡한 의미 구조를 표현할 수 있다 본 논문에서는 이들을 사용하여 언어적인 의미 지식(Semantic Knowledge)을 구축하였으며 이 지식은 결국 영한 기계번역에서의 대역어 선택 시 발생하는 중의성을 해소하기 위하여 단어간 의미 유사도를 추정하는데 사용된다. 또한 대역어 선택을 위해서는 미리 사전에 저장된 문법 관계를 활용하여야 한다. 본 논문에서는 이러한 대역어 선택 시 발생하는 데이터 희소성 문제를 해소하기 위하여 k-최근점 학습 알고리즘을 사용한다. 그리고 위의 두 모델을 활용하여 k-최근점 학습에서 필요한 예제 간 거리를 추정하였다. 실험에서는, 두 기법에서의 은닉 의미 공간을 구성하기 위하여 TREC 데이터(AP news)론 활용하였고, 대역어 선택의 정확도를 평가하기 위하여 Wall Street Journal 말뭉치를 사용하였다. 그리고 은닉 의미 분석을 통하여 대역어 선택의 정확성이 디폴트 의미 선택과 비교하여 약 10% 향상되었으며 PLSA가 LSA보다 근소하게 더 좋은 성능을 보였다. 또한 은닉 공간에서의 축소된 벡터의 차원수와 k-최근점 학습에서의 k값이 대역어 선택의 정확도에 미치는 영향을 대역어 선택 정확도와의 상관관계를 계산함으로써 검증하였다.젝트의 성격에 맞도록 필요한 조정만을 통하여 품질보증 프로세스를 확립할 수 있다. 개발 된 패키지의 효율적인 활용이 내조직의 소프트웨어 품질보증 구축에 투입되는 공수 및 어려움을 줄일 것으로 기대된다.도가 증가할 때 구기자 열수 추출 농축액은 $1.6182{\sim}2.0543$, 혼합구기자 열수 추출 농축액은 $1.7057{\sim}2.1462{\times}10^7\;J/kg{\cdot}mol$로 증가하였다. 이와 같이 구기자 열수 추출 농축액과 혼합구기자 열수 추출 농축액의 리올리지적 특성에 큰 차이를 나타내지는 않았다. security simultaneously.% 첨가시 pH 5.0, 7.0 및 8.0에서 각각 대조구의 57, 413 및 315% 증진되었다. 거품의 열안정성은 15분 whipping시, pH 4.0(대조구, 30.2%) 및 5.0(대조구, 23.7%)에서 각각 $0{\sim}38.0$$0{\sim}57.0%$이었고 pH 7.0(대조구, 39.6%) 및 8.0(대조구, 43.6%)에서 각각 $0{\sim}59.4$$36.6{\sim}58.4%$이었으며 sodium alginate 첨가시가 가장 양호하였다. 전체적으로 보아 거품안정성이 높은 것은 열안정성도 높은 경향이며, 표면장력이 낮으면 거품형성능이 높아지고, 비점도가 높으면 거품안정성 및 열안정성이 높아지는 경향이 있었다.protocol.eractions between application agents that are developed using different

수증기 연직 분포에 의한 GOCI-II 해색 산출물 오차 분석 (Analysis of Uncertainty in Ocean Color Products by Water Vapor Vertical Profile)

  • 이경상;배수정;이은경;안재현
    • 대한원격탐사학회지
    • /
    • 제39권6_2호
    • /
    • pp.1591-1604
    • /
    • 2023
  • 해색 원격탐사에서 대기 보정은 자료의 정확도와 신뢰성 확보를 위해 반드시 수행해야하는 과정으로 높은 정확도가 요구된다. 또한 최근 원격 탐사 커뮤니티에서는 위성 자료의 오차에 대한 요구 사항이 증가함에 따라 대기 보정의 보조 자료로 사용되는 기상 변수(오존량, 기압, 바람장, 층적분 수증기량[total precipitable water, TPW])의 오차에 의해 발생하는 원격 반사도(remote sensing reflectance, Rrs)의 오차에 대한 연구가 진행되고 있지만 오차 요인으로 알려진 수증기 프로파일의 변동성에 의한 Rrs의 오차에 대한 연구는 수행되지 않았다. 본 연구에서는 Second Simulation of a Satellite Signal Vector version 2.1 모의를 통해 GOCI-II 관측 영역 내의 수증기 프로파일의 변동성에 따른 수증기 투과도의 오차를 계산하고 이로 인해 발생하는 해색 산출물의 오차에 대해 분석하였다. Radiosonde 관측 수증기 프로파일은 그 형태가 복잡할 뿐만 아니라 지표 부근의 큰 변동성으로 인해 기존 GOCI-II 대기 보정에서 사용하고 있는 US standard 62 수증기 프로파일과의 차이가 최대 0.007만큼 발생하였다. 이로 인해 발생한 수증기 투과도의 차이는 GOCI-II 대기 보정에서 에어로졸 반사도 추정의 차이를 발생시키고, 결과적으로 모든 밴드에서 Rrs의 오차가 발생하였다. 하지만 412-555 nm 밴드에서 수증기 프로파일 차이로 인한 Rrs 오차는 요구 정확도보다 낮은 2% 미만으로 나타났으며, 다른 해색 산출물인 클로로필(chlorophyll-a) 농도, 용존 유기물, 총 부유물 농도에서도 유사한 오차를 보이고 있다. 본 연구의 결과는 대기 보정 및 해색 산출물의 정확도에 있어 수증기 프로파일의 차이의 영향이 적다는 것을 의미한다. 하지만 추후 연구에서 수증기 흡광 보정 시 수증기 프로파일의 변동성을 고려할 경우 보다 높은 수준의 Rrs 정확도 확보를 기대할 수 있다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.