• 제목/요약/키워드: Engineering characteristics

검색결과 51,782건 처리시간 0.093초

머신러닝&딥러닝 모델을 활용한 댐 일유입량 예측시 융적설을 고려하기 위한 데이터 전처리에 대한 방법 연구 (Study on data preprocessing methods for considering snow accumulation and snow melt in dam inflow prediction using machine learning & deep learning models)

  • 조영식;정관수
    • 한국수자원학회논문집
    • /
    • 제57권1호
    • /
    • pp.35-44
    • /
    • 2024
  • 댐유입량 예측에 대하여 데이터 기반 머신러닝 및 딥러닝(Machine Learning & Deep Learning, ML&DL) 분석도구들이 공개되어 다양한 분야에서 ML&DL의 적용연구가 활발히 진행되고 있으며, 모델의 자체 성능향상 뿐만 아니라 모델의 특성을 고려한 데이터의 전처리도 댐유입량을 정확하게 예측하게 하는 중요한 모델성능 향상의 요소라고 할 수 있다. 특히 기존 강우자료는 적설량을 열선 설비를 통하여 녹여 강우량으로 환산되어 있으므로, 융적설에 따른 강우와 유입량의 상관관계를 왜곡하게 된다. 따라서 본연구에서는 소양강댐과 같이 융적설의 영향을 받는 댐유역에 대한 댐일유입량 예측시 겨울에 강설량이 적설이 되어 적게 유출되는 현상과, 봄에 융설로 인하여 무강우나 적은 비에도 많은 유출이 일어나는 물리적 현상을 ML&DL모델로 적용하기 위하여 필요한 강우 데이터의 전처리에 대한 연구를 수행 하였다. 강우계열, 유입량계열을 조합하여 3가지 머신러닝(SVM, RF, LGBM)과 2가지 딥러닝(LSTM, TCN) 모델을 구축하고, 최적 하이퍼파라메터 튜닝을 통하여 적합 모델을 적용하고 한 결과, NSE 0.842~0.894로 높은 수준의 예측성능을 나타내었다. 또한 융적설을 반영한 강우보정 데이터를 만들기 위하여 융적설 모의 알고리즘을 개발하고, 이를 통하여 산정된 보정강우를 머신러닝 및 딥러닝 모델에 적용한 결과 NSE 0.841~0.896 으로 융적설 적용전과 비슷한 높은 수준의 예측 성능을 나타내었으나, 융적설 기간에는 조정된 강우로 학습되어 예측되었을 때 실측유입량에 근접하는 모의결과를 나타내었다. 결론적으로, 융적설이 영향을 미치는 유역에서의 데이터 모델 적용시에는 입력자료 구축시 적설 및 융설이 물리적으로 타당한 강우-유출 반응에 적합하도록 전처리과정이 중요함을 밝혔다.

해상풍력발전기 설치 선박 레그의 해저면 관입 깊이에 따른 고유 진동 모드와 구조 강도 평가 (Evaluation of the Natural Vibration Modes and Structural Strength of WTIV Legs based on Seabed Penetration Depth)

  • 이명수;서광철;박주신
    • 해양환경안전학회지
    • /
    • 제30권1호
    • /
    • pp.127-134
    • /
    • 2024
  • 해상풍력발전 시장의 성장과 함께 해상풍력발전기 설치 선 시장에 대한 기대감이 커지고 있다. 해상풍력발전 시장 내 2030년까지 약 100척의 설치 선이 필요할 것으로 전망되고 있다. 척당 가격이 3,000~4,000억 원이라서 일반 운반선보다 고부가가치 시장이다. 특히, 풍력발전기 용량이 11MW 이상의 대형 설치 선의 수요가 커지고 있다. 중국을 중심으로 아시아 해상풍력발전기 시장의 급성장으로 이 지역에서 운용 가능한 설치 선에 대한 발주에 대한 협의가 많다. 아시아권역 대부분의 해저 지질은 지지 반력이 작은 점토층으로 구성되어 있다. 이러한 특성에 의해서 설치 선이 작업을 위해 수면 밖으로 오르고 내림 시 스퍼드캔(Spudcan)과 레그(Leg)의 관입 깊이가 크게 발생한다. 연구에서는 최소 3m에서 최대 21m까지 관입 변수를 이용하여 관입 깊이에 따른 고유 진동 주기, 레그의 구조 안전성 평가 그리고 전복 안전성 지수를 평가하였다. 관입 깊이가 증가하면 고유 진동 주기가 짧아지고, 레그의 모멘트 길이가 짧아져서 구조 강도의 여유 치가 증가한다. 모든 입사각에서 전복 모멘트에 대해 안전하며, 최댓값은 270도에서 발생한다. 본 연구를 통하여 검토된 조건들은 연약 지반에서 설치 선의 운용 절차서를 작성 시 관입 깊이에 따라서 레그를 어떻게 운용해야 하는지 판단할 수 있는 중요한 자료로 활용할 수 있다. 결론적으로 관입 깊이에 따른 레그 구조 안전성을 정확히 파악하는 것은 설치 선의 안전과 직결된 문제이다.

총체맥류 분쇄기 개발 및 분쇄 총체맥류 사일리지의 품질 특성 (Development of Crushing Device for Whole Crop Silage and the Characteristics of Crushed Whole Crop Silage)

  • 이성현;유병기;주선이;박태일
    • 한국초지조사료학회지
    • /
    • 제36권4호
    • /
    • pp.344-349
    • /
    • 2016
  • 본 연구에서는 주로 한(육)우, 낙농 등에서 이용되는 총체맥류 조사료를 돼지, 닭 등에게까지 확대 이용 가능성을 모색하기 위하여 수행하였다. 이를 위해 총체맥류를 분쇄할 수 있는 시스템을 개발하였고 분쇄시스템을 통해 분쇄한 총체맥류를 비닐 백에 밀봉 저장한 후 사료가치를 분석하였다. 총체맥류는 Fig. 4에서 보는 바와 같이 수확 직후 줄기, 잎, 곡실 등을 분리하지 않고 원형 그대로 분쇄장치에 투입하였다. 분쇄되어 배출된 총체맥류의 분쇄상태를 분석한 결과 알곡 20%, 10 mm 이상 4%, 5~10 mm 27%, 5 mm 이하 49%로 매우 미세하게 분쇄되는 것으로 나타나 단위동물의 배합사료에 일정비율 혼합하여 급이 하는 것이 가능할 것으로 판단되었다. 분쇄 직후 밀봉하여 상온에서 저장한 총체맥류 사일리지는 약 3개월이 지난 시점에서 품질을 분석하였다. 시험에 사용한 총체맥류는 새쌀보리와 금강밀이다. 분쇄된 총체맥류의 발효를 촉진하기 위하여 하나에는 발효제를 접종하였고 다른 하나는 발효제를 접종하지 않았다. 발효제를 접종한 분쇄 총체 새쌀보리의 조단백질, 조지방, 조섬유, NDF, ADF, 리그닌, 셀룰로스 함량은 2.45%, 1.61%, 8.95%, 16.94%, 9.52%, 1.01%, 8.51%로 나타났으며 TDN, RFV는 81.38%, 447.5%로 나타났다. 발효제를 접종하지 않은 총체 새쌀보리의 조단백질, 조지방, 조섬유, NDF, ADF, 리그닌, 셀룰로스 함량은 2.57%, 1.62%, 9.61%, 18.25%, 10.13%, 1.10%, 9.04%로 나타났으며 TDN, RFV는 80.90%, 412.9%로 나타났다. 발효제를 접종한 분쇄 총체 금강밀의 조단백질, 조지방, 조섬유, NDF, ADF, 리그닌, 셀룰로스 함량은 2.43%, 1.27%, 10.99%, 19.49%, 11.23%, 1.46%, 9.77%로 나타났으며 TDN, RFV는 80.03%, 382.6%로 나타났다. 발효제를 접종하지 않은 총체금강밀의 조단백질, 조지방, 조섬유, NDF, ADF, 리그닌, 셀룰로스 함량은 2.28%, 1.44%, 10.08%, 18.02%, 10.44%, 1.26%, 9.18%로 나타났으며 TDN, RFV는 80.65%, 416.9%로 나타났다. 발효제를 접종한 것과 발효제를 접종하지 않은 분쇄 총체맥류 사일리지의 상대적 사료가치를 평가한 결과 새쌀보리의 경우 발효제를 첨가한 것이 높았으며, 금강밀의 경우 발효제를 첨가하지 않은 것이 높은 것으로 나타났다. 따라서 총체맥류 분쇄 사일리지를 조제할 때 품종에 따라 발효제의 첨가 여부를 결정하는 것이 중요할 것으로 판단되었다. 또한 Ju 등(2009, 2011)의 TDN과 RFV를 비교 분석한 결과 발효제의 접종 여부와 관계없이 분쇄 총체맥류 사일리지의 TDN과 RFV가 월등히 높은 것으로 나타났다. 따라서 총체맥류 사일리지 조제시 수확${\rightarrow}$분쇄${\rightarrow}$밀봉의 과정을 거쳐 사일리지를 조제하는 것이 조사료 이용효율을 높일 수 있을 것으로 판단된다.

플라즈마 보조 유기금속 화학기상 증착법에 의한 MCN(M=Ti, Hf) 코팅막의 저온성장과 그들의 특성연구 (Low Temperature Growth of MCN(M=Ti, Hf) Coating Layers by Plasma Enhanced MOCVD and Study on Their Characteristics)

  • 부진효;허철호;조용기;윤주선;한전건
    • 한국진공학회지
    • /
    • 제15권6호
    • /
    • pp.563-575
    • /
    • 2006
  • Ti(C,N) 박막을 온도범위 $200-300^{\circ}C$에서 tetrakis diethylamido titanium유기금속 화합물을 전구체로 이용하여 pulsed DC 플라즈마 보조 유기금속 화학기상 증착법 (PEMOCVD)으로 합성하였다. 본 연구에서는 플라즈마 특성을 서로 비교하기 위하여 수소$(N_2)$와 헬륨/수소$(He/H_2)$ 혼합기체를 각각 운반기체로 사용하였으며 전구체 이외에 질소$(N_2)$와 암모니아$(NH_3)$ 기체를 반응기체로 사용하여 서로 다른 플라즈마 화학조건에서 얻어지는 박막내의 탄소함유량(C Content)의 변화를 비교하여 탄소가 가장 적게 함유된 저온 코팅막 합성공정을 찾으려고 하였다. 이를 위하여 증착시 서로 다른 pulsed bias 전압과 기체종류 하에서 여기된 플라즈마 상태의 라디칼종들과 이온화 경향을 in-situ optical emission spectroscopy(OES)법으로 플라즈마 진단분석을 실시하였다. 그 결과 $(He/H_2)$ 혼합기체를 $N_2$와 함께 사용할 경우 라디칼 종들의 이온화를 매우 효과적으로 향상시킴을 관찰하였다. 아울러 $NH_3$ 기체를 $H_2$ 또는 $He/H_2$ 혼합기체와 같이 사용할 경우는 CN 라디칼의 생성을 억제하여 결과적으로 Ti(C, N) 박막내의 탄소함량을 크게 낮춤을 알 수 있었고, CN 라디칼의 농도가 탄소 함유량과 많은 관련이 있음을 알았다. 이 결과는 바로 박막의 미세경도와도 연관이 되며, bias전압과 기체종류에 크게 의존하여 Ti(C, N) 박막의 미세경도가 1250 - 1760 Hk0.01 사이에서 나타났고, 최대치$(1760\;Hk_{0.01})$는 600 V bias 전압과 $H_2$$N_2$ 기체를 사용한 경우에 얻어졌다. HF(C, N) 박막 역시 tetrakis diethylamido hafnium 전구체와 $N_2/He-H_2$ 혼합기체를 이용하여 pulsed DC PEMOCVD 법으로 기판온도 $300^{\circ}C$ 이하, 공정압력 1 Torr, 그리고 bias전압과 기체 혼합비를 변화시키면서 증착하였다. 증착시 in-situ OES 분석결과 플라즈마 내의 질소종의 함유량 변화에 따라 증착속도가 크게 변화됨을 알 수 있었고, 많은 질소기체를 인입하면 질소종이 많아지지만 증착률은 급격히 감소하였고 박막내 탄소의 함량이 커지면서 막질이 비정질로 바뀌고 미세경도 또한 감소함을 알 수 있었다. 이는 in-situ 플라즈마 진단분석이 전체 PEMOCVD 공정에 있어서 대단히 중요하고, Ti(C,N)과 Hf(C,N) 코팅막의 탄소함량과 미세경도는 플라즈마내의 CH과 CN radical종의 세기에 크게 의존함을 의미한다. 그리고 Hf(C,N) 박막의 경우도 Ti(C,N) 박막의 경우와 유사하게 최대 미세경도값$(2460\;Hk_{0.025})$이 -600 V bias 전압과 10% 질소기체 혼합비를 사용한 경우에 얻어졌고, 이는 박막이 주로(111) 방향으로 성장됨에 기인한 것으로 사료된다.

한국 NPL시장 수익률 예측에 관한 연구 (A study on the prediction of korean NPL market return)

  • 이현수;정승환;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.123-139
    • /
    • 2019
  • 국내 NPL (Non performing loan) 시장은 1998년에 형성되었지만, 본격적으로 활성화 된 시기는 2009년으로 역사가 짧은 시장이다. 이로 인해 NPL 시장에 대한 연구도 아직까지는 활발히 진행되지 않고 있는 상황이다. 본 연구는 NPL 시장의 각 물건 별 기준 수익률 달성 유무를 예측할 수 있는 모델을 제안한다. 모델 구축에 사용되는 종속변수는 물건 별 최종 수익률이 기준 수익률 수치 도달 여부를 나타내는 이항변수를 사용하였고, 독립변수로는 물건의 특성을 나타내는 11개의 변수를 대상으로 one to one t-test와 logistic regression stepwise, decision tree를 수행하여 의미있는 7개의 독립변수를 선별하였다. 그리고 통상적으로 사용되는 기준 수익률 수치(12%)가 의미있는 기준 수치인지 확인하기 위해 수치 값을 조절해가며 종속변수를 산출하여 예측모델을 구축해보았다. 그 결과 12%의 기준 수익률 수치로 산출한 종속변수를 이용하여 구축한 예측모델의 평균 Hit ratio가 64.60%로 가장 우수하다는 결과를 얻었다. 다음으로 선별된 7개의 독립변수들과 12%를 기준으로한 수익률 달성유무 종속변수를 이용하여 판별분석, 로지스틱 회귀분석, 의사결정나무, 인공신경망, 유전자알고리즘 선형 모델의 5가지 방법론을 적용해 예측모델을 구축해보았다. 5가지 방법론으로 도출한 예측 모델 간 Hit ratio를 비교한 결과 인공신경망을 이용하여 구축한 예측모델의 Hit ratio가 67.4%로 가장 우수한 결과를 도출해내었다. 본 연구를 통해 추후 NPL시장 신규 물건 매매에 있어서 7가지의 독립변수들과 인공신경망 예측 모델을 활용하는 것이 효과적임을 증명하였다. 물건의 12% 수익률 달성 여부를 사전에 예측해봄으로써 유동화회사가 투자 의사결정을 하는 데에 도움을 줄 것으로 예상하며, 나아가 NPL 시장의 거래가 적정한 가격 선에서 진행됨으로 인해 유동성이 더욱 높아질 것이라 기대한다.

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

현장실증시험에 의한 단일 및 이중필터층 우물의 해수 여과 특성 연구 (A Study on the Seawater Filtration Characteristics of Single and Dual-filter Layer Well by Field Test)

  • 송재용;이상무;강병천;이근춘;정교철
    • 지질공학
    • /
    • 제29권1호
    • /
    • pp.51-68
    • /
    • 2019
  • 국내에서는 바닷가 주변의 상가나 수협 등의 활어 위판장 등에 많은 양의 해수가 사용되고 있다. 이러한 해수는 기상악화나 태풍 등에 의해 관련시설이 수시로 파손되고 조기 폐색되어 시간적, 경제적 비용이 많이 소요되고 있는 실정이다. 또한 오염된 해수가 그대로 유입되는 경우가 많아 환경적인 문제를 야기하기도 한다. 본 연구는 직접적인 해수취수의 대안으로 이중필터취수정을 적용한 해변여과 방식의 해수취수 적용성을 평가하고자 수행하였다. 본 연구에서는 토층으로 이루어진 해변의 자유면대수층에서 필터조건을 달리하여 실규모의 이중필터취수정과 단일필터취수정을 각각 설치하고 설치된 우물에서 단계 및 연속대수성시험을 실시하여 필터재 조건에 따른 투수특성 및 적정양수량을 평가하였다. 단계대수성시험 분석결과 이중필터 취수정에서 우물 개량의 정도가 양호하여 단일필터 대비 110.3%의 투수계수 상승효과가 발생하는 것으로 분석되었다. 동일 양수량 대비 이중필터의 투수계수가 높게 나타나며, 이는 이중필터가 단일필터에 비해 투수성이 개선된 영향으로 판단된다. 연속대수성시험 분석결과 관측정 및 양수정을 이용한 투수계수 분석에서 이중필터취수정(SD1200)이 단일필터취수정(SS800)에 비해 높은 투수특성을 나타내는 것으로 평가되었으며, 이중필터가 단일필터 대비 평균 110.7%의 투수계수 상승효과가 발생하는 것으로 분석되었다. 수위강하량 분석을 통한 양수량 평가결과, 수위강하 2.0 m일 때 이중필터 취수정이 단일필터 취수정 대비 122.8% 양수량이 증대되는 것으로 분석되었으며, 비수위강하량을 이용하여 적정양수량을 산정한 결과 이중필터취수정이 단일필터취수정에 비해 136.0% 높은 양수량을 보이는 것으로 분석되었다. 또한 변곡점을 이용한 양수량 평가결과 이중필터가 단일필터에 비해 160.0% 높은 적정양수량을 보이는 것으로 분석되었다. 적정양수량의 경우 분석방법에 따라 단일필터 대비 122.8~160.0%의 개선효과가 있는 것으로 평가되었으며, 이를 평균한 단일필터 대비 이중필터의 양수량 개선율은 139.6%이다. 즉, 이중필터 설치만으로 일반적인 우물 대비 취수효율이 40% 정도 개선될 수 있음을 확인하였다. 변곡점을 이용한 이중필터취수정의 적정양수량은 2843.3 L/min로써 이중필터취수정 단일공의 일 해수취수량은 약 $4,100m^3/day$ (${\fallingdotseq}4094.3m^3/day$)에 달하는 것으로 평가되었다. 이와 같이 공당 다량의 취수가 가능하기 때문에 해수취수의 적용성이 높을 것으로 기대된다. 또한 이중필터취수정을 이용하여 해수취수를 수행하는 경우 기존에 문제시되었던 기상악화나 태풍 등에 의한 파손우려를 해소할 수 있으며, 해변의 모래층이 필터재 역할을 하여 오염정도를 개선하는 효과가 있을 것으로 기대된다. 따라서, 기존 해수취수기술에 대한 환경적인 문제 해결의 대안이 될 수 있고, 설치비용 및 파손등과 관련된 장기적인 유지관리비용 면에서도 유리하여 경제적 측면에서 그 적용성이 매우 높을 것으로 판단된다. 본 연구의 결과는 추후 수행예정인 이중필터취수정의 강변여과수 적용을 위한 현장실증시험의 기초자료로 활용될 예정이며, 그 결과를 종합하여 강변여과 및 해변여과기술과 관련된 우물의 설계 및 시공에 대한 표준화된 기준을 제시할 수 있을 것으로 기대된다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

대구 안심연료단지 환경오염물질 노출 평가(II) - TSP, PM10, PM2.5 및 중금속 농도분포 및 노출특성 - (Exposure Assessments of Environmental Contaminants in Ansim Briquette Fuel Complex, Daegu(II) - Concentration distribution and exposure characteristics of TSP, PM10, PM2.5, and heavy metals -)

  • 정종현;피영규;이준정;오인보;손병현;이형돈;윤미라;김근배;유승도;민영선;이관;임현술
    • 한국산업보건학회지
    • /
    • 제25권3호
    • /
    • pp.380-391
    • /
    • 2015
  • Objectives: The objective of this study is to assess airborne particulate matter pollution and its effect on health of residents living near Ansim Briquette Fuel Complex and its vicinities. Also, this study measured and analyzed the concentration of TSP, $PM_{10}$, $PM_{2.5}$, and heavy metals which influences on the environmental and respiratory disease in Ansim Briquette Fuel Complex, Daegu, Korea. Methods: In this study, we analyzed various environmental pollutants such as particulate matter and heavy metals from Ansim Briquette Fuel Complex that adversely affected local residents's health. In particular, we verified the concentration distribution and characteristics of exposure for TSP, $PM_{10}$, and $PM_{2.5}$ among particulate matters, and heavy metals(Cd, Cr, Cu, Mn, Ni, Pb, Fe, Zn, and Mg). In that regard, the official test method on air pollution in Korea for analysis of particulate matter and heavy metal in atmosphere were conducted. The large capacity air sampling method by the official test method on air pollution in Korea were applied for sampling of heavy metals in atmosphere. In addition, we evaluated the concentration of seasonal environmental pollutants for each point of residence in Ansim Briquette Fuel Complex and surrounding area. The sampling measured periods for air pollutants were from August 11, 2013 to February 21, 2014. Furthermore, we measured and analyzed the seasonal concentrations(summer, autumn and winter). Results: The average concentration for TSP, $PM_{10}$, and $PM_{2.5}$ by direct influence area at Ansim Briquette Fuel Complex were 1.7, 1.4 and 1.9 times higher than reference region. In analysis results of seasonal concentrations for particulate matter in four direct influence and reference area, concentration levels for winter were generally somewhat higher than concentrations for summer and autumn. The average concentrations for Cd, Cr, Mn, Ni, Pb, Fe, and Zn in direct influence area at Ansim Briquette Fuel Complex were $0.0008{\pm}0.0004{\mu}g/Sm^3$, $0.0141{\pm}0.0163{\mu}g/Sm^3$, $0.0248{\pm}0.0059{\mu}g/Sm^3$, $0.0026{\pm}0.0011{\mu}g/Sm^3$, $0.0272{\pm}0.0084{\mu}g/Sm^3$, $0.4855{\pm}0.1862{\mu}g/Sm^3$, and $0.3068{\pm}0.0631{\mu}g/Sm^3$, respectively. In particularly, the average concentrations for Cd, Cr, Mn, Ni, Pb, Fe, and Zn in direct influence area at Ansim Briquette Fuel Complex were 1.9, 3.6, 2.1, 1.9, 1.4, 2.6, and 1.2 times higher than reference area, respectively. The continuous monitoring and management were required for some heavy metals such as Cr and Ni. Moreover, the average concentration in winter for particulate matter in direct influence area at Ansim Briquette Fuel Complex were generally higher than concentrations in summer and autumn. Also, average concentrations for TSP, $PM_{10}$, and $PM_{2.5}$ were from 1.5 to 2.0 times, 1.2 to 1.8 times, and 1.1 to 2.3 times higher than reference area, respectively. In results for seasonal atmospheric environment, TSP, $PM_{10}$, $PM_{2.5}$, and heavy metal concentrations in direct influence area were higher than reference area. Especially, the concentrations in C station were a high level in comparison with other area. Conclusions: In the results, some particulate matters and heavy metals were relatively high concentration, in order to understand the environmental pollution level and health effect in surrounding area at Ansim Briquette Fuel Complex. The concentration of some heavy metals emitted from direct influence area at Ansim Briquette Fuel Complex were relatively higher than reference area. In particular, average concentration for heavy metals in this study were higher than average concentrations in air quality monitoring station for heavy metal for 7 years in Deagu metropolitan region. Especially, the residents near Ansim Briquette Fuel Complex may be exposed to the pollutants(TSP, $PM_{10}$, $PM_{2.5}$, and heavy metals, etc) emitted from the factories in Ansim Briquette Fuel Complex.