• 제목/요약/키워드: 데이터 정규화

검색결과 471건 처리시간 0.034초

베리오그램 최적화 기반의 정규크리깅을 이용한 전국 에어코리아 PM10 자료의 일평균 격자지도화 및 내삽정확도 검증 (Kriging of Daily PM10 Concentration from the Air Korea Stations Nationwide and the Accuracy Assessment)

  • 정예민;조수빈;윤유정;김서연;김근아;강종구;이달근;정욱;이양원
    • 대한원격탐사학회지
    • /
    • 제37권3호
    • /
    • pp.379-394
    • /
    • 2021
  • 우리나라에서는 2005년부터 전국 에어코리아(Air Korea) 측정소의 대기오염도 정보를 실시간으로 제공하고 있다. 선행연구들은 이러한 포인트 기반의 미세먼지 농도 자료에 대한 격자지도화 가능성을 보여준 바 있으나, 측정소가 밀집된 특정 도시만을 대상으로 하였다. 본 연구에서는 우리나라 전역의 PM10 일평균 격자 지도를 산출하기 위해서, 전국 333개 에어코리아 측정소 자료를 활용하여 베리오그램 최적화 기반의 정규크리깅을 수행하고, 검증지점의 공간적인 과밀(too dense) 및 과소(too sparse)를 방지하기 위하여 검증지점의 위치에 따른 선별적 임의추출을 통한 암맹평가를 실시하였다. 114,745건의 데이터로부터 365일 각각 다른 검증지점을 추출하는 암맹평가를 4회에 걸쳐 수행한 결과, MAE=5.697 ㎍/m3, CC=0.947의 정확도 통계량이 산출되어, 매우 효과적인 공간내삽이 이루어졌음을 확인할 수 있었다. 또한, PM10 고농도 사례(나쁨 및 매우 나쁨)로 분류된 1,500건 이상에 대해서도 MAE=11~12 ㎍/m3, CC=0.870~873의 정확도를 나타냈으며, 이는 본 연구의 방법론이 다양한 상황에 적용가능함을 의미한다. 2019년 365일에 대해 산출된 0.05° 해상도의 일평균 PM10 격자지도는 자연스러운 공간분포를 나타내는 것이 시각적으로도 확인되었다. 이러한 PM10 농도의 격자지도는 향후의 연구에서 익일 PM10 농도의 격자예측을 위한 입력자료로 활용될 수 있을 것이다.

'위기의 지구'에 대한 인지프레임 비교: 대학교 신입생들 대상으로 (A Comparison of the Freshmen's Cognitive Frame about the 'Crisis of Earth')

  • 정덕호;최현아;박선옥
    • 한국지구과학회지
    • /
    • 제37권2호
    • /
    • pp.117-131
    • /
    • 2016
  • 본 연구의 목적은 고등학교에서의 지구과학 I 이수 여부에 따른 대학교 신입생들의 '위기의 지구'에 대한 인지프레임을 비교하여 이것이 교육과정을 반영하고 있는지 확인하는 것이다. 이를 위해 정규 교육과정을 거쳐 고등학교를 졸업한 67명에게 위기의 지구에 대해 그림으로 표현하고 그에 대해 설명하도록 했으며, 그림으로부터 각각의 의미 단위를 추출하였다. 수집된 데이터는 언어네트워크 분석법을 통하여 단어 분석과 프레임 분석을 하고 이를 시각화 하였다. 그 결과는 다음과 같다. 첫째, 이수 집단과 비이수 집단에서 모두 '위기의 지구'에 대한 인지프레임을 구성할 때, 지구환경을 구성하는 각 영역을 서로 연결시켰으며 상호 영향을 미치면서 변화하는 관계로 인식하고 있는 것으로 나타났다. 둘째, 두 집단 모두 위기의 지구에 대한 인지프레임을 구성할 때 인간 활동과 관련지어 인식하고 있으며 특히 이수 집단에서 인지프레임을 구성할 때 교육과정을 충분히 반영했다고 할 수 있다. 다만 대부분의 학생들이 '위기의 지구'에 대해 지구 외적인 현상보다는 지구 내부의 현상과 강하게 연결시키고 있으므로 지구 내부뿐만 아니라 전 우주적인 관점에서 인식할 수 있도록 하고, 위기의 지구 문제 해결에 대한 당위성을 이해할 수 있도록 학교 현장에서의 노력이 필요하다.

통항분포함수 축방향 의존성에 관한 연구 (A Study on the Axial Dependence of the Traffic Distribution Function)

  • 유상록;강상근
    • 해양환경안전학회지
    • /
    • 제21권2호
    • /
    • pp.179-187
    • /
    • 2015
  • 본 연구의 목적은 통항분포함수 계산 시 적용하는 기준선의 방향과 기준점의 수평위치 및 수직위치에 따라서 통항분포함수가 변하는 양상을 식별하기 위한 것이다. 목포항 입구에 있는 항로를 대상으로 2013년 1월달의 AIS 실측자료를 이용하여 기준선의 방향(${\theta}$), 수평위치($\mathfrak{L}_H$) 및 수직위치($\mathfrak{L}_V$) 등의 3가지 변수가 통항분포함수의 평균($\bar{x}$)과 표준편차(${\delta}$)에 미치는 영향을 실험하였다. 실험결과, ${\theta}$에 따라 추출되는 샘플 데이터가 달라지기 때문에 ${\theta}$의 변화에 따라서 $\bar{x}$${\delta}$가 변화됨을 나타냈고, ${\theta}$에 따른 $\bar{x}$${\delta}$의 변화는 사인(sine)함수 합의 관계로 도출되었다. 또한 항로가 복잡한 해역에서 최적의 통항분포함수를 결정하기 위해서는 ${\delta}$의 변화 값이 최소가 되는 ${\theta}$을 기준선의 방향으로 설정하는 것이 타당함을 알았다. 본 연구의 결과는 정규분포가 보다 더 정량화된 수치로 표현되어 해상교통흐름을 파악하고 해상교통안전관리 의사결정을 위한 기초자료로 활용될 것으로 판단된다.

유전자 발현 메트릭에 기반한 모수적 방식의 유의 유전자 집합 검출 비교 연구 (A Comparative Study of Parametric Methods for Significant Gene Set Identification Depending on Various Expression Metrics)

  • 김재영;신미영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권1호
    • /
    • pp.1-8
    • /
    • 2010
  • 최근 마이크로어레이 데이터를 기반으로 두 개의 샘플 그룹간에 유의한 발현 차이를 나타내는 생물학적 기능 그룹을 검출하기 위한 유전자 집합 분석(gene set analysis) 연구가 많은 주목을 받고 있다. 기존의 유의 유전자 검출 연구와는 달리, 유전자 집합 분석 연구는 유의한 유전자 집합과 이들의 기능적 특징을 함께 검출할 수 있다는 장점이 있다. 이러한 이유로 최근에는 PAGE, GSEA 등과 같은 다양한 통계적 방식의 유전자 집합 분석 방법들이 소개되고 있다. 특히, PAGE의 경우 두 샘플 그룹간의 유전자 발현 차이를 나타내는 스코어의 분포가 정규 분포임을 가정하는 모수적 접근 방식을 취하고 있다. 이러한 방법은 GSEA 등과 같은 비모수적 방식에 비해 계산량이 적고 성능이 비교적 우수한 장점이 있다. 하지만, PAGE에서 유전자 발현 차이를 정량화하기 위한 메트릭으로 사용하고 있는 AD(average difference)의 경우, 두 그룹간에 절대적 평균 발현 차이만을 고려하기 때문에 실제 유전자의 발현값 크기나 분산의 크기에 따른 상대적 중요성을 반영하지 못하는 문제가 있다. 본 논문에서는 이를 보완하기 위해 실제 유전자의 발현값 크기나 그룹 내 샘플들의 분산 정보 등을 스코어 계산에 함께 반영하는 WAD(weighted average difference), FC(Fisher's criterion), 그리고 Abs_SNR(Absolute value of signal-to-noise ratio)을 모수적 방식의 유전자 집합 분석에 적용하고 이에 따른 유의 유전자 집합 검출 결과를 실험을 통해 비교 분석하였다.

3×3 분할요인모형의 검정력 비교연구 (Power comparison for 3×3 split plot factorial design)

  • 최영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.143-152
    • /
    • 2017
  • 블럭내의 완전랜덤화 제약은 하나의 블럭이 여러 실험구로 분할되는 분할요인모형으로 해결할 수 있다. 본 연구는 $3{\times}3$ 분할요인모형에서 두 주요인 및 하나의 블럭이 모두 고정일 경우에는, 실제로 존재하는 효과크기가 작을수록 혹은 검정대상의 요인효과 크기보다 검정대상 이외의 효과들의 크기가 상대적으로 작을수록 주구요인효과 및 세구요인효과 검정을 위한 순위변환 통계량의 검정력은 기존의 모수적 통계량의 검정력보다 뛰어남을 알 수 있다. 또한 모집단 모형의 오차항이 지수분포 및 이중지수분포일 때 효과크기 및 효과구성유형에 상관없이 거의 모든 상황하에서 순위변환 통계량의 검정력이 모수적 통계량의 검정력보다 상대적으로 높은 우위를 보이며, 정규분포 및 균일분포하에서는 상당히 유사한 수준을 나타낸다. 한편 두 주요인은 고정이나 하나의 블럭이 랜덤일 경우에는, 두 주요인 및 블럭이 모두 고정일 경우보다 모수적 통계량 및 순위변환 통계량의 검정력은 각각 낮은 수준을 보인다. 특히 주구요인효과 검정보다 세구요인효과 검정을 위한 모수적 통계량 및 순위변환 통계량의 검정력이 다소 낮은 수준임을 보이지만, 순위변환 통계량의 검정력은 모수적 통계량의 검정력에 비하여 높은 상대적 검정력 우위를 나타낸다.

농업환경 분야에서 토양 리질리언스 분야별 평가 방법 (Evaluation Methods of Soil Resilience Related to Agricultural Environment)

  • 김민석;민현기;현승훈;김정규
    • Ecology and Resilient Infrastructure
    • /
    • 제7권2호
    • /
    • pp.97-113
    • /
    • 2020
  • 토양은 인간의 삶의 터전이자 식량안보를 책임질 수 있는 근간으로, UN의 지속가능한 개발 목표에서도 중요하게 다루고 있다. 농업환경에서 토양 리질리언스는, 불확실성과 예측불가능성이 높은 시대에 건전하고 지속가능한 토양 관리를 위해 반드시 필요한 연구분야이다. 토양 리질리언스의 정의는 연구자들마다 조금씩 다르나 교란에 대한 회복과 저항 개념을 공통적으로 포함하고 있다. 본 연구에서는 다양한 종류의 교란에 대한 토양 리질리언스의 반응을 평가하기 위하여 사용된 토양의 물리적, 화학적, 생물학적 특성들을 정리하였다. 이어서 토양 리질리언스 연구의 시공간적 범위가 넓은 것에 기인한 다양한 통계 처리 기법들과 리질리언스 정량화 방법들을 정리하였다. 또한 많은 토양 리질리언스 연구들은 공통적으로 (1) 토양 및 부지 선정 (2) 스트레스 및 교란 (독립변수) 설정 (3) 토양 특성 및 지표 (종속변수) 설정 (4) 다양한 시공간적 규모 (scale) 실험 수행 (5) 데이터 통계분석 등 5단계에 걸쳐 수행되어왔음을 확인할 수 있었다. 선행 및 이번 연구를 통해 토양 리질리언스의 일반적 개론을 다루었으며, 이를 바탕으로 국내 농업 환경을 고려한 실질적인 연구가 수행되어야 할 것이다.

ARIMA-Intervention 시계열 모형을 이용한 인천국제공항 식음료 매출 분석 및 추정 연구 (Analysis and Estimation of Food and Beverage Sales at Incheon Int'l Airport by ARIMA-Intervention Time Series Model)

  • 윤한영;박성식
    • 한국산학기술학회논문지
    • /
    • 제20권2호
    • /
    • pp.458-468
    • /
    • 2019
  • 본 연구는 2015년 6월부터 2018년 8월까지 인천국제공항 여객터미널에서 발생한 품목별 식음료 매출액(POS) 데이터를 기반으로 2020년 12월까지 식음료 매출액을 추정하고자 하였다. 이를 위해 연구자는 시계열 분석기법들 중 하나인 ARIMA-Intervention(개입모형)을 이용하여 인천국제공항 식음료 매출액에 영향을 미칠 것으로 판단되는 주요 시계열 영향변수들을 구분하고 그에 따른 변화폭을 추정하였고 그 결과를 토대로 향후 발생가능할 것으로 예측되는 식음료 월별 매출액을 추정하는 것을 목적으로 한 것이다. 개입변수는 국내 THAAD 배치에 따른 중국 정부의 2016년 7월부터 2017년 12월까지 한국 방문을 자제를 권고한 한한령으로 설정하였다. 정상 예측치의 경우에 비록 식사 매출 상승세가 둔화되었다 하더라도 하계 극성수기인 2019년 7월 203억, 2019년 8월 212억으로 월별 매출액이 200억을 돌파할 것으로 예측되며 2020년에는 각각 214억 및 221억으로 증가할 것으로 예측되었다. 음료 매출액은 2019년 7월에는 77억, 2019년 8월에는 81억으로 예측되며 2020년에는 79억 및 82억으로 증가할 것으로 전망되었다. 저비용항공사들은 정규항공사에 비해 식음료 서비스가 전무하거나 유료화 정책으로 운영하기 때문에 저비용항공사 이용객들은 여객터미널에서 출국 및 입국 시 식음료 서비스를 이용하는 빈도가 높을 수 밖에 없을 것이다. 앞서 예측자료에 제시된 것처럼 식음료 매출은 저비용항공사의 성장과 동반하여 증대될 가능성이 높을 것이다.

하천 녹조 모니터링을 위한 드론 다중분광영상의 분광지수 적용성 평가 (Application of Spectral Indices to Drone-based Multispectral Remote Sensing for Algal Bloom Monitoring in the River)

  • 최은영;정경미;윤종수;장정희;김미정;이호중
    • 대한원격탐사학회지
    • /
    • 제37권3호
    • /
    • pp.419-430
    • /
    • 2021
  • 신속하게 면단위(2-Dimension)로 하천의 녹조 우심지역을 관측하기 위해 드론 다중분광영상을 이용한 분석기법을 연구하였다. 드론은 항공기나 위성에 비해 관측 면적이 작지만 높은 공간해상도와 현장접근 및 데이터 획득 용이성, 대기에 의한 간섭 저감, 다중분광센서를 이용한 신속한 자료처리로 녹조 모니터링 효율성을 향상시킬 수 있을 것으로 보고 있다. 이러한 드론의 다중분광센서 영상으로 하천의 녹조발생 현황을 모니터링하기 위해 광합성 색소에 의한 분광특성을 반영하는 분광지수들을 비교 분석하고 Chlorophyll-a(Chl-a) 농도 추정식에 적용 가능성을 평가하였다. 주로 Red-edge 밴드를 포함하는 분광지수가 Chl-a 농도와 높은 상관성을 보였는데, 그 중에서도 3-Band Model(3BM), Normalized Difference Chlorophyll Index(NDCI)가 각각 비슷한 수준으로 가장 높은 통계적 유의성(R2=0.86, RMSE=7.5)을 나타내었다. NDCI의 경우에는 두 개의 분광밴드만 적용되는 간결한 수식과 정규화된(Normalizing) 결과값으로 신속하고 표준화된 프로세싱이 가능할 것으로 보이며 드론 녹조 모니터링에서 적용성이 높을 것으로 기대된다. 3BM의 경우에는 Red-edge 영역에서 두 개의 파장대를 적용해야 하나 본 연구에서 사용한 드론 센서에는 한 개의 Red-edge 밴드만 포함되어서 근적외선으로 대체하여 수식을 적용하였는데 Red-edge 파장영역이 세밀한 분광센서를 활용할 경우에 NDCI 보다 높은 정확도를 나타낼 수 있을 것으로 보인다.

중·북부지역에서 재배된 GM 배추와 Non-GM 배추간의 식물체 특성 및 영양 성분 비교 분석 (Comparison of the Plant Characteristics and Nutritional Components between GM and Non-GM Chinese Cabbages Grown in the Central and Northern Parts of Korea)

  • 조동욱;오진표;박권우;이동진;정규환
    • 원예과학기술지
    • /
    • 제28권5호
    • /
    • pp.836-844
    • /
    • 2010
  • 본 연구는 GM 배추와 non-GM 배추 계통간의 식물체 생장 특성, 지방산의 조성 및 무기 영양 성분을 분석하여 GM 작물의 평가를 위한 기초 자료로 이용하고자 실시하였다. GM 배추(SKCP)와 모본(SC) 계통을 중부지역과 북부지역에서 2008년 가을과 2009년 봄과 가을에 밀식 및 일반 배치시험구로 나누어 40일간 재배하고 수확 후 특성을 조사하여 SKCP 계통과 SC 계통간의 차이점 및 재배 지역간의 차이를 분석하였다. 밀식 배치 시험구에서 재배된 배추 식물체의 최외각 엽의 특성 9개 항목에 대하여 조사한 결과, 두 지역에서 재배된 SKCP 계통과 SC 계통간에 통계적 유의차는 두 항목(잎의 모양과 모용수)을 제외하곤 크게 나타나지 않았다. 식물체의 지상부의 특성 6개 항목과 지하부의 특성 3개 항목을 조사한 결과, 두 지역 모두에서 SKCP 계통과 SC 계통간의 통계적 유의차는 거의 나타나지 않았다. 다만, 중륵의 길이가 두 지역에서 계통간 약간의 유의차를 보였으며, 재배 지역간에도 통계적 유의차가 발생하였다. 중부와 북부지역의 일반 배치 시험구의 경우 최외각 잎의 특성을 조사한 결과, 9개의 조사 항목 중 4개의 조사 항목에서 SKCP 계통과 SC 계통간의 통계적 유의차를 보였다. 특히 잎의 길이에서는 계통간, 재배 지역간 그리고 재배 시기별로 변이가 나타나는 것으로 조사되었다. 또한 식물체의 지상부 특성 9개의 조사 항목 중 5개의 항목에서 통계적 유의차가 발생하였으며, 생체중 무게와 중륵의 길이와 넓이에서는 계통간, 지역간 그리고 시기별로 유의차가 크게 나타났다. 2009년도 가을에 중부와 북부 지역의 일반 배치 시험구에서 재배된 배추 식물체의 잎에 존재하는 주된 지방산은 palmitic acid, oleic acid, stearic acid, linoleic acid 및 linolenic acid인 것으로 조사되었다. 5 가지 지방산의 총 함량은 재배 지역 및 식물 계통간에 통계적 유의 차가 없었으나 linolenic acid를 제외한 4가지 지방산은 중부와 북부 지역에서 SKCP 비해 SC 계통이 건중량 1g당 함량이 다소 높은 것으로 조사되었다. 배추 식물체의 잎에 존재하는 무기영양성분의 함량을 조사한 결과, 다량 원소는 질소(N), 인(P), 칼슘(Ca), 칼륨(K), 마그네슘(Mg) 및 나트륨(Na)의 6가지이었고 미량원소는 구리(Cu), 철(Fe), 망간(Mn) 및 아연(Zn)의 4가지로 조사되었다. 무기영양 물질의 대사체 분석 데이터를 표준화 작업하여 스코어를 통해 시각화하여 본 결과, GM 및 non-GM 계통간에 특이적 변이에 따른 클러스터 형성은 확인할 수 없었으나, 지역간 차이에 따른 클러스터 형성은 확인할 수 있었다.

하동녹차 재배지역의 기상요소별 분석 (Analysis of Meteorological Elements in the Cultivated Area of Hadong Green Tea)

  • 황정규;김종철;조경환;한재윤;김루미;김연수;정강원;김용덕
    • 한국농림기상학회지
    • /
    • 제12권2호
    • /
    • pp.132-142
    • /
    • 2010
  • 우리나라에서 대표적 녹차재배 지역인 화개지역과 악양지역의 2009년 기상특성을 정리하면 화개지역과 악양지역의 연평균 기온은 각각 $14.5^{\circ}C$$14.2^{\circ}C$이며, 두 지역의 월평균기온을 보면 가장 더운 달은 8월로 각각 $25.4^{\circ}C$$24.9^{\circ}C$이고 가장 추운 달은 1월로 각각 $0.3^{\circ}C$$0.2^{\circ}C$ 이었으며, 일 최고기온은 각각 $28.4^{\circ}C$$27.9^{\circ}C$이고 일 최저기온은 $-5.0^{\circ}C$$-5.4^{\circ}C$이다. 연평균일교차는 화개지역이 $11.3^{\circ}C$이고 악양지역은 $11.1^{\circ}C$이다. 화개와 악양지역의 연평균습도는 각각 62.7%와 65.3% 이고, 연강수량은 1,387mm와 1,793mm로 2008년 대비 각각 605mm와 835mm가 더 내렸고, 5월부터 8월까지 화개 1,074mm, 악양 1,374mm로 집중적인 강수량을 보였다. 이것은 2009년 전체 강수량의 77.6%와 76.6%에 해당하는 수치로써 나머지 달에 비해 많은 강수량을 보임을 알 수 있다. 연평균 일조시간은 2,054.3시간으로 관측되었고 4, 5월에 각각 232.2시간과 235.1시간으로 가장 긴 일조시간을 보인 반면에 7, 8월에는 각각 102.5시간과 28.8시간으로 가장 짧은 일조시간을 보였다. 풍향은 가을과 겨울에 서북서, 서, 북서계열의 서풍이 불었고 봄, 여름철에는 남동, 북북동, 남동계열의 동풍이 불었으며, 연평균 풍속은 1.5m/s로 관측 되었으며 12월이 2.0m/s로 평균 풍속이 가장 높은 달이었고 2월이 1.1m/s로 평균풍속 이 가장 낮은 달이었다. 순간최대풍속은 3월 13일에 측정된 23.3m/s이었다. 2009년 조사된 기상관측정보를 토대로 매년 기상관측정보를 데이터화해서 녹차재배지역의 기상환경을 이해하고 생장환경 정보를 수집하며 최적의 녹차재배 환경의 기초자료로 활용할 수 있을 것으로 기대한다.