• 제목/요약/키워드: Data validation

검색결과 3,319건 처리시간 0.027초

옵티컬 플로우 방법으로 계산된 초기 바람 추정치에 따른 대기운동벡터 알고리즘 개선 연구 (Improvements for Atmospheric Motion Vectors Algorithm Using First Guess by Optical Flow Method)

  • 오유림;박형민;김재환;김소명
    • 대한원격탐사학회지
    • /
    • 제36권5_1호
    • /
    • pp.763-774
    • /
    • 2020
  • 수치예보모델의 예측 바람장은 대기운동벡터 알고리즘의 표적 추적 과정에서 추적 정확도 향상이나 계산 시간 단축을 위해 초기 추정치로 사용된다. 대기운동벡터는 수치예보모델의 자료동화 시 활용가치가 높다고 알려졌으나, 초기 추정치로 사용된 수치예보모델 바람장이 대기운동벡터의 검증 과정에 참 값으로 사용된다는 모순이 있다. 이를 해결하기 위해서는 수치예보모델로부터 독립적인 초기 추정치가 필요하다. 본 연구에서는 Lucas and Kanade 옵티컬 플로우 방법을 적용하여 바람장을 도출한 후 이를 초기 추정치로 사용함으로써 표적 추적과정에서의 모델 의존성을 제거하고 계산 속도를 향상시키고자 하였다. 대기운동벡터 산출에는 2015년 8월 18일 ~ 9월 5일 00, 06, 12, 18시 동안의 정지궤도 위성 Himawari-8/AHI의 14번 채널 Level 1B 자료를 사용하였다. 옵티컬 플로우 방법이 대기운동벡터 산출에 미치는 영향을 평가하기 위하여 다음과 같은 세가지 방법으로 교차 검증을 수행 하였다. (1) 초기 추정치 없이, (2) KMA/UM 예보바람장을 초기 추정치로 사용하여, 그리고 (3) 옵티컬 플로우 방법으로 계산된 바람장을 초기 추정치로 사용하여 대기운동벡터를 산출하고 ECMWF ERA-Interim 재분석장과 비교 검증한 결과, 옵티컬 플로우 기반 바람장을 초기 추정치로 사용한 경우에 가장 높은 정밀도를 보였다(RMSVD: 5.296-5.804 ms-1). 계산 속도는 초기 추정치를 사용하지 않은 경우에 가장 느렸고, 나머지 테스트는 유사한 속도를 보였다. 그러므로 대기운동벡터 알고리즘의 표적 추적 과정에 옵티컬 플로우 방법을 적용하면, 모델 의존성 없는 고품질 바람벡터의 산출이 가능할 것으로 사료된다.

KOSDAQ 시장의 관리종목 지정 탐지 모형 개발 (Development of a Detection Model for the Companies Designated as Administrative Issue in KOSDAQ Market)

  • 신동인;곽기영
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.157-176
    • /
    • 2018
  • 관리종목은 상장폐지 가능성이 높은 기업들을 즉시 퇴출하기 보다는 시장 안에서 일정한 제약을 부여하고, 그러한 기업들에게 상장폐지 사유를 극복할 수 있는 시간적 기회를 주는 제도이다. 뿐만 아니라 이를 투자자 및 시장참여자들에게 공시하여 투자의사결정에 주의를 환기시키는 역할을 한다. 기업의 부실화로 인한 부도 예측에 관한 연구는 많이 있으나, 부실화 가능성이 높은 기업에 대한 사회, 경제적 경보체계라 할 수 있는 관리종목에 관한 연구는 상대적으로 매우 부족하다. 이에 본 연구는 코스닥 기업들 가운데 관리종목 지정 기업과 비관리종목 기업을 표본으로 삼아 로지스틱 회귀분석과 의사결정나무 분석을 이용하여 관리종목 지정 예측 모형을 개발하고 검증하였다. 분석결과에 따르면 로지스틱 회귀분석 모형은 ROE(세전계속사업이익), 자기자본현금흐름률, 총자산회전율을 사용하여 관리종목 지정을 예측하였으며, 전체 평균 예측 정확도는 검증용 데이터셋에 대해 86%의 높은 성능을 보여주었다. 의사결정나무 모형은 현금흐름/총자산과 ROA(당기순이익)를 통한 분류규칙을 적용하여 약 87%의 예측 정확도를 보여주었다. 로지스틱 회귀분석 기반의 관리종목 탐지 모형의 경우 ROE(세전계속사업이익)와 같은 구체적인 관리종목 지정 사유를 반영하면서 기업의 활동성에 초점을 맞추어 관리종목 지정 경향성을 설명하는 반면, 의사결정 관리종목 탐지 모형은 기업의 현금흐름을 중심으로 하여 관리종목 지정을 예측하는 것으로 나타났다.

식품의 일상섭취량 추정을 위한 식품섭취빈도의 활용가능성 및 타당도 연구 (Validation of Food Intake Frequency from Food Frequency Questionnaire for Use as a Covariate in a Model to Estimate Usual Food Intake)

  • 이자윤;김동우
    • 한국조리학회지
    • /
    • 제23권2호
    • /
    • pp.64-73
    • /
    • 2017
  • 본 연구에서는 국민건강영양조사의 식품섭취빈도 조사로부터 식품섭취빈도를 산출한 후 이를 24시간 회상법에서 조사된 식품별 섭취량과의 상관관계를 탐색하여 식품 수준의 일상 섭취량을 추정할 때 식품섭취빈도를 공변수의 형태로 활용할 수 있을지 타진해 보기 위해 수행되었다. 국민건강영양조사에서 식품섭취빈도 조사가 수행되기 시작한 2012년부터 2014년까지 총 3개년도의 자료를 사용하였으며, 24시간 회상법과 식품섭취빈도 조사 모두를 수행한 10,945명을 대상으로 하였다. 분석을 위해 식품섭취빈도 조사지에 수록된 112개 항목별로 24시간 회상법에서 산출된 식품별 섭취량을 재산출하였으며, 이 결과와 각 개인이 식품섭취빈도 조사법에서 응답한 섭취빈도 및 섭취분량 간의 스피어만 상관계수를 산출하였다. 상관계수를 분석한 결과, 24시간 회상법의 섭취량과 식품섭취빈도법의 섭취빈도 간에는 총 112개 식품 중 59개 식품(52.2%)에서 통계적으로 유의한 양의 상관관계를 보였으며, 24시간 회상법의 섭취량과 섭취분량 간에는 102개 식품(90.3%)에서 통계적으로 유의한 양의 상관관계를 보였다. 곡류, 과일류, 난류, 두류, 생선류, 서류, 우유류, 육류, 음료류, 주류, 채소류, 해조류, 기타류의 13개 식품군으로 묶어 분석한 결과에서도 섭취빈도의 13개 군(100%)에서 통계적으로 유의한 상관관계를 보였으며, 생선류, 해조류, 기타류는 음의 상관을 보였고, 나머지 10개 항목은 양의 상관을 보였다. 본 연구를 통해 식품섭취빈도조사로부터 산출한 식품섭취빈도와 24시간 회상법 섭취량간의 일관된 상관관계를 확인할 수 있었으며, 이는 식품(군) 수준의 일상 섭취량을 추정할 때 식품섭취빈도를 중요한 공변수로 활용할 수 있는 근거가 된다고 하겠다.

북서태평양 GCOM-W1/AMSR2 해수면온도 검증 및 오차 특성 (Validation of GCOM-W1/AMSR2 Sea Surface Temperature and Error Characteristics in the Northwest Pacific)

  • 김희영;박경애;우혜진
    • 대한원격탐사학회지
    • /
    • 제32권6호
    • /
    • pp.721-732
    • /
    • 2016
  • 2012년 7월부터 2016년 8월까지 GCOM-W1/AMSR2 마이크로파 센서 자료와 해양 현장수온 관측 자료 사이에서 획득된 총 162,264개의 일치점 자료를 활용하여 북서태평양 해역에서의 마이크로파 해수면온도 정확도를 검증하고 오차 특성을 분석하였다. AMSR2 해수면온도는 실측 자료에 대해 $0.63^{\circ}C$의 평균제곱근오차와 $0.05^{\circ}C$의 편차를 보였다. 위성 해수면온도와 현장 관측 해수면온도의 차이는 풍속, 해수면 온도, 연안으로부터의 거리, 열전선 등 다양한 요인에 의해 발생되었다. AMSR2 해수면온도는 낮시간 동안 낮은 풍속(< 6 m/s)에서 실측 해수면온도보다 높게 산출되는 일변동(diurnal effect)에 의한 오차를 보였다. 또한 겨울철에 평균제곱근오차가 커지는 경향이 나타났는데, 이는 해상풍의 풍속이 커질수록 해수면의 방사율이 높아져 해수면온도 산출 시 양의 편차가 발생할 수 있으므로 겨울철의 강한 바람이 해수면온도 오차를 증가시킨 것으로 추정되었다. 이 외에도 저온에서 저하되는 민감도와 육지에 의한 자료오염 또한 AMSR2 해수면온도의 오차를 증가시키는 요인으로 작용할 수 있음을 확인하였다. 열전선에 따른 해수면온도 오차 특성을 분석한 결과 해수면온도의 공간 구배 크기가 커질수록, 열전선에 근접할수록 해수면온도 오차가 증가하였다. 본 연구는 북서태평양 해역 마이크로파 해수면온도의 정확도 검증 및 오차 특성 분석을 통해 향후 마이크로파 해수면온도를 활용하는 연구의 바탕을 마련하고자 하였으며, 연구 지역의 환경적 요인에 따라 발생할 수 있는 오차에 대한 분석이 선행되어야 보다 정확한 위성 관측 해수면온도를 얻을 수 있음을 제시하였다.

전산유체역학(CFD)을 이용한 유동층반응기 내부의 목질계 바이오매스 급속 열분해 모델 비교 및 검증 (Simulation and model validation of Biomass Fast Pyrolysis in a fluidized bed reactor using CFD)

  • 주영민;어승희;오광철;이강열;이범구;김대현
    • 에너지공학
    • /
    • 제24권4호
    • /
    • pp.200-210
    • /
    • 2015
  • 유동층반응기에서 바이오매스 급속 열분해의 모델화를 통해 열분해로부터 발생되는 바이오오일(Bio-oil) 및 비응축 가스(Non-condensable gas) 성분의 예측과, 이를 통한 수율 향상을 목표로 한다. 본 연구의 목적은 유동층반응기 내부에 투입된 바이오매스가 급속 열분해되는 동안 발생되는 생성물의 수율 예측과 실험 및 시뮬레이션 값을 비교 및 분석하는 것이다. 급속 열분해의 시뮬레이션을 위해 전산유체역학(Computational Fluid Dynamics, CFD) 프로그램이 사용되었으며, 바이오매스의 급속 열분해의 시뮬레이션을 위해 바이오매스 하위 구성 성분의 상세한 열분해 반응 경로가 적용되었다. 이 열분해 반응은 세부적으로 셀룰로오스(Cellulose), 헤미셀룰로오스(Hemicellulose) 및 리그닌(Lignin)의 반응을 포함하고 있으며, 열분해로부터 발생되는 주요 가스 성분은 이산화탄소($CO_2$), 일산화탄소(CO), 메탄($CH_4$), 수소($H_2$), 에틸렌($C_2H_4$)이다. 본 모델의 예측치와 기존 문헌(Mellin et al., 2014)의 실험 및 시뮬레이션 결과를 비교하였으며, 그 결과, $CH_4$, $H_2$$C_2H_4$의 경우, 각각 3.7%p, 4.6%p 및 3.9%p로 비교적 일치하게 예측되었지만, $CO_2$ 및 CO의 경우, 각각 9.6%p 및 6.7%p로 높게 예측되었다. 이러한 차이가 발생하는 이유는 이차 열분해 반응에서의 세부 반응조건에 해당되는 각각의 인자의 부재에 기인한 것으로 판단된다. 연구 결과, 시뮬레이션을 통한 모델화 접근이 가능한 것으로 판단되며, 추후에 연구된 모델화를 통해 바이오오일 및 기타 성분들의 예측도 가능할 것으로 판단된다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

미시적 주행행태를 반영한 후미추돌위험 평가모형 개발 (Development of the Risk Evaluation Model for Rear End Collision on the Basis of Microscopic Driving Behaviors)

  • 정성봉;송기한;박창호;전경수;고승영
    • 대한교통학회지
    • /
    • 제22권6호
    • /
    • pp.133-144
    • /
    • 2004
  • 안전측면에서 교통류를 효율적으로 운영${\cdot}$관리하기 위해서는 교통류의 위험정도를 명확하게 판단할 수 있는 기준 및 모형개발이 필요하다. 이를 위해, 본 연구에서는 불완전한 추종으로 인해 발생할 수 있는 교통류 위험을 후미추돌위험의 관점에서 파악하였다. 과거 사고 예측 및 도로위험도 평가모형의 경우 운전자 반응을 고려하지 않았기 때문에, 모형의 신뢰성에 다소 문제가 있는 것으로 나타났다. 본 연구에서는 이러한 한계 및 문제점을 극복하기 위해 사고발생 가능성이라는 개념을 도입함으로써 위험과 사고 사이에 존재하는 운전자 반응을 모형에 반영하였다. 즉, 추종이론 및 안정성 이론을 바탕으로 후미추돌과 관련된 미시적 변수 즉, 운전자의 반응시간과 감속도를 반영하여 운전자를 고려한 모형을 개발하였다. 위험도를 대표할 수 있는 지표 개발을 위해 소음영향평가에서 사용되는 척도를 활용하였으며, 상대적인 위험도 우위를 평가하기 위해 위험강도 및 지속시간을 고려한 ‘등가위험도’를 개발하였다. 서울시 도시고속도로를 대상으로 직접 실험${\cdot}$조사를 수행하였으며, 미시적 교통류 자료수집을 위해 직접 실험차량을 제작하였다. 수집된 자료를 바탕으로 구간별, 차로별, 교통상황별 위험도를 도출하였다. 모형에 의해 도출된 위험도를 해당구간에서 수집된 차로별 사고자료와 비교하여 본 결과, 교통상황 및 사고자료 패턴과 일치하는 결과를 보여주었다. 본 연구에서 개발된 모형은 안전진단 및 도로설계에서부터 첨단안전차량 제어알고리즘의 안전성평가에 이르기가지 다양한 분야에서 활용될 수 있다.

복사전달모의를 통한 중적외 파장역의 민감도 분석 및 지표면온도 산출 가능성 평가 (Evaluation of Sensitivity and Retrieval Possibility of Land Surface Temperature in the Mid-infrared Wavelength through Radiative Transfer Simulation)

  • 최윤영;서명석;차동환;서두천
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1423-1444
    • /
    • 2022
  • 본 연구에서는 대기 및 지표면 인자들에 대한 중적외 파장역의 복사휘도의 민감도를 복사전달모델인 MODerate resolution atmospheric TRANsmission (MODTRAN)6을 이용하여 분석하고 이를 이용하여 야간에 중적외 파장역 만을 이용한 지표면온도 산출 가능성을 평가하였다. 이를 기반으로 야간에 대해 다양한 조건을 반영한 지표면온도 산출식을 개발하고 처방 온도 자료와 현장 관측 자료를 이용하여 개발된 지표면온도 산출식의 수준을 평가하였다. 중적외 파장역을 활용한 위성 원격탐사에 주로 영향을 미치는 대기연직구조, 이산화탄소와 오존, 지표면온도의 일 변동, 지표면 방출률 그리고 위성의 관측각에 대해 민감도 실험을 실시하였다. 이때 분리대기창 기법 활용 가능성을 평가하기 위해 중적외 파장역을 투과율을 근거로 2개의 밴드로 분리한 후 민감도를 분석한 결과 밴드와 관계없이 대기연직구조에 가장 큰 영향을 받으며 지표면 방출률, 지표면온도의 일 변동, 위성의 관측각 순으로 영향을 받았다. 주요 변인 실험 모두에서 대기의 창에 해당되는 밴드 1은 민감도가 낮은 반면 오존과 수증기 흡수가 포함된 밴드 2에서는 민감도가 높아서 분리대기창 기법을 활용하여 지표면온도 산출이 가능할 것으로 판단하였다. 중적외 2개 밴드와 다양한 변인들을 이용하여 개발된 지표면온도 산출식은 복사모의 시 입력된 기준 지표면온도와 상관계수, 편의 그리고 root mean squared error (RMSE)가 각각 0.999, 0.023K과 0.437K의 수준을 보였다. 또한 26개의 현장관측 지표면온도 자료로 검증한 결과 상관계수는 0.993, 편의는 1.875K, RMSE는 2.079K을 보였다. 본 연구의 결과는 대기 및 지표면 조건이 야간의 중적외 두 밴드에 미치는 영향이 다른 특성을 이용하여 지표면온도를 산출할 수 있음을 제시한다. 따라서 향후에는 중적외 파장역 센서를 탑재한 위성자료를 이용하여 지표면온도를 산출하고 그 수준을 평가해 볼 필요가 있다.

오차 계산 방식에 따른 사료용 벼 품종의 품종모수 추정치 불확도 비교 (Comparison between Uncertainties of Cultivar Parameter Estimates Obtained Using Error Calculation Methods for Forage Rice Cultivars)

  • 조영상;현신우;김광수
    • 한국농림기상학회지
    • /
    • 제25권3호
    • /
    • pp.129-141
    • /
    • 2023
  • 작물 모형은 작물의 유전적 특성을 나타내는 품종모수를 요구하며, 품종모수는 작물의 개별 품종별로 추정되어야 한다. 품종모수의 추정에는 고품질의 많은 생육 자료가 요구되지만, 자료의 생산에 상당한 비용이 필요하다. 비교적 낮은 품질의 가용성이 높은 자료를 활용하는 대신, 대량의 랜덤 모수를 생성하고 이를 평가하여 품종모수를 추정할 수 있다. 본 연구에서는 SIMPLE 작물 모델의 불확도를 최소화하기 위해 품종모수 추정 방식을 비교하고, 두 앙상블 방식과 대한 비교를 하였다. 모수 추정을 위한 Metropolis-Hastings (MH) 알고리즘에 대한 목적함수로 로그 가능도(log-likelihood: LL)와 generic composite similarity measure (GCSM)를 사용하였다. 또한 품종모수의 평균값을 사용한 예측(Epm)과 개별 모수들로부터 얻어진 추정값의 평균값(Eem)의 일치도를 분석하여 앙상블 방식에 따른 불확도 변화를 파악하였다. 국내에서 재배되는 사료용 벼 품종인 조우 벼와 영우 벼를 대상으로 품종모수를 추정하였다. 2013년, 2014년, 2016년에 대한 수원, 전주, 나주, 익산에 위치한 실험포장에서 얻은 수량 관측 자료를 사용하였다. 또한 2016년부터 2018년까지 수원에서 보고된 별도의 수량 관측 자료를 사용하였다. 목적함수에 따라 추정된 품종모수의 분포에 차이가 있었다. LL을 통해 얻은 품종모수는 GCSM으로 얻은 품종모수보다 좁은 범위에 분포하였다. 두 가지 앙상블 접근법은 통계적으로 유의한 차이가 나타나지 않음을 확인하였다. GCSM의 상대적으로 높은 불확도는 수용확률을 조정하여 낮출 수 있다고 사료되고, Epm의 결과는 기존과 다른 앙상블 방식을 통해 적은 연산을 통해 불확도를 낮출 수 있음을 보인다.

임상 치과위생사의 치매 환자 치과 진료 시 주의 사항에 관한 지식측정 도구 개발 (Development of a Tool to Measure Knowledge of Clinical Dental Hygienists on Precautions for Dental Treatment of Dementia Patients)

  • 김나현;문소정;노희진;한선영
    • 대한치위생과학회지
    • /
    • 제6권2호
    • /
    • pp.79-89
    • /
    • 2023
  • 연구 배경 및 목적: 치매 유병률은 매년 증가하는 추세를 보이고 있으며, 치매와 구강 건강의 관련성에 대한 선행 연구들이 계속해서 진행되고 있다. 임상 치과위생사는 적절한 치과 의료서비스 제공을 위한 전문적인 역량이 필요하며, 치과위생사의 지식 수준을 객관적으로 측정할 수 있는 도구 개발이 필요하다. 이에 임상 치과위생사의 치매 환자 치과 진료 시 고려사항에 대한 지식 측정도구를 개발하고자 하였다. 연구 방법: 문헌 고찰을 바탕으로 예비문항을 구성하여 전문가 검증, 예비조사, 본조사를 진행하였다. 본조사는 임상 경력이 1년 이상인 치과위생사 220명을 대상으로 설문조사를 시행하였다. 수집된 자료를 바탕으로 타당도 분석, 신뢰도 분석을 진행하여 최종 문항을 선정하였고, 선정된 문항별 정답률을 확인하였다. 연구 결과: 수집된 자료 분석 결과, 총 40개의 예비문항 중 18문항이 삭제되어 총 6개 요인, 22문항이 선정되었으며, 선정된 문항의 Cronbach's α값은 0.791로 나타났다. 하위 항목 별 문항 수는 '치매 환자의 치과 진료 시 주의사항' 5문항, 치매 환자의 약물 부작용' 4문항, 치매 환자의 구강 관리 방법' 4문항, '치매 환자와의 의사소통' 4문항, '치매 환자의 심리적 반응' 3문항, '치매 환자 안내' 2문항으로 구성하였다. 정답률이 가장 높았던 문항은 '치매 환자 안내' 항목의 2번 문항이 98.6%, 정답률이 가장 낮았던 문항은 '치매 환자의 심리적 반응' 항목의 2번 문항이 5.9%로 나타났다. 결론: 본 연구를 통해 타당도와 신뢰도가 검증된 도구는 향후 임상 치과위생사와 치매 관련 후속 연구의 기반으로 활용할 수 있으며, 보수교육, 교육 프로그램 개발, 의료기관 내 업무 지침 개발의 기초 자료로 기여하고자 한다.