• 제목/요약/키워드: 데이터 샘플링

검색결과 510건 처리시간 0.028초

ISE 기반의 임베디드 시스템을 이용한 실시간 수경재배 양액 모니터링 (Real-time Nutrient Monitoring of Hydroponic Solutions Using an Ion-selective Electrode-based Embedded System)

  • 한희조;김학진;정대현;조우재;조영열;이공인
    • 생물환경조절학회지
    • /
    • 제29권2호
    • /
    • pp.141-152
    • /
    • 2020
  • 본 연구는 양액 내 존재하는 다량 영양소의 농도를 실시간으로 측정하기 위해 이온 선택 전극 (ISE) 으로 구성된 임베디드 시스템의 개발을 보여준다. NO3, K 및 Ca 이온을 감지하기위한 PVC ISE, H2PO4를 감지하기위한 코발트 전극, 기준 전극, 샘플 용액이 담기는 챔버, 펌프 및 밸브를 사용하여 측정하는 시스템으로 구성된다. 양액 샘플양 조절과 데이터 수집을 위해서 데이터 Due 보드가 사용되었고, 각각의 샘플 측정 전에, 측정 중 발생하는 드리프트를 최소화시키기 위해 2 점 정규화 방법을 사용하였다. PVC 멤브레인을 기반으로 한 NO3 및 K 전극의 농도 예측 성능은 표준 분석기의 결과와 근접한 일치 (R2 = 0.99) 나타내며 만족스러운 결과를 나타냈다. 하지만, Ca II 이온 투과체 제조된 Ca 전극은 고농도 양액 농도에서 Ca 농도를 55 %로 낮게 측정하였다. 코발트 전극 기반 인산 측정은 반복측정 중에 발생한 코발트 전극의 불안정한 신호로 인해 표준 방법과 비교하여 45 ~ 155 mg / L의 인산 농도 범위에서 24.7 ± 9.26 %의 비교적 높은 오차를 나타냈다. 수경 P 감지의 예측 능력을 향상시키기 위해 코발트 전극의 신호 컨디셔닝에 대한 추가 연구가 필요함으로 판단된다.

3차원 포인트 클라우드 기반 복셀화에 의한 식생의 물리적 구조 재구현 (Reconfiguration of Physical Structure of Vegetation by Voxelization Based on 3D Point Clouds)

  • 안명희;장은경;배인혁;지운
    • 대한토목학회논문집
    • /
    • 제40권6호
    • /
    • pp.571-581
    • /
    • 2020
  • 하천에 광범위하게 활착되는 식생은 수위 변화 및 흐름 저항에 절대적인 영향을 미칠 뿐만 아니라 하천 시스템 전반에 영향을 미치는 중요 요소이다. 따라서 유입되는 식생의 형태와 규모를 정확하게 파악하는 것이 매우 중요함에도 불구하고 현장에서 이를 파악하기란 쉽지 않은 일이다. 따라서 최근에는 지상 레이저 스캐닝 등을 활용하여 대용량의 식생 정보를 취득하는 연구가 시도되고 있다. 그러나 식생의 복잡한 형상으로 인해 캐노피 영역의 정확한 정보를 획득하기 어려우며, 자연적인 영향에 매우 민감하게 반응한다는 한계가 있다. 본 연구에서는 3차원 지상 레이저 스캐닝을 통해 수집된 고해상도의 포인트 클라우드 데이터를 복셀 형식으로 재구현하여 식생의 물리적 구조를 분석하였다. 먼저 잎이 없는 단순한 형태, 잎이 있는 완전한 형태의 식생 및 패치 규모 식생 조건으로 설정하여 각각의 물리적 구조를 분석하였다. 이를 위해 측정된 데이터의 이상치 제거 및 불필요한 데이터의 필터링을 위해 통계적 이상치 제거 방법을 활용하여 각각 17 %, 26 %, 25 %의 포인트를 제거하였다. 또한 후처리 된 포인트 클라우드로부터 복셀 크기별 식생 형상을 재구현하여 실제 식생의 부피와 비교하였으며, 분석 결과, 오차 범위는 각 조건별로 8 %, 25 %, 63 %로 나타났다. 대상 샘플의 규모가 클수록 더 큰 오차가 발생하였으며, 복셀 크기 조정 시 식생의 표면이 시각적으로 비슷하게 보이지만 전체 식생의 부피는 이러한 변화에 매우 민감한 것으로 나타났다.

빅데이터를 활용한 공공계약의 입찰참가자수 영향요인 분석 (Influencing Factors Analysis for the Number of Participants in Public Contracts Using Big Data)

  • 최태홍;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.87-99
    • /
    • 2018
  • 본 연구는 공공계약의 여러 가지 형태 중 나라장터(KONEPS)를 통해 체결된 물품구매, 용역, 시설공사 등의 계약 자료를 수집하여 공공계약에서 입찰참가자수의 영향요인을 분석한다. 공공계약에서 입찰참가자수가 중요한 이유는 경쟁성 확보를 통한 합리적 계약 체결여부를 판단하는 최소한의 기준이 될 수 있으며, 발주기관의 예산절감 또는 입찰참가자의 수익성과 밀접한 관계가 있기 때문이다. 연구 목적은 공공계약에서 입찰참여자들의 입찰참여 여부는 어떤 요인에 의해 결정되는지를 분석하여 현재 공공계약에서 입찰참여에 관한 문제점과 정책적 시사점을 제시하기 위한 것이다. 본 연구는 5만여 공공기관이 나라장터로 발주하여 30만여 개인사업자 및 법인이 참여한 435만여 물품구매, 용역, 시설공사 등 많은 계약 건을 비교 분석함으로써 기존의 샘플링 기반 연구와의 차별성을 가진다. 연구모형으로 공고일수, 예산금액, 계약방법, 낙찰방법 등을 독립변수로, 입찰참가자수를 종속변수로 각각 도출하여 활용한다. 조사 분석은 빅데이터 및 다차원 분석기법을 사용한다. 분석결과 첫째, 공공발주 사업의 예산금액의 규모가 클수록 입찰참가자수가 적고, 이는 입찰참가자들이 예산금액이 클수록 수주할 확률이 매우 낮아진다고 인지하는 것에 기인한 것으로 공공사업에 대한 신뢰성 제고를 위하여 분리발주에 대한 제도적 장치가 필요하다는 것을 의미한다. 둘째, 계약방법으로는 제한경쟁이 일반경쟁 보다 입찰참가자수가 많고, 이는 계약방법이 입찰참가자수와 공공사업의 예산절감에 영향을 줄 수 있다는 것을 의미한다. 셋째, 공고일수는 입찰참가자수에 유의미한 영향을 미치지 않았으며 이는 나라장터를 통해 많은 개인사업자 및 법인들이 입찰정보를 숙지하고 있어 정보불균형의 문제는 심각하지 않다는 것을 의미한다. 넷째, 낙찰방법으로는 적격심사낙찰제가 최저가낙찰제 보다 입찰참가자수가 많고, 이는 낙찰방법이 입찰참가자수와 입찰참가자의 수익성에 영향을 줄 수 있다는 것을 의미한다.

리프팅 스킴의 2차원 이산 웨이브릿 변환 하드웨어 구현을 위한 고속 프로세서 구조 및 2차원 데이터 스케줄링 방법 (A Fast Processor Architecture and 2-D Data Scheduling Method to Implement the Lifting Scheme 2-D Discrete Wavelet Transform)

  • 김종욱;정정화
    • 대한전자공학회논문지SD
    • /
    • 제42권4호
    • /
    • pp.19-28
    • /
    • 2005
  • 본 논문에서는 리프팅 스킴의 2차원 고속 웨이블릿 변환에서 2차원 처리 속도를 향상시키고, 내부 메모리 사이즈를 감소시키는 병렬 처리 하드웨어 구조를 제안한다. 기존의 리프팅 스킴을 이용한 병력 처리 2차원 웨이블릿 변환 구조는 행 방향의 예측, 보상 연산 모듈과 열 방향의 예측 보상 연산 모듈로 구성되며, 2차원 웨이블릿에서 역 방향 변환을 위해서는 행 방향의 결과가 나와야 하고, 열 방향 연산을 위한 데이터가 연속적으로 발생하는 것이 아니라 행 방향의 샘플 데이터 수만큼의 시차를 갖고 발생함으로 내부 버퍼를 사용하고 있다. 이에 제안하는 구조에서는 행 방향 연간에 있어서 짝수 행과 홀수 행을 동시에 할 수 있도록 하드웨어 구조와 데이터 흐름을 구성하여 속도를 향상시키고, 열 방향 연산의 시작 지연 시간을 단축 시켰다. 그리고, 행 방향 처리 결과를 버퍼에 저장하지 않고 열 방향 연산의 입력으로 사용할 수 있도록 열 방향 처리 모듈을 개선하였다. 제안하는 구조는 입력 데이터를 4개의 분한 셋으로 분할하여 기존의 2개의 입력 데이터를 동시에 처리하는 방식에서 4개의 입력 데이터를 동시에 받아 처리 할 수 있도록 데이터의 흐름과 각 모듈의 연산 제어를 구성하였다. 그 결과 행 방향연산 속도를 향상시키고, 열 방향 연산 수행의 지연을 줄여 내부 버퍼 메모리를 절반으로 줄일 수 있었다. 제안하는 데이터흐름과 하드웨어 구조를 이용하여 VHDL을 이용하여 설계한 결과 기존의 $N^2/2+\alpha$의 전체 처리 시간을 $N^2/4+\beta$로 줄이는 결과를 얻었고, 내부 메모리 역시 기존의 방법에 비해 최대 $50\%$까지 줄이는 결과를 얻을 수 있었다.이 길었다. D, F 2개 시험구의 부화된 계통수는 각 48계통, 29계통으로 전체 조사계통의 15.6%, 9.4%를 차지하였다. D, F시험구의 평균부화비율은 각 54.5%, 71.6%였으며 평균사란비율은 각 33.0%, 25.0%였다 이상의 시험 결과를 보면 D, F 두 시험구 모두 최청사란비율이 일반계통보다 높게 나타나 월년잠종의 2년간 냉장보존을 위해서는 최청사란비율에 직접적으로 작용하는 최청 조건의 재검토가 우선적으로 필요함을 알 수 있었다.L)보다 높았다. 특히, 0.5 mM의 salicylic acid를 처리한 경우는 control에 비해 1.74배로 증가하였다. Methyl jasmonate 100 mM을 배양 6일째 첨가했을 때의 세포생장 변화를 보면, 첨가 후 2일이 지나면서부터 세포의 양이 크게 감소하기 시작하여 첨가 4일 후부터는 변화가 없었다. 따라서 methyl jasmonate를 처리 후 4일이 지나면 세포가 모두 죽는다는 것을 알 수 있었다. Methyl jasmonate 100 mM을 첨가한 후 4일째에 수확한 세포로부터 나온 oleanolic acid의 앙은 5.3 mg/L로 매우 적었다. 반면에 첨가 후 2일째에 수확한 세포로부터 나온 양은 94.1 mg/L로 control (43.4 mg/L)에 비해 2.17배로 증가되었다.재래시장과 백화점에서 시판되고 있는 계란 총 446개에 대해서도 동일한 절차와 방법으로 조사하였던바, 재래시장에서 구입했던 계란의 난각부분(Egg-shell)에서만 가금티푸스(fowl Typhoid)의 병원체인 S. gallinarum이 1주$(0.2\%)$만이 분리되었고, 기타 세균으로서는 대장균군이 역시 난각에서 가장 높은 빈도로 분리되었고,

복잡도 기반 적응적 샘플 오프셋 병렬화 (Complexity-based Sample Adaptive Offset Parallelism)

  • 유은경;조현호;서정한;심동규;김두현;송준호
    • 방송공학회논문지
    • /
    • 제17권3호
    • /
    • pp.503-518
    • /
    • 2012
  • 본 논문은 High Efficiency Video Coding (HEVC)의 인-루프 필터 기술인 Sample Adaptive Offset (SAO)에 대하여 복잡도 분석기반의 병렬화 방법을 제안한다. HEVC의 SAO는 쿼드트리 기반으로 영상을 다수의 SAO영역으로 분할하고, 각 영역 단위로 에러 보정을 위한 오프셋 값을 전송함으로써 복호화된 화소의 에러를 보정한다. HEVC의 SAO는 데이터 레벨의 병렬화를 통하여 고속화할 수 있는데, SAO영역 단위의 데이터 레벨 병렬화는 영역의 크기가 일정하지 않아 멀티 코어를 사용한 병렬화시 작업량 불균형(Workload imbalance)이 발생한다. 또한, SAO는 영역 단위로 필터링 적용 여부가 결정되므로 균둥하게 SAO영역을 각 코어에 할당하더라도, 작업량 불균형이 발생할 수 있다. 본 논문에서는 SAO영역의 최소 단위인 Largest Coding Unit (LCU)를 SAO 수행의 기본단위로 하여, 각 단위에서의 SAO 파라미터 정보를 이용하여 복잡도를 미리 예측 하였다. 예측된 복잡도를 기반으로 각 코어에 균일하게 작업량이 할당될 수 있도록 영역을 코어에 적응적으로 할당하여 병렬화를 수행한 결과 순차 수행 기반 SAO에 비하여 2.38배, 영역 균등 SAO 병렬화 대비 21% 속도 향상되었다.

L1/L2 혼합형 중계 방법을 적용한 이더넷 기반 비압축 오디오 분배 시스템의 성능 분석 (Performance of Uncompressed Audio Distribution System over Ethernet with a L1/L2 Hybrid Switching Scheme)

  • 남위정;윤종호;박부식;조남홍
    • 대한전자공학회논문지TC
    • /
    • 제46권12호
    • /
    • pp.108-116
    • /
    • 2009
  • 본 논문에서는 고품질 비압축 오디오 트래픽의 분배 시에 요구되는 낮은 지연 및 지터를 보장하고 이더넷 환경에서 데이터 트래픽의 효율적인 교환을 가능하게 하는 새로운 L1/L2 혼합형 중계 방식을 적용한 이더넷 기반 오디오 분배 시스템을 제안하고 성능을 분석하였다. 제안하는 방식이 적용된 오디오 분배 시스템은 마스터 노드와 다수의 중계 노드로 구성되며 이들은 상호간에 상향 하향 링크를 통하여 데이지 체인 형태로 연결된다. 마스터 노드는 스테레오 24채널에서 PCM샘플링된 16비트 오디오 채널을 수납할 수 있는 오디오 프레임을 125us의 주기마다 생성하여 하향 링크를 통해 전송한다. 하향 링크를 통하여 오디오 프레임을 수신한 중계 노드들은 생성한 오디오 트래픽을 해당 노드에게 할당된 오디오 채널에 수납하고 다음 중계노드로 물리 계층 기반(L1)의 전송을 한다. 망의 종단 노드는 수신되는 오디오 프레임을 상향 링크를 통하여 마스터 노드로 루프백시키고 오디오가 상향 링크를 통하여 전송되는 과정에서 모든 중계 노드들은 자신이 수신해야 할 오디오 채널을 복사하여 오디오를 재생한다. 오디오 프레임의 송신이 완료되면 남은 기간 동안 중계 노드들은 L2 스위치로 동작하면서 데이터 프레임을 데이터 링크 계층 기반(L2)에서 교환한다. 이와 같은 L1/L2 혼합형 중계 방식의 동작을 위해 노드 입력 부의 물리 계층과 데이터 링크 간에 존재하는 MII에 오디오 프레임과 데이터 프레임을 구분하는 기능을 가지는 글루로직을 새로 추가하였다. 제안된 방식에 대하여 네트워크 시뮬레이터인 OMNeT++를 사용하고 다양한 파라미터를 통하여 제안된 방식이 오디오 트래픽의 지연 특성과 데이터 트래픽의 전송 효율 면에서 우수한 특성을 제공할 수 있음을 보였다. 제안된 방식은 물리 계층 기반의 전송 또는 데이터 링크 기반의 전송 방식을 사용하는 기존 이더넷 기반 오디오 분배 기술에 비하여 향상된 지연 성능 및 전송 효율을 제공할 수 있어 오디오분배 시스템뿐만 아니라 비디오분배 시스템, 디지털 AV장치 간의 연결 등에도 활용될 수 있다.

품질기능전개(Quality Function Deployment) 방법을 적용한 고추장 소스 콘셉트 개발: 미국과 중국 시장을 중심으로 (Development of Sauces Made from Gochujang Using the Quality Function Deployment Method: Focused on U.S. and Chinese Markets)

  • 이슬기;김아영;홍상필;이승제;이민아
    • 한국식품영양과학회지
    • /
    • 제44권9호
    • /
    • pp.1388-1398
    • /
    • 2015
  • 본 연구의 목적은 고추장 소스의 제품 개발을 위해 소비자 요구에 기반을 둔 Quality Function Deployment(QFD) 모델을 적용하고자 하였다. QFD는 고객의 요구 사항이 제품이나 서비스 개발의 각 단계에 반영될 수 있도록 하는 강력한 품질 경영 도구이다. 고추장 소스 제품 개발에 QFD 기법을 적용하기 위해 먼저 소비자로부터 요구 사항을 도출하고 소비자의 중요도, 수행도 분석을 위해 소비자 설문조사를 실시하였다. 다음으로 전문가 인터뷰를 통해 기술특성을 도출하고 품질표 및 상관관계를 정의하였다. 최종적으로 각 단계에서 수집되고 해석된 데이터를 이용하여 고추장 소스 제품 개발을 위한 품질의 집을 완성하였다. 그 결과 고객인지도 비교에서는 고추장 소스의 신선한 풍미를 가장 중요하게 생각하였으며, 음식 풍미 향상, 음식 활용도 높음의 순으로 높게 나타났다. 고추장 소스의 품질에 대한 요구도와 개선비를 모두 고려하여 우선순위로 연결해 본 결과 신선한 풍미, 음식 풍미 향상, 음식 활용도 높음, 활용 가능한 레시피 제공 등이 높게 분석되었다. 이를 통해 소비자들은 고추장 소스 제품의 외관적인 측면보다는 풍미와 관련된 제품 품질을 더 중요하게 생각하는 것으로 나타났다. 기술특성의 난이도는 구매용이성, 브랜드 개발, 현지 식재료 사용, 독특한 콘셉트가 높게 나타난 반면, 순한 매운맛, 선명하고 탁한 붉은색, 끈적끈적하게 천천히 흐르는 점도에 대해서는 난이도 점수 및 순위가 낮게 나타났다. 기술특성 값을 중심으로 실행 난이도와 기술특성 간의 상호관계를 고려하여 기술특성 우선순위를 매겨 본 결과 용도 다양화에 대한 속성이 가장 높은 우선순위를 차지하고 있는 것을 알 수 있었다. 다음으로 무료 샘플 및 시식, 독특한 콘셉트, 브랜드 개발, 고추장 소스의 입자 보이지 않음 순으로 우선순위가 높게 나타났다. 이를 통해 고추장 소스의 개발과 이의 소비 확대를 위해서는 현지 소비자가 쉽게 접할 수 있는 레시피 개발과 동반 음식을 함께 제안하는 것이 필요할 것으로 사료된다. 고추장은 매운 맛을 내는 소스 중에서 발효라는 공정을 거쳐 제조되므로 이러한 이미지를 부각시켜 기존의 매운 소스와의 차별성을 둔 현지인 맞춤형 포지셔닝 전략이 필요할 것이다. 한편으로는 제품 콘셉트 도출 단계에서부터 소비자가 직접 참여하는 프로슈머 마케팅을 잘 활용하면 그들의 요구사항을 반영한 맞춤 상품을 공급할 수 있을 것이다. 이는 고객 만족도를 높이는 것뿐만 아니라 브랜드에 대한 로열티를 높일 수 있으므로 고추장 소스 콘셉트 개발 시에도 이러한 방법을 이용한다면 소비자의 니즈를 충족시킬 수 있는 차별화된 제품을 개발할 수 있을 것이라 판단된다. 그러나 본 연구는 편의추출법에 의해 설문 대상자를 선정하였고, 미국의 뉴욕 맨해튼과 중국의 베이징이라는 지역적 제한점을 갖고 있어 미국과 중국 대부분의 소비자 니즈를 반영했다고 보기에는 어려움이 있다. 이에 따라 향후 외적 타당도의 저해 요인들을 감소시킬 수 있는 소비자 계층에 따른 샘플링, 지역적 범위를 확장시킨 조사 설계 연구가 필요할 것으로 사료된다.

머신러닝 기법을 이용한 납축전지 열화 예측 모델 개발 (Building battery deterioration prediction model using real field data)

  • 최근호;김건우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.243-264
    • /
    • 2018
  • 현재 전세계 배터리 시장은 이차전지 개발에 박차를 가하고 있는 실정이지만, 실제로 소비되는 배터리 중 가격 대비 성능이 좋고 재충전을 통해 다시 재사용이 가능한 납축전지(이차전지)의 소비가 광범위하게 이루어지고 있다. 하지만 납축전지는 복합적 셀(cell)을 묶어 하나의 배터리를 구성하여 활용하는 배터리의 특성상 하나의 셀에서 열화가 발생하면 전체 배터리의 손상을 가져와 열화가 빨리 진행되는 문제가 존재한다. 이를 극복하기 위해 본 연구는 기계학습을 통한 배터리 상태 데이터를 학습하여 배터리 열화를 예측할 수 있는 모델을 개발하고자 한다. 이를 위해 실제 현장에서 배터리 상태를 지속적으로 모니터링 할 수 있는 센서를 골프장 카트에 부착하여 실시간으로 배터리 상태 데이터를 수집하고, 수집한 데이터를 이용하여 기계학습 기법을 적용한 분석을 통해 열화 전조 현상에 대한 예측 모델을 개발하였다. 총 16,883개의 샘플을 분석 데이터로 사용하였으며, 예측 모델을 만들기 위한 알고리즘으로 의사결정나무, 로지스틱, 베이지언, 배깅, 부스팅, RandomForest를 사용하였다. 실험 결과, 의사결정나무를 기본 알고리즘으로 사용한 배깅 모델이 89.3923%이 가장 높은 적중률을 보이는 것으로 나타났다. 본 연구는 날씨와 운전습관 등 배터리 열화에 영향을 줄 수 있는 추가적인 변수들을 고려하지 못했다는 한계점이 있으나, 이는 향후 연구에서 다루고자 한다. 본 연구에서 제안하는 배터리 열화 예측 모델은 배터리 열화의 전조현상을 사전에 예측함으로써 배터리 관리를 효율적으로 수행하고 이에 따른 비용을 획기적으로 줄일 수 있을 것으로 기대한다.

150 mm GaAs 웨이퍼의 플라즈마 식각에서 식각 깊이의 균일도에 대한 가스 흐름의 최적화 연구 (Effect of Gas now Modulation on Etch Depth Uniformity for Plasma Etching of 150 mm GaAs Wafers)

  • 정필구;임완태;조관식;전민현;임재영;이제원;조국산
    • 한국진공학회지
    • /
    • 제11권2호
    • /
    • pp.113-118
    • /
    • 2002
  • 대면적 GaAs 웨이퍼의 플라즈마 식각 공정에서 식각 깊이의 좋은 균일도를 얻기 위해 반응기 내의 가스 흐름을 조절하는 진보된 기술을 실험하였다. 유한차분수치법(Finite Difference Numerical Method)은 GaAs 웨이퍼의 건식 식각을 위한 반응기 안의 가스 흐름의 분포를 시뮬레이션하기에 유용한 방법이다. 이 방법을 이용해 시뮬레이션된 자료와 실제의 것이 상당히 일치한다는 것이 $BCl_3/N_2/SF_6/He$ICP플라즈마의 실험 결과로 확인되었다. 대면적 GaAs 웨이퍼의 플라즈마 식각 공정 중에서 포커스 링(focus ring)의 최적화된 위치가 가스 흐름과 식각 균일성을 동시에 향상시키는 것을 이해했다. 반응기와 전극(electrode)의 크기가 변하지 않는 상황에서 샘플을 고정시키는 클램프 배치의 최적화를 통해 100 mm(4 inch) GaAs 웨이퍼에서 가스 흐름의 균일성을 $\pm$1.5 %, 150 mm(6 inch) 웨이퍼에서는 $\pm$3% 이하로 유지시킬 수 있는 것을 시뮬레이션결과에서 확인할 수 있다. 시뮬레이션된 가스 흐름의 균일도 자료와 실제 식각 깊이 분포실험 데이터의 비교로 대면적 GaAs 웨이퍼에서 건식 식각의 뛰어난 균일성을 얻기 위해서는 반응기 내의 가스흐름분포의 조절이 매우 중요함을 확인하였다.

비선형 모델을 이용한 결측 대체 방법 비교 (A comparison of imputation methods using nonlinear models)

  • 김혜인;송주원
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.543-559
    • /
    • 2019
  • 자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체 방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.