• 제목/요약/키워드: 이상치 선별

검색결과 67건 처리시간 0.038초

k-NN 기법을 이용한 학습자의 학습 행위 데이터의 이상치 분석 (Outlier Analysis of Learner's Learning Behaviors Data using k-NN Method)

  • 윤태복;정영모;이지형;차현진;박선희;김용세
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.524-529
    • /
    • 2007
  • 지능형 학습 시스템은 학습자의 학습 과정에서 수집된 데이터를 분석하여 학습자에게 맞는 전략을 세우고 적합한 서비스를 제공하는 시스템이다. 학습자에게 적합한 서비스를 위해서는 학습자 모델링 작업이 우선시 되며, 이 모델 생성을 위해서 학습자의 학습 과정에서 발생한 데이터를 수집하고 분석하게 된다. 하지만, 수집된 데이터가 학습자의 일관되지 못한 행위나 비예측 학습 성향을 포함하고 있다면, 생성된 모델을 신뢰하기 어렵다. 본 논문에서는 학습자에게서 수집된 데이터를 거리기반 이상치 선별 방법인 k-NN을 이용하여 이상치를 선별한다. 실험에서는 홈 인테리어 컨텐츠 기반에 학습자의 학습 행위에 대한 학습 성향을 진단하기 위한 DOLLS-HI를 이용하여, 수집된 학습자의 데이터에서 이상치를 분류하고 학습 성향 진단을 위한 모델을 생성하였다. 생성된 모델은 이상치 분류전과 비교하여 신뢰가 향상된 것을 확인하였다.

  • PDF

고차원 자료의 비지도 부분공간 이상치 탐지기법에 대한 요약 연구 (A survey on unsupervised subspace outlier detection methods for high dimensional data)

  • 안재형;권성훈
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.507-521
    • /
    • 2021
  • 고차원 자료에서 이상치를 탐지하기 위해서는 변수를 선별해야 할 필요성이 있다. 이상치 탐지에 적합한 정보가 종종 일부 변수에만 포함되어 있기 때문이다. 많은 수의 부적합한 변수가 자료에 포함될 경우 모든 관측치의 거리가 비슷해지는 집중효과가 발생하고 이로 인해 모든 관측치의 이상정도가 비슷해지는 문제가 발생하게 된다. 부분공간 이상치 탐지기법은 전체 변수 중 이상치 탐지에 적합한 변수들의 집합을 선별하여 관측치의 이상정도를 측정함으로써 이러한 문제를 극복한다. 본 논문은 대표적인 부분공간 이상치 탐지기법을 부분공간 선정 방식에 따라 세가지 유형으로 분류하고 각 유형에 속한 방법론을 부분공간 선정 기준과 이상 정도 측정 방식에 따라 요약한다. 더하여, 부분공간 이상치 탐지기법들을 적용할 수 있는 컴퓨팅 프로그램을 소개하고 집중효과에 대한 간단한 가상 실험과 자료 분석 결과를 제시한다.

원통형 홈 쇄미 선별기의 개발 (Development of an Indented cylinder broken rice separator)

  • 김상현;김명호;박승제;이종호
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2002년도 동계 학술대회 논문집
    • /
    • pp.276-281
    • /
    • 2002
  • 본 연구에서는 정밀 쇄미 선별 시스템을 개발하기 위하여 원통형 홈 쇄미 선별기의 시작품을 제작하고 이것의 설계인자와 운전인자에 따른 성능 분석을 수행한 결과는 다음과 같다. 1. 원통형 홈 쇄미 선별기의 시작품은 홈의 직경이 작은 선별원통을 상단에, 홈의 직경이 큰 선별원통을 하단에 장착하는 2단형으로 설계 제작하였다. 각 단의 trough에는 스크류 컨베이어를 설치하였으며, 원통의 회전 속도와 trough의 각도 및 원통의 수평각을 변경시킬 수 있도록 하였다. 홈의 크기가 작은 상단에서 쇄미를, 홈의 크기가 큰 하단에서 준완전립을 선별하도록 하였다. 2. 원통형 홈 쇄미 선별기의 원통 회전속도가 증가하면 처리 용량이 증가하며, 이 속도에 따른 최적의 trough 각이 존재하는데, 본 실험에서는 회전 속도 35rpm에서 trough 각 37$^{\circ}$, 45rpm에서 55$^{\circ}$, 55rpm에서 73$^{\circ}$로 분석되었다. 3. 원통형 홈 쇄미 선별기의 공급율이 증가할수록 선별효율과 수거율(준완전립+쇄미)은 급격히 감소하지만, 순도(준완전립+쇄미)는 완만히 증가하였고, 완전립의 수거율과 순도는 95%이상을 유지하며 일정한 경향을 보였다. 본 실험 범위에서는 원통형 홈 쇄미선별기의 선별효율은 각 공급율에서 공히 원통의 분당 회전수 35rpm, trough 각 37$^{\circ}$에서 최대치를 나타내었다. 이 최적 조건에서 공급을 400-800kg/h 범위의 선별효율 평균치는 70% 정도로 분석되었다.

  • PDF

ASQ :소아과외래에서의 발달지연 선별검사 (The ages and stages questionnaire: screening for developmental delay in the setting of a pediatric outpatient clinic)

  • 김은영;성인경
    • Clinical and Experimental Pediatrics
    • /
    • 제50권11호
    • /
    • pp.1061-1066
    • /
    • 2007
  • 목 적 : 소아의 발달 장애는 조기에 발견하면 조기 치료가 가능하게 되어 치료 효과가 높아지고 후유 장애를 최소화할 수 있다. 발달 장애의 조기 발견을 위하여 기존에 사용해 오던 정식 발달 선별검사는 대부분 시간이 오래 걸리고, 복잡하며, 의료인력이 추가로 필요하기 때문에 바쁜 소아과 외래에서 모든 소아에게 적용하기는 어렵다. 기존의 발달검사 대신에 부모가 작성한 내용을 토대로 평가하는 발달 설문 양식들 중 Ages and Stages Questionnaire (ASQ)는 60개월 이전의 소아의 발달 선별을 목적으로 개발된 검사이다. 본 연구의 목적은 소아과 외래에서 시행하는 발달 지연의 선별 도구로서 ASQ의 타당성을 알아보기 위한 것이다. 방 법 : 가톨릭대학교 의과대학 부속 성모병원 소아과 외래를 방문한 소아의 부모에게 진료 전 대기 시간 동안 한국형 ASQ (K-ASQ)를 완성하도록 하였다. 설문지를 완성한 총 150명 중 만삭 출생아이며 이전에 발달지연의 진단을 받은 적이 없고, 기타 선천성 기형, 경련성 질환을 포함한 신경학적 이상, 유전성 질환의 경력이 없는 소아 67명을 대상으로 하였다. K-ASQ는 각 영역별로 평균에서 2 표준편차(SD) 아래 점수보다 낮으면 "실패"로 판정하며, 한 발달 분야 이상에서 "실패"가 있는 경우를 "선별검사 양성"으로 하였다. 최종 발달평가는 Bayley Scales of Infant Development-II (BSID-II)를 사용하여 판단하였으며, 지능 혹은 운동발달 지수가 평균보다 -1 SD 미만인 경우는 발달지연으로 판정하였다. K-ASQ의 결과를 BSID-II와 비교하여 분석하였다. 결 과 : 1) 대상아의 평균 연령은 $16.4{\pm}7.4$개월($6{\pm}30$개월 범위, 중앙치 14개월)이었다. 10명(14.9%)은 출생 시 부당경량아였으며, 평균 출생체중 $3.1{\pm}0.6kg$, 재태기간 $38.8{\pm}1.4$주이었다. 9명(13.4%)이 쌍생아였고, 33명(49.0%)이 남아였다. 대상 소아들의 모친의 평균 교육 기간은 $13.6{\pm}2.4$년, 53명(79.1%)이 고등학교 졸업 이상의 학력을 가졌고, 21명(31.3%)이 정규직 근무자였다. ASQ 설문지를 완성하는데 평균 $10.2{\pm}3.0$분이 소요되었다. (2) 17명(25.4%)이 ASQ 선별검사 양성이었는데, 그 중 4명은 발달이 지연되었고, 나머지 13명의 발달은 정상이었다. BSID-II로 판정한 발달 지연아 8명 중 4명은 ASQ 선별검사에서 양성이었고, 다른 4명은 선별검사 음성이었다. ASQ 선별검사 음성인 50명 중 4명이 발달지연으로 판단되었다. (3) BSID-II와 비교한 K-ASQ의 민감도(sensitivity)는 50.0%, 특이도(specificity) 78.0%, 양성 예측치 (positive predictive value) 23.5%, 음성 예측치(negative predictive value)는 92.0%로 나타났다. 결 론 : K-ASQ는 높은 음성 예측치를 보여 소아과 외래에서 소아 발달 지연의 선별 도구로서 사용하는 것이 타당한 것으로 판단되었다.

글로벌 기후지수와 인공신경망모형을 이용한 금강권역의 봄철 강수량 예측 (Prediction of spring precipitation in the Geum River basin using global climate indices and artificial neural network model)

  • 김철겸;이정우;김현준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.292-292
    • /
    • 2023
  • 본 연구에서는 인공신경망을 이용한 통계적 모형을 구성하여 금강권역의 봄철(3~5월) 강수량 예측을 수행하였다. 통계적 모형의 예측인자로서는 NOAA 등에서 제공하는 AAO, AMM, AO 등 36종의 기후지수와 대상권역인 금강권역의 강수량, 기온 등의 기상인자 8종 등 총 44종의 기후지수를 활용하였다. 예측대상기간을 기준으로 선행기간(1~18개월)에 따른 상관성을 분석하여 상관도가 높은 10개의 기후지수를 예측인자로 선정하였다. 예측모형 형태는 10개의 입력층과 1개의 은닉층으로 되어 있는 인공신경망모형을 구성하였다. 모형 구성과정에서의 불확실성을 최소화하고 예측모형의 적합도를 높이기 위해 예측대상기간을 기준으로 과거 40년간의 자료에 대해 임의로 20년간 자료를 선별하여 모형을 구성하고, 너머지 기간에 대해 검증하는 무작위 교차검증을 반복하여, 예측대상기간 및 예측시점에 따라 각각 적합도가 높은 1000개의 예측모형을 선별하였다. 과거기간(1991~2022년)을 대상으로 예측시점에 따라 각 연도별 1000개의 예측결과를 도출하여, 실제 해당년도의 관측값과의 비교를 통해 예측성을 분석하였다. 예측성은 크게 예측치의 최대값과 최소값 범위 및 예측치의 25%~75% 범위 안에 관측치가 포함될 확률, 그리고 과거 관측값의 3분위 구간을 기준으로 한 예측확률 등을 평가하였다. 관측치가 예측치의 범위 안에 포함될 확률은 평균 87.5%, 예측치의 25~75% 범위 안에 포함될 확률은 30.2%로 나타났으며, 3분위 예측확률은 35.6%로 분석되었다. 관측값과의 일대일 비교는 정확도가 떨어지지만 3분위 예측확률이 33.3% 이상인 점으로 볼 때 예측성은 확보된다고 볼 수 있다. 다만, 우리나라 강수량의 불규칙성과 통계적 모형 특성상 과거 관측되지 않은 패턴에 대해서는 예측이 어려운 문제가 있어, 특정년도의 예측결과가 관측치를 크게 벗어나는 경우도 종종 나타나고 있다.

  • PDF

동일연령군에서 크기 선별에 따른 넙치(Paralichthys olivaceus) 성장, 사료효율 및 생존율의 비교 (Effect of Size Grading on Growth, Feed Efficiency and Survival in Olive Flounder (Paralichthys olivaceus))

  • 김종현;김현철;이정호;노재구;이미숙;김경길
    • 한국양식학회지
    • /
    • 제18권3호
    • /
    • pp.154-159
    • /
    • 2005
  • 동일연령군의 넙치 치어를 개체 크기별 4개의 group (small group, 체중 $1.3{\pm}0.23g;$ medium group, 체중 $3.1{\pm}0.45g;$ large group, 체중 $4.9{\pm}0.57g;$ ungraded group, 체중 $3.3{\pm}1.66g$)으로 나누어 8주동안 사육하면서 크기 선별이 어류의 성장, 사료효율 및 생존율에 미치는 영향을 조사하였다. 실험종료시 체중의 분포에 따른 소형 개체(체중 10 g)의 빈도는 크기 선별한 small group에 비해 ungraded group에서 매우 높게 나타났다. 실험 전기간동안의 일일성장률은 small group 및 large group에서 각각 최고치 및 최저치를 보였으며, medium group과 선별 group (small group; medium group; large group)의 pooled data는 ungraded group에 비해 높은 수치의 일일성장률을 나타내었다. (P<0.05). 사료섭취율은 ungraded group이 medium group 및 선별 group의 pooled data에 비해 높았던 반면, 사료효율에 있어서는 ungraded group이 이들에 비해 낮게 나타났다(P<0.05). 그리고 ungraded group의 생존율은 93.3%로 99.3% 이상으로 나타난 다른 실험구들에 비해 유의적으로 낮게 나타났다(P<0.05). 결론적으로 크기가 작은 넙치는 큰 넙치가 없는 곳에서 유의하게 빠른 성장과 높은 생존율을 나타내었다. 따라서 크기 선별은 넙치 치어(체중 1-5 g)의 성장과 생존율을 향상시키기 위해서 중요한 작업이 될 수 있다.

경험적 영향함수와 표본영향함수의 차이 및 보정에 관한 연구 (A study on the difference and calibration of empirical influence function and sample influence function)

  • 강현석;김홍기
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.527-540
    • /
    • 2020
  • 이상치에 대한 적절한 선별과 배제없이 모든 데이터를 종합적으로 분석하게 되는 경우 데이터 분석을 통해 얻은 결과의 신뢰성과 해석의 일반성에 치명적인 위협을 받을 수 있다. 따라서 데이터의 분석 과정에서 이러한 이상치를 판별하고, 이상치가 통계량, 통계적 모형에 어떠한 영향을 주는 지에 대한 분석은 매우 중요한 일이라 할 수 있다. Hampel이 영향함수를 활용하여 이상치를 판별할 수 있는 방법을 소개한 이후, 이상치를 판별하기 위한 방법론으로 영향함수가 폭넓게 활용되어 왔다. 영향함수에는 경험적 영향함수와 표본영향함수가 있으며, 경험적 영향함수를 활용해 표본영향함수를 근사 추론하여 하나의 관측값이 제거되었을 때 통계량에 미치는 영향을 예측하는 방법론이 주로 활용되었다. 본 연구에서는 표본평균, 표본분산, 표본표준편차의 표본영향함수 유도를 통해 경험적 영향함수와 표본영향함수의 차이를 살펴 본다. 또한 경험적 영향함수로 표본영향함수를 근사하는 과정에서 발생하는 오차를 줄이기 위해 경험적 영향함수의 보정으로 표본영향함수를 근사 추론하는 방법을 제안하고, 모의실험을 통해 제안한 추론 방법의 타당성을 확인한다.

이관 기록물 분류 자동화를 위한 목록 기반 이상치 판별 학습데이터 구축 (Building the Outlier Candidate Discrimination Training Data based on Inventory for Automatic Classification of Transferred Records)

  • 정지혜;이젬마;왕호성;오효정
    • 한국기록관리학회지
    • /
    • 제22권1호
    • /
    • pp.43-59
    • /
    • 2022
  • 전자적으로 생산된 공공기록물은 생산과 동시에 편철되고 보존기간이 부여되며 일정기간이 지나면 영구기록물관리기관으로 이관되어 보존된다. 이관 시 기록물관리 담당자가 기록물 분류정보를 확인하고 품질을 일정 수준으로 유지토록 해야 하지만, 이관된 기록물의 분류는 기록물 정리/기술 업무로 편성되어 있고, 대부분의 정리/기술 업무는 수작업에 의존하고 있어 당해 연도에 처리해야 할 기록물 수량을 맞추기 어려운 실정이다. 이에 본 연구는 이관 기록물 분류 업무의 효율화와 일관된 기준을 유지하기 위한 방안을 제안하고자 한다. 이를 위해 먼저 국가기록원에서 수행하고 있는 현행의 기록분류 업무 프로세스를 분석하고 개선 요구사항을 수렴하여 분류 업무의 수작업을 최소화하기 위한 방안으로 이관된 기록물의 편철 정보, 즉 목록에 기반한 분류 이상치 후보를 판별하는 과정을 도출·체계화하였다. 나아가 제안한 이상치 판별 프로세스를 실제 국가기록원으로 이관된 기록물을 대상으로 적용하고, 그 결과를 규격화하여 추후 기계학습에 활용 가능한 학습데이터 형식으로 구축하였다. 본 연구의 궁극적인 목적은 지능형 전자기록 관리 환경 구축을 위한 사전 단계로, 기록관리 업무 내 기계학습 기법이 적용 가능한 문제 유형을 선별하고 자동화하는 방안을 모색하고자 한다.

한국 유치 모델에서 유전치 지르코니아 크라운의 형태계측학적 연구 (A Morphometric Study of Primary Anterior Zirconia Crowns in Korean Tooth Models)

  • 박정하;이상호;이난영;지명관
    • 대한소아치과학회지
    • /
    • 제45권1호
    • /
    • pp.41-56
    • /
    • 2018
  • 본 연구의 목적은 한국인의 상악 유중절치와 유측절치와 기성 지르코니아 크라운의 형태 및 크기를 3차원적으로 분석함으로써 가장 유사한 지르코니아 크라운을 선별하고 수복시 임상적 지침을 제시하는 것이다. 이를 위해 300명의 어린이의 건전한 상태의 상악 유중절치, 유측절치를 3차원 스캔하여 평균 형태를 재현하였고, 4개의 제조사(NuSmile $ZR^{(R)}$ Crown, Cheng $Crowns^{(R)}$, Kinder $Krowns^{(R)}$, EZ $Pedo^{(R)}$ Crown)의 지르코니아 크라운을 3차원 스캔하여 형태 및 크기 비교를 위한 좌표점을 측정하여 치아와 크라운 형태의 유사성을 평가하였다. 근원심 길이, 절단연에서 치경부까지의 길이, 치관 형태 비율, 같은 좌표에서 치아와 크라운의 거리, 순면의 곡률반경, 그리고 체적을 비교하여 최종적으로 가장 유사한 지르코니아 크라운을 선별하였다. 분석 결과, 상악 유중절치는 Cheng $Crowns^{(R)}$ 3번, 유측절치는 NuSmile $ZR^{(R)}$ Crown 2번이 가장 유사한 형태를 가졌으며, 이 크라운의 내면을 스캔하여 크라운 수복시 필요한 치아 삭제량을 평가한 결과, 기존의 제조사의 가이드라인으로 제시되어 있는 양보다 전반적으로 더 적은 치아 삭제를 시행하는 것을 제안할 수 있다.

Autoencoder 기법을 활용한 부동산 가격 이상치 분석 (Analsis Of Outliers In Real Estate Prices Using Autoencoder)

  • 김윤서;박종찬;오하영
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1739-1748
    • /
    • 2021
  • 부동산 가격은 국가, 기업, 가계에 영향을 미치며 최근 급등하는 부동산 가격에 부동산 버블에 관한 연구가 많이 시행되고 있다. 하지만 부동산 버블 예측에서 단순히 부동산 가격만을 비교하거나, 부동산 매매에서 핵심적인 심리적 변수를 반영하지 못한다면 버블 예측 모형의 정확성이 떨어진다 판단할 수 있다. 본 연구는 오토인코더 기법을 사용하여 지역별 부동산 버블 상황을 설명할 수 있는 예측 모형을 설계하는 것이 목적이다. 기존의 부동산 버블 분석 연구들이 가격에 영향을 미치는 다양한 종류의 변수를 설정하지 못하였고 주로 선형 모형을 기반으로 연구를 진행했다는 부분에서, 본 연구는 기존 부동산 버블 연구에 사용되지 않았던 기법과 변수들의 도입 가능성을 시사한다.