• 제목/요약/키워드: 순서통계량

검색결과 87건 처리시간 0.027초

상호정보 추정을 위한 k-최근접이웃 기반방법 (k-Nearest Neighbor-Based Approach for the Estimation of Mutual Information)

  • 차운옥;허문열
    • Communications for Statistical Applications and Methods
    • /
    • 제15권6호
    • /
    • pp.977-991
    • /
    • 2008
  • 본 논문에서는 연속형 변수에 대한 결합확률분포를 추정하지 않고도 상호정보(MI) 추정량을 구할 수 있는 k-최근접이웃 기반방법에 대하여 연구하였다. 변수가 동일한 값들을 가지는 경우 k-최근접이웃을 구할 때 생기는 문제점을 해결하기 위하여 지터링(jittering)과 붓스트랩(bootstrap) 방법을 제안하였다. 몬테칼로 모의실험과 실제 데이터에 대한 실험을 수행한 결과, k=1과 같이 작은 값을 사용한 k-최근접이웃 기반방법에 의해 효율적인 MI 추정량을 구할 수 있었다. k-최근접이웃 기반방법은 연속형 설명변수, 범주형 또는 연속형인 목적변수 형태의 데이터에 적용할 수 있으며, 목적변수에 영향을 주는 중요한 설명변수의 순서를 구할 수 있을 뿐만 아니라 다차원에도 적용할 수 있기 때문에 중요변수의 집합을 구하는 변수 선택(feature subset selection) 문제에도 적용할 수 있다.

지식기반사회에서 이용자연구의 최신동향 (A Study on the Current Trends of User Study at the Knowledge Based Information Society)

  • 한복희
    • 한국문헌정보학회지
    • /
    • 제37권4호
    • /
    • pp.295-310
    • /
    • 2003
  • 본 연구는 1991년부터 2003년까지 이용자연구 논문의 내용분석을 통하여 우리나라 이용자연구의 연구 방법과 연구동향을 제시한 것이다. 분석자료는 연구의 주제, 연구방법, 자료수집방법, 자료분석방법, 가설설정 등을 조사하였다. 이용자연구논문의 경우 1991∼2003년 가을까지 발표된 논문의 연 평균은 12.8편으로 나타났다. 연도별 발표량은 200l년이 24 편으로 가장 많고, 주제별 발표논문 현황은 정보이용행태, 이용자연구, 이용자 인터페이스, 도서관 및 정보이용교육, 온라인 목록 이용행태의 순으로 연구되었다. 연구방법은 문헌연구, 서베이 연구, 사례연구의 순서로 이루어지고 있으며, 자료 분석방법은 주로 기술통계를 사용하고 이용자연구자들은 카이자승(28.0%), 상관관계(22.7%), T-검증(17.35), 분산 분석(14.7%), 다변량분석(4.0%) 등을 사용하며, 연구자의 약 17%가 가설을 설정하고 있다.

상악 중절치 삭제 시 수복 디자인과 변연부 위치에 따른 부피 변화 (Volume difference in upper central incisor preparation according to the changes of restorative design and marginal location)

  • 김종현;박영범;김성태;이근우
    • 대한치과보철학회지
    • /
    • 제49권2호
    • /
    • pp.152-160
    • /
    • 2011
  • 연구 목적: 상악 중절치에 여러 가지 수복물 설계와 변연부 위치를 설정하여 치아 삭제를 하였을 때 나타나는 치아 삭제량의 변화를 평가하기 위함이다. 연구 재료 및 방법: 36개의 상악 중절치 레진 인공치가 실험에 사용되었다. 수복물의 디자인에 따라 이들은 4개의 군으로 나뉘었다. 그리고 각각의 군은 다시 변연부의 위치에 따라 3개의 세부 군으로 나뉘었다. 삭제되지 않은 치아의 부피가 미세단층촬영을 이용해 측정되었고 같은 방법으로 삭제 후의 치아의 부피가 측정되었다. 이 측정된 영상들을 서로 겹쳐서 비교함으로 삭제 전과 후의 부피 변화를 알아보았다. 결과: 수복물 설계에 따른 삭제 전과 후의 부피 변화량은 다음과 같은 순서로 변화량의 차이를 보였다: traditional laminate veneer < full laminate veneer < all ceramic crown < metal ceramic crown. One-Way ANOVA와 다중비교 Tukey로 유의수준5%에서 통계 분석한 결과 각각의 군에서는 다음과 같은 순서로 변화량의 차이를 보였다: CEJ 1 mm 상방 < CEJ < CEJ 1 mm 하방 (P<.05). 부피 변화를 백분율로 나타낸 수치를 보면 all ceramic crown과 metal ceramic crown 에서는 31 - 48% 로 나타났고 laminate veneer에서는 14 - 30%로나타났다. Laminate veneer에서 나타난 부피 변화량은 metal ceramic crown의 1/3로 나타났다. The full laminate (CEJ 1 mm 하방)와 all ceramic crown (CEJ 1 mm 상방)는 유사한 부피 변화를 보였다. Metal ceramic crown은 all ceramic crown과 비교하였을 때 13.7% 더 많은 부피 변화를 보였다. 결론: 수복물의 설계와 변연부 위치의 변화에 따라 부피 변화의 차이가 존재한다.

신호교차로의 측면직각 층돌사고 특성과 심각도 (Characteristics and Severity of Side Right-Angle Collisions at Signalized Intersections)

  • 박정순;박길수;김태영;박병호
    • 한국도로학회논문집
    • /
    • 제10권4호
    • /
    • pp.199-211
    • /
    • 2008
  • 본 연구는 청주시 4지 신호교차로에서 발생한 측면직각 충돌사고를 다루고 있다. 연구의 목적은 측면직각 충돌사고의 특성을 분석하고, 순서형 프로빗 모형을 이용하여 사고의 심각도에 영향을 주는 사고요인을 파악하는 것이다. 이를 위해 본 연구는 2004년과 2005년의 2년간 181개 교차로에서 발생한 580건의 측면직각 충돌사고 자료를 이용한다. 사고특성 분석결과, 야간과 직진 중에 가장 많은 교통사고가 발생하였으며, 주된 원인은 신호위반으로 밝혀졌다. 사고심각도 모형개발의 주요결과는 다음과 같다. 첫째, 모형의 적합도를 나타내는 우도비(${\rho}^2$)값은 0.094이며, 변수의 적합성을 나타내는 t-ratio 값은 모두 통계적으로 유의한 것으로 분석되었다. 둘째, 측면직각 충돌사고의 심각도에 영향을 미치는 변수로는 부도로 교통량, 부도로 차로수, 주도로 좌회전차로, 주도로 좌회전신호유무, 주도로 황색신호시간, 교차각, 주도로 부도로 제한속도가 선정되었다.

  • PDF

목표변수의 형태에 따른 신용평점 모형 구축 (Building credit scoring models with various types of target variables)

  • 우현석;이석형;조형준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.85-94
    • /
    • 2013
  • 금융시장의 규모가 점점 더 커짐에 따라 고객정보 관리 미숙 또는 부실한 의사결정, 즉 신용 리스크 관리 실패로 인한 손실이 막대하게 증가하고 있다. 따라서 신용 리스크 관리가 점차 더 중요해지고, 이런 신용 리스크를 최소화하는 기본적인 도구인 신용 평점 모형이 절실히 요구된다. 신용평점 모형은 주로 이항형 목표변수만 이용하여 개발 연구되었다. 본 논문에서는 순서형 다항 자료 또는 경시적 이항 자료 같은 다른 형태의 목표 변수를 고려한 신용평점 모형구축 방법을 제시한다. 그 개발된 모형을 실제 자료와 랜덤화한 자료에 적용하여 Kolmogorov-Smirnov 통계량으로 비교 분석한다.

연안환경 수은 모니터링용 괭이갈매기 알의 산란순서별 농도 차이 (Mercury Concentrations of Black-tailed Gull Eggs Depending on the Egg-Laying Order for Marine Environmental Monitoring)

  • 이장호;이종천;장희연;박종혁;최정희;이수용;심규영
    • 환경영향평가
    • /
    • 제26권6호
    • /
    • pp.538-552
    • /
    • 2017
  • 본 연구에서는 연안환경 오염물질 중 수은의 생물축적 모니터링 지표종인 괭이갈매기(Larus crassirostris) 알의 산란순서 간 수은 농도차이를 서해 백령도 번식지를 대상으로 분석하였다. 첫 번째(평균${\pm}$표준오차, $234.4{\pm}11.2ng/g\;wet$) 산란한 알의 총수은 농도는 두 번째($182.8{\pm}9.1ng/g\;wet$) 산란한 알에 비해 통계적으로 유의하게 높게 나타났다(각 n=18, t=8.4, p<0.01). 또한 생체특성치에서도 장경, 단경, 중량 모두 첫 번째 알(길이: $63.10{\pm}0.49mm$, 단경: $44.51{\pm}0.19mm$, 중량 $65.53{\pm}0.87g$) 이 두 번째 알(장경: $62.37{\pm}0.40mm$, 단경: $43.55{\pm}0.17mm$, $62.48{\pm}0.72g$)보다 통계적으로 유의하게 높게 나타났다(각 n=18, 장경 t=2.4, p<0.05; 단경 t=4.3, p<0.01; 중량 t=4.2, p<0.01). 이러한 차이는 알 생성기에 암컷이 섭취하는 먹이량과 관련이 있으며, 이는 수컷이 암컷에게 먹이를 공급하다가 첫 번째 알을 낳으면 급이 빈도와 양을 줄이는 구애급이 행동패턴 변화와 관련이 있는 것으로 추측된다. 특히, 암컷의 섭취량 감소는 메틸수은이 주로 존재하는 알 속 흰자(albumen)의 감소에 영향을 미치는 것으로 판단된다. 따라서 수은의 경우, 산란순서에 따라 축적농도가 감소하는 경향이 뚜렷하기 때문에 지역 간 그리고 시기별 비교 모니터링을 수행할 때는 목적과 조사여건(번식경과를 고려한 채취 시기, 입도(入島) 체류가능기간 등) 등을 고려하여 둥지 내 알 선택방법(첫 번째 알만 선택 또는 두 번째 알만 선택 또는 랜덤선택 등)을 일관되게 적용하는 것이 중요하다고 판단된다.

AI기반 하천 부유쓰레기 모니터링 기술 연구 (A Study of AI-based Monitoring Techniques for Land-based Debris in Stream)

  • 이경수;윤해인;원종화;정상화
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.137-137
    • /
    • 2023
  • 해양쓰레기는 해안의 심미적 가치 저하뿐만 아니라 생태계 파괴, 유령 어업에 따른 수산업 피해 등의 사회적·환경적 문제를 발생시키며, 그중 70% 이상은 육상 기인으로 플라스틱 및 기타 쓰레기가 주를 이루는 해외와 달리 국내의 경우 다량의 초목류를 포함하고 있다. 다양한 부유쓰레기에 대한 기존의 해양쓰레기량 추정의 한계와 하천·하구 쓰레기 수거의 효율화를 위해 해양으로 유입되는 부유쓰레기 방지를 위한 실효성 있는 대책 수립이 필요한 실정이다. 본 연구는 해양 유입 전 하천의 차단시설에 차집된 부유쓰레기의 수거 효율화 및 지속가능한 해양쓰레기 데이터 구축을 위해 AI기반의 기술을 통해 부유쓰레기 성상 분석 기법(Object Detection)과 차집량 분석 기법(Semantic Segmentation)을 활용하였다. 실제와 유사한 데이터 수집을 위해 다양한 하천 환경(정수조, 소하천, 급경사수로)에 대해 탁도(녹조, 유사), 광량, 쓰레기형상, 초목류 함량, 날씨(소하천), 유속(급경사수로) 등의 실험조건에 대하여 해양쓰레기 분류 기준 및 통계를 바탕으로 부유쓰레기 종류 선정하여 학습을 위한 데이터를 수집하였다. 학습 목적에 따라 구분하여 라벨링(Bounding box, Polygon)을 수행하고, 각 분석 기법별 전이학습을 통해 Phase 1(정수조), Phase 2(소하천), Phase 3(급경사수로) 순서로 모델을 고도화하였다. 성상 분석을 위해 YOLO v4를 활용하여 Train, Test DataSet(9:1)을 구성하고 학습 및 평가는 Iteration마다의 mAP, loss 값을 통해 비교하였으며, 학습 Phase에 따라 모델 고도화로 Test Set의 mAP 값이 성상별로 높아짐을 확인하였으며, 차집량 분석을 위해 Unet을 활용하여 Train, Test, Validation DataSet(8.5:1:0.5)을 구성하고 epoch별 IoU(intersection over Union), F1-score, loss 값을 비교하여 정성적, 정량적 평가 모두 Phase 3에서 가장 높은 성능을 확인하였다. 향후 하천 환경에서의 다양한 영양인자별 분석을 통해 주요 영향인자 도출 및 Hyper Parameter 최적화를 통한 모델 고도화로 인해 활용성이 높아질 것으로 판단된다.

  • PDF

모의 실험을 이용한 여러 합치도들의 비교 (A simulation study of rater agreement measures)

  • 한경도;박용규
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.25-37
    • /
    • 2012
  • 두 평정자간 평가의 일치정도를 나타내는 합치도로 Cohen (1960)의 ${\pi}$, Scott (1955)의 H, 박미희와 박용규 (2007)의 등 많은 통계량이 제안되어왔다. 모의실험을 통하여 균형적 주변분포에서의 명목형과 순서형 합치도, 두 가지 역설이 발생하는 불균형 주변분포에서의 명목형 합치도들의 편의, 표준오차, 평균오차제곱 분산, 변이계수를 비교한 결과, 모든 경우에서 AC1과 H의 표준오차와 변이계수가 가장 작게 나타났다.

SAMED 필터의 잡음제거 성능에 대한 연구 (A Study on the Noise Removal Performance of SAMED Filters)

  • 송종관
    • 한국전자통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1309-1314
    • /
    • 2012
  • SAMED 필터는 미디언 부필터들의 출력을 선형 FIR 필터의 입력으로 사용하는 다단 필터로 선형 필터와 순서통계에 기초한 비선형 필터의 특성을 모두 포함하는 광범위한 필터군(filter class)으로 소개되었다. 본 논문에서는 여러 가지 잡음 환경에서 주어진 영상에서 각 차수에 대한 최적 SAMED 필터를 설계하고 그 성능을 분석하였다. 연속 SAMED 필터가 아닌 각 차수에 대한 SAMED 필터의 성능을 분석함으로써 잡음의 종류에 따라서 각 차수의 효율이 다름을 보였다. 가우스 잡음의 경우는 낮은 차수의 필터들이 계산량 대비 성능이 우수한 반면 임펄스 잡음의 경우는 반대의 성향을 보인다는 사실을 밝혔다.

한국 프로야구 경기결과에 관한 통계적 연구 (A Statistical Study on Korean Baseball League Games)

  • 최영근;김형문
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.915-930
    • /
    • 2011
  • 경기의 결과를 모형 화하는 것은 다양한 방법을 통하여 이루어져 왔다. 특히 두 개의 팀만이 경기를 하는 경우에는 더욱 다양한 방법이 제안되었다. 그 중에서 Bradley-Terry 모형은 짝지어진 자료로부터 선호하는 크기의 특성을 얻을 수 있는 가장 넓게 사용되어지고 있는 모형이다. Bradley-Terry 모형은 스포츠 경기결과의 분석과 심리학에 관련된 분야들에서 다양하게 적용되어진다. 본 연구자는 한국 프로야구 자료에 Bradley-Terry 모형을 적용하였다. 그 결과 연속형 공변량의 경우 평균자책점과 세이브를 포함하는 모형이 최적으로 나타났고 관심의 대상이 되는 몇 가지 범주형 분석의 결과 동군과 서군, 골든글러브, 다승왕, 그리고 홈경기의 이점이 승부에 영향을 주는 것으로 나타났다. 하지만 이들의 조합은 단순히 연속형 변수만을 포함한 모형이 분석 결과 더 적절한 것으로 고려되어졌다. 제안된 모형은 경기의 승패를 예측하는 데도 유용하게 사용될 수 있다. 한 예로 한국시리즈에서 우승할 확률들의 순서가 2008년도의 결과와 정확히 일치하였다.