• 제목/요약/키워드: 자료분류

검색결과 5,182건 처리시간 0.031초

오분류된 이진자료에서 Agresti-Coull유형의 신뢰구간에 대한 이론적 고찰 (Theoretical Considerations for the Agresti-Coull Type Confidence Interval in Misclassified Binary Data)

  • 이승천
    • Communications for Statistical Applications and Methods
    • /
    • 제18권4호
    • /
    • pp.445-455
    • /
    • 2011
  • 표본추출에서 오분류된 이진자료는 흔히 발생될 수 있는 현실적인 문제이지만 통계적 방법론은 상대적으로 제한적이라고 할 수 있다. 특히, 모비율의 구간추정 문제는 고전적인 Wald 방법에 의존하고 있었다. 그러나 최근 이승천과 최병수 (2009)에서 Agresti-Coull 방법을 적용하고 새로운 구간추정 방법을 제시하였으며, 수치적인 방법에 의해 Agresti-Coull 신뢰구간의 효율성을 주장하였다. 본 연구에서는 오분류된 이진자료에 대한 베이지안 모형을 다루었으며, 베이지안 모형이 Agresti-Coull 신뢰구간의 이론적 배경이 될 수 있는지 살펴 보았다.

Adaptive Nearest Neighbors를 활용한 판별분류방법 (Adaptive Nearest Neighbors for Classification)

  • 전명식;최인경
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.479-488
    • /
    • 2009
  • 비모수적 판별분류방법으로 널리 사용되는 ${\kappa}$-Nearest Neighbors Classification(KNNC) 방법은 자료의 국소적 특징을 고려하지 않고 전체 자료에 대해 고정된 이웃의 개수 ${\kappa}$를 사용하여 개체를 분류하는 방법이다. 본 연구에서는 KNNC의 대안으로 자료의 국소적 특징을 고려하는 Adaptive Nearest Neighbors Classificaion(ANNC) 방법을 제안하였다. 제안된 방법의 특징을 규명하기 위하여 실제 자료에 대한 분석을 통하여 제안된 방법의 응용 가능성을 제시하였으며, 나아가 모의실험을 통하여 기존의 방법과의 효율성을 비교하였다.

Landsat TM 화상을 이용한 당진군 일원의 논면적 추정 (Estimation of Rice-Planted Area using Landsat TM Imagery in Dangjin-gun area)

  • 홍석영;임상규;이규성;조인상;김길웅
    • 한국농림기상학회지
    • /
    • 제3권1호
    • /
    • pp.5-15
    • /
    • 2001
  • 논의 시기별 파장별 분광반사특성을 조사하기 위해, Landsat TM 밴드, RVI, 습윤도의 특성을 분산분석한 결과, 가시광선 영역의 TM 밴드 1, 2, 3의 논지역 평균 자료값은 식물색소에 의한 광흡수와 관련이 많아 군락형성이 최대인 8월 19일과 9월 1일에 가장 낮아졌다가 등숙기인 9월 중 하순에 다시 높아졌다. 중간 적외선 영역인 TM 밴드 5와 7은 수분에 민감하여, 담수상태로 수체의 영향이 컸던 5월 31일과 6월 2일의 자료값이 가장 낮았고, 군락의 최성기에서 성숙기로 접어들면서 식물체의 수분함량이 줄어들어 자료값이 점점 높아졌다. 한편, RVI는 출수ㆍ개화기인 8월 19일과 9월 1일에 가장 높았고, 습윤도는 벼의 생육초기에서 성숙기로 갈수록 계속 낮아졌다. 이앙기인 5월 31일, 출수기인 8월 19일 두시기 자료에서 수분에 민감한 TM 밴드 5, 식생의 특징이 드러나는 RVI, 또한 모든 밴드의 특성이 포함된 습윤도를 벼 재배면적 추정을 위한 정보로 이용하여, 이앙기에 담수상태이고 같은 지역이 출수기에 무성한 식생의 특징을 보이는 곳을 벼 재배지역으로 정하여 벼 재배면적 지도를 작성하였다. 벼 재배면적은 7291.19ha 추정되었고, 지형도를 이용한 100지점의 정확도 검증 결과 92%로 나타났다. 1991년 5월 31일과 8월 19일 두 시기의 Landsat TM 밴드 3, 4, 5, RVI 및 습윤도를 각각 유효밴드로 선정하여 중첩한 총 10개의 밴드를 가진 화상을 생성하여 기존의 분류법에 이용하였다. 최대우도법에 의한 감독분류 결과 벼 재배면적은 9100.98 ha였다. Error matrix에 의한 분류정확도는 97.2%로 나타났고, 지형도를 이용한 정확도는 95%로 나타났다. 분류항목수를 15개와 20개로 한 ISODATA법에 의한 비교사 분류결과 벼 재배면적이 각각 6663.60ha와 5704.56 ha로 추정되었고, 지형도에 의한 분류정확도는 각각 87%와 82%로 나타났다. 통계연보를 기준자료로 하여 분류방법간 비교를 위하여 당진군 우강면에 대하여 벼 재배면적 비교를 한 바 감독분류에 의해 2522.97ha로 가장 크게 추정되었고, 다음이 규칙기반분류와 분류항목수를 20으로 한 무감독분류법으로 각각 1567.31 ha와 1865.61 ha로 추정되었다. 분류항목수를 15로 한 무감독분류에 의한 벼 재배면적이 1638.72 ha로 가장 작게 추정되었다. 이때, 통계연보 자료상의 우강면의 논면적(2242.69ha)에 가장 가깝게 추정된 결과는 규칙기반분류이었다. 벼 재배지역은 추정방법에 관계없이 이앙기와 출수기, 두 시기의 자료를 이용한 경우 다소 차이는 있으나 정확하게 구분되었다. 위성의 분광반사 특성을 이용한 규칙기반분류는 매우 쉽고, 재현성이 있으며, 넓은 지역에 대한 신속한 작업이 가능하다.

  • PDF

불균형자료를 위한 판별분석에서 HDBSCAN의 활용 (Discriminant analysis for unbalanced data using HDBSCAN)

  • 이보희;김태헌;최용석
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.599-609
    • /
    • 2021
  • 군집간의 개체 수의 차이가 큰 자료들을 불균형자료라고 한다. 불균형자료의 판별분석에서 다수 범주의 개체를 잘 분류하는 것 보다 소수 범주의 개체를 잘 분류하는 것이 더 중요하다. 그러나 개체 수가 상대적으로 작은 소수 범주의 개체를 개체 수가 상대적으로 많은 다수 범주의 개체로 오분류하는 경우가 많다. 본 연구에서는 이를 해결하기 위해 HDBSCAN과 SMOTE를 결합한 방법을 제안한다. HDBSCAN을 이용하여 소수 범주의 노이즈와 다수 범주의 노이즈를 제거하고 SMOTE를 적용하여 새로운 자료를 만들어낸다. 기존의 방법들과 성능을 비교하기 위하여 AUC와 F1 점수를 이용하였고 그 결과 대부분의 경우에 HDBSCAN과 SMOTE를 결합한 방법이 높은 성능 지표를 보였고, 불균형자료를 분류하는데 있어 뛰어난 방법으로 나타났다.

한국음악자료 분류에 관한 연구 (A Study of the Classification of Korean Music Materials)

  • 한경신
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.5-34
    • /
    • 1998
  • 본 연구의 목적은 오늘날 한국음악에 관한 각종 다양한 자료를 융통성있게 수용하면서 학문적 전문지식에 근거한 보편성을 갖는 한국음악분류표를 제시하고자 하는 것이다. 이를 위하여 이론적배경으로서 한국 음악 및 한국음악학의 체계와 각종 음악자료의 유형을 살펴보고, KDC의 한국음악 분야를 비롯 현재 도서관 및 각종 관련기관에서 사용되고 있는 한국음악 관련 분류표들을 분석하여 조사 분석된 분류전개에서 이론적 배경을 근거로 문제점을 찾아 이를 기초로 각종 한국음악 관련 문헌들을 참고로 하여 새로운 한국음악 분야의 분류표를 전개하였다.

  • PDF

수치위성자료를 이용한 광역의 토지피복분류 기법 (Land Cover Classification Techniques for Large Area using Digital Satellite Data)

  • 박병욱
    • 한국측량학회지
    • /
    • 제14권1호
    • /
    • pp.39-47
    • /
    • 1996
  • Landsat TM자료를 이용하여 전라남도 전역에 대한 토지피복분류를 실시하므로서 광역 분석시 자주 발생하게되는 서로 다른 두 path 데이타의 통합 분석기법을 제시하였다. path가 다를 경우 관측일이 다르므로 개별적 분석후 통합하였으며, 이 과정에서 두 scene간의 분류가능 항목의 변화 및 자료 중복지역의 처리문제 등이 대두되었다. 또한 광역 분석시 위도차에 따른 데이타값의 변화로 인하여 분류항목 및 training field의 선정이 어려웠다. 본 연구에서는 수차례의 시행착오를 통하여 이러한 문제에 대한 해결방안을 제시하였으며, 분류 정확도 향상을 위한 Bayesian 최대우도법 및 majority 필터링의 효율성을 입증하였다.

  • PDF

국도 기능 분류를 위한 그룹핑 방법론에 관한 연구 (Grouping method on functional classification for national highway)

  • 김주현;도명식;정재은
    • 대한교통학회지
    • /
    • 제20권5호
    • /
    • pp.131-144
    • /
    • 2002
  • 도로의 그룹핑(Grouping)이란 도고 계획, 설계, 관리, 조사 계획 및 정비 방침 등을 세우기 위해 유사한 성격의 도로 구간을 군집화하는 방법이다. 기존에 일반적으로 적용되고 있는 도로 그룹핑 방법은 그룹 수를 미리 지정함으써 분석가의 주관적 판단이 개입되었고, 그룹핑 변수 선정에 대한 근거가 부족하였다. 이에 본 연구에서는 기존에 일반적으로 적용되고 있는 도로 그룹핑 방법을 개선하여 새로운 방법론을 제시하였다. 또한 새로 제시된 방법론의 검증을 위해 도로 교통량 통계연보에서 제공하고 있는 일반국도의 2000년 294개 상시조사 지전의 교통량 자료를 이용하여 분석하였다. 연구 결과 기존의 월, 요일 변동계수만을 적용한 그룹핑 방법보다는 기타 교통지표(AADT, $\Sigma$K1000(K값의 상위 1000번 순위까지의 누적 값), 중차량 비율, 주야율)를 동시에 적용할 때 좀 더 효율적이면서 세부적으로 분류됨을 알 수 있었다. 또한 기타 교통지표론 적당한 그룹핑 결과로는 5그룹의 국도 기능 분류가 가능함을 알 수 있었다. 그 결과 기존의 소재지역과 기능에 따른 국토의 구분을 지방 산업도로 그룹, 지역 간선도로 그룹, 대도시 주변형 도로 그룹, 중소도시 주변형 및 관광도로 그룹, 관광도로 그룹으로 분류할 수 있었다. 본 연구에서의 도로 그룹핑 결과에 각 지역특성을 추가하여 분석한다면 도로의 계획, 선계, 관리 등에 매우 유용한 자료로 활용되리라 예상한다. 또한 본 연구의 결과를 이용하면 좀 더 효율적으로 설계시간계수 선정, 전역 조사 지점의 AADT추정, 상시 교통량 조사 자료의 누락 데이터 보정 및 교통량 조사의 스케줄링에 많이 활용할 수 있을 것으로 기대된다.

구술문서 자료분석을 위한 정보검색기술의 응용 (Information Technology Application for Oral Document Analysis)

  • 박순철;함한희
    • 한국산업정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.47-55
    • /
    • 2008
  • 본 연구는 정보검색기술을 응용해서 구술문서 자료를 효율적으로 분석하는 시스템 개발을 목적으로 한다. 여기서 사용된 기술은 용어검색, 문서요약기술, 클러스터링기술 문서분류기술 주제추적기술 등이 있다. 본 연구를 위해서 전북지역에서 채록한 구술자료를 이용하였다. 구술문서 구조의 특성을 반영하면서 분석의 단위를 정하고 내용의 자동분류 및 분류체계에 따른 분류도 시도하였다. 특히 주제를 추적하면서 순서에 따라서 검색해 가는 기술은 세계적으로도 아직 연구단계에 있던 것을 실제로 구현하였다. 이러한 5가지의 검색기술이 한 시스템에서 통합적으로 처리될 수 있다는 것도 이 연구가 이룬 성과이다. 이 연구의 기대효과는 구술문서 분석의 신뢰성 타당성 효용성을 높여서 구술문화연구에도 큰 기여를 할 것으로 기대된다.

  • PDF

공공도서관 영유아실 자료조직 실태분석에 관한 연구: J시 시립도서관의 배가를 중심으로 (A Study on Resource Organization in Infants & Young Children's Sections in Public Libraries: Focusing on the Arrangement of Library Materials in J City's Municipal Libraries)

  • 형은영;김수정
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.85-106
    • /
    • 2016
  • 본 연구는 영유아 도서의 자료조직 실태를 파악하기 위하여 J시에 소재한 8개 시립도서관 영유아실을 대상으로 자료조직 현황과 문제점을 분석하고 이를 토대로 개선방안을 제시하였다. 조사방법은 분석대상 도서관의 어린이실 담당 사서 8명, 영유아실을 방문한 부모 25명을 대상으로 인터뷰를 실시하였다. 조사 결과, 모든 도서관에서 KDC를 적용하여 분류하고 있었으나 배가는 분류체계와는 달리 출판사명의 자모순 배가를 실시하고 있었다. 이러한 출판사별 배가 방식은 사서 측면에서는 정리의 편리성이 높은 것으로 평가되었으나 이용자들은 분류체계와 배가의 이원화로 인해 자료 검색의 어려움을 겪고 있는 것으로 조사되었다. 또한, 온라인검색목록시스템의 검색 결과에 도서 위치에 대한 정확하고 충분한 정보가 제공되지 않는 경우가 많았다. 이러한 결과를 바탕으로 본 연구는 (1) KDC를 유지하되 배가 방식을 청구기호 순으로 전환하는 방안과 (2) 새로운 영유아용 분류표를 개발하는 두 가지 개선방안을 제안하였다.

하천복잡도 시나리오를 이용한 흐름특성 모의 분석 (Analysis of Flow Characteristics Using River Morphological Complexity Scenario)

  • 이지완;정인균;박종윤;정충길;이미선;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.141-141
    • /
    • 2011
  • 생태적 기능이 담보되는 하안의 조성 및 복원은 필연적으로 하안공간에서 물리적 구조변화를 야기한다. 이러한 하안공간의 물리적 구조변화는 장기적으로 구간에서의 생태적 기능뿐만 아니라 단기적으로 하천의 수리특성변화를 야기한다. 이러한 수리특성변화는 복원구간에서의 생태적 기능에 직접적인 영향을 준다. 하천복잡도에 따른 수리특성의 변화는 자연형 하천복원에 영향을 주는 변수이므로 이들 변화를 예측할 수 있는 하천복잡도 시나리오의 수립은 매우 중요하다. 따라서 본 연구에서는 2차원 하상변동 수치모형인 CCHE2D 모형을 이용하여 하천유형에 따른 수리특성을 분석하고자 하였다. 하천복잡도 시나리오는 Rosgen (1994)에 의해 제안된 하천분류방법과 유량크기별 모의 시나리오를 작성하여 모델에 적용하였다. 연구대상지역은 안성천유역의 오산천과 진위천으로 하천분류결과 크게 C유형과 E 유형으로 분류되었다. 분류된 유형의 수리특성 분석을 위해 C 유형의 구간중 진위천 본류구간과 통삼천의 만곡구간을 선정하여 모형을 구동하였다. 모형의 입력자료인 유한요소망은 하천정비기본계획의 부도를 이용하여 생성하였으며 모델의 경계입력자료는 WMS HEC-1의 유출량 결과 자료를 사용하였다. 빈도별 강우량 자료를 Huff의 4분위 법을 적용하여 24시간으로 분포화하여 빈도별, 구간별 유출량 자료를 구축하여 모의 하였다. 선정한 하천유형구간에 대하여 유량크기별 수위, 유속, 한계유속, 소류력에 대한 흐름특성분석을 실시하였으며, 조도계수의 변화에 따른 흐름특성 변화를 분석하였다.

  • PDF