• 제목/요약/키워드: 새로운 범주

검색결과 395건 처리시간 0.031초

데이터 마이닝을 위한 대용량 고차원 데이터의 셀-기반 분류방법 (Cell-based Classification of High-dimensional Large data for Data Mining Application)

  • 진두석;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.192-194
    • /
    • 2000
  • 최근 데이터 마이닝에서 대용량 데이터를 처리하는 응용이 많아짐에 따라, 클러스터링(Clustering) 및 분류(Classification)방법이 중요한 분야가 되고 있다. 특히 분류방법에 관한 기존 연구들은 단지 메모리 상주(memory-resident) 데이터에 대해 한정되며 고차원 데이터를 효율적으로 처리할 수 없다. 따라서 본 논문에서는 대용량 고차원 데이터를 효과적으로 처리할 수 있는 새로운 분류 알고리즘을 제안한다. 이는 데이터들을 차원 공간상의 셀(cell)로 표현함으로써 수치(numerical) 애트리뷰트와 범주(categorical) 애트리뷰트 모두 처리할 수 있는 알고리즘을 제안한다. 아울러, 실험결과를 통해 제안한 알고리즘이 데이터의 양,차원 그리고 속성에 관계없이 분류를 효과적으로 수행함을 보인다.

  • PDF

데이터 분포를 고려한 연속 값 속성의 이산화 (Discretization of continuous-valued attributes considering data distribution)

  • 이상훈;박정은;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.217-220
    • /
    • 2003
  • 본 논문에서는 특정 매개변수의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형(conti-nuous) 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공하는 정보의 손실을 최소화하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

  • PDF

가상예제를 이용한 $Na{\ddot{i}}ve$ Bayes 분류기 성능 향상 (Improving Performance for $Na{\ddot{i}}ve$ Bayes Classifier Using Virtual Examples)

  • 이유정;강병호;강재호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.655-657
    • /
    • 2005
  • 기계학습에서 분류는 훈련 예제들로 학습하여 생성한 분류기를 활용하여 새로운 예제에 어느 한 범주를 부여하는 것을 말한다. 일반적으로 분류의 성능 즉 정확도의 향상은 학습 알고리즘을 개선하거나 훈련예제 집합을 변형시킴으로써 가능하다. 본 논문에서 소개하는 가상예제를 이용한 분류기 성능 향상 방안은 후자에 속한다. 실세계 분류문제에서 많은 수의 훈련예제들을 수집하는 일은 대상문제에 따라 비용이 많이 드는 경우가 있다. 또한 적은 수의 훈련예제를 학습해 생성한 분류기는 분류성능이 좋지 않을 수 있다. 본 논문에서는 이런 문제를 해결하기 위해서 가상예제를 생성해 훈련예제 집합에 추가하는 방안을 제안하고자 한다. 가상예제를 이용한 분류성능 향상방안이 $Na{\ddot{i}}ve$ Bayes 학습 알고리즘 성능 개선에 효과가 있음을 실험을 통해 확인하였다.

  • PDF

우리나라에 적용되는 저농축우라늄 구역 보장조치

  • 박완수
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1995년도 추계학술발표회논문집(2)
    • /
    • pp.1054-1059
    • /
    • 1995
  • 국제원자력기구에서는 현재 적용되고 있는 보장조치(Safeguards) 방법을 보다 효과적이고 효율적으로 적용하기 위하여 1993년부터 'Program 93+2'라는 사업을 수행하고 있다. 이중 하나의 과제로 수행되고 있는 구역 보장조치는 기존의 보장조치 개념이 하나의 시설을 대상(Facility-Oriented Safeguards)으로 개발된 것과는 달리 동일한 범주의 핵물질을 취급하는 여러 개의 시설을 하나의 가상적인 구역(Fuel Cycle-Oriented Safeguards)으로 설정하여 보장조치를 적용하는 개념으로, 보다 강화된 사찰 활동에 의하여 보장조치 신뢰도를 향상시키면서 사찰 횟수 및 사찰량은 절감되고 있다. 우리나라는 한국원자력연구소의 중수로핵연료 가공시설과 월성 1호기를 천연우라늄 구역(Natural Uranium Zone)으로, 한국원전연료(주)의 경수로핵연료 가공시설과 국내의 모든 경수로를 저농축우라늄 구역(Low Enriched Uranium Zone)으로 설정하여 성공적으로 구역 보장조치를 적용하고 있다. 그러나 이러한 구역 보장조치의 적용에는 원자력산업 체제의 단순화와 같은 제약조건이 따른다. 앞으로 우리나라에서는 현재 적용되고 있는 구역 보장조치 방법이 보다 효율적으로 운영되고 시설 운영에 대한 방해를 최소화시키는 방안을 고려하여야 하며 이에 는 가공시설에서의 생산 및 수송 일정을 발전소 운영 및 사찰 일정과 적절히 조화시키는 방법, 가공시설에서 검증된 핵연료에 대하여 적절한 감시 및 봉인 장비를 적용하는 방법, 현재의 구역 이외의 시설 또는 핵물질에 새로운 구역을 설정, 적용하는 방안 등을 고려할 수 있다.

  • PDF

보전등급 설정에 대한 식물개체의 중요도 평가의 기준 (Criteria of Evaluation Method of Importance of Individual Plant to Establishment of the Conservation Rank)

  • 송종석
    • 한국환경생태학회지
    • /
    • 제19권1호
    • /
    • pp.63-68
    • /
    • 2005
  • 지역의 자연환경을 평가하기 위하여 식물개체의 평가수법을 검토하였다. 기존의 평가 시스템을 기초로 새로운 평가항목의 시안을 제시하였다. 평가항목은 대장(1979)과 오전과 중촌(1989)의 체계에 준하여 총 9항목으로 하였다. 이들 항목은 다시 질, 양, 기능, 활력도 등 네가지 다른 범주로 분류되었다 이들 평가방법은 지역의 환경평가에 즈음하여 공간계획을 증진하고 행정적 문제를 완화하는데 이용될 수 있다. 또 식물개체의 보전등급 설정에도 응용될 수 있다.

디지털 환경에서의 로컬리티 기록화 방법론 연구 (A Study on Documenting Locality in Digital Environment)

  • 설문원
    • 한국기록관리학회지
    • /
    • 제11권1호
    • /
    • pp.207-230
    • /
    • 2011
  • 이 논문의 목적은 지역 내 기록유산기관들의 협력을 기반으로 하는 Cox의 로컬리티 기록화 모형의 한계를 극복하고 디지털 환경에 맞는 새로운 방안을 제시하는 것이다. 이를 위해 국내외에서 이루어지고 있는 로컬리티 기록화와 관련한 접근방법을 4가지로 유형화하여 분석하였다. 이를 토대로 특히 공간과 장소를 중심축으로 하는 기록화의 범주를 도출하고 참여와 협력을 통하여 로컬리티가 담긴 기록을 생산 수집할 수 있는 지속가능한 아카이브를 구축하기 위한 방향을 제안하였다.

QA를 위한 백과사전 사건 추적 시스템의 설계 (Design of Topic Detection and Tracking System for QA in Encyclopedia)

  • 장혜주;정유철;강보영;송사광;김운;송훈;맹성현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.22-24
    • /
    • 2006
  • 본 논문은 백과사전 QA에서 여러 문서에서 정답을 추출한 후 종합하여 답을 출력하여야 하는 질의를 위한 백과사전 사건 추적 시스템을 제안한다. 본 시스템은 사건 관련 질문과 문서의 속성을 반영할 수 있는 템플릿을 정의하여 문서를 추적하며, 하나의 사건은 '제목' '시간', '장소' '주체', '범주'의 5가지 속성을 가진다. 이러한 방법론을 통하여 기존 QA 시스템의 정답 추출 성능 향상에 도움을 주고, 정보 구성(organizing)과 TDT(Topic Detection and Tracking) 연구에서의 새로운 관점과 방향을 제시하고자 한다.

  • PDF

동적 3-D 뉴로 시스템을 이용한 오프라인 필기체 숫자 인식 (Off-line Handwritten Digit Recognition Using A Dynamic 3-D Neuro System)

  • 김기택;권영철;이수동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.505-508
    • /
    • 2004
  • 본 논문은 동적 3-D 뉴로 시스템(A Dynamic 3-D Neuro System)모델을 이용하여 오프라인 필기체 숫자 인식 실험을 하였다. 3-D 뉴로 시스템 모델을 사용함으로써 기존에 교육된 정보를 유지하면서 새로운 정보를 추가할 수 있는 추가학습이 가능했고, 동일한 범주의 정보에 대해서는 반복교육 횟수에 따라 교육정도가 점점 누적되는 반복교육이 가능했다. 교육과정을 통해 누적된 정보로부터 일반화된 패턴(Generalized Pattern)을 도출해 인식시 사용할 수 있었다. 패턴 인식기는 피드백루틴을 통해 미지의 입력이미지를 원형이미지로 복원한 후, 그 결과 데이터를 사용하여 문자를 인식하도록 동작한다. NIST의 MNIST 데이터베이스를 사용해 실험을 하였고, 결과로 $99.0\%$의 정인식률을 얻었다.

  • PDF

구매이력 데이터에서 상품 분류 체계를 고려한 시퀀스 유사도 측정 기법 (A Sequence Similarity Measure Considering the Product Taxonomy in Transaction Data)

  • 양유정;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.367-370
    • /
    • 2019
  • 본 논문은 구매이력 데이터에서 상품간의 분류 체계를 고려하여 시퀀스 간의 유사도를 계산하는 새로운 방법을 제안한다. 시퀀스란 두 항목간의 순서가 존재하는 데이터를 의미한다. 항목 간의 선후관계가 중요한 시퀀스 데이터에서는 두 시퀀스 간의 유사도를 정확히 정의하는 것이 중요하다. 본 논문에서는 대표적인 시퀀스 유사도 측정 알고리즘인 편집 거리 알고리즘을 활용하여 구매이력 데이터에서 시퀀스 간의 유사도를 정의한다. 상품은 상품의 특성에 따라 항목 분류 체계에서 여러 범주로 분류된다. 이 경우 기존의 편집 거리 알고리즘에서 문자의 일치유무에 따라 단순히 0 또는 1을 부여하는 것은 부정확하다. 따라서 본 논문은 편집 거리 알고리즘의 수정 연산 중 대체 연산 비용 계산 시 항목 분류 트리를 사용하여 연산 비용이 0 에서 1 사이의 값을 가지도록 세분화하였다. 실험 결과 제안 방법은 대체 연산 비용 계산 시 두 문자가 다르면 단순히 1 을 부여하는 기존의 편집 거리 알고리즘에 비해 시퀀스 간의 유사도를 더 정확하게 계산함을 확인하였다.

젖은 곱슬머리를 표현하기 위한 컬 기반의 효율적인 제약 모델 (Curl-based efficient constraint model for wet curly hair)

  • 안장훈;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.567-568
    • /
    • 2022
  • 헤어 시뮬레이션은 수많은 가닥으로 구성되어 있으며, 헤어 동역학을 기반으로 계산되기 때문에 일반적으로 계산양이 큰 범주에 속한다. 뿐만 아니라 곱슬머리 형태를 유지하려는 제약은 더 큰 계산을 요구하며, 본 논문에서는 수분에 의해 곱슬머리가 젖었을 때 표현되는 구부러짐과 수축을 모델링 할 수 있는 새로운 알고리즘을 제시한다. 이전 연구에서는 곱슬머리에 대한 헤어 시뮬레이션은 곱슬머리의 회전(Curl)형태를 유지하려는 알고리즘을 제안했지만, 강한 외력에 의한 회전형태만을 유지하려고 했으며, 수분이나 열에 의한 곱슬머리의 상태변화는 고려하지 못했다. 따라서 본 논문에서는 IIR(Infinite impulse response) 필터로 스무딩된 헤어 커브를 따라 회전의 수직 성분을 추출하여 회전의 세로방향 신축성을 제어할 수 있는 방법을 제안한다. 우리의 헤어 모델은 곱슬머리의 회전과 신축성을 제어하기 위해 스프링 동역학을 사용하며, 젖은 헤어의 부분적인 상태 변화에도 안정적으로 표현할 수 있음을 보여준다.

  • PDF