• 제목/요약/키워드: 속성분류

검색결과 859건 처리시간 0.028초

사례기반 추론을 위한 동적 속성 가중치 부여 방법 (A Dynamic feature Weighting Method for Case-based Reasoning)

  • 이재식;전용준
    • 지능정보연구
    • /
    • 제7권1호
    • /
    • pp.47-61
    • /
    • 2001
  • 사례기반 추론과 같은 사후학습 기법은 인공신경망이나 의사결정나무와 같은 사전학습 기법에 비해서 여러 장점을 가지고 있다. 하지만, 사후학습 기법은 사례 표현에 관련성이 적은 속성이 포함된 경우에는 성능이 저하되는 단점을 가지고 있다. 이러한 단점을 극복하기 위해서, 속성 가중치 부여 방법들이 연구되었다. 기존의 속성 가중치 부여 방법들은 대부분 전역적으로 속성 가중치를 부여하는 것이었다. 본 연구에서는 새로운 지역적 속성 가중치 부여 방법인 CBDFW를 제안한다. CBDFW 기법은 무작위로 생성된 속성 가중치들의 분류 성공 여부를 저장하고 있다가, 새로운 사례가 주어졌을 때에 성공적인 분류 결과를 보인 가중치들을 검색하여 동적으로 새로운 가중치들을 생성해낸다. 신용평가 데이터로 CBDFW의 성능을 실험한 결과, 기존의 연구들에서 제시된 분류 적중률보다 우수한 성능을 보였다.

  • PDF

가상예제를 이용한 수치 및 범주 속성 데이터의 분류 성능 향상 (Improving Classification Accuracy for Numerical and Nominal Data using Virtual Examples)

  • 이유정;강재호;강병호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.183-188
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크를 기반으로 생성하고 평가한 가상예제를 활용하여 범주속성 및 수치속성 데이터에 대한 분류 성능을 향상시키는 방안을 제안한다. 가상예제를 활용하는 종래의 연구들은 주로 수치 속성 데이터를 대상으로 한 반면 본 연구에서는 범주속성 데이터에 대해서도 가상예제를 적용하여 효과를 확인하였다. 그리고 대상 도메인에 특화된 지식을 활용하여 특정 학습 알고리즘의 성능을 향상시키는 것을 목표로 한 기존 연구들과는 달리 본 연구에서는 도메인에 특화된 지식을 활용하는 대신 주어진 훈련 집합을 기반으로 만든 베이지안 네트워크로부터 가상예제를 생성하고, 그 예제가 네트워크의 조건부 우도를 증가시키는데 기여할 경우 유용한 것으로 선별한다. 이러한 생성 및 선별과정을 반복하여 적절한 크기의 가상예제 집합을 수집하여 사용한다. 범주 속성 데이터와 수치 속성을 포함한 데이터를 대상으로 한 실험 결과, 여러 가지 학습 모델의 성능이 향상됨을 확인하였다.

  • PDF

우리나라 해양지명 표준화에 관한 연구 - 해양지명 명명 사례조사를 중심으로 - (A Study on Standardization of Marine Geographical Names in Korea)

  • 임영태;최윤수;윤하수
    • Spatial Information Research
    • /
    • 제19권6호
    • /
    • pp.55-65
    • /
    • 2011
  • 우리가 살고 있는 지역에는 이름 즉 지명이 있다. 바다 속 작은 바위에도 이름이 있다. 이를 해양지명이라 한다. 해양지명은 고유지명과 속성지명으로 분류할 수 있는데, 서론에서 언급한 해협, 만, 포 및 암(岩), 초(礁), 퇴(堆)등은 해양지명의 속성지명이다. 속성지명의 경우 이름을 붙이는 데는 일정한 법칙이 있다. 이를 통하여 우리나라 주변 바다에 많은 항해장애물인 암(岩), 초(礁), 퇴(堆)에 어떻게 이름을 명명하고 있는지, 현재 사용되고 있는 해양지명에 관하여 사례조사를 실시하였다. 또한 과거 해양지명의 속성분류와 현재의 속성 분류를 비교하고, 국립해양조사원에서 간행한 항해용해도에 사용되는 해양지명과 해양지명위원회에서 고시한 해양지명에 대해 조사 분석을 통하여 향후 해양지명의 표준화에 관한방안을 제시하였다.

유전자 알고리즘 기반의 불완전 데이터 학습을 위한 속성값계층구조의 생성 (Genetic Algorithm Based Attribute Value Taxonomy Generation for Learning Classifiers with Missing Data)

  • 주진우;양지훈
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.133-138
    • /
    • 2006
  • 부부분불완전 데이터(Partially Missing Data) 또는 데이터의 속성 값이 표현되는 정도의 깊이가 서로 다른 데이터를 학습하는데 있어서 속성값계층구조(Attribute Value Taxonomy, AVT)를 기반으로 학습하면 기존의 학습 알고리즘을 통해 얻은 결과보다 정확하고 간결한 분류기를 얻을 수 있다는 사실이 밝혀졌다. 하지만 이러한 속성값계층구조는 처음부터 전문가 또는 데이터 도메인에 대한 지식을 가지고 있는 사람에 의해 만들어져 제공되어야 한다. 이러한 수작업을 통한 속성값계층구조를 생성하기 위해서는 많은 시간이 걸리며 생성과정에서 오류가 발생할 수 있다. 또한 데이터 도메인에 따라서 속성값계층구조를 제공할 전문가가 부재한 경우가 있다. 이러한 배경 아래 본 논문은 유전자 알고리즘을 통해 자동으로 근 최적의 속성값계층구조를 생성하는 알고리즘(GA-AVT-Learner)을 제안한다. 본 논문의 실험은 다양한 실제 데이터를 가지고 GA-AVT-Learner로 생성한 속성값계층구조를 다른 속성값계층구조와 비교하였다. 따라서 GA-AVT-Learner에 의해 생성된 속성값계층구조가 정확하고 간결한 분류기를 제공함을 보이고, 불완전데이터 처리에 있어서도 높은 효율을 보임을 실험적으로 증명하였다.

특정 속성과 Co-training을 이용한 전자메일 분류 (E-Mail Filtering with Co-training Based on Specific Features)

  • 류제;윤성희;한광록
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.549-551
    • /
    • 2003
  • 본 논문은 점점 증가되고 있는 SPAM 메일 문제를 해결하기 위한 방법으로써, 특정 속성에 기반을 둔 학습 알고리즘의 co-training을 통한 전자메일 분류 기법을 제안한다. 전자메일 분류는 결국 문서 분류 기술과 다르지 않다. 이미 많은 연구에서 학습 알고리즘을 이용한 문서 분류 기법은 많이 제안되고 검증되었다. 본 논문에서는 이러한 학습 알고리즘들을 co-training을 통하여 해당 메일이 SPAM인지 아닌지 구분하며, 학습의 효율성을 높이기 위하여 전자메일의 특정한 속성들, 예를 들면, 핵심문구나 기타 특정한 문구 및 전자메일의 헤더 정보 등을 학습 기반으로 이용하였다.

  • PDF

물류설비 및 속성 분류체계 연구 (A Classification Study on Logistics Equipments and Their Attributes)

  • 장태우
    • 한국철도학회논문집
    • /
    • 제12권1호
    • /
    • pp.175-182
    • /
    • 2009
  • 포장, 수송, 운반, 하역, 보관 등 물류 기능별 단계에서 사용되는 설비의 호환성과 연계성에 대한 요구가 지속되고 있다. 본 연구에서는 일관수송을 위한 표준 파렛트를 중심으로 물류설비 간의 모자 관계 등에 대한 인터페이스 분석을 위한 분류체계를 제시하고자 한다. 이를 위해 국내외 물류설비 관련 분류체계 및 표준/규격을 검토하여 문제점과 이슈를 분석하였다. 또한 설비별 속성 분류체계를 제시하고 의미론적으로 표현하는 예를 제시한다. 본 연구의 결과를 확장하여 표준 파렛트의 변경 또는 다변화에 대비한 관련 물류설비의 정합성 검토의 자동화 작업이 가능할 것이다.

변형된 Category Utility를 이용한 점진 개념학습 (Incremental Conceptual Clustering Using Modified Category Utility)

  • 김표재;최진영
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.193-197
    • /
    • 2005
  • 점진적 개념 학습 알고리즘인 COBWEB은 클래스 정보가 주어지지 않은 사례들(instances)을 분류하기 위하여 사례의 속성과 값에 근거하여 학습하며 각 노드가 유사한 사례들의 집합인 클래스에 해당하는 분류 트리를 생성하는 알고리즘이다. 유사한 사례들을 같은 클래스로 분류하기 위한 기준으로 category utility가 사용되며 이는 클래스 내부의 유사도와 클래스간의 차이점을 최대화하는 방향으로 클래스를 분류한다 기존의 COBWEB에 사용되는 category utility는 클래스 사이즈와 예측 정확성 사이의 tradeoff 관계로 볼 수 있으며, 이로 인하여 예측 정확성은 약간 감소하나 클래스 사이즈가 커지는 방향으로 학습이 진행 될 수 있는 편향성(bias)를 가지고 있다. 이는 분류 트리에 불필요한 클래스 노드들(spurious nodes)을 생성하게 하여 학습 결과인 클래스 개념을 이해하는뎨 어렵게 한다. 본 논문에서는 클래스와 그에 속하는 사례들의 속성-값 분포를 고려하여 클래스와 속성의 연관성에 비례한 가충치를 더한 변형된 category utility를 제안하고, dataset에 대한 실험을 통하여 제안된 category utility가 기존의 큰 클래스 사이즈를 선호하는 bias를 완화시킴을 보이고자 한다.

  • PDF

초등학교 6학년의 인공자극과 자연자극에 대한 분류 사고 (Classification Activity Thoughts of Elementary Sixth Grade Pupils about Artificial and Natural Stimulus)

  • 최현동;양일호;권치순
    • 한국과학교육학회지
    • /
    • 제26권1호
    • /
    • pp.40-48
    • /
    • 2006
  • 이 연구의 목적은 초등학교 6학년 학생의 분류활동에서 나타나는 사고 유형, 과정과 특징을 분석하는 것이다. 이러한 목적을 달성하기 위하여 분류활동 수행에 적합한 2가지 도구를 개발하였다. 첫 번째는 속성이 분명하게 드러나는 인공자극카드이고, 두 번째는 속성이 잘 드러나지 않는 자연자극카드이다. 서울시 영등포구 소재 D초등학교 6학년 8명을 대상으로 질적 연구를 수행하였다. 자료는 피험자의 과제 수행과정을 녹화한 비디오테이프, 피험자의 분류 기록지, 연구자의 피험자 행동 관찰, 피험자와의 면담 등 자료 삼각측정법에 의해 획득하였다. 연구결과, 6학년 학생들은 분류활동에서 속성 관찰, 속성 평가, 예비 점검, 기준 선택, 샘플 동정의 다섯 가지 유형의 사고를 하였으며, 모든 항목을 분류할 때까지 속성 관찰 $\rightarrow$ 속성 평가 $\rightarrow$ 예비 점검 $\rightarrow$ 기준 선택 $\rightarrow$ 샘플 동정의 과정을 반복하였다. 그리고 인지 경제성을 활용하여 분류하여 분류하였다. 이상의 연구 결과는 과학 분류 학습 지도에 다음과 같은 시사점을 줄 수 있다. 첫째,교사가 학생들의 분류 사고과정을 이해한다면, 보다 효과적인 분류학습 지도가 가능할 것이다. 둘째, 분류사고 과정의 각 단계를 고려한 단계별 학습지도가 필요하다.

질감 및 에지 방향 특징에 기반한 게임 캐릭터 분류에 관한 연구 (A Study on Game Character Classification Based on Texture and Edge Orientation Feature)

  • 박창민
    • 한국정보통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.1318-1324
    • /
    • 2012
  • 본 논문에서는 게임의 재미를 높이고 속도감 있는 게임 진행을 위하여 게임 캐릭터의 특징에 따라 움직임이 없는 캐릭터(NPC)와 움직임이 있는 캐릭터(Monster)로 분류하는 방법을 제시한다. 분류 속성은 각각의 캐릭터 내부에 있는 직선선분의 특징을 추출하여 사용한다. 우선 캐릭터 내부에 존재하는 에지 특징을 추출하여 EEDH를 산출하고 또한 방향성을 질감의 속성으로 이용하여 SSPD를 계산한다. 추출된 속성들은 특정 방향에 따른 에너지를 나타내며 캐릭터 내부의 특정 방향에 대한 크기를 나타내고 있기 때문에 게임 캐릭터들을 NPC와 Monster로 분류 하는 속성으로 이용하였다. 본 논문에서 제안한 방법은 게임진행에서 유저가 불필요한 플레이를 함으로서 소모되는 시간을 줄이고 전략적이고 속도감 있게 플레이 할 수 있는 기능을 제공한다.

Na$ddot{i}$ve-Bayesian Classifier를 이 용한 전자 카탈로그 자동 분류 시스템 (Extending Na$ddot{i}$ve Bayesian Classifier for Catalog Classification Systems)

  • 서광훈;이경종;김현철;이태희;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.91-93
    • /
    • 2004
  • B2B Marketplace상에서의 거래에서 나타나는 주요한 특징은 다품종 및 대량의 물품 거래가 n:n거래 관계에 놓여있다는 점과 거래자가 원활한 거래 및 기업 내 관리를 위해 각자의 전자 카탈로그를 이용한 거래를 원한다는 정이다. 하지만 개별적인 전자 카탈로그 사용과 미흡한 표준안은 전자 카탈로그 상호 연계의 걸림돌이 되어 시장 형성의 걸림돌이 되고 있다. B2B Marketplace는 표준 분류체계를 중심으로 거래 대상 상품을 재분류하여 구매 당사자간의 거래 대상 물품에 대한 상호 애핑을 지원하는 방법 등으로 이를 충족시키려 하고 있다. 하지만 요청되는 다량의 물품에 대해 매번 분류를 수행해야 하는 고비용의 작업이라는 문제점이 있다. 본 논문에서는 이를 극복하기 위하여 기계학습 기법을 이용한 전자 카탈로그 상품 자동분류기를 모델링하고 이를 구현하는 것에 초점을 두었다. 상품의 속성별로 분류에 끼치는 영향력이 다론 것이라는데 착안하여 전자 카탈로그를 상품 단위로 재 모델링 하였으며 속성별 정보가 풍부하지 못한 정물 극복하기 위하여 속성값을 어휘 단위로 구분한 데이터를 추가 하는 확장 모델을 정의하였다. 또한 해당 모델을 학습시키기 위한 알고리즘으로는 속성별로 다른 가중치를 부여 할 수 있도록 확장된 Naive Bayesian Classifier를 고안하였다. 그리고 이론 B2B Market Place상의 실 데이터에 적용하여 고안된 모델의 유효성을 검증하였다.

  • PDF