• 제목/요약/키워드: 범주

검색결과 3,933건 처리시간 0.033초

대용량 데이터를 위한 전역적 범주화를 이용한 결정 트리의 순차적 생성 (Incremental Generation of A Decision Tree Using Global Discretization For Large Data)

  • 한경식;이수원
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.487-498
    • /
    • 2005
  • 최근 들어, 대용량의 데이터를 처리할 수 있는 트리 생성 방법에 많은 관심이 집중되고 있다 그러나 대용량 데이터를 위한 대부분의 알고리즘은 일괄처리 방식으로 데이터를 처리하기 때문에 새로운 데이터가 추가되면 이 데이터를 반영한 결정 트리를 생성하기 위해 처음부터 트리를 다시 생성해야 하다. 이러한 재생성에 따른 비용문제에 보다 효율적인 접근 방법은 결정 트리를 순차적으로 생성하는 접근 방법이다. 대표적인 알고리즘으로 BOAT와 ITI를 들 수 있으며 이들 알고리즘은 수치형 데이터 처리를 위해 지역적 범주화를 이용한다. 그러나 범주화는 정렬된 형태의 수치형 데이터를 요구하기 때문에 대용량 데이터를 처리해야하는 상황에서 전체 데이터에 대해 한번만 정렬을 수행하는 전역적 범주화 기법이 모든 노드에서 매번 정렬을 수행하는 지역적 범주화보다 적합하다. 본 논문은 수치형 데이터 처리를 위해 전역적 범주화를 이용하여 생성된 트리를 효율적으로 재생성하는 순차적 트리 생성 방법을 제안한다. 새로운 데이터가 추가될 경우, 전역적 범주화에 기반 한 트리를 순차적으로 생성하기 위해서는 첫째, 이 새로운 데이터가 반영된 범주를 재생성해야 하며, 둘째, 범주 변화에 맞게 트리의 구조를 변화시켜야한다. 본 논문에서는 효율적인 범주 재생성을 위해 샘플 분할 포인트를 추출하고 이로부터 범주화를 수행하는 기법을 제안하며 범주 변화에 맞는 트리 구조 변화를 위해 신뢰구간과 트리 재구조화기법을 이용한다. 본 논문에서 피플 데이터베이스를 이용하여 기존의 지역적 범주화를 이용한 경우와 비교 실험하였다.

감성지향적 범주화를 통한 디자인?마케팅 전략(장류제품을 중심으로) (The Design?Marketing Strategy through emotion-oriented categorization(focused on Korean traditional sauce))

  • 이유리;양종열;박상준
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2007년도 춘계학술대회 및 국제감성 심포지엄
    • /
    • pp.64-66
    • /
    • 2007
  • 범주화(categorization)은 제품디자인에 있어서 매우 중요하다. 범주화의 유형에 따라 소비자의 감성이 다르고 감성의 차이에 따라 디자인 컨셉 및 디자인요소가 다르게 배합되어야 하기 때문이다. 특히 요즘처럼 제품라인이 확대되어 제품의 차별화가 모호한 경우에는 범주화과정이 필요하다. 즉 감성의 유사성정도를 바탕으로 정확한 범주를 정하고 컨셉화하여 소비자 지향적인 디자인을 제공해야 하는 것이다. 본 연구는 특정의 제품범주(장) 안에 유사한 하위 범주(고추장, 된장, 청국장, 쌈장, 간장)를 구성하고 있는 장류제품전체와 고추장, 된장, 청국장, 쌈장, 간장제품에 대한 소비자의 감성을 추출하고 그 유사성정도를 바탕으로 고추장, 된장, 청국장, 쌈장, 간장의 범주를 결정하여 디자인방향을 어떻게 결정해야 할지를 제시하는데 목적이 있다. 장류제품을 연구대상으로 한 것은 장류제품이 한국인의 식탁에서는 가장 기본적이고 중요한 제품 중의 하나이고 또 현대화시대의 라이프스타일과 환경의 변화로 시장이 확대되고 있기 때문이다. 실증연구는 전북지역과 서울지역의 소비자을 바탕으로 이루어졌다. 본 연구는 학문적 측면과 실무적 측면에서 제품디자인에 대한 다양한 통찰력을 제공할 것이다.

  • PDF

단어 군집 기반 모바일 애플리케이션 범주화 (Word Cluster-based Mobile Application Categorization)

  • 허정만;박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 단어 군집 정보를 활용하여 모바일 애플리케이션의 범주를 분류하는 방법을 제안한다. 제안하는 방법은 모바일 애플리케이션 설명이 짧을 수 있다는 점을 고려하여, 모바일 애플리케이션 설명에 포함된 단어 정보 뿐만 아니라 각 단어의 단어 군집 대표 정보를 범주화 자질로 활용한다. 그리고, 모바일 애플리케이션의 카테고리가 세분화되어 있으므로, 제안하는 방법은 범주별 단어 발생 빈도를 K 평균 군집화 알고리즘에 적용하여 단어 군집을 생성한다. 모바일 애플리케이션 설명이 설치사양과 같이 범주와 관련없는 내용이 있을 수 있다는 점을 반영하여, 제안하는 방법은 단어 군집 중에서 범주화에 유용한 일부 단어 군집만을 선별하여 활용한다. 실험결과 제안하는 방법은 단어 군집 정보를 활용하여 모바일 애플리케이션 범주화 재현율을 5.65% 개선시켰다.

워드 임베딩과 유의어를 활용한 단어 의미 범주 할당 (Assignment Semantic Category of a Word using Word Embedding and Synonyms)

  • 박다솔;차정원
    • 정보과학회 논문지
    • /
    • 제44권9호
    • /
    • pp.946-953
    • /
    • 2017
  • 의미역 결정은 서술어와 논항들 사이의 의미 관계를 결정하는 문제이다. 의미역 결정을 위해 의미 논항 역할 정보와 의미 범주 정보를 사용해야 한다. 세종 전자사전은 의미역을 결정하는데 사용한 격틀 정보가 포함되어 있다. 본 논문에서는 워드 임베딩과 유의어를 활용하여 세종 전자사전을 확장하는 방법을 제시한다. 연관 단어가 유사한 벡터 표현을 갖도록 하기 위해 유의어 사전의 정보를 사용하여 재구성된 벡터를 생성한다. 기존의 워드 임베딩과 재구성된 벡터를 사용하여 동일한 실험을 진행한다. 워드 임베딩을 이용한 벡터로 단어의 세종 전자사전에 나타나지 않은 단어에 대해 의미 범주 할당의 시스템 성능은 32.19%이고, 확장한 의미 범주 할당의 시스템 성능은 51.14%이다. 재구성된 벡터를 이용한 단어의 세종 전자사전에 나타나지 않은 단어에 대해 의미 범주 할당의 시스템 성능은 33.33%이고, 확장한 의미 범주 할당의 시스템 성능은 53.88%이다. 의미 범주가 할당되지 않은 새로운 단어에 대해서 논문에서 제안한 방법으로 의미 범주를 할당하여 세종 전자사전의 의미 범주 단어 확장에 대해 도움이 됨을 증명하였다.

범주화 훈련과 전문성이 인지 문제 해결에 미치는 영향 (Effects of categorization training and expertise on cognitive problem solving)

  • 이희승;손영우
    • 인지과학
    • /
    • 제16권1호
    • /
    • pp.53-67
    • /
    • 2005
  • 본 연구는 전문성에 따른 범주화 양상의 차이를 확인하고, 범주화 훈련이 전문성에 따라 인지 문제 해결에 어떠한 영향을 주는지 살펴보았다. 실험 떼서는 수학 연립방정식 문제를 사용하여 전문성 수준에 따른 집단별 문제 범주화 양상의 차이를 확인하였다. 전문가는 주로 문제 해결방법과 관련된 문제의 구조적 특징을 범주화의 기준으로 사용하였지만, 초보자는 문제의 표면적 정보를 기준으로 하여 범주화하였다. 그러나 문제의 구조를 명시적으로 표현한 조건 범주화 상황에서 초보자의 범주화 양상이 전문가와 같은 형태로 변화하는 것을 확인할 수 있었다. 초보자와 전문가의 범주화 양상이 다른 것은 초보자들이 문제의 깊은 구조를 파악하는데 어려움이 있기 때문인 것으로 보인다. 실험 2에서는 문제의 구조가 명시적으로 표현된 조건 범주화 훈련이 문제해결 능력의 향상을 가져올 수 있는지 알아보기 위하여 문제 해결 훈련을 한 집단과의 비교를 통해 전이 검사수행을 살펴보았다. 실험 결과, 전문가 집단은 문제해결 훈련이 효과적이었던데 반해, 초보자 집단은 문제 분류훈련이 더 효과적인 것으로 나타났다. 이는 초보자의 경우 문제의 깊은 구조를 파악하기 어렵기 때문에 이를 명시적으로 보여주어 훈련시킴으로써 문제 해결에 도움을 주기 때문인 것으로 보인다. 따라서 전문성의 수준에 따라 서로 다른 형태의 교육방법이 사용되어야 할 것이다.

  • PDF

범주 응집성과 기저율의 상호작용이 선호의 이유 추정에 미치는 효과 (Effect of Interaction between Category Coherence and Base Rate on Presumption of Reasons for Preference)

  • 도은영;이국희
    • 인지과학
    • /
    • 제31권3호
    • /
    • pp.77-102
    • /
    • 2020
  • 복장이나 언행에서 유사성이 높고, 다른 범주와 구분이 용이한 군인이나 수녀들이 가진 속성은 일반화되기 쉽다는 범주 응집성 효과 연구에는 어느 정도 진전이 있었다. 그러나 이러한 범주 응집성 효과의 근본에 어떤 심리적 기제가 있는지에 대한 직접적인 연구가 드물었기에 본 연구에서 다루어보고자 한다. 이를 위해 본 연구는 응집성이 높은 범주(수녀, 군인, 비행기승무원)와 낮은 범주(통역사, 웨딩플래너, 플로리스트)를 선정한 후, 두 가지 실험을 진행하였다. 실험 1은 응집성이 높은 범주에서 [속성X]가 반복 관찰될 때가 응집성 낮은 범주에서 [속성X]가 반복 관찰될 때보다 해당 범주 구성원이 [속성X]를 선호할 만한 이유가 있을 것으로 추정하는 정도(선호의 이유 추정 정도)가 높아지는 현상을 관찰하였다. 실험 2는 응집성이 높은 범주의 경우, 일상적으로 드물게 나타나는 [속성X](기저율 30%)이 관찰될 때는 선호의 이유 추정 정도가 높아지지만, 일상에서 자주 나타나는 [속성Y](기저율 70%)가 관찰될 때는 선호의 이유 추정 정도가 낮아지는 현상을 관찰하였고, 응집성이 낮은 범주의 경우, 일상에서 드물게 나타나는 속성과 자주 나타나는 속성 모두 선호의 이유 추정 정도가 낮은 경향을 확인하였다. 즉 범주 응집성과 기저율의 이원 상호작용이 선호의 이유 추정 정도에 미치는 효과가 유의하였다. 본 연구가 심리학적 본질주의, 고정관념 형성에 시사점을 가진다는 것에 대해 논의하였다.

공단지역에서 생육하는 가로수 27종의 항산화특성과 잠재적 환경정화능력 (Antioxidant Characteristics and Phytoremediation Potential of 27 Taxa of Roadside Trees at Industrial Complex Area)

  • 한심희;이재천;오창영;김판기
    • 한국농림기상학회지
    • /
    • 제8권3호
    • /
    • pp.159-168
    • /
    • 2006
  • 대기오염물질을 정화하기에 적합한 수종을 탐색하기 위하여, 공단지역의 가로수로 식재된 27개 수종의 잎에서 항산화 능력, 과산화 지질 함량 및 질소함량을 조사하였다. 2깨 수종 중 항산화 능력이 가장 높은 수종은 개잎갈나무(91.4%) 이었고, 가장 낮은 수종은 벽오동(56.9%) 이었다. MDA함량이 가장 적은 수종은 배롱나무와 은행나무였으나, 양버즘나무, 구실잣밤나무, 후박나무 및 향나무에서는 높은 MDA 함량이 측정되었다. 낙엽활엽수의 항산화 능력은 상록수의 항산화 능력과 뚜렷한 차이가 없었으나, 낙엽활엽수의 MDA 함량은 상록수의 MDA 함량보다 낮게 나타났다. 27개 수종은 항산화 능력과 과산화지질 함량을 기준으로 하여 다음과 같이 4개의 범주로 구분하였다. 범주 I은 높은 항산화 능력과 낮은 과산화지질 함량을 가진 수종, 범주 II는 높은 항산화 능력과 높은 과산화지질 함량을 가진 수종, 범주 III은 낮은 항산화 능력과 낮은 과산화지질 함량을 가진 수종, 범주 IV는 낮은 항산화 능력과 높은 과산화 지질 함량을 가진 수종. 이들 4개 범주에 속하는 수종은 각각 7종(범주 I), 6종(범주 II), 8종(범주 3), 6종(범주 IV) 이었다. 높은 항산화 능력을 가진 범주 I과 II의 수종들은 낮은 질소함량을 나타냈으나, 낮은 항산화능력을 가진 범주 III과 IV의 수종들은 높은 질소함량을 나타냈다. 그러나 범주 I과 II에 속하는 메타세코이아, 굴피나무, 양버즘나무는 예외적으로 높은 항산화 능력과 높은 질소함량을 나타냄으로써 이들 수종들은 공단지역의 식재 수종으로 적합한 것으로 판단되었다.

암석과 지각, 판구조론에 대한 고등학교 학생들의 존재론적 범주화 (Ontological Categorizing of High School Students About Rocks and Crust, Plate Tectonics)

  • 정구송
    • 과학교육연구지
    • /
    • 제33권1호
    • /
    • pp.56-68
    • /
    • 2009
  • 이 연구는 암석과 지각, 판구조론에 대한 학생들의 존재론적 범주화를 분석한 것이다. 연구에는 고등학교 1학년 169명의 학생들이 참여하였으며, 연구 영역에 대한 학생들의 존재론적 범주화 경향을 밝히기 위해 질문지를 개발하고 부호화 틀을 제작하였다. 그리고 모든 학생 결과물들은 부호화 틀에 따라 4 단계(물질, 전환, 초기적 과정, 완료적 과정)의 범주로 부호화하였다. 연구 결과에서 다음과 같은 결과를 얻었다. 첫째, 연구 영역의 개념들에 대한 학생들의 존재론적 범주화는 암석 영역의 개념들에서 62%로 그리고 지각 영역의 개념들에서 75%로 우세하게 물질과 전환 범주로 분류되었다. 판구조론 영역에 대한 개념들의 존재론적 범주화 경향은 65%가 과정 범주로 부호화됨으로써 비교적 과정 지향적 관점을 가지고 있는 것으로 해석되었다. 둘째, 학생 개개인의 영역별 개념들에 대한 존재론적 범주 배정 경향은 모든 영역에서 과정 범주와 물질 범주로 부호화된 학생의 비율이 각각 17%, 30%로 확인되었다. 응답 분석 결과에서 물질 범주로 부호화된 대부분의 학생들은 세계를 단순한 물질의 조합으로 보는 경향이 많은 것으로 확인되었다. 그리고 지식 구조를 형성하는 개념들에 대하여 현상이나 사건 자체로만 사고하는 존재론적 신념을 지니고 있는 것으로 나타났다.

  • PDF

조건부 확률에 기반한 범주형 자료의 거리 측정 (A distance metric of nominal attribute based on conditional probability)

  • 이재호;우종하;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.53-56
    • /
    • 2003
  • 유사도 혹은 자료간의 거리 개념은 많은 기계학습 알고리즘에서 사용되고 있는 중요한 측정개념이다 하지만 입력되는 자료의 속성들중 순서가 정의되지 않은 범주형 속성이 포함되어 있는 경우, 자료간의 유사도나 거리 측정에 어려움이 따른다. 비거리 기반의 알고리즘들의 경우-C4.5, CART-거리의 측정없이 작동할 수 있지만, 거리기반의 알고리즘들의 경우 범주형 속성의 거리 정보 결여로 효과적으로 적용될 수 없는 문제점을 갖고 있다. 본 논문에서는 이러한 범주형 자료들간 거리 측정을 자료 집합의 특성을 충분히 고려한 방법을 제안한다. 이를 위해 자료 집합의 선험적인 정보를 필요로 한다. 이런 선험적 정보인 조건부 확률을 기반으로한 거리 측정방법을 제시하고 오류 피드백을 통해서 속성 간 거리 측정을 최적화 하려고 노력한다. 주어진 자료 집합에 대해 서로 다른 두 범주형 값이 목적 속성에 대해서 유사한 분포를 보인다면 이들 값들은 비교적 가까운 거리로 결정한다 이렇게 결정된 거리를 기반으로 학습 단계를 진행하며 이때 발생한 오류들에 대해 피드백 작업을 진행한다. UCI Machine Learning Repository의 자료들을 이용한 실험 결과를 통해 제안한 거리 측정 방법의 우수한 성능을 확인하였다.

  • PDF

One-class 문서 분류를 위한 가상 부정 예제의 사용 (One-Class Document Classification using Pseudo Negative Examples)

  • 송호진;강인수;나승훈;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.469-471
    • /
    • 2005
  • 문서 분류에서의 one class classification 문제는 오직 하나의 범주를 생성하고 새로운 문서가 주어졌을 때 미리 만들어진 하나의 범주에 속하는가를 판별하는 문제이다. 기존의 여러 범주로 이루어진 분류 문제를 해결할 때와는 달리 one class classification에서는 학습 시에 이미 정해진 하나의 범주와 관련이 있는 문서들만을 사용하여 학습을 수행하기 때문에 범주의 경계를 정하는 것이 매우 어려운 작업이며 또한 분류기의 성능에 있어서도 매우 중요한 요소로 작용하게 된다. 본 논문에서는 기존의 연구에서 one class classification 문제를 해결할 때 관심의 대상이 되는 예제의 일부를 부정 예제로 간주하여 one class문제를 two class문제로 변경시켜 학습을 수행했던 것에서 더 나아가 추가적으로 새로운 가상 부정 예제를 설정하여 학습을 수행하고, SVM을 통하여 범주화 성능을 확인해 보기로 한다.

  • PDF