• 제목/요약/키워드: 분류각

검색결과 5,720건 처리시간 0.034초

문서 요약 기법을 이용한 자동 문서 범주화 (Automatic Text Categorization Using Text Summarization Techniques)

  • 박진우;고영중;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.138-145
    • /
    • 2001
  • 자동 문서 범주화란 문서의 내용에 기반하여 미리 정의되어 있는 범주에 문서를 자동으로 분류하는 작업이다. 문서 분류를 위해서는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고, 이러한 자질들을 통해 분류할 문서를 표현해야 한다. 기존의 연구들은 문장간의 구분 없이, 문서 전체에 나타난 각 자질의 빈도수를 이용하여 문서를 표현 한다. 그러나 하나의 문서 내에서도 중요한 문장과 그렇지 못한 문장의 구분이 있으며, 이러한 문장 중요도의 차이는 각각의 문장에 나타나는 자질의 중요도에도 영향을 미친다. 본 논문에서는 문서에서 사용되는 중요 문장 추출 기법을 문서 분류에 적용하여, 문서 내에 나타나는 각 문장들의 문장 중요도를 계산하고 문서의 내용을 잘 나타내는 문장들과 그렇지 못한 문장들을 구분하여 각 문장에서 출현하는 자질들의 가중치를 다르게 부여하여 문서를 표현한다. 이렇게 문장들의 중요도를 고려하여 문서를 표현한 기법의 성능을 평가하기 위해서 뉴스 그룹 데이터를 구축하고 실험하였으며 좋은 성능을 얻을 수 있었다.

  • PDF

Card sorting기법을 이용한 사용자 중심의 쇼핑몰 카테고리 제안 (The mall offers user-centric categorys Using Card sorting methods)

  • 윤정민;한미란;박범
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 추계학술대회
    • /
    • pp.291-295
    • /
    • 2009
  • 최근 인터넷 쇼핑몰이 활성화 되면서 각 쇼핑몰의 카테고리 분류 체계에 대한 사용자의 접근 편이성이 중요한 요소로 부각되었다. 따라서, 카테고리 분류체계에 대한 사용성 평가를 통하여 각 카테고리의 타당성 검증 및 개선에 대한 필요성이 대두되고 있다. 본 논문에서는 D 쇼핑몰의 각 카테고리 항목을 대상으로 카드 소팅 기법을 실시하여 새로운 카테고리 분류체계를 제안하였다. 뿐만 아니라 기존의 카테고리와 새로 제안된 카테고리의 사용성 평가를 실시하여 비교 및 검증을 실시하였다. 본 연구는 기존 온라인 쇼핑몰의 카테고리의 분류 체계를 재정립하며, 사용자 중심의 인포메이션 아키텍처를 설계하는데 활용 가능할 것이다.

  • PDF

건설정보 분류체계 활용도 측정을 통한 분류체계 활성화 방안 (A Promotion Plan through Measuring the Utilization of Information Classification Systems in the Construction Industry)

  • 박환표;이재섭
    • 한국건설관리학회논문집
    • /
    • 제5권6호
    • /
    • pp.90-100
    • /
    • 2004
  • 최근, 산업구조는 산업사회에서 정보화 사회로, 제조산업에서 정보서비스 중심의 산업으로 산업구조의 중심이 소프트하고, 고부가가치의 지식경제사회로 급격히 전환하고 있다. 건설산업도 점차 대형화, 복잡화됨으로써 건설정보화의 중요성은 더욱 커지고 있다. 따라서, 정부에서는$\ulcorner$건설정보 분류체계 구축을 위한 연구$\lrcorner$ 를 추진하여 2001년 5월에 실무적용을 위한 대 $\cdot$ 중분류 등을 제시하였고, 그 결과, '통합건설정보분류체계적용기준' 을 건설교통부 공고로 2001년 8월에 발표하였다. 그러나, 기 구축된 '통합건설정보분류체계"는 건설공사에서 실무활용이 미흡한 실정이다. 이러한 원인을 분석해 보면, 새로운 표준화체계로 추진하기에는 기존의 체계를 변화시키기 어렵고, 잘 개발된 정보표준화의 홍보가 부족하고, 법적 인 구속력이 미약하여 그 적용이 미흡한 것으로 볼 수 있다 또한, 각 발주처의 정보분류체계의 인식부족 및 활용분야의 인식부족으로, 그 실무 활용성이 미흡하다고 볼 수 있다. 특히, 각 주체가 건설관리 분야에서 건설정보 분류체계의 건설업무 활용도를 정확히 인식하지 못함으로써, 그 활용도가 미약한 것으로 지적할 수 있다. 따라서, 본 연구는 건설관리 분야에서 각 업무의 정보분류체계 활용도 측정모델을 활용하여 분석하고, 기 구축된$\ulcorner$정보분류체계$\lrcorner$의 각 파셋이 각 업무단계에서 어느 정도 활용되는 지를 분석하였고, 그 활성화 방안을 제시하였다.

유색 대두수집종의 특성 연구 제II보 밭밑콩 수집유색재래종의 다변량에 의한 품종분류 (Basic Studies on the Native Colored-Soybean Cultivars II. Classification of Collected Soybean Varieties by the Multivariate Analysis)

  • 구자옥;이영만;신동영
    • 한국작물학회지
    • /
    • 제28권3호
    • /
    • pp.340-344
    • /
    • 1983
  • 전국에서 수집된 혼식용 유색대두 32품종에 대하여 조사된 21개 형질로서 분류적 거리와 Q 상관에 의하여 품종간의 유사정도를 계산하고 이들에 의하여 Single link clustering 방법에 의하여 dendrogram을 그리고 Q 상관에 의하여 10개의 품종군을 분류하였다. 각 품종군의 군내 Q상관은 군간 Q상관보다 높았으며, 각 품종군의 각 형질평균으로 보아 각 군이 특징있게 구분되었다.

  • PDF

객체 추출 및 객체별 그룹핑을 이용한 영상검색 결과의 단계적 서비스 방안 (A Scheme for Progressive Service of Retrieved Images based on Object Extraction and Grouping)

  • 박창민;김성영;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.180-185
    • /
    • 2002
  • 본 논문에서는 키워드를 입력해 검색된 영상들을 유사한 특징을 갖는 소수의 그룹으로 그룹핑하고 각 그룹을 대표하는 대표영상을 추출하여 우선적으로 사용자에게 보여주고 필요에 따라 나머지 영상들을 단계적으로 서비스할 수 있는 방안을 제시한다. 영상 그룹핑을 위한 각 영상의 특징은 영상에 포함된 중심 객체를 사용하여 추출한다. 이를 위해 검색 키워드는 객체와 연관성이 있는 단어로 제한하여 영상을 검색하며 검색된 영상으로부터 중심 객체를 추출할 수 있는 객체 추출 방법을 활용하였다. 각 영상으로부터 추출된 중심 객체에 대한 특징 벡터는 칼라 분포를 이용한다. 영상 그룹핑은 칼라분포로 표현되는 특징공간에서의 밀집도를 조사하여 높은 밀도로 모여있는 영역별로 추출하여 동일한 그룹으로 분류하였다. 대표 영상은 분류된 그룹에서 가장 밀집도가 높은 영상으로 선택된다. 한편, 얼굴이 포함된 영상은 사전에 따로 분류하고 얼굴 크기 및 얼굴 수에 따라 영상을 그룹핑하여 각 그룹에 대한 대표 영상을 선정한다. 본 연구에서 제안한 방법은 사용자에게 모든 검색 결과를 일괄적으로 보여주는 것에 비해 보다 빠른 시간 내에 사용자가 원하는 영상을 편리하면서도 효과적으로 확인할 수 있는 방법을 제공해 줄 수 있을 것으로 기대한다.

  • PDF

텍스트 문서 분류를 위한 베이지안망 학습 (Learning Bayesian Networks for Text Documents Classification)

  • 황규백;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.262-264
    • /
    • 2000
  • 텍스트 문서 분류는 텍스트 형태로 주어진 문서를 종류별로 구분하는 작업으로 웹페이지 검색, 뉴스 그룹 검색, 메일 필터링 등이 분야에 응용될 수 있는 기반 작업이다. 지금까지 문서를 분류하는데는 k-NN, 신경망 등 여러 가지 기계학습 기법이 이용되어 왔다. 이 논문에서는 베이지안망을 이용해서 텍스트 문서 분류를 행한다. 베이지안망은 다수의 변수들간의 확률적 관계를 표현하는 그래프 모델로 DAG 형태인 망 구조와 각 노드에 연관된 지역확률분포로 구성된다. 그래프 모델을 사용할 경우 학습에 이용되는 각 속성들간의 관계를 사람이 알아보기 쉬운 형태로 학습할 수 있다는 장점이 있다. 실험 데이터로는 Reuters-21578 문서분류데이터를 이용했으며 베이안망의 성능은 나이브 베이즈 분류기와 비슷했다.

  • PDF

고속도로 분류부 설계기법 개선 연구 (A Study on Improvement of Design Method for Freeway Diverging Areas)

  • 박재범;이승준;강정규;김일환
    • 대한교통학회지
    • /
    • 제25권1호
    • /
    • pp.23-35
    • /
    • 2007
  • 고속도로 분류부는 고속에서 저속으로의 급격한 감속, 양호한 기하구조에서 취약한 기하구조로의 급격한 선형변화가 발생하는 구간으로, 고속도로 구성요소 중 사고위험이 매우 높은 구간에 해당된다 따라서 분류부 설계시는 안전하고 원활한 교통흐름이 이루어지도록 세심한 주의를 기울여야 함은 물론 이의 달성을 위한 설계기준이 수립되어야 한다. 이에 따라 현 도로설계기준에서는 차로변경을 위한 변이구간, 감속을 위한 감속구간 그리고 무한 곡선반경에서 유한곡선반경으로의 원활한 차량주행궤적 변경을 위한 완화곡선 등 이를 위한 설계기준을 제시하고 있으나, 실제 그 적용에 있어서는 설계기준상의 각 구간별 구성에 대한 정의가 명확하지 않아 분류부의 각 구성요소가 중첩되어 설계되고 있다. 이러한 설계기준상의 문제로 인한 각 구성요소간 혼재는 현 설계기준에서 의도하고 있는 분류부에서의 역할을 충분히 발휘하지 못하게 하는 결과를 초래하고 있으며 일관된 선형을 기대하는 운전자에게 혼동을 야기시키는 등 많은 고속도로 분류부 현장에서 안전상 문제점으로 작용하고 있다. 따라서 본 연구에서는 고속도로 분류부에서의 실측 현장조사 데이터를 바탕으로 분류부 차량주행행태 특성 분석 및 사고예측모형의 개발을 통해 다양한 교통조건 및 기하구조 조건을 고려한 분류부 설계기준 개선안을 제시하였다.

Berberis amurensis complex의 형태 변이 분석 (Morphological Variation of Berberis amurensis Complex)

  • 현창우;김영동
    • 식물분류학회지
    • /
    • 제38권2호
    • /
    • pp.93-109
    • /
    • 2008
  • 본 연구에서는 B. amurensis complex를 구성하는 세 분류군, 매발톱나무(B. amurensis Rupr. var. amurensis), 섬매발톱나무[B. amurensis var. quelpaertensis (Nakai) Nakai] 및 왕매발톱나무(B. amurensis var. latifolia Nakai)를 대상으로 형태 변이 분석을 수행하여 이들에 대한 기존의 분류학적 견해를 논의하였다. 분류군 간에 차이를 나타낼 것으로 조사된 22개 형질에 대한 변이 양상 조사 및 주성분분석을 수행한 결과 섬매발톱나무는 엽신의 길이와 폭, 엽정의 각도, 거치 간격, 절간 길이, 화서당 꽃의 수 등 여러 형질에서 나머지 두 분류군과 차이를 보였고, 왕매발톱나무는 엽정의 각도, 엽신의 폭과 길이 비에서 다른 두 분류군과 달랐다. 주성분분석 결과 엽신의 길이와 폭 및 엽정의 각도 등 잎의 형질이 분류군의 차이를 잘 반영하는 유용한 형질로 재확인되었으며, 절간의 길이와 화서를 구성하는 꽃의 수는 이들 종내 분류군들을 구분하는 새로운 식별형질로 밝혀졌다. 이들 세 분류군의 지리적 분포와 변이 양상 및 주성분분석 결과를 종합해 고려할 때 섬매발톱나무와 왕매발톱나무를 각각 변종으로 인정하는 것이 가장 타당할 것으로 판단하였다.

슬라이딩 윈도우 기반 다변량 스트림 데이타 분류 기법 (A Sliding Window-based Multivariate Stream Data Classification)

  • 서성보;강재우;남광우;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권2호
    • /
    • pp.163-174
    • /
    • 2006
  • 분산 센서 네트워크에서 대용량 스트림 데이타를 제한된 네트워크, 전력, 프로세서를 이용하여 모든 센서 데이타를 전송하고 분석하는 것은 어렵고 바람직하지 않다. 그러므로 연속적으로 입력되는 데이타를 사전에 분류하여 특성에 따라 선택적으로 데이타를 처리하는 데이타 분류 기법이 요구된다. 이 논문에서는 다차원 센서에서 주기적으로 수집되는 스트림 데이타를 슬라이딩 윈도우 단위로 데이타를 분류하는 기법을 제안한다. 제안된 기법은 전처리 단계와 분류단계로 구성된다. 전처리 단계는 다변량 스트림 데이타를 포함한 각 슬라이딩 윈도우 입력에 대해 데이타의 변화 특성에 따라 문자 기호를 이용하여 다양한 이산적 문자열 데이타 집합으로 변환한다. 분류단계는 각 윈도우마다 생성된 이산적 문자열 데이타를 분류하기 위해 표준 문서 분류 알고리즘을 이용하였다. 실험을 위해 우리는 Supervised 학습(베이지안 분류기, SVM)과 Unsupervised 학습(Jaccard, TFIDF, Jaro, Jaro Winkler) 알고리즘을 비교하고 평가하였다. 실험결과 SVM과 TFIDF 기법이 우수한 결과를 보였으며, 특히 속성간의 상관 정도와 인접한 각 문자 기호를 연결한 n-gram방식을 함께 고려하였을 때 높은 정확도를 보였다.

유비쿼터스 센서네트워크 서비스 분류 기법 및 상용화 이슈 (A Scheme to Categorize Ubiquitous Sensor Network Services and Their Practical Issues)

  • 은성배;소선섭;채의근
    • 대한임베디드공학회논문지
    • /
    • 제2권3호
    • /
    • pp.202-208
    • /
    • 2007
  • 본 논문에서는 USN 응용을 분류하는 기법을 제시하였다. 분류의 기준은 3가지인데 서비스의 심각성 유무, 관측자의 이동성 유무, 관측대상의 이동성 유무이다. 각 분류에 의해 8가지로 분류하였으나 그 중, 관측자가 이동하는 경우는 서비스의 심각성 유무에 관계없이 하나로 분류하여 총 7가지로 분류하였다. 각 분류에 해당하는 서비스들을 예시하였고 특정을 기술하였다. 본 논문에서 제시한 분류기법을 따르면 U-city의 3대 서비스에 속하는 원격 모니터링 서비스, 실내 위치인식 서비스 텔레매틱스 서비스가 도출되며 그 특징을 쉽게 파악할 수 있다.

  • PDF