• 제목/요약/키워드: 가중치부여방법

검색결과 463건 처리시간 0.033초

웹문서 자동 분류를 위한 하이퍼링크 기반 특징 가중치 부여 기법 (A Hyperlink-based Feature Weighting Technique for Web Document Classification)

  • 이아람;김한준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.417-420
    • /
    • 2012
  • 기계학습을 이용하는 문서 자동분류 시스템은 분류모델의 구성을 위해서 단어를 특징으로 사용한다. 자동분류 시스템의 성능을 높이기 위해 보다 의미있는 특징을 선택하여 분류모델을 구성하기 위한 여러 연구가 진행되고 있다. 특히 인터넷상에서 사용되는 웹문서는 단어 외에도 태그정보, 링크정보를 가지고 있다. 본 논문에서는 이 두 가지 정보를 이용하여 웹문서 자동분류 시스템의 성능을 향상 시키는 방법 제안 한다. 태그 정보와 링크 정보를 이용하여 적절한 특징을 선택하고, 각 특징의 중요도를 계산하여 가중치를 구한다. 계산된 가중치를 각 특징에 부여하여 분류 모델을 구성하고 나이브 베이지안 분류기를 통하여 성능을 평가하였다

가중치 부여 부정 트리 패턴 추출 (Weighted Negative Tree Pattern Discovery)

  • 백주련;김진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.23-26
    • /
    • 2019
  • 사물인터넷(IoT)은 지금의 우리가 살고 일하는 모든 방식을 변화시키고 있다. IoT를 통해 데이터를 생성하고 저장하고 연결된 장치와 상호작용하여 비즈니스는 물론 우리의 일상 생활을 개선하고 있는 것이다. 무수히 많은 센서들이 연결된 세상은 센서들에 의해 그 어느 때보다 거대한 양의 데이터들을 생산하고 있다. JSON, XML 같은 트리 구조의 데이터 타입은 대량 데이터 저장 전송 교환 등에 주요하게 사용되는데 이는 트리 구조가 이형 데이터 간의 유연한 정보 전송과 교환을 가능하게 하기 때문이다. 반면에, 효용성 높은 정보나 감추어져 있는 정보들을 트리 구조의 대량 데이터들로부터 추출하는 것은 일반 데이터 구조에 비해 훨씬 어려우며 더 난해한 문제들을 발생시킨다. 본 논문에서는 트리 구조의 대량 스트리밍 데이터로부터 가중치가 부여된 주요한 부정 패턴들을 추출하기 위한 방법을 공식화한다.

  • PDF

학술지 기사에 대한 메타데이터 품질의 계량화 방법에 관한 연구 (A Study on Quantitative Measurement of Metadata Quality for Journal Articles)

  • 이용구;김병규
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.309-326
    • /
    • 2011
  • 기존 메타데이터의 품질 측정 방법은 오류가 발생한 레코드를 단순히 계수하여 그 비율로 품질을 측정하였다. 이러한 한계를 극복하기 위해 메타데이터 요소별로 상대적 중요 정도를 나타내는 가중치를 적용함으로서, 메타데이터 품질을 체계적으로 계량화 하는 측정 방법을 제시하고자 하였다. 구체적인 가중치 부여 방법으로 엔트로피, 이용자 과업, 그리고 이용 통계를 활용하였다. 또한 이들을 결합하여 통합 가중치를 제시하고 실제 서비스 되고 있는 학술지 기사 메타데이터에 적용하였다. 실험 결과, 엔트로피 가중치 방법은 데이터 자체의 특성을 잘 반영하며, 이용자 과업을 적용한 방법은 이용자의 정보요구를 해결하는 필요한 메타데이터 요소를 제시하며, 통합 가중치는 특정 메타데이터 요소의 오류에 영향을 받지 않으면서 균형 잡힌 측정값을 제시하여 계량화 방법에 적합한 것으로 나타났다.

다중반응표면 최적화를 위한 가중평균제곱오차 (A Weighted Mean Squared Error Approach to Multiple Response Surface Optimization)

  • 정인준;조현우
    • 한국산학기술학회논문지
    • /
    • 제14권2호
    • /
    • pp.625-633
    • /
    • 2013
  • 본 다중반응표면 최적화는 다수의 반응변수(품질특성치)를 동시에 고려하여, 입력변수의 최적 조건을 찾는 것을 목적으로 한다. 지금까지 다중반응표면 최적화를 위하여 다양한 방법이 제안되어 왔는데, 그 중 평균제곱오차 최소화법은 다수의 반응변수의 평균과 표준편차를 동시에 고려하여 최적화하는 방법이다. 이 방법은 기본적으로 평균과 표준편차가 동일한 가중치를 가지고 있다는 것을 전제로 하고 있다. 그러나 문제의 상황에 따라 평균과 표준편차에 서로 다른 가중치를 부여해야 하는 경우도 있다. 이에 본 논문에서는 기존의 평균제곱오차를 확대하여 평균과 표준편차에 서로 다른 가중치도 부여할 수 있도록 가중평균제곱오차 최소화법을 제안하고자 한다.

가중치를 적용한 FFP 소프트웨어 규모 측정 (A Software Size Estimation Using Weighted FFP)

  • 박주석
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.37-47
    • /
    • 2005
  • 대부분 소프트웨어 규모 추정 기법들은 사용자에게 제공될 기능에 기반을 두고 있으며, 기능에 대한 점수를 부여하는 과정에서 복잡도를 함께 고려하고 있다. 완전기능점수 기법은 데이터 처리, 실시간 시스템과 알고리즘 소프트웨어 등 광범위한 분야에 적용되는 장점을 갖고 있는 반면에 규모를 추정하는데 필요한 기능 요소들에 대한 가중치를 부여하지 않는 단점도 갖고 있다. 본 논문은 신규로 개발되는 프로젝트와 유지보수 프로젝트들에 적용되는 완전기능점수 계산 방법에 각기능 요소들에 대한 복잡도를 고려하여 소프트웨어 규모를 추정할 수 있는 방법을 제안하였다. 이를 위해 기능 점수 기반으로 실측된 데이터를 이용하여 제안된 방법의 타당성을 검증하였다. 검증한 결과, 소프트웨어의 규모 추정에 사용되는 속성들인 기능 요소들에 다른 가중치를 적용하였을 경우 보다 좋은 규모 추정이 가능하였다.

  • PDF

심적 상태와 가중치를 이용한 협상 시스템 구현 (The Implementation of negotiation system by psychological state and weight)

  • 박종락;정원;박관희
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.33-43
    • /
    • 2003
  • 최근에 인터넷 기반의 상거래가 활발하게 진행되면서 공급자와 구매자간의 협상을 위한 연구 개발이 활발하게 진행이 되고 있다. 이러한 협상에는 여러 가지 방법들이 있지만 대부분을 그 고려 대상이 단순하거나, 개념적인 증명에 제한되는 경우가 많다. 따라서 본 논문에서는 협상 과정중에 발생하는 심리적인 환경을 속성화시켜서 그 가중치를 부여하는 방법을 제시함으로 함으로 협상의 진행을 효율성을 제시하고자 한다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2002년도 추계공동학술대회 정보환경 변화에 따른 신정보기술 패러다임
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기발에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

영상검색엔진을 위한 가중치 N-Gram색인 방법 (Weighted N-Gram Indexing for Image Search Engine)

  • 이상열;정성호;황병곤
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 추계공동학술대회
    • /
    • pp.412-416
    • /
    • 2002
  • 멀티미디어 검색 시스템들은 아직까지 내용 기반에 의한 검색기술이 실용적으로 쓰일 만큼 높은 성능을 보이고 있지 않기 때문에 텍스트에 의한 검색만을 지원하고 있는 실정이다. HTML 문서에 나타나는 텍스트 중 이미지 아래에 붙은 표제나 이미지 링크에 붙어 있는 텍스트를 골라내어 이미지의 색인 정보로 이용하여 텍스트를 추출하는 기법을 제안하였다. 텍스트를 추출하기 위해 N-Gram 색인 방법을 사용하였으며 한편 검색 효율을 높이기 위해서 질의 의도가 큰 단어에 가중치를 부여하였다.

  • PDF

협력적 여과 시스템의 예측 정확도 향상을 위한 전처리 방법 (A Preprocessing Method for Improving Prediction Accuracy in Collaborative Filtering)

  • 김교창;전종훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.698-700
    • /
    • 2003
  • 본 논문에서는 협력적 여과방식에서 고객의 특정 상품에 대한 선호도 예측의 정확도를 향상하기 위해 상품의 선호도 값에 가중치를 반영하는 전처리 방법을 제안한다. 이를 위해 고객별 상품의 선호도 값에 정보검색 분야에서 사용되고 있는 벡터 공간 모델을 이용하여 가중치를 부여하며, 이를 통하여 특정 상품을 선호하는 고객과 전체 상품을 고루 선호하는 고객간의 차별화 값을 반영하여 보다 정확한 선호도를 예측할 수 있게 된다. 전처리 과정을 수행하지 않은 기존의 협력적 여과 방식과의 실험을 통한 비교 분석을 통하여 본 논문이 제안하는 전처리 과정의 타당성과 비교우위를 검증한다.

  • PDF

소프트웨어 제품을 위한 평가 선정 모형의 조사 및 적용성에 관한 연구 (A Study on Survey and Applicability of Evaluation and Selection Models for Software Products)

  • 박호인;정호원
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1706-1718
    • /
    • 1997
  • 다양한 소프트웨어 제품의 급격한 증가로 인하여 소프트웨어 제품의 평가·선정을 위한 체계적이고 객관적인 방법이 필요하게 되었다. 본 연구에서는 소프트웨어 제품의 효과적 평가·선정을 위해 평가 과정의 핵심인 가중치 부여와 모형의 선정에 중점을 둔다. 이를 위해 첫째, 계층적 분석 과정을 이용하여 평가 속성에 일관적 가중치를 부여한다. 둘째, 소프트웨어 제품의 선정 문제의 성격에 알맞은 모형을 조사${\cdot}$분류하여 모형별 장${\cdot}$단점을 분석한다. 적용 모형은 4개의 보상모형과 7개의 비보상모형으로 구성되어 있다. 선정된 모형은 특정 소프트웨어 제품(데이터베이스 모델러)에 응용되어 모형별로 제품을 평가한다. 본 연구는 가중치 부여 및 모형의 장·단점 분석과 응용 절차를 통하여 사용자의 다양한 요구사항에 대한 모형의 적용성을 제고하고자 한다.

  • PDF