• 제목/요약/키워드: 개념 가중치

검색결과 189건 처리시간 0.025초

신경망을 적용한 온톨로지 기반의 Focused Crawling (Ontology-Based Focused Crawling Combined with Neural Network)

  • ;강보영;남궁현;김홍기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.128-133
    • /
    • 2007
  • Focused crawling은 검색시스템의 구축을 위한 웹 문서 수집단계에서, 미리 정의된 토픽 집합들과 관련성을 가지는 웹 문서를 수집하기 위하여 제안되었다. 이러한 focused crawling 연구에서 보다 효과적인 웹 문서 수집을 위해 주어진 토픽에 대한 양질의 배경지식을 제공할 수 있도록 온톨로지가 활발히 활용되어왔다. 그러나 기존의 온톨로지 기반 focused crawling 연구는 토픽과 웹 문서 간의 관련성 측정을 위하여, 주어진 토픽과 관련있는 온톨로지 내 각 개념들에 직관에 의존한 가중치를 부여하여 활용하였다. 하지만 이러한 직관에 의존한 가중치부여 기법은 안정된 수집결과를 도출할 수 있는 최적화된 가중치 값을 얻기가 힘든 한계가 있다. 따라서 본 논문에서는 이러한 개념에 대한 가중치가 학습에 의하여 자동으로 결정되도록, 인공신경망을 적용한 온톨로지 기반 focused crawling 기법을 제안한다. 웹 상에서 제안된 시스템의 성능을 실험한 결과 기존의 온톨로지 기반 수집 기법에 비하여 보다 향상된 결과를 보임을 알 수 있었다.

  • PDF

새로운 거리 가중치와 지역적 패턴을 고려한 적응적 선형보간법 (Adaptive Linear Interpolation Using the New Distance Weight and Local Patterns)

  • 김태양;전영균;정제창
    • 한국통신학회논문지
    • /
    • 제31권12C호
    • /
    • pp.1184-1193
    • /
    • 2006
  • 영상 보간은 영상 처리 분야에서 전통적으로 많이 연구되어 왔고 널리 사용되고 있다. 그에 따라 다양한 보간 능력과 계산 복잡도를 갖는 보간법들이 많이 시도되고 있다. 이 논문에서는 기존의 선형 보간법을 위한 새로운 거리 가중치 개념과 보간되는 값의 상하, 좌우 지역적 패턴을 고려하여 반영하는 적응적 선형 보간법(New Adaptive Linear Interpolation : NAL Interpolation)을 제안한다. 새로운 거리 가중치는 기존의 거리에 선형적으로 비례하는 가중치의 개념에서 벗어나 가까운 화소에 더욱 더 영향을 많이 받는 특성을 이용하여 거리 가중치를 2차, 3차 다항식으로 개선한 것이다. 또한 NAL 보간법은 보간되는 화소의 상하, 좌우 패턴을 고려하는 선형 보간법으로 MF(magnification factor)의 변화에 따라 보다 선명한 이미지를 쉽게 얻기 위해서 보간하기 전 MF에 따라 패턴을 반영하는 정도를 결정하는 패턴 가중치를 이용한다. 실험 결과에서 제안된 보간법은 계산 복잡도 면에서 기존의 bicubic 보간법 보다 훨씬 간단할 뿐만 아니라 더 좋은 PSNR(peak signal-to-noise ratio)를 갖고 보다 선명한 화질의 영상으로 보간하였다.

의미정보모델 구축을 위한 색채정보의 수집과 정량적 분석 (Collecting and Analyzing Color Information for Constructing Semantic Information Model)

  • 류기곤;선동언;김현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.232-235
    • /
    • 2011
  • 지식표현은 일반적으로 논리, 규칙, 프레임 또는 의미망 형태로 표현되며, 최근에는 의미망을 이용한 온톨로지 형태로 표현되고 있다. 이러한 지식표현 방법은 개념을 설명하는 문맥적인 정보나 개념들 간의 구조적인 정보를 이용하여 개념에 대한 지식을 논리적으로 표현하는데 중점을 두었다. 하지만, 지식표현에 사용되는 의미정보는 사람에 의해 수집되고 정제되기 때문에 많은 시간, 비용 및 인력이 필요하다는 한계가 있고, 새로운 의미를 추가하거나 기존의 의미를 수정하는 것이 매우 어렵다는 한계가 있다. 색채는 특정 대상이나 개념에 대한 의미, 연상, 상징 등 객관적인 특징 뿐 아니라 시대, 나라, 문화와 같은 사회적 배경을 반영하기 때문에, 정보를 제공하고 감성을 전달하는 효과적인 수단으로 사용되고 있다. 이에 본 논문은, 색채를 이용한 의미정보모델 구축을 위해, 색채정보를 수집하고 정량적으로 분석하는 방법을 제안한다. 긍정/부정/불안/중립으로 구성된 감성어휘 273개를 이용하여 이미지를 수집한 결과 총 130,944개의 이미지를 수집하였다. 이미지에는 여러 가지 사물, 행동, 배경, 색채 등 다양한 정보가 혼재되어 있어 감성어휘와 연관된 색채를 구별하기 어렵기 때문에 이미지를 직관적으로 설명할 수 있는 사용자 태그를 별도로 수집하였다. 태그는 총 2,836,395개를 수집하였고 각 이미지와 그룹에서의 가중치를 구하였다. 태그의 가중치를 통해 이미지가 그룹 내에서 갖는 중요도를 판별하였고, 각 그룹 별로 상위 30%의 이미지를 추출하여 대표 색채를 분석하였다.

종이의 durability 개념 및 평가방법

  • 정양진;김태영;이승한
    • 한국펄프종이공학회:학술대회논문집
    • /
    • 한국펄프종이공학회 2007년도 춘계학술대회논문집
    • /
    • pp.257-263
    • /
    • 2007
  • 본 논문은 내구성(durability) 및 내오염성(soiling resistance)이 매우 중요한 성질로 인식되는 유통지의 평가방법을 제안하는데 목적이 있다. 즉, 종이의 내구성 및 내오염성의 측정 및 평가에 있어서, 재현성 및 반복성이 우수하고 합리적인 측정방법 및 평가방법을 구축하는데 목적이 있다. 연구목적에 적합한 시료의 준비, 오염물의 조성, 실험장치 및 실험후의 타당한 평가방법 등에 대하여 선행 연구결과를 고찰하였다. 기존 방법의 수정과 새로운 장치의 제작 및 평가방법의 설정을 통해 재현성이 높은 평가방법을 정립하고자 하였다. 유통지의 내구성을 평가하는 방법으로는 습식, 내오염성, 건식 내오염성, 구김기공도, 내세탁성, 잉크 내마모도 등의 항목을 측정하여 개별항목으로 내구성을 가늠하거나, 몇가지항목에 각기 다른 가중치를 부여하여 구한 내구성 지수(durability index)의 개념으로 내구성을 평가하기도 한다. 본 논문에서는 내구성에 영향하는 요소로 강도적 성질요소(strength property value)와 내오염성 요소(artificial soiling value)로 구분하였다. 강도적 성질요소에서는 전통적으로 내구성과 관련이 깊은 것으로 인식되어 온 내절도(folding endurance), 인열강도(tearing resistance) 및 구김기공도(crumpled porosity)를 인쇄하기 전 용지상태에서 측정하여 4:4:2의 가중치를 주어 구하였다. 내오염성 요소는 국가별 기후특성에 따라 연평균 상대습도가 60% 이상인 경우 인쇄 시료를 대상으로하여 습식 내오염성, 건식 내오염성 및 내석검성을 평가한 후 6:3:1의 가중치를 주어 구하였다. 또한 연평균 60% 미만인 국가의 경우 3:6:1의 가중치를 부여하였다. 이렇게 구해진 강도적 성질요소와 내오염성 요소에 있어 강도적 성질요소는 궁극적으로 내오염성 요소에 영향하기 때문에 3:7의 비율로 가중치를 부여하여 최종적으로 내구성 지수를 구하였다. 이때의 점수가 60점 이상이면 내구성 용지로 정의하였다. 본 논문에서는 현장실험을 통하여 시제품을 제조하였다. 상기 설명된 방법으로 내구성 지수를 구한 결과, 일반 유통지 제조방법으로 제조한 경우 내구성 지수가 약 45점이었다. 반면, 새로 개발된 방법에 의한 고내구성용지(durability paper)의 경우 70점 이상을 나타내어 내구성이 향상되었음을 확인할 수 있었다.

  • PDF

kNN 알고리즘에서의 속성 가중치 자동계산 방법 (an Automatic Calculation Method of Feature Weights in k Nearest Neighbor Algorithms)

  • 이강일;이창환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.423-426
    • /
    • 2005
  • 기억기반학습의 일종인 최근접 이웃(k nearest neighbor) 알고리즘은 과거의 데이터들 중에서 새로운 개체와 유사한 데이터들을 이용해서 새로운 개체의 목적 값을 예측하는 것이다. 이 경우 속성의 가중치를 계산하는 방식은 kNN의 성능을 결정하는 중요한 요소가 된다. 본 논문에서는 기존의 다른 이론들과 달리 정보이론에서 사용되는 엔트로피 개념을 이용해서 속성의 가중치를 이론적이고, 효과적으로 계산하는 새로운 방법을 제시하고자한다. 제안된 방법은 각 속성이 목적속성에 제공하는 정보의 양에 따라 가중치를 자동으로 계산하여 kNN의 성능을 향상시킨다. 마지막으로 이러한 방식의 성능을 다수의 실험을 통해 비교하였다.

  • PDF

퍼지 일반화 계층을 이용한 일반화된 퍼지 정량 연관규칙 마이닝 (Mining Generalized Fuzzy Quantitative Association Rules with Fuzzy Generalization Hierarchies)

  • 한상훈;손봉기;이건명
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.8-11
    • /
    • 2001
  • 연관규칙 마이닝은 트랜잭션 데이터를 이루고 있는 항목간의 잠재적인 의존관계를 발견하는 데이터 마이닝의 한 분야이다. 정량 연관규칙이란 부류적 속성과 정량적 속성을 모두 포함한 연관규칙이다. 정량 연관규칙 마아닝을 위한 퍼지 기술의 응용, 정량 연관규칙 마이닝을 위한 일반화된 연관규칙 마이닝, 사용자의 관심도를 반영한 중요도 가중치가 있는 연관규칙 마이닝 등에 대한 연구가 이루어져 왔다. 이 논문에서는 중요도 가중치가 있는 일반화된 퍼지 정량 연관규칙 마이닝의 새로운 방법을 제안한다. 이 방법은 부류적 속성의 퍼지 개념 계층과 정량적 속성의 퍼지 언어항 일반화 계층을 일반화된 추출하기 위해 이용한다. 이것은 속성들의 수준별 일반화 계층과 속성의 중요도 가중치를 이용함으로써 사용자가 보다 융통성 있는 연관규칙을 마이닝할 수 있게 해준다.

  • PDF

국가정보화지수 측정방법에 관한 연구 (A Study of measurement for National Information Index)

  • 지경용;강신원;김정란
    • 전자통신동향분석
    • /
    • 제14권3호통권57호
    • /
    • pp.95-105
    • /
    • 1999
  • 일반적으로 정보화 수준을 측정할 때 많이 사용되는 방법은 산술평균의 개념에 의한 대표값 산출방식이다. 그러나 이는 항목간의 통합문제의 관점에서 각 항목의 정보화 기여도가 무시되고, 급격한 정보화의 구조변화를 적절히 반영하지 못하며, 기본지표의 측정항목이 많아질 경우에는 해당 측정항목이 상대적으로 작은 기여도를 갖는 것으로 나타나는 등 여러 문제점을 내포하고 있다. 따라서 본 연구는 이와 같은 문제점을 해결하기 위하여 새로운 정보화 수준 측정방법을 제안하고 이에 따른 정보화지수의 측정.비교.분석을 통하여 새로운 측정방법을 검증하는 데에 있다. 본 고에서는 서로 상관된 국가정보화 지표들을 결합하여 하나의 가중치를 구하는 인자분석 및 대표성분점수화법 등 세 가지 방법을 이용하여 방법별로 정보화지수를 산출한 결과를 비교.분석하여 보았다. 세 가지 방법들에 의한 가중치 및 지수는 다소 값의 차이를 보이고 있지만 전체적인 추이는 같음을 보았다. 방법 1과 방법 2는 요인분석에 의한 분석 결과로서 가중치나 지수에서 다소의 차이를 보이고 있지만 유사성이 매우 크며, 방법 3에 의한 분석결과는 앞의 방법들과는 가중치 및 지수에서 차이를 보이고 있다. 특히 방법 3은 다른 측정 방법과는 달리 상관성이 높은 변수들에게 가중치를 부여하게 된다. 따라서 방법 1과 방법 2보다 더 객관적으로 각 지표의 가중치를 반영한다고 볼 수 있어 어느 정도 이 방법에 의한 분석이 유의함을 보여주었다.

정보검색 모델에서 개념적 거리를 이용한 추론 (Reasoning with Conceptual Distance in an Information Retrieval Model)

  • 김영환;김진형
    • 인지과학
    • /
    • 제2권1호
    • /
    • pp.193-204
    • /
    • 1990
  • 본 논문은 계층적 시소러스를 이용한 정보검색 추론모델을 제안하였다.제안된 모델은 계층적 시소러스를 구성하는 색인어들과 이들의 가중치로써 표현되는 사용자의 질의오와 정보요소 간의 개념적 거리를 계산한다. 사요자질의어에 부울리언 연산자를 사용할 수 있도록 하여 검색 요구의 표현력을 향상시켰고,계층적 시소러스에 에지(edge)가중치를 허용하여 색인어들간의 상관관계를 보다 정확하게 표현할 수 있도록 하였다. 제안한 모델의 성능 평가를 위한 실험 결과, 인간의 적합도 판정과 상당히 유사함을 알 수 있었다.

개념 기반 키워드 정보를 이용한 웹 문서의 자동 분류 (Automatic Classification of Web Documents Using Concept-Based Keyword Information)

  • 박사준;김기태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.151-153
    • /
    • 2003
  • 본 연구에서는 웹 문서를 분류하기 위해서 분류하고자 하는 영역(category)에 대한 개념 지식을 이용한다. 먼저, 영역별 개념 지식을 기구축된 웹 문서의 집합으로부터 제목과 하이퍼링크에 기반한 앵커 텍스트를 이용하여 개념을 보유한 키워드를 추출한다. 추출된 키워드를 형태소 분석을 통해 색인어로 추출한다. 추출된 색인어에 대해 TFIDF를 확장한 영역 적용 색인 가중치 TFIDFc를 적용하여 영역별 개념 기반 색인어와 색인를 구축한다. 색인은 TFIDF를 영역별로 확장하여 구축한다. 구축된 영역별 개념 기반 색인을 이용하여 새로운 웹 문서에 대해서 어떤 영역에 해당하는 가를 결정하는 자동 분류 알고리즘을 수행한다. 자동 분류 알고리즘에 의해 수행된 문서는 영역별로 정리되며, 또한, 분류된 웹 문서의 색인어는 새로운 개념 기반 키워드로 추출되어 개념 기반 영역 지식을 구축한다.

  • PDF

심적 상태와 가중치를 이용한 협상 시스템 구현 (The Implementation of negotiation system by psychological state and weight)

  • 박종락;정원;박관희
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.33-43
    • /
    • 2003
  • 최근에 인터넷 기반의 상거래가 활발하게 진행되면서 공급자와 구매자간의 협상을 위한 연구 개발이 활발하게 진행이 되고 있다. 이러한 협상에는 여러 가지 방법들이 있지만 대부분을 그 고려 대상이 단순하거나, 개념적인 증명에 제한되는 경우가 많다. 따라서 본 논문에서는 협상 과정중에 발생하는 심리적인 환경을 속성화시켜서 그 가중치를 부여하는 방법을 제시함으로 함으로 협상의 진행을 효율성을 제시하고자 한다.

  • PDF