• 제목/요약/키워드: 가중치 모델

검색결과 930건 처리시간 0.039초

XML 문서의 내용기반 검색을 위한 인덱싱 모델 및 색인어의 가중치 부여 (Indexing Model and Weight Assignment on Keywords for Contents based Retrieval in XML Documents)

  • 한예지;한창우;서동혁;김수희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.103-105
    • /
    • 2004
  • 본 논문에서는 XML 문서의 내용을 효율적으로 검색하기 위해 필요한 메타데이터의 스키마몰 개발하고 이론 바탕으로 구축되는 내용기반 인덱싱 모델을 제안한다. 제안하는 내용기반 인덱싱 모델은 엘리먼트타입에 따라 랭킹 검색과 불리언 검색을 지원한다. 랭킹 검색 결과의 재현도와 정확도를 높이기 위해, 검색 결과의 출력 기준 노드가 리프 노드와 내부 노드인 경우를 구별하여 색인어에 대한 가중치를 부여하고, 이를 이용하여 질의와 엘리먼트간의 유사도를 계산하는 방법을 제안한다.

  • PDF

타입 2-퍼지 가중치 그래프에서 최단경로 문제 (Shortest Path Problem in a Type-2 Fuzzy Weighted Graph)

  • 이승수;이광형
    • 한국지능시스템학회논문지
    • /
    • 제11권6호
    • /
    • pp.528-531
    • /
    • 2001
  • 그래프에서 최단경로를 찾는 문제는 그래프 이론분야에서 고전적인 문제이다. 전통적인 최단경로 문제에서 간선의 가중치값을 정확히 결정하는것이 어려운 경우에는 퍼지 가중치를 이용하여 문제를 해결할수 있다. 그리고 이러한 퍼지 가중치값을 결정하는데 있어 또 다른 불확실성이 존재하는 경우에는, 타입 2-퍼지 가중치를 이용하여 간선이 가중치를 표현할수 있다. 본 논문에서는 타입-1 퍼지 가중치 그래프에서의 최단경로문제를 타입 2 퍼지 가중치 그래프의 경우로 확장하고, 확장된 그래프에서 최단경로를 찾기 위한 모델을 제시하였다.

  • PDF

Wanda Pruning에 기반한 한국어 언어 모델 경량화 (Wanda Pruning for Lightweighting Korean Language Model)

  • 윤준호;서대룡;전동현;강인호;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.437-442
    • /
    • 2023
  • 최근에 등장한 대규모 언어 모델은 다양한 언어 처리 작업에서 놀라운 성능을 발휘하고 있다. 그러나 이러한 모델의 크기와 복잡성 때문에 모델 경량화의 필요성이 대두되고 있다. Pruning은 이러한 경량화 전략 중 하나로, 모델의 가중치나 연결의 일부를 제거하여 크기를 줄이면서도 동시에 성능을 최적화하는 방법을 제시한다. 본 논문에서는 한국어 언어 모델인 Polyglot-Ko에 Wanda[1] 기법을 적용하여 Pruning 작업을 수행하였다. 그리고 이를 통해 가중치가 제거된 모델의 Perplexity, Zero-shot 성능, 그리고 Fine-tuning 후의 성능을 분석하였다. 실험 결과, Wanda-50%, 4:8 Sparsity 패턴, 2:4 Sparsity 패턴의 순서로 높은 성능을 나타냈으며, 특히 일부 조건에서는 기존의 Dense 모델보다 더 뛰어난 성능을 보였다. 이러한 결과는 오늘날 대규모 언어 모델 중심의 연구에서 Pruning 기법의 효과와 그 중요성을 재확인하는 계기가 되었다.

  • PDF

회귀분석에서 설명변수와 반응변수 간의 시차를 파악하는 딥러닝 모델 (A Deep Learning Model for Identifying The Time Lag Between Explanatory Variables and Response Variable in Regression Analysis)

  • 김채현;류의림;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.868-871
    • /
    • 2021
  • 기후, 경영, 경제 등 여러 분야의 회귀분석에서 설명변수가 반응변수에 일정 시차를 두고 영향을 미치는 경우들이 많다. 하지만 지금까지 대부분의 회귀분석은 설명변수가 반응변수에 즉각적으로 영향을 미치는 경우만을 가정하고 있으며, 설명변수와 반응변수 간에 존재하는 시차를 탐색하는 연구는 거의 이루어지지 않았다. 그러나 보다 정확한 회귀분석을 위해서는 설명변수와 반응변수 간에 존재하는 시차를 파악하는 것이 중요하다. 본 논문은 회귀분석 데이터가 주어졌을 때 설명변수와 반응변수 간에 존재하는 시차를 파악하는 딥러닝 모델을 제안한다. 제안하는 딥러닝 모델은 설명변수의 과거 값들 중 어떤 값이 현재 반응변수에 가장 큰 영향을 미치는지를 노드 간 가중치로 표현하고, 회귀모델의 오차를 최소화하는 가중치를 탐색한다. 훈련이 끝나면 이 가중치들을 사용하여 각 설명변수와 반응변수 간에 존재하는 시차를 파악한다. 실험을 통해 제안 방법은 시차를 고려하지 않는 기존 회귀모델에 비해 시차까지 고려함으로써 오차가 1/100 수준에 불과한 더 정확한 회귀모델을 찾을 수 있음을 확인하였다.

의사결정나무를 활용한 교량 구조계산서의 XML 스키마 매칭 가중치의 효율적 선택방안 연구 (An Efficient Selection of XML Schema Matching Parameters using Decision Tree for Structural Document of Bridge)

  • 박상일;안현정;김봉근;이상호
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2010년도 정기 학술발표대회
    • /
    • pp.69.1-69.1
    • /
    • 2010
  • 본 연구는 교량 시설물의 재난방지를 위한 정보시스템의 구축에 있어 선행되어야 하는 교량 구조계산서 항목 저장정보의 질적 향상을 위해 XML 스키마 매칭 기법을 효율적으로 활용할 방법에 대해 제시하였다. 이를 위하여 XML 스키마 매칭에 사용되는 가중치 변화에 따른 매칭 정확도를 나타내는 데이터를 구축하고, 이를 활용하여 데이터 마이닝 기법 중 하나인 의사결정나무 모델을 구현하여 교량의 형식, 문서가 포함하고 있는 항목의 수, 문서를 작성한 회사에 따라 달라질 수 있는 최적의 가중치를 지동으로 선정할 수 있는 프로세스를 제안하였다. 의사결정나무 모델을 통해 결정한 매칭 가중치는 이전에 비하여 약 10% 정확도 상승효과가 있음을 알 수 있었다.

  • PDF

영상 압축기술을 통한 가중치 압축방법 (Weight Compression Method with Video Codec)

  • 김승환;박은수;굴람 무즈타바;류은석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.129-132
    • /
    • 2020
  • 최근 모바일 기기에서 딥러닝 모델을 사용하기 위한 경량화 연구가 진행되고 있다. 그중 모델의 가중치 표현 bit를 줄이는 양자화와 사용하기 위한 다양한 압축 알고리즘이 개발되었다. 하지만 대부분의 양자화 및 압축 알고리즘들은 한 번 이상의 Fine-tuning을 거쳐야 하는데 이 과정은 모바일 환경에서 수행하기에는 연산복잡도가 너무 높다. 따라서 본 논문은 양자화된 가중치를 High Efficiency Video Coding(HEVC)을 통해 압축하는 방법을 제안하고 정확도와 압축률을 실험한다. 실험결과는 양자화만 실시한 경우 대비 크기는 25%의 감소했지만, 정확도는 0.7% 감소했다. 따라서 이런 결과는 모바일 기기에 가중치를 전송하는 과정에 적용될 수 있다.

  • PDF

상황인식기반 선형회귀의 적응적 가중치를 적용한 클러스터링 (Clustering with Adaptive weighting of Context-aware Linear regression)

  • 이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.271-273
    • /
    • 2021
  • 본 논문은 이동노드의 클러스터링내에서 보다 효율적인클러스터링을 제공하고 유지하기위한 딥러닝의 선형회귀적 적응적 보정가중치에 따른 군집적 알고리즘을 제안한다. 대부분의 클러스터링 군집데이터를 처리함에 있어 상호관계에 따른 분류체계가 제공된다. 이러한 경우 이웃한 이동노드중 목적노드와는 연결가능성이 가장높은 이동노드를 클러스터내에서 중계노드로 선택해야 한다. 본 연구에서는 이러한 상황정보를 이해하고 동적이동노드간 속도와 방향속성정보간의 상관관계의 친밀도를 고려한 자율학습기반의 회귀적 모델에서 적응적 가중치에 따른 분류를 제시한다. 본 논문에서는 이러한 상황정보를 이해하고 클러스터링을 유지할 수 있는 자율학습기반의 적응적 가중치에 따른 딥러닝 모델을 제시 한다.

  • PDF

용어 가중치와 역범주 빈도에 의한 자동문서 범주화 (Automatic Text Categorization by Term Weighting and Inverted Category Frequency)

  • 이경찬;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.14-17
    • /
    • 2003
  • 문서의 확률을 이용하여 자동으로 문서를 분류하는 문서 범주화 기법의 대표적인 방법이 나이브 베이지언 확률 모델이다. 이 방법의 기본 형식은 출현 용어의 확률 계산 방법이다. 하지만 실제 문서 범주화 과정에서 출현하지 않는 용어들도 성능에 많은 영향을 줄 수 있으며, 출현 용어들에 대한 빈도 이외의 역범주 빈도나 용어가중치를 적용하여 문서 범주화 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 나이브 베이지언 확률 모델에 출현 용어와 출현하지 않는 용어들에 대한 smoothing 기법을 적용하여 실험하였다. 성능 평가를 위해 뉴스그룹 문서들을 이용하였으며, 역범주 빈도와 가중치를 적용했을 때 나이브 베이지언 확률 모델에 비해 약 7% 정도 성능 개선 효과가 있었다.

  • PDF

온톨로지 기반 가중치 부여 논문 검색 모델 (Weighting Assignments Paper Retrieval Model Based On Ontology)

  • 박현철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.328-331
    • /
    • 2007
  • 많은 연구원들이 자신의 연구 과제를 수행함에 있어 선행 연구 자료로 참고하는 것이 관련 주제에 관한 학술 자료이다. 현재 많은 학교와 기관 그리고 단체에서 관련 학술 자료를 발간하고 있으며 이를 참조하는 방식도 다양하다. 그러나 학술 자료를 참조함에 있어 단어 기반 검색이 사용되고, 발간된 자료의 양이 방대해짐에 따라 사용자가 원하는 정보를 참조하는 데 많은 어려움이 따른다. 본 논문은 이러한 기존 학술 자료 검색 방법을 보완하기 위하여 온톨로지를 기반으로 하는 가중치 부여 논문 검색 모델을 제안한다. 제안한 모델은 논문 관련 정보를 온톨로지로 구축하고, 검색 문서에 가중치를 부여하는 순위화 알고리즘을 적용한 것이다. 이는 기존 유사도 적용 기법에 시멘틱 개념을 적용한 것으로 효율적이고 정확한 논문 검색을 보장한다.

  • PDF

웹문서 자동 분류를 위한 하이퍼링크 기반 특징 가중치 부여 기법 (A Hyperlink-based Feature Weighting Technique for Web Document Classification)

  • 이아람;김한준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.417-420
    • /
    • 2012
  • 기계학습을 이용하는 문서 자동분류 시스템은 분류모델의 구성을 위해서 단어를 특징으로 사용한다. 자동분류 시스템의 성능을 높이기 위해 보다 의미있는 특징을 선택하여 분류모델을 구성하기 위한 여러 연구가 진행되고 있다. 특히 인터넷상에서 사용되는 웹문서는 단어 외에도 태그정보, 링크정보를 가지고 있다. 본 논문에서는 이 두 가지 정보를 이용하여 웹문서 자동분류 시스템의 성능을 향상 시키는 방법 제안 한다. 태그 정보와 링크 정보를 이용하여 적절한 특징을 선택하고, 각 특징의 중요도를 계산하여 가중치를 구한다. 계산된 가중치를 각 특징에 부여하여 분류 모델을 구성하고 나이브 베이지안 분류기를 통하여 성능을 평가하였다