• 제목/요약/키워드: 집합관계 모델

검색결과 146건 처리시간 0.025초

통계정보와 WordNet을 이용한 복합명사 분석 (Nominal Compound Analysis Using Statistical Information and WordNet)

  • 류민홍;나동열;장명길
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.33-40
    • /
    • 2000
  • 복합명사의 한 구조는 구성 명사간의 수식관계의 집합이라고 본다. 한 복합 명사에 대하여 가능한 여러 구조 중에서 올바른 구조를 알아 내는 것이 본 논문의 목표이다. 이를 위하여 우리는 최근에 유행하는 통계 기반 분석 기법을 이용한다. 먼저 우리의 복합 명사 분석 asn제에 알맞은 통계 모델을 개발하였다. 이 모델을 이용하면 분석하려는 복합명사의 가능한 분석 구조바다 확률값을 얻게 된다. 그 다음 가능한 구조들 중에서 가장 확률값이 큰 구조를 복합구조로 선택한다. 통계 기반 기법에서 항상 문제가 되는 것이 데이터 부족문제이다. 우리는 이를 해결하기 위해 개념적 계층구조의 하나인 워드넷(WordNet)을 이용한다.

  • PDF

비다양체 모델간의 기하학적 접합 연산에 관한 연구 (A Study on Geometrical Glue Operation between Non-manifold Models)

  • 박상호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제4권1호
    • /
    • pp.11-19
    • /
    • 1998
  • 오일러 연산과 집합 연산과 같은 비다양체 위상 연산은 모델링의 다양한 환경을 제공한다. 이들 연산들은 주어진 모델의 위상 정보를 적합하게 유지하도록 하기 위하여 기하학적인 문제를 발생시킨다. 꼭지점, 모서리와 면과 같은 요소들이 서로 접촉할 때 이들 연산의 내부에서 수행되는 접합 연산은 비다양체 모델의 위상을 수정하는 기본적인 방법이다. 비다양체 모델을 접합할 때는 위상 관계를 추론하여야 한다. 위상 관계의 추론 방법은 위상학적인 방법과 기하학적인 방법의 2 가지 경우로 분류할 수 있다. 위상학적인 방법은 저장되어 있는 위상 정보만을 이용하여 위상 관계를 추론한다. 반면에, 기하학적인 방법은 접합이 일어나는 부분적인 영역에서 기하학적인 형상을 고려하여 위상의 관계를 찾아내는 방법이다. 본 연구에서는 이들 중에서 기하학적인 방법에 관하여 기술한다.

  • PDF

지식 그래프를 이용한 영상 기반 상식 추론 (Visual Commonsense Reasoning with Knowledge Graph)

  • 이재윤;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.994-997
    • /
    • 2019
  • 영상 기반 상식 추론(VCR) 문제는 기존의 영상 기반 질문-응답(VQA) 문제들과는 달리, 영상에 포함된 사물들 간의 관계 파악과 답변 근거 제시 등 별도의 상식 추론이 요구되는 새로운 지능 문제이다. 본 논문에서는 입력 데이터(영상, 자연어 질문, 응답 리스트)에서 사물들 간의 관계와 맥락 정보를 추출해내는 모듈들 외에, 별도로 ConceptNet과 같은 외부 지식 베이스로부터 관련 상식들을 직접 가져다 GCN 기반의 지식 그래프 임베딩 과정을 거쳐 추가적으로 활용할 수 있는 모듈들을 포함한 새로운 심층 신경망 모델인 KG_VCR을 제안한다. 제안 모델인 KG_VCR의 세부 설계사항들을 소개하고, VCR 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해 제안 모델의 성능을 입증한다.

중첩 클러스터를 이용한 피드백 문서의 재샘플링 기법 (Resampling Feedback Documents Using Overlapping Clusters)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.247-256
    • /
    • 2009
  • 대부분의 잠정적 적합피드백기법들은 질의에 대해 검색된 상위검색문서들이 적합하다고 가정하고, 그 문서들을 질의 확장을 위한 피드백 문서로 이용하고 있다. 그러나 초기검색결과에는 상당한 양의 부적합 문서를 포함하고 있는 것이 현실이다. 이 논문에서는 보다 좋은 피드백 문서를 선택하기 위해서 중첩클러스터를 이용한 피드백문서의 재샘플링 기법을 제안한다. 주요 아이디어는 질의 중심적인 초기검색문서집합에 대해서 중첩이 허용된 문서클러스터를 이용하여 문서들 사이의 관계를 반영하여 질의에 핵심역할을 하는 지배적 문서를 찾고, 이 문서들을 반복적으로 피드백 하여 질의가 내포하는 핵심 주제를 강조하는 것이다. 대규모 실험집합인 TREC GOV2와 WT10g에 대한 실험비교에서, 최근 잠정적 적합피드백 기법들 중에서 가장 좋은 성능을 보이고 있는 적합모델보다 재샘플링기법이 우수한 성능향상을 보였다. 제안기법에 대한 검증을 위해서 피드백문서에 포함된 적합문서의 정도를 나타내는 적합밀도를 측정하였다. 재샘플링 기법이 TREC 실험집합에 대해서 적합모델에 비해 높은 적합밀도를 보였고, 이 결과 적합피드백에서 검색성능을 향상시키게 되었다. 이는 제안 기법이 잠정적 적합피드백에서 유효한 방법임을 알 수 있다.

모델트리의 결측치 처리 방법에 따른 콜레스테롤수치 예측의 성능 변화 (Using Missing Values in the Model Tree to Change Performance for Predict Cholesterol Levels)

  • 정용규;원재강;신성철
    • 서비스연구
    • /
    • 제2권2호
    • /
    • pp.35-43
    • /
    • 2012
  • 데이터 마이닝은 특정분야에서만 관심을 갖는 분야가 아니라 현재 우리주변 여러 분야에서 많이 사용되고 응용되고 있다. 즉, 수많은 데이터 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 예측하여 추출해 내고 추후에 의사 결정에 이용하는 과정을 말한다. 하지만, 일부 데이터 집합에서는 매우 많은 결측치를 포함하는 변수들이 존재한다. 다시 말해서 다수의 레코드에서 측정치가 존재하지 않는 데이터 집합이 존재한다. 그래서 본 논문에서는 Cholesterol 값을 예측하기 위한 결측치 처리에 따른 모델트리 알고리즘을 적용하고, 실험을 통해서 각 처리방식에 대한 성능을 분석한다. 또는 이 결과를 통하여 결측치 대체방법에 대한 효율적인 적용사례를 제시한다.

  • PDF

워드넷 기반 특징 추상화를 통한 웹문서 자동분류시스템의 성능향상 (Improving Hypertext Classification Systems through WordNet-based Feature Abstraction)

  • 노준호;김한준;장재영
    • 한국전자거래학회지
    • /
    • 제18권2호
    • /
    • pp.95-110
    • /
    • 2013
  • 본 논문은 기계학습 기법에 기반한 웹문서 자동분류 시스템의 성능을 높이기 위한 새로운 형태의 특징가공 기법을 제안한다. 제안 기법은 하이퍼텍스트 웹문서에 대한 자동분류를 효과적으로 수행하기 위해 하이퍼링크 관계를 활용하여 특징 집합을 확장시킨다. 웹문서는 하이퍼링크 관계를 통해 서로 연결된 구조를 가지며, 그 관계는 많은 경우 연관도가 높은 문서들 간에 존재한다. 이러한 링크 정보가 분류모델의 주요 인자가 되는 특징 집합의 질을 높이는 중요한 역할을 수행할 수 있다. 제안 기법의 기본 아이디어는 워드넷 온톨로지를 기반으로 분류 대상 문서와 인접 문서들에 포함된 단어(특징)들 간의 의미적 유사도를 평가함으로써 다수의 특징들로 구성된 추상화된 개념적 특징을 생성하는 것이다. 여기서 유사도 함수는 워드넷 안에서 특징들 간의 상/하위어 관계 정보를 정량적으로 계산하게 된다. 분류모델의 구축시 추상화된 개념 특징은 일반 특징과 동일하게 간주하여 보다 정확한 분류 모델을 구축하는데 기여한다. Web-KB 문서집합을 이용한 실험을 통해 제안 기법이 기존 기법 보다 우수함을 보였다.

Temporal 데이터의 최적의 클러스터 수 결정에 관한 연구 (A Study for Determining the Best Number of Clusters on Temporal Data)

  • 조영희;이계성;전진호
    • 한국콘텐츠학회논문지
    • /
    • 제6권1호
    • /
    • pp.23-30
    • /
    • 2006
  • Temporal 데이터의 클러스터링 방법론 중의 하나로 모델기반 방법론이 있다. 이는 각 클러스터에 대하여 오토마타기반의 모델을 가정하는 것이다. 개별 모델을 추출하기 위해서는 먼저 전체 데이터에 대한 적합한 모델을 찾는 것이 필요하다. 전체에 대한 모델은 데이터집합에 대한 최적의 클러스터의 수를 결정함으로 개별 모델 구축의 준비를 완료한다. 본 연구에서는 클러스터 수를 결정하기 위한 기준인 베이지안 정보기준(BIC : Bayesian Information Criterion) 근사법의 활용도를 검증하고 데이터 크기와 BIC 값의 상관관계를 파악함으로 탐색 효율을 높이는 방안을 제안한다. 실험에서는 인위적 모델을 통하여 생성된 인공적인 여러 형태의 데이터집합을 활용하여 BIC근사 측도의 활용성에 대해 살펴보았다. 실험결과에서 보여주는 것처럼 BIC 근사 측도는 데이터의 크기가 비교적 클 경우에 올바른 파티션의 사이즈를 추정함을 확인하였다.

  • PDF

Textual Entailment Feedback 기반 효율적인 문서 재순위화기 (Effective Passage Reranking with Textual Entailment Feedback)

  • 남성욱;한동훈;박은환;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.377-381
    • /
    • 2023
  • 재순위화기 연구는 주로 파이프라인 과정 설계, 데이터 증강, 학습 함수 개선, 혹은 대규모 언어 모델의 지식 활용 등에 집중되어있다. 이러한 연구들은 좋은 성능 상승을 이끌어주었지만 실제 적용이 힘들 뿐만 아니라 학습 비용이 크게 발생한다는 한계점을 가지고 있다. 더 나아가 주어진 데이터 집합만을 활용해서는 보다 더 세부적인 학습 신호를 주기 어렵다는 단점 또한 존재한다. 최근 자연어처리 분야의 연구에서는 피드백을 인위적으로 생성하여 반영하여 모델 성능 상승을 이끄는 연구가 제안되었다. 본 연구는, 이러한 연구를 바탕으로 질의와 문서 간의 함의 관계 점수를 피드백으로 사용 및 재순위화기 모델로의 반영을 제안한다. 재순위화기 모델에 대해 피드백을 반영하는것은 그렇지 않은 모델 대비하여 성능 상승을 이끌며 피드백 반영이 더 좋은 표상 도출에 도움이 됨을 확인할 수 있다.

  • PDF

시공간 지식탐사를 위한 3계층 프레임워크 (A 3-Layered Framework for Spatiotemporal Knowledge Discovery)

  • 이준욱;남광우;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권3호
    • /
    • pp.205-218
    • /
    • 2004
  • 시공간 데이타관리를 위한 데이타베이스 기술이 발전함에 따라 방대한 시공간 데이타 집합으로부터 의미 있는 시공간 지식 탐사를 필요로 하는 시공간 응용 서비스가 증대되고 있다. 이 논문에서는 시공간 지식 탐사 기법 개발을 지원하기 위하여 시공간 3계층 지식탐사 프레임워크를 제안하였다. 프레임 워크에서는 시공간 지식 탐사 문제 정의를 위한 기반 모델을 제시하여 시공간 지식에 대한 정의 및 관계를 표현할 수 있도록 하였다. 또한 시공간 지식 탐사 시스템의 구성요소 및 구현 모델을 제시하였다. 이 논문에서 제안한 시공간 지식 탐사를 위한 프레임워크는 앞으로 새로운 유형의 시공간 지식 탐사 기법 개발에 적용될 수 있는 특징을 포함하고 있다. 제안한 프레임워크는 시공간 이동 패턴과 같은 새로운 유형의 지식 탐사 기법 개발 지원에 있어 시공간 데이타 집합, 정보 및 지식에 대한 관계 규정과 각 요소에 대한 표현 모델을 제공함으로써 지식 탐사 문제를 형식화하고 단순화할 수 있다.

예비중등교사의 수학화 학습을 위한 교수단원의 설계: 분할모델과 일반화된 피보나치 수열 사이의 관계 탐구 (A Design of Teaching Unit to Foster Secondary pre-service Teachers' Mathematising Ability : Exploring the relationship between partition models and generalized fobonacci sequences)

  • 김진환;박교식
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제18권3호
    • /
    • pp.373-389
    • /
    • 2008
  • 이 연구에서는 예비중등교사들의 수학화 학습을 위해 분할모델과 일반화된 피보나치 수열 사이의 관계를 탐구하는 교수단원을 설계한다. 이 교수단원에서는 먼저 예비중등교사들이 조직해야 할 현상을 탐구문제의 형태로 제공한다. 그들은 이 탐구문제를 해결하면서, 그것을 조직하는 본질 즉, 분할의 수에 대한 패턴을 찾게 된다. 이 과정에서 점차 커지는 분할될 수의 집합에 따라 분할모델의 유형도 다양해진다. 이러한 분할모델에 대한 분할의 수를 구하고, 이 수들 사이의 패턴을 찾아 공식을 만들고, 이 공식들이 일반화된 피보나치 수열과 관계가 있음을 찾는다. 분할모델과 피보나치 수열 사이의 이러한 관계는 이전에 알려지지 않은 소재인 만큼, 그것은 예비중등교사들로 하여금 수학화를 가상적으로 연습하게 하는 것이 아니라, 실제처럼 연습할 수 있게 된다.

  • PDF