• 제목/요약/키워드: 지식속성

검색결과 376건 처리시간 0.027초

데이터 마이닝을 위한 제어규칙의 생성 (The Generation of Control Rules for Data Mining)

  • 박인규
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.343-349
    • /
    • 2013
  • 러프집합에서는 동치류와 근사공간의 개념을 이용하여 데이터 마이닝 분야에서 중복되는 정보로부터 특징점을 효율적으로 추출하여 최적화된 제어규칙을 유도할 수 있다. 이러한 추출과정에서 가장 중요하게 고려되어져야 할 부분은 많은 속성에 대한 감축이다. 본 논문에서는 속성간의 관계에서 러프엔트로피를 이용하여 가장 신뢰도가 우수한 속성을 구할 수 있는 정보이론적인 척도를 제시한다. 제안된 방법은 러프엔트로피를 기반으로 불필요한 속성을 제거함으로써 유용한 리덕트를 생성하고 이들에 대한 코어를 형성한다. 결과적으로 원시정보의 내용은 변하지 않으면서 지식감축을 통하여 간소화된 제어규칙을 구축할 수 있음을 보인다.

구문 관계 정보를 이용한 한국어 질의-응답 시스템 (Korean Question-Answering System using Syntactic-Relation Information)

  • 신승은;이대연;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제4권2호
    • /
    • pp.36-42
    • /
    • 2004
  • 본 논문은 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위한 동사의 구문 관계 정보를 이용한 한국어 질의-응답 시스템에 대해 기술한다. 구문 관계 정보는 동사의 원형, 사용 패턴, 각 문장 성분들의 의미 속성, 유의 동사 등의 정보를 담고 있다. 문장 및 구에 대한 구문분석은 구문관계 정보에 나타난 동사에 의존적인 문장 성분들의 의미속성과 동사의 일반적인 사용 패턴을 활용한다. 또한 정답후보 문장들의 구문분석을 위해 구문 관계 정보를 사용하고, 질의문의 격 슬롯(case slot)으로부터 정답을 찾기 위해 구문관계 정보를 사용한다. 실험에서 동사의 구문 관계 정보의 이용이 대규모 지식베이스와 언어 자원의 부족 문제를 해결하기 위해 한국어 질의-응답 시스템에 효율적으로 활용될 수 있음을 보였다.

  • PDF

한식정보 활용을 위한 온톨로지 설계에 관한 연구 (The Study on Design an Ontology for Korean Food Information)

  • 유하경;박옥남
    • 한국콘텐츠학회논문지
    • /
    • 제19권2호
    • /
    • pp.147-158
    • /
    • 2019
  • 한국의 고유문화로만 주목을 받아온 한식은 한류 및 1인 미디어의 소재로 활용되며 세계 시장 속에서 인기를 이어가고 있다. 한식의 조리법에 더하여 한식의 가치를 부각시켜줄 수 있는 관련 자료들을 체계적으로 조직하는 것은 확장 및 제한검색, 효과적인 브라우징을 통한 한식 콘텐츠의 재사용성을 향상시키는 데 토대가 된다. 이에 본 연구는 한식 지식구조의 정립을 위한 온톨로지의 설계를 목적으로 한다. 온톨로지 모델링은 OWL을 활용하였으며, 한식 정보를 담고 있는 32권의 단행본을 기반으로 한식의 유형 및 어휘를 조사하고, 음식 정보를 기반으로 하는 5개의 도메인 및 어플리케이션을 분석하여 데이터요소를 추출하였다. 연구결과 클래스 및 관련 속성을 도출하였고, 클래스별 속성과 색인예를 제시하였다.

데이터 마이닝을 위한 퍼지 결정트리 (A Fuzzy Decision Tree for Data Mining)

  • 이중근;민창우;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.63-65
    • /
    • 1998
  • 사회 전 분야에서 데이터가 폭발적으로 증가함에 따라 데이터를 이해하고 분석하는 새로운 자동적이고 지능적인 데이터 분석 도구와 기술이 필요하게 되었다. KDD(Knowledge Discovery in Databases)는 이러한 필요로부터 데이터에서 유용하고 이해 가능한 지식을 추출하는 연구이다. 데이터 마이닝(Data Mining)은 KDD에서 가장 중요한 단계로 데이터로부터 지식을 추출하는 단계이다. 데이터 마이닝에서 생성된 지식은 좋은 분류율을 가져야하고 이해하기 쉬워야한다. 본 논문에서는 퍼지 결정트리(FDT : Fuzzy Decision Tree)에 기반한 효율적인 데이터 마이닝 알고리즘을 제안한다. FDT의 각 링크는 속성(attribute) 값을 갖는 퍼지 집합이며, EDT의 각 경로는 퍼지 규칙을 생성한다. 제안된 알고리즘은 ID3의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법으로 히스토그램에 이루어진다. 마지막으로 제안된 방법의 타당성을 검증하기 위해 표준적인 패턴 분류 벤치마크 데이터에 대한 실험 결과를 보인다.

  • PDF

의료데이터마이닝에서 클러스터링 기반의 나이브 베이지안 학습 (A Naive Bayesian Learning of Clustering for Medical Datamining)

  • 한송이;정용규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.410-413
    • /
    • 2010
  • 병원정보시스템의 전세계적인 보급과 데이터웨어하우스의 도입으로 인해서 병원내의 의료데이터가 기하 급수적인 증가추세를 보이고 있다. 환자에 대한 임상적인 특징을 다수 포함하고 있는 의료데이터는 유용한 임상지식의 보고로서 그 가치가 매우 유용하다. 따라서 데이터에 숨겨진 지식을 발견하여 구조화시킴으로써 새로운 지식을 창조하는 데이터마이닝은 임상부분에 적합한 기술이라 말할 수 있다. 본 연구에서는 급성염증을 가진 환자들의 의료데이터를 기반으로 특징을 추출하고, 추출된 특징을 바탕으로 병명을 판단하기 위한 학습을 수행한다. 학습 방법은 클러스터링을 이용한 나이브 베이지안으로 진행한다. 기존의 나이브 베이지안 학습은 대량의 데이터를 처리하는데 효과적이며 성능 또한 우수하지만, 속성별 독립을 가정하기 때문에 의료데이터를 분석에는 잘 사용되지 않는다. 따라서 높은 신뢰도를 구현하기 위해 나이브 베이지안 학습 전에 클러스터링을 선행하여, 기존 데이터에 클러스터링 클래스를 추가한다. 이를 통해 급성염증의 증상을 보이는 환자데이터를 바탕으로 자동적으로 방광염과 결석으로 인한 신장염을 효과적으로 진단해낸다.

  • PDF

연결망 분석을 활용한 인문사회기반 융합연구 구조에 관한 연구: 네트워크 중심성과 중개자 역할을 중심으로 (Research Networking in Convergence Relations: A Network Analytic Approach to Interdisciplinary Cooperation)

  • 양창훈;허정은
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.49-63
    • /
    • 2017
  • 본 연구는 인문사회기반 융합연구 지원과제를 대상으로 연구 분야간 협력적 연계관계 구조와 그 속성을 분석하고자 하였다. 학제간 연구협력은 공동의 문제를 해결하는데 있어서 개별 연구 분야들이 보유한 지식, 정보, 자원 등을 다른 분야들과 결합하고 공유하는 상호 협력적인 연구 활동이라고 볼 수 있다. 2009년부터 2015년까지 한국연구재단이 지원한 183개 융합과제를 대상으로 98개의 연구 분야를 추출하고 이를 관계형 네트워크 데이터로 구축하여 분석을 수행하였다. 분석 결과, 다양한 분야들이 상호 연계되어 군집을 형성하고 이를 통해 협력적 융합연구 활동이 고르게 분포되는 구조적 속성을 확인할 수 있었다. 둘째, 외향 및 내향 연결 중심성이 높은 분야들이 전체 년도구간에서 학제적 연구협력의 주요 기능을 담당하는 것으로 판단되었다. 셋째, 연결자(Liaison)의 중개 역할이 전체 네트워크에서 이종 지식과 정보의 흐름을 중개하는 연구 분야의 대표적인 특성이라는 점도 확인되었다. 본 연구는 학제간 연구협력 네트워크의 구조적 속성을 파악하고 융합연구에 있어서 네트워크 방법론의 적용이 가지는 정책적 함의를 제시하였다.

시간 단위 그룹핑을 이용한 빈발 아이템셋 마이닝 (Mining Frequent Itemsets using Time Unit Grouping)

  • 황정희
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.647-653
    • /
    • 2022
  • 데이터 마이닝은 데이터를 탐색하고 분석하여 데이터 사이의 관계나 패턴 등의 지식을 탐사하는 기법이다. 실세계에서 발생하는 데이터는 시간 속성을 포함한다. 시간 속성을 포함하는 데이터에서 유용한 지식을 찾아내기 위한 시간 데이터마이닝 연구는 미래를 예측할 수 있는 예측 판단에 효율적으로 활용될 수 있다. 본 논문은 데이터베이스를 일정한 시간 간격 단위로 구분하고, 시간 단위에서 빈발한 패턴 아이템셋을 발견하기 위한 시간 단위 그룹핑을 이용하는 알고리즘을 제안한다. 제안하는 알고리즘은 시간 단위에 포함된 트랜잭션과 아이템 정보를 매트릭스로 구성하고, 그룹핑을 통한 시간 단위에서의 빈발한 아이템셋을 발견한다. 성능평가의 실험 결과에서 수행시간은 기존의 알고리즘보다 1.2배 소요되지만, 2배 이상의 빈발 아이템셋이 탐사되었다.

지식기반 (Knowledge-based) 질의응답시스템: 사실 자료 (Faet Database)구축을 중심으로 (A Knowledge-based Question-Answering System: With A View To Constructing A Fact Database)

  • 신효필
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.41-51
    • /
    • 2002
  • 본 논문에서는 질의어 응답시스템에 있어 핵심이 되는 사실 자료 (Fact Database) 구축의 관점에서 지식기반 방법의 중요성과 그 과정에 대해서 논의한다. 지식기반 질의어 시스템은 기존의 이용가능한 자연언어처리의 자원-형태소, 구문, 의미분석 등-과 온톨로지라는 개념구조망을 이용하는 시스템으로 이 개념을 현실세계의 사실 자료와 연결시켜 개념구조가 지닌 속성과 값의 확장을 통해 그 가능한 응답을 유도해 내는 시스템이다. 이 시스템 구축에 있어 실제 세계의 자료를 수집하고 가공하고 개념화하는 과정은 이 시스템의 성패를 좌우하는 핵심작업으로 아직은 완전히 자동화되기 어렵다. 그러나 지식기반에 기초한 방법은 응용시스템의 질적 향상이라는 측면에서 진지하게 논의될 필요가 있다. 이 글에서는 사실 자료 구축의 관점에서 이런 작업들이 어떻게 행해져야 하는지 그리고 그 방법론이 지닌 특징 및 문제점에 대해 논의한다.

  • PDF

퍼지지식베이스에서의 효율적인 정보검색을 위한 규칙생성 및 근사추론 알고리듬 설계 (Rule Generation and Approximate Inference Algorithms for Efficient Information Retrieval within a Fuzzy Knowledge Base)

  • 김형수
    • 디지털콘텐츠학회 논문지
    • /
    • 제2권2호
    • /
    • pp.103-115
    • /
    • 2001
  • 본 논문은 퍼지지식베이스에서 러프 집합과 요인공간이론을 적용하여 최소 결정규칙 생성과 근사추론 연산을 수행하는 두 개의 알고리듬을 제안한다. 최소 결정규칙의 생성은 속성요인에 관련한 상관분석과 베이지안 정리를 응용한 데이터의 분류기법과 리덕트에 의해 수행된다. 이 결정규칙으로 이루어진 최소지식 베이스의 탐색공간에서 소속함수와 t-norm의 합성 연산을 정의한 근사추론 방식에 의해 특정 객체를 검색한다. 본 연구의 러프와 퍼지연산 모듈을 수행하는 제안 알고리듬 기법을 객체및 속성수를 증가시키는 시뮬레이션을 통해 다른 검색이론 및 합성연산 방식과 비교하였다. 그 결과 다른 제 방법보다 본 연구에서 제안하는 기법이 특정 객체를 추출하기 위한 검색연산 시간에 있어 보다 빠르게 검색됨을 입증하였다.

  • PDF

건설현장의 프로세스 Context 추출을 위한 디지털 이미지 정보체계 구축 (An Information Framework for the Derivation of Process Context from Construction Site Digital Images)

  • 윤수원;진상윤
    • 한국건설관리학회논문집
    • /
    • 제6권2호
    • /
    • pp.80-91
    • /
    • 2005
  • 건설현장에서 수집되는 사진은 그 중요성에도 불구하고 효과적인 관리체계 미흡으로 촬영자의 의도나 사진의 의미를 파악하기 힘든 경우가 많았으며, 이로 인하여 거대한 디지털 이미지 파일 pool이 형성되어 있음에도 불구하고 그 안에 숨어있는 수많은 정보와 지식을 제대로 도출하기 어렵고 재활용도가 떨어지는 한계를 가지고 있다. 따라서 본 연구의 목적은 수집된 현장 사진들로부터 현장 프로세스에 대한 기술, 지식, 교훈 등의 context를 추출하기 위한 정보체계 구축을 위해 육하원칙, 즉 누가(who), 언제(when), 어디서(where), 무엇을(what), 왜(why), 어떻게(how)라는 원칙에서 일련의 사진들이 가지는 여러 가지 상황정보를 추출하고 이 정보들을 이용하여 효과적으로 정보를 관리하고 재활용할 수 있는 속성을 도출하고 정보 모델을 개발하는 것이다. 이 논문에서는 속성도출 및 정보모델 개발 과정과 이를 기반으로 개발된 사진정보관리 시스템에 관하여 논하고 있다.