• Title/Summary/Keyword: concept extracting

검색결과 135건 처리시간 0.024초

Extracting Database Knowledge from Query Trees

  • Yoon, Jongpil
    • Journal of Electrical Engineering and information Science
    • /
    • 제1권2호
    • /
    • pp.145-156
    • /
    • 1996
  • Although knowledge discovery is increasingly important in databases, the discovered knowledge sets may not be effectively used for application domains. It is partly because knowledge discovery does not take user's interests into account, and too many knowledge sets are discovered to handle efficiently. We believe that user's interests are conveyed by a query and if a nested query is concerned it may include a user's thought process. This paper describes a novel concept for discovering knowledge sets based on query processing. Knowledge discovery process is performed by: extracting features from databases, spanning features to generate range features, and constituting a knowledge set. The contributions of this paper include the following: (1) not only simple queries but also nested queries are considered to discover knowledge sets regarding user's interests and user's thought process, (2) not only positive examples (answer to a query) but also negative examples are considered to discover knowledge sets regarding database abstraction and database exceptions, and (3) finally, the discovered knowledge sets are quantified.

  • PDF

패턴 기반 기법을 사용한 용어 간 관계 추출 방법 (A Method for Extracting Relationships Between Terms Using Pattern-Based Technique)

  • 김영태;김치수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권8호
    • /
    • pp.281-286
    • /
    • 2018
  • 최근 정보의 복잡성과 다양성 및 방대한 양의 가용 정보가 증가함에 따라 대규모 데이터로부터 의미 있는 검색 결과를 추출하는 방법으로서 온톨로지에 대한 관심과 필요성이 증가하고 있다. 주어진 자연어 텍스트로부터 온톨로지를 추출하는 많은 방법이 제안되었지만, 현재 대부분의 방법은 온톨로지의 구조에 일치되도록 추출하지 못하는 실정이다. 본 논문에서는 온톨로지를 구축하기 위해 필요한 용어를 특정 도메인에서 주어진 텍스트와 구별하고 패턴 기반 방법을 기반으로 용어 사이의 다양한 관계를 추출하는 방법을 제안한다. 용어들 간의 관계를 추출하기 위해 일치 패턴 집합을 고려하고 조인 집합 개념과 패턴의 정렬을 연결하여 검색 공간의 크기를 줄이는 방법을 제안한다. 그 결과 이 방법이 검색 공간으로부터 유용한 어떤 패턴도 제거하지 않고 50-95% 정도로 검색 공간의 크기를 줄이는 결과를 보였다.

영-한 조어단위 대역쌍 추출을 위한 조어단위 정렬 모델 (An Alignment Model for Extracting English-Korean Translations of Term Constituents)

  • 오종훈;황금하;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.300-311
    • /
    • 2005
  • 전문용어는 전문분야의 개념을 표현하는 언어적 표현이다. 전문용어의 조어단위는 전문용어를 구성하는 최소의 형태적 단위이다. 따라서 조어단위는 전문용어의 의미를 파악하는데 중요한 요소이다. 하지만 조어단위를 이용한 전문용어의 의미파악은 ‘조어단위와 개념단위의 불일치 문제’, 조어 단위의 ‘동형이의어’, ‘동의어’문제 둥으로 인한 어려움이 있다. 이러한 문제를 해결하기 위해서는 하나의 개념을 나타내는 조어단위의 덩어리인 개념단위를 파악하는 작업이 선행되어야 한다. 본 논문에서는 영어의 조어단위를 하나의 개념단위로 정의하고 개념단위에 대응되는 한국어 조어단위의 집합을 개념단위로 인식한다. 개념단위의 파악과정은 영한 대역 전문용어사전에 대한 영어-한국어 조어단위 정렬문제로 해결하고자 한다. 본 논문의 기법은 물리, 화학, 생물 분야에 대한 조어정렬 실험을 수행하였으며, 평균 약 $93\%$의 정확률로 조어단위 간의 정렬을 수행하였다

형식개념분석을 위한 자동화 도구의 개발과 의료분야에서의 적용사례 (The Development of an Automatic Tool for Formal Concept Analysis and its Applications on Medical Domain)

  • 김홍기;강유경;황석형;김동순
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.997-1008
    • /
    • 2006
  • 형식개념분석기법(FCA: Formal Concept Analysis)은 대상 도메인의 데이터를 사용자의 관점과 해석을 바탕으로 개념화함으로서 필요한 정보의 추출과 접근을 제공하기 위한 기법으로서 다양한 분야에서 널리 사용되고 있다. 그러나, 기존의 형식개념분석기법 지원 도구들은 대부분 객체와 속성간의 관계를 나타낸 One-valued context에 대한 분석만을 중점적으로 지원하고 있고, 다종다양한 값을 갖는 데이터들로 구성된 Many-valued context에 대한 분석을 충분히 지원하지 못하고 있다. 따라서, 본 논문에서는 다양한 값을 갖는 입력 데이터를 사용자의 목적에 맞도록 해석하여 간결화하기 위한 스케일링(Scaling) 알고리즘과 입력 데이터들로부터 개념을 추출하여 계층구조화하기 위한 알고리즘을 제안한다. 이와 같은 연구결과를 토대로 개념분석과 계층구조화를 위한 자동화 도구(FCA Wizard)를 개발하여, 실제 의료 분야에서의 적용사례를 소개한다.

개선된 시간영역 해석기법에 의한 동특성 추정 (Determination of Vibration Parameters Using The Improved Time Domain Modal Identification Algorithm)

  • 정범석
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제3권2호
    • /
    • pp.147-154
    • /
    • 1999
  • A new approach to conducting the vibration parameters identification algorithm is proposed. The approach employs the concept of modal amplitude ratio implemented in a mode shape estimation. The accuracy of the improved Ibrahim Time Domain identification algorithm in extracting structural modal parameters from free response functions has been studied using computer simulated data for 9 stations on the two-span continuous beam. Simulated responses from the lumped and distributed parameter system demonstrate that this algorithm produces excellent results, even in the 300% noise response.

  • PDF

크로스커팅 개념을 이용한 시스템 최적화 기법 (System Optimization Technique using Crosscutting Concern)

  • 이승형;유현
    • 디지털융복합연구
    • /
    • 제15권3호
    • /
    • pp.181-186
    • /
    • 2017
  • 시스템 최적화는 소스코드의 변경 없이 중복된 모듈을 추출하고, 추출된 모듈의 재사용을 위하여 프로그램의 구조를 변경하는 기법이다. 구조지향 개발과 객체지향 개발은 크로스커팅 영역의 모듈화에는 효율적이나 크로스커팅 개념을 모듈화 할 수 없다. 기존 시스템에서 크로스커팅 개념을 적용하기 위해, 각 시스템 내에 분산되어 있는 시스템 최적화 대상 모듈을 크로스커팅 영역으로 추출하는 기술이 필요하다. 본 논문에서는 개발이 완료된 시스템에서 중복 모듈을 추출하기 위한 방법을 제안한다. 제안하는 방법은 소스코드 분석을 통해 데이터 의존관계와 제어 의존관계를 분석하여 중복되는 요소를 추출한다. 추출된 중복된 요소는 시스템 최적화를 위하여 프로그램 의존 관계 분석에 사용될 수 있다. 중복된 의존관계 분석 결과는 제어 흐름 그래프로 변환되며, 이를 활용하여 최소 크로스커팅 모듈을 생성할 수 있다. 의존 관계 분석을 통해 추출된 요소는 크로스커팅 영역 모듈로 설정함으로써 시스템 내 중복된 코드를 최소화 할 수 있는 시스템 최적화 방법을 제시한다.

구간데이터분석을 위한 형식개념분석기반의 분류 (A FCA-based Classification Approach for Analysis of Interval Data)

  • 황석형;김응희
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.19-30
    • /
    • 2012
  • 다양한 정보기기와 소셜네트워크시스템, 그리고, 클라우드컴퓨팅환경 등과 같은 인터넷기반의 인프라를 토대로 분산화되고 공유가능한 데이터가 폭발적으로 증가하고 있다. 최근에는 데이터에 내재되어 있는 유용한 정보와 지식을 추출하고 분석 및 분류하기 위한 데이터분석 및 마이닝기법으로서, 이진데이터 또는 다치데이터에 관한 형식개념분석기법에 관한 연구가 활발하게 진행되어 다양한 분야에서 성공적으로 활용되고 있다. 그러나, 각 속성들이 구간값을 갖는 형태로 이루어진 구간데이터의 분석에 대한 형식개념분석에 관한 연구는 많이 수행되지 못하였다. 본 논문에서는, 구간데이터를 분석하기 위하여 형식개념분석기법을 기반으로 하는 새로운 분류기법을 제안한다. 또한, 구간데이터의 이진화, 개념추출 및 개념계층구조 구축 등, 본 논문에서 제안한 새로운 분류기법을 지원하기 위한 도구(iFCA)의 구축에 관하여 소개하고, 마지막으로, 몇가지 실세계의 데이터를 대상으로 한 실험결과를 토대로, 본 논문에서 제안하는 분류기법의 유용성에 대해서 설명한다.

초등학교 수학과 개념학습을 위한 스토리텔링 기반학습 콘텐츠 개발 (Development of Mathematics Learning Contents based on Storytelling for Concept Learning)

  • 오영범;박상섭
    • 정보교육학회논문지
    • /
    • 제14권4호
    • /
    • pp.537-545
    • /
    • 2010
  • 본 연구의 목적은 초등학교 3학년 학생들을 위한 수학과 개념 학습용 콘텐츠를 개발하고 그 교육적 효과를 검증하기 위한 것이다. 수학과 개념 학습을 위한 스토리텔링 기반 학습 콘텐츠를 개발하기 위해 교수체제 설계의 기본 모형인 ADDIE 모형을 활용하였다. 먼저, 교육과정 분석을 통해 54개의 핵심 용어를 추출한 후, 학습자들에게 친숙한 맥락을 반영한 스토리를 수학 개념과 결합하는 설계 전략을 마련하였다. 개발된 콘텐츠의 교육적 효과성을 검증하기 위해 학생과 교사들을 대상으로 설문지와 인터뷰를 실시하였다. 그 결과 콘텐츠에 대한 학생들의 이해도, 흥미도, 집중도, 기대감이 아주 높게 나타났으며, 교사들 역시 동기유발을 위한 유용한 교수 자료로 사용할 수 있음을 시사하였다.

  • PDF

2000년 이후 인테리어 데코레이션 트랜드의 언어심상에 관한 연구 (A Study on the Verbal Image of Interior Decoration Trend from the Year 2000)

  • 김주연;한효정;이혜경
    • 한국실내디자인학회논문집
    • /
    • 제15권6호
    • /
    • pp.238-246
    • /
    • 2006
  • Recent trends of interior design have a focus on creation of more various meanings rather than past ideology which sought after the compatibility to the function of modem design. These trends requires integral understanding of social and cultural ideologies with a sens of values for a certain periods. In addition, they also require creativity which able to read, find and solve consumer's diverse demand and desire. Considering the effort of trend forecasting in Korea is still heavily rely on the foreign trend shows, it is natural to attempt to study the analytical forecasting methodology based upon more systematic principles which lead to more objective outcome, when the understanding, forcasting and analysis of interior decoration trend are required. In this thesis, the analysis and forecasting of interior decoration trend are studied by means of verbal image code process which involves the induction of design concept through data extraction, classification and analysis, in order to understanding and satisfying the diversified consumer's demand and trend. The coding process of verbal image is understanding as general concept. by extracting common elements from abstract and individual image, and/or specific concept. Therefore, it is proposed that the database building and data mining process of verbal Image, and subsequent development of programming skill can be applied as more efficient tool for various verbal image process.

웹 사용자의 선호도 추출을 위한 지능모델 설계 및 평가 (Design & Evaluation of an Intelligent Model for Extracting the Web User' Preference)

  • 김광남;윤희병;김화수
    • 한국지능시스템학회논문지
    • /
    • 제15권4호
    • /
    • pp.443-450
    • /
    • 2005
  • 본 논문에서는 웹 사용자의 선호도를 추출하기 위한 지능적 모델을 제안하고 이에 대한 평가결과를 제시한다. 이를 위해 현재 정보검색엔진의 문제점을 분석하고, 선호도 가중치를 학습기에 반영한다. 이것은 키워드에 의한 단어별 빈도수에 의존하지 않고 지능적으로 사용자의 행동유형을 학습하게 함으로써 질의에 대한 결과집합을 사용자의 의도에 맞게 제공하는 메커니즘이다. 다음으로 선호도 유행성에 대한 개념과 고려요소를 제안하며, 선호도 추출 알고리즘과 이에 대한 예를 제시한다. 또한 행동유형 추출을 위한 지능모델을 설계하고 HTML 색인과 선호도 결정 지능학습과정을 제안한다. 마지막으로 선호도를 적용한 후의 문서 랭킹 측정결과를 비교함으로써 본 논문에서 제안한 모델의 타당성을 검증한다.