• 제목/요약/키워드: 개체관계모델

검색결과 171건 처리시간 0.026초

지식 기반 추론 엔진을 이용한 자동화된 데이터베이스 튜닝 시스템 (Automated-Database Tuning System With Knowledge-based Reasoning Engine)

  • 강승석;이동주;정옥란;이상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (A)
    • /
    • pp.17-18
    • /
    • 2007
  • 데이터베이스 튜닝은 일반적으로 데이터베이스 어플리케이션을 "좀 더 빠르게" 실행하게 하는 일련의 활동을 뜻한다[1]. 데이터베이스 관리자가 튜닝에 필요한 주먹구구식 룰(Rule of thumb)들을 모두 파악 하고 상황에 맞추어 적용하는 것은 비싼 비용과 오랜 시간을 요구한다. 그렇게 때문에 서로 다른 어플 리케이션들이 맞물려 있는 복잡한 서비스는 필수적으로 자동화된 데이터베이스 성능 관리와 튜닝을 필 요로 한다. 본 논문에서는 이를 해결하기 위하여 지식 도매인(Knowledge Domain)을 기초로 한 자동화 된 데이터베이스 튜닝 원칙(Tuning Principle)을 제시하는 시스템을 제안한다. 각각의 데이터베이스 튜닝 이론들은 지식 도매인의 지식으로 활용되며, 성능에 영향을 미치는 요소들을 개체(Object)와 콘셉트 (Concept)로 구성하고 추론 시스템을 통해 튜닝 원칙을 추론하여 쉽고 빠르게 현재 상황에 맞는 튜닝 방법론을 적용시킬 수 있다. 자동화된 데이터베이스 튜닝에 대해 여러 분야에 걸쳐 학문적인 연구가 이루어지고 있다. 그 예로써 Microsoft의 AutoAdmin Project[2], Oracle의 SQL 튜닝 아키텍처[3], COLT[4], DBA Companion[5], SQUASH[6] 등을 들 수 있다. 이러한 최적화 기법들을 각각의 기능적인 방법론에 따라 다시 분류하면 크게 Design Tuning, Logical Structure Tuning, Sentence Tuning, SQL Tuning, Server Tuning, System/Network Tuning으로 나누어 볼 수 있다. 이 중 SQL Tuning 등은 수치적으로 결정되어 이미 존재하는 정보를 이용하기 때문에 구조화된 모델로 표현하기 쉽고 사용자의 다양한 요구에 의해 변화하는 조건들을 수용하기 쉽기 때문에 이에 중점을 두고 성능 문제를 해결하는 데 초점을 맞추었다. 데이터베이스 시스템의 일련의 처리 과정에 따라 DBMS를 구성하는 개체들과 속성, 그리고 연관 관계들이 모델링된다. 데이터베이스 시스템은 Application / Query / DBMS Level의 3개 레벨에 따라 구조화되며, 본 논문에서는 개체, 속성, 연관 관계 및 데이터베이스 튜닝에 사용되는 Rule of thumb들을 분석하여 튜닝 원칙을 포함한 지식의 형태로 변환하였다. 튜닝 원칙은 데이터베이스 시스템에서 발생하는 문제를 해결할 수 있게 하는 일종의 황금률로써 지식 도매인의 바탕이 되는 사실(Fact)과 룰(Rule) 로써 표현된다. Fact는 모델링된 시스템을 지식 도매인의 하나의 지식 개체로 표현하는 방식이고, Rule 은 Fact에 기반을 두어 튜닝 원칙을 지식의 형태로 표현한 것이다. Rule은 다시 시스템 모델링을 통해 사전에 정의되는 Rule와 튜닝 원칙을 추론하기 위해 사용되는 Rule의 두 가지 타업으로 나뉘며, 대부분의 Rule은 입력되는 값에 따라 다른 솔루션을 취하게 하는 분기의 역할을 수행한다. 사용자는 제한적으로 자동 생성된 Fact와 Rule을 통해 튜닝 원칙을 추론하여 데이터베이스 시스템에 적용할 수 있으며, 요구나 필요에 따라 GUI를 통해 상황에 맞는 Fact와 Rule을 수동으로 추가할 수도 었다. 지식 도매인에서 튜닝 원칙을 추론하기 위해 JAVA 기반의 추론 엔진인 JESS가 사용된다. JESS는 스크립트 언어를 사용하는 전문가 시스템[7]으로 선언적 룰(Declarative Rule)을 이용하여 지식을 표현 하고 추론을 수행하는 추론 엔진의 한 종류이다. JESS의 지식 표현 방식은 튜닝 원칙을 쉽게 표현하고 수용할 수 있는 구조를 가지고 있으며 작은 크기와 빠른 추론 성능을 가지기 때문에 실시간으로 처리 되는 어플리케이션 튜닝에 적합하다. 지식 기반 모률의 가장 큰 역할은 주어진 데이터베이스 시스템의 모델을 통하여 필요한 새로운 지식을 생성하고 저장하는 것이다. 이를 위하여 Fact와 Rule은 지식 표현 의 기본 단위인 트리플(Triple)의 형태로 표현된다, 트리플은 Subject, Property, Object의 3가지 요소로 구성되며, 대부분의 Fact와 Rule들은 트리플의 기본 형태 또는 트리플의 조합으로 이루어진 C Condition과 Action의 두 부분의 결합으로 구성된다. 이와 같이 데이터베이스 시스템 모델의 개체들과 속성, 그리고 연관 관계들을 표현함으로써 지식들이 추론 엔진의 Fact와 Rule로 기능할 수 있다. 본 시스템에서는 이를 구현 및 실험하기 위하여 웹 기반 서버-클라이언트 시스템을 가정하였다. 서버는 Process Controller, Parser, Rule Database, JESS Reasoning Engine으로 구성 되 어 있으며, 클라이 언트는 Rule Manager Interface와 Result Viewer로 구성되어 었다. 실험을 통해 얻어지는 튜닝 원칙 적용 전후의 실행 시간 측정 등 데이터베이스 시스템 성능 척도를 비교함으로써 시스템의 효용을 판단하였으며, 실험 결과 적용 전에 비하여 튜닝 원칙을 적용한 경우 최대 1초 미만의 전처리에 따른 부하 시간 추가와 최소 약 1.5배에서 최대 약 3배까지의 처리 시간 개선을 확인하였다. 본 논문에서 제안하는 시스템은 튜닝 원칙을 자동으로 생성하고 지식 형태로 변형시킴으로써 새로운 튜닝 원칙을 파생하여 제공하고, 성능에 영향을 미치는 요소와 함께 직접 Fact과 Rule을 추가함으로써 커스터마이정된 튜닝을 수행할 수 있게 하는 장점을 가진다. 추후 쿼리 자체의 튜닝 및 인텍스 최적화 등의 프로세스 자동화와 Rule을 효율적으로 정의하고 추가하는 방법 그리고 시스템 모델링을 효과적으로 구성하는 방법에 대한 연구를 통해 본 연구를 더욱 개선시킬 수 있을 것이다.

  • PDF

대화 데이터셋에서 멘션 경계와 멘션 쌍을 이용한 상호참조해결 파이프라인 모델 (Coreference Resolution Pipeline Model using Mention Boundaries and Mention Pairs in Dialogues)

  • 김담린;박성식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.307-312
    • /
    • 2022
  • 상호참조해결은 주어진 문서에서 멘션을 추출하고 동일한 개체의 멘션들을 군집화하는 작업이다. 기존 상호참조해결 연구의 멘션탐지 단계에서 진행한 가지치기는 모델이 계산한 점수를 바탕으로 순위화하여 정해진 비율의 멘션만을 상호참조해결에 사용하기 때문에 잘못 예측된 멘션을 입력하거나 정답 멘션을 제거할 가능성이 높다. 또한 멘션 탐지와 상호참조해결을 종단간 모델로 진행하여 학습 시간이 오래 걸리고 모델 복잡도가 높은 문제가 존재한다. 따라서 본 논문에서는 상호참조해결을 2단계 파이프라인 모델로 진행한다. 첫번째 멘션 탐지 단계에서 후보 단어 범위의 점수를 계산하여 멘션을 예측한다. 두번째 상호참조해결 단계에서는 멘션 탐지 단계에서 예측된 멘션을 그대로 이용해서 서로 상호참조 관계인 멘션 쌍을 예측한다. 실험 결과, 2단계 학습 방법을 통해 학습 시간을 단축하고 모델 복잡도를 축소하면서 종단간 모델과 유사한 성능을 유지하였다. 상호참조해결은 Light에서 68.27%, AMI에서 48.87%, Persuasion에서 69.06%, Switchboard에서 60.99%의 성능을 보였다.

  • PDF

다양한 웹 기반 소프트웨어의 테스트를 위한 효율적인 테스트 케이스의 생성 (Effective Test Case Generation for Various Types of Web-based Software)

  • 김현수;최은만
    • 정보처리학회논문지D
    • /
    • 제12D권4호
    • /
    • pp.569-582
    • /
    • 2005
  • 인터넷을 통한 정보의 교류와 비즈니스가 활발해지면서 웹 기반 소프트웨어도 확대되고 있고 그만큼 품질 측면의 노력이 중요하다. 웹 컨텐츠의 링크나 웹 기반 프로그램을 검증하는 연구가 시도되었으나 다양한 웹 기반 구성 방법들을 커버하는 방법은 찾기 어려웠고 또한 적용 실험이 부족하다. 이 논문에서는 다양한 동적인 웹 기반 소프트웨어들을 타입별로 나누어 보고 동일한 방법으로 모델링 한 후 테스트 케이스를 생성하는 방법을 제안한다. 웹 기반 소프트웨어를 구성하는 개체들을 파악한 후 이를 개체 제어흐름 그래프(Object Control of Flow Graph)와 개체 관계 다이어그램(Object Relationship Diagram)으로 모델링 한다. 모델에서 테스트 경로를 파악하고 테스트 키 포인트를 구동하는 테스트 케이스를 찾는다. 제안한 방법으로 다섯 가지 타입의 웹 기반 소프트웨어를 적용하여 실용성을 보였으며 이제까지 제안된 방법과 어떤 차이를 보이는지 비교하였다.

개체명 인식 코퍼스 생성을 위한 지식베이스 활용 기법 (Automatic Training Corpus Generation Method of Named Entity Recognition Using Knowledge-Bases)

  • 박영민;김예진;강상우;서정연
    • 인지과학
    • /
    • 제27권1호
    • /
    • pp.27-41
    • /
    • 2016
  • 개체명 인식은 미리 정의된 개체 범주로 텍스트의 요소를 분류하는 과정을 의미하며 최근 주목 받고 있는 음성 비서 서비스 등 다양한 응용 분야에 널리 활용되고 있다. 본 논문에서는 지식베이스를 사용하여 개체명 인식 코퍼스를 자동으로 생성하는 방법을 제안한다. 지식베이스의 종류에 따라 두 가지 방법을 적용하며 그 중 첫 번째 방법은 위키피디아를 기반으로 위키피디아 본문의 문장에 개체명 표지를 부착하여 학습 코퍼스를 생성하는 방법이다. 두 번째 방법은 인터넷으로부터 다양한 형태의 문장을 수집하고 다양한 개체들 간의 관계를 데이터베이스에 보유 중인 프리베이스를 이용하여 개체명 표지를 부착하는 방법으로 학습 코퍼스를 생성한다. 자동 생성된 학습 코퍼스의 질과 본 논문에서 제안하는 학습 코퍼스 자동 생성 기법을 평가하기 위해 두 가지로 실험했다. 첫 번째, 다른 형태의 지식베이스인 위키피디아와 프리베이스(Freebase)를 기반으로 생성된 학습 코퍼스의 표지 부착 성능을 수동으로 측정하여 코퍼스의 질을 평가하였다. 두 번째, 각 코퍼스로 학습된 개체명 인식 모델의 성능을 통해 제안하는 학습 코퍼스 자동 생성 기법의 실용성을 평가하였다. 실험을 통해 본 방법이 타당함을 증명하였으며 특히 실제 응용에서 많이 사용되는 웹 데이터 환경에서 의미 있는 성능 향상을 보여주었다.

  • PDF

동적 분할 기법을 이용한 네트워크 계층 모델에 관한 연구 (A Study on Network Hierarchy Model which uses a Dynamic Segmentation Technique)

  • 주용진;이용익;문경기;박수홍
    • Spatial Information Research
    • /
    • 제14권2호
    • /
    • pp.245-260
    • /
    • 2006
  • 이동성을 지원하는 모바일 환경에서 위치정보의 활용과 사용자 요구가 증가되고 GIS 공간 DB와 연계된 다양한 서비스가 진행되고 있다. 일반적으로 도로 DB를 구성하는 교통 네트워크의 논리적 관계의 표현은 노드-링크 구조를 사용한다. 이러한 단일 수준에 적합하게 설계된 구조는 다양한 모형 적용에 유연하지 못하고, 데이터베이스 검색과 유지관리 측면에서 비효율적이다. 본 연구에서는 동적 분할(Dynamic Segmentation)을 이용한 네트워크 모델의 설계와 구축을 통해 기존 도로망 모델의 문제점과 구축상의 한계점을 보완하고, 네트워크의 검색과 표현에 효율적인 계층 모델을 구현하고자 하였다. 설계된 모델은 다양한 수준의 단계별 표현과 계층 간 개체 관계성을 지원하며, GIS가 지닌 네트워크 공간 모델링 기능을 대폭 보완할 수 있을 것으로 기대 된다.

  • PDF

FRBR 알고리즘 분석 및 KORMARC 데이터베이스 적용 방안 (Study on the FRBR Algorithm and Application of KORMARC Database)

  • 조재인
    • 한국문헌정보학회지
    • /
    • 제38권3호
    • /
    • pp.5-21
    • /
    • 2004
  • FRBR은 개체-관계형 모델을 기반으로한 서지 정보의 새로운 개념 모델로 향후 개정될 AACR 3의 기본 개념으로 자리잡고 있다. OCLC를 비롯한 서지 유틸리티 기관과 상용 편목 시스템 벤더들은 기구축 MARC 데이터베이스를 자동적으로 FRBRize하기 위한 알고리즘을 개발하고, 동일 저작에서 파생된 연관 저록을 브라우징하기 위한 인터페이스 개발에 박차를 가하고 있다. 그러나 그에 비하여 국내에서 진행되고 있는 FRBR 연구는 개념 모형의 고찰 수준에만 머물고 있을 뿐이어서, 세계적 흐름을 주목하고 능동적으로 대응하기 위한 다각도의 노력이 요구되는 상황이다. 본 연구는 FRBR의 선진 응용 사례를 심층 분석하고 국내 기구축된 KORMARC 데이터베이스에 적용하기 위한 방안을 제시하였다.

유시티 콘텐츠를 위한 시공간 온톨로지 구축 방법 (How to Construct Spatio-Temporal Ontologies for U-City Contents)

  • 나방현;권창희;박래훈;윤형국
    • 한국산학기술학회논문지
    • /
    • 제11권7호
    • /
    • pp.2632-2637
    • /
    • 2010
  • 유비쿼터스 환경에서 획득되는 정보들은 시공간의 틀 속에서 서로 만나 관계성을 가지게 됨으로써 지식화되고, 업무 또는 어플리케이션 모델과 결합하여 지능화된 콘텐츠로 변화하게 된다. 따라서, 유시티 콘텐츠를 구성하는 개체들은 복잡한 관계들을 가진다. 유시티 콘텐츠는 사용자의 의도를 파악하여 개인화된 응답을 제공하는 지능성을 갖추어야 한다. 본 연구에서는 SPIRIT의 공간 온톨로지 설계 방법을 확장하여 사람 또는 사물에 대하여도 유형, 관계, 인스턴스의 세 가지 온톨로지로 구성하였다. 공유된 개념의 관계 모델이 없는 경우의 인스턴스들 간의 관계는 어떤 시공간적 사건을 통한 관계로 설정하였다. 이렇게 함으로써 문자열 매칭에 의한 연관어에 비하여, 반드시 의미적 관련성을 갖는 연관어들을 추천할 수 있게 하였다.

변경관리에서 ANP기법을 이용한 컴포넌트 선택 결정 방법 (Component Selection Decision Method Using ANP Technique in Change Management)

  • 김경훈;송영재
    • 한국콘텐츠학회논문지
    • /
    • 제12권1호
    • /
    • pp.59-67
    • /
    • 2012
  • 소프트웨어 변경관리는 시스템의 변경된 내용을 프로그램이나 설명문서와 같은 특정 개체의 특성 변경에 초점을 둔 것이다. 변경관리 시 요구사항간의 상호종속적인 관계를 가지고 최적의 상태를 위하여 복잡한 의사결정을 필요로 한다. 본 논문은 소프트웨어 변경관리를 분산환경에서 컴포넌트들간에 시간과 상황에 따른 변화를 관리하는 모델을 설계 한다. 그리고 각 컴포넌트들간의 관계성들에 대한 정의를 하고 ANP 기법을 이용하여 분산환경에서의 각 컴포넌트가 변화되어 참조되는 상호 의존성을 고려하여 종속관계와 피드백을 이용하여 최적의 대안을 선택할 수 있다. 즉, 서로간의 관계된 의존도를 분석하여 3가지 형태의 변경관계를 나타내도록 하였다. 또한 의존도 분석을 통해 이러한 접근 방법의 유효성을 검증하였다.

NoSQL 기반의 SNS 데이터베이스 설계 (NoSQL-based SNS Data Model Design)

  • 장성호;김수희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.957-959
    • /
    • 2013
  • SNS(Social Networking Service)는 사용자 간의 자유로운 의사소통과 정보 공유, 그리고 인맥 확대 등을 통해 사회적 관계를 생성하고 강화시켜주는 온라인 플랫폼을 의미한다. 이 연구에서는 SNS에서 주요 개체들을 발견하고 그들간의 관계를 도출하고, 이들을 기반으로 ERD를 그린다. 작성한 ERD를 NoSQL 데이터베이스인 MongoDB 데이터 모델의 컬렉션들로 변환함으로써, SNS 데이터베이스의 주요 스키마를 설계한다.

  • PDF

링크드 데이터 환경에서의 서지기술형식 BIBFRAME과 그 활용에 대한 고찰 (Deployment of BIBFRAME as a New Bibliographic Framework in Linked Data)

  • 박옥남;오정선
    • 한국비블리아학회지
    • /
    • 제25권4호
    • /
    • pp.235-263
    • /
    • 2014
  • 미국국회도서관에서 서지레코드의 웹 접근성을 확보하고 웹 환경으로의 통합을 목적으로 새로운 서지기술형식인 BIBFRAME을 제시하였다. 본 연구는 BIBFRAME 모델 및 경과를 소개하고, BIBFRAME 클래스와 속성어휘를 살펴보고, MARC21과 BIBFRAME 어휘간 매핑, MARC 목록레코드의 BIBFRAME 전환사례를 제시함으로써 BIBFRAME 활용방안에 대한 이해를 높이고자 하였다. BIBFRAME은 서지개체를 저작-인스턴스 관계로 구분하고 데이터의 시맨틱을 이해할 수 있는 RDF/XML과 식별자를 사용하며, 주석 개체를 제시하여 이용자 및 외부 기관에서 생산한 정보를 서지데이터상에 제시하고 있다. 이를 통해 서지데이터의 링크드 데이터로의 활용가능성을 제시하고 이용자의 정보탐색가능성을 향상할 수 있다는 점에서 그 의의가 있다. 그럼에도 불구하고 콘텐트 모델에 상관없는 적용 및 다양한 자료유형의 수용을 보완하기 위한 계속적인 테스트가 요구되며 복잡한 구조의 사용성을 높이기 위한 BIBFRAME 모델 및 어휘 수정 그리고 가이드라인 구축이 요구된다.