• 제목/요약/키워드: Relational attribute

검색결과 54건 처리시간 0.03초

관계형 데이터베이스에서 효과적 데이터 마이닝 정보 추출을 위한 관계 연산자의 정의 (Definition of Relational Operators for Effective Extracting Data Mining Information from Relational Relational Database)

  • 송지영
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권2호
    • /
    • pp.123-130
    • /
    • 2001
  • 데이터베이스의 크기가 증대함에 따라, 데이터의 분석 및 데이터베이스로부터의 지식 습득필요성이 대두되고 있다. 데이터 마이닝 기법은 그 대표적인 예이다. 대부분의 마이닝 대상 데이터 집합은 규모가 매우 크고, 데이터베이스 내에 저장되어 있다. 효과적인 마이닝 기능을 구현하기 위해서는 기존의 데이터베이스로부터 분석 대상 데이터 집합을 추출하고, 일반화시켜 함께 유지 관리함이 요구된다. 본 논문에서는 새로운 미이닝 연산자를 정의함으로써 기존 SQL 언어를 확장하여 릴레이션으로부터 분석 대상 데이터를 도메인 중심 방법으로 추출 후 일반화시킨다. 분석 대상 애트리뷰트 값과 일반화된 정보를 포함하는 배경지식은 관계형 데이터베이스의 릴레이션과 동일한 구조로 저장 및 관리된다. 또한 본 논문에서 제안된 배경지식 추출을 수행하는 SQL 유사 연산자와 집단 함수를 예제를 통하여 그 사용 예를 보임으로써, 마이닝 표현력을 나타낸다.

  • PDF

지적정보데이터베이스의 효율적 구축과 활용에 관한 연구 (A Study on the Effective Construction and Use of Cadastral Information Database)

  • 강준묵;이형석
    • 대한공간정보학회지
    • /
    • 제8권2호
    • /
    • pp.71-78
    • /
    • 2000
  • 현재 지적도 전산화에 기록된 속성자료는 도형자료와의 연계를 고려하여 작성된 것이 아니고 형식면에서 자료가 기재된 상태로 사용되고 있다 따라서 다양한 공간정보의 분석과 종합도형정보의 기초 자료로 활용하기 위해서는 속성자료와 지적도가 연계되어 수치정보화가 이루어져야 한다. 본 연구는 도해지적도와의 관련 사항들을 기준으로 도형 및 속성정보를 연계하여 지적정보를 효율적으로 구축하여 활용하고자 하였다. 속성정보는 데이터 모델링을 이용하여 개체-관계 다이어그램으로 표현하므로써 관계형 데이터베이스의 형태로 구축하였다. 그리고 다양한 공간분석 및 응용방법을 제시함으로써 지적정보를 효율적으로 관리하고 지적도면의 전산화 방안을 비롯하여 각종 공공계획을 수립, 설계하는데 기초자료로 제시하고자 한다.

  • PDF

GIS와 데이터베이스를 이용한 가로수정보 관리프로그램 구축 (Construction of Street Trees Information Management Program Using GIS and Database)

  • 김희년;정성관;박경훈;유주한
    • Current Research on Agriculture and Life Sciences
    • /
    • 제26권
    • /
    • pp.45-54
    • /
    • 2008
  • The purpose of this research is to develope street trees management program for more an effective street trees management. The principal point of this program is to relate spatial data and attribute data that is the main concept in GIS(Geographic Information System). To do this function, MapObjects which is ESRI's mapping and GIS components was used to process spatial data and Access which had been developed by MS was used to manipulate attribute data in this program. Visual Basic also was used to design and develop user interfaces and procedures, relate two sort of data, and lastly complete Application. Relational data model was adopted to design tables and their relation, Antenucci's GIS development model was selected to design and complete this program. The configuration of this application is composed of management data and reference data. The management data includes the location of street tree, a growth condition, a surrounding environment, the characters of tree, an equipments, a management records and etc. The reference data include general information about tree, blight and insects.

  • PDF

XML 문서의 관계 데이터베이스 저장 (Storing XML Documents in Relational Databases)

  • 신병주;진민;정민수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.55-58
    • /
    • 2001
  • XML 문서의 저장 및 관리 방법으로 관계형 데이터베이스가 많이 사용되고 있다. 그러나 XML과 관계 데이터베이스의 구조상의 불일치로 인해 데이터 손실, 질의처리의 효율성 저하 등과 같은 문제가 발생한다. element의 순환, 다중값을 갖는 attribute들의 처리 등을 위한 별도의 처리방법이 필요하다. 따라서, 본 논문은 효율적인 저장, 관리 및 질의 처리를 고려하여 DTD 기반의 XML 문서를 관계 데이터 베이스에 저장하는 방법을 제시한다.

  • PDF

패싯(Facet)을 이용한 과학기술분야 시소러스 구축과 활용방안 (Building Thesaurus for Science & Technology Domain Using Facets and Its Application to Inference Services)

  • 황순희;정한민;성원경
    • 정보관리연구
    • /
    • 제37권3호
    • /
    • pp.61-84
    • /
    • 2006
  • 본 논문은 시소러스 구축 시 직면하는 문제점과 구축방법을 비판적으로 검토하고, 여러 가지 구축 방법 중 직접구축 방법을 제안하였다. 또한, 확장검색의 효율성을 보장할 수 있는 시소러스 구축을 위해 의미적 준거인 개념패싯, 관계패싯 등의 도입과 활용을 도입하였으며, 이를 이용하여 구축한 과학기술분야 시소러스의 구축사례를 제시하였다. 특별히, 패싯이 반영된 시소러스에는 다양한 관점이 반영될 수 있으므로 검색의 효율성이 보장된다는 장점이 있고, 인접 과학기술분야에 응용될 수 있다. 일례로 본 시소러스는 과학기술 연구자들의 협업을 지원하기 위한 정보유통 서비스에 응용될 수 있으며, 향후 고도화된 지식 서비스에도 확장 응용될 수 있다.

A Data Mining Approach for Selecting Bitmap Join Indices

  • Bellatreche, Ladjel;Missaoui, Rokia;Necir, Hamid;Drias, Habiba
    • Journal of Computing Science and Engineering
    • /
    • 제1권2호
    • /
    • pp.177-194
    • /
    • 2007
  • Index selection is one of the most important decisions to take in the physical design of relational data warehouses. Indices reduce significantly the cost of processing complex OLAP queries, but require storage cost and induce maintenance overhead. Two main types of indices are available: mono-attribute indices (e.g., B-tree, bitmap, hash, etc.) and multi-attribute indices (join indices, bitmap join indices). To optimize star join queries characterized by joins between a large fact table and multiple dimension tables and selections on dimension tables, bitmap join indices are well adapted. They require less storage cost due to their binary representation. However, selecting these indices is a difficult task due to the exponential number of candidate attributes to be indexed. Most of approaches for index selection follow two main steps: (1) pruning the search space (i.e., reducing the number of candidate attributes) and (2) selecting indices using the pruned search space. In this paper, we first propose a data mining driven approach to prune the search space of bitmap join index selection problem. As opposed to an existing our technique that only uses frequency of attributes in queries as a pruning metric, our technique uses not only frequencies, but also other parameters such as the size of dimension tables involved in the indexing process, size of each dimension tuple, and page size on disk. We then define a greedy algorithm to select bitmap join indices that minimize processing cost and verify storage constraint. Finally, in order to evaluate the efficiency of our approach, we compare it with some existing techniques.

HTML 문서의 테이블 식별을 위한 효율적인 알고리즘 (An Efficient Algorithm for Detecting Tables in HTML Documents)

  • 김연석;이경호
    • 한국멀티미디어학회논문지
    • /
    • 제7권10호
    • /
    • pp.1339-1353
    • /
    • 2004
  • HTML의 table 태그는 연관된 정보를 기술하기 위한 테이블은 물론이고 웹 문서의 레이아웃을 표현하기 위하여 사용된다. 본 논문에서 는 웹으로부터 유용한 정보를 추출하기 위한 목적의 일환으로 HTML 문서로부터 테이블을 식별하는 효율적인 방법을 제안한다. 제안된 방법은 전처리와 속성-값 연관관계 추출의 두 단계로 구성된다. 전처리 단계에서는 진짜 테이블 또는 레이아웃용으로 사용된 table 태그의 일반적인 특징을 반영한 규칙을 적용하여 진짜 또는 가짜로 명확히 식별이 가능한 table태그를 추출한다. 속성-값 연관관계 추출 단계에서는 테이블 영역을 속성 및 값 영역으로 구분한 후, 값 영역에 대하여 구문적 일관성 검사를 수행한다. 또한 값 영역의 크기가 작아서 구문적 일관성 검사를 수행할 수 없는 경우, 속성-값 영역의 의미적 일관성을 검사한다. 제안된 방법의 성능을 평가하기 위하여 1,393개의 HTML문서로부터 추출한 11,477개의 table 태그를 대상으로 실험한 결과, 평균적으로 97.54%의 정확률과 99.22%의 재현률을 보여 기존 연구보다 우수하였다.

  • PDF

관계형 데이타모델을 이용한 선체구조의 표현에 관한 연구 (A Study on the Relational Data Model for the Representation of Ship Structure)

  • 김용대;이규열;서승완;류호율;홍창호
    • 대한조선학회논문집
    • /
    • 제28권2호
    • /
    • pp.12-20
    • /
    • 1991
  • 지금까지 선체구조 설계 관련 정보는 주로 도면을 통해서 전해져 왔으나 최신의 컴퓨터 관련 기술인 CAD 시스템이나 DBMS등을 이용하면 설계과정에서의 중복작업을 없앰으로서 설계생산성을 크게 높일 수 있다. 본연구에서는 선체구조 설계 관련 정보를 데이터 베이스관리시스템을 통하여 일관화하기 위해서 선체 중앙부 구조부재들의 배치형상과 속성정보들에 대한 데이터 모델링을 시도하였으며, 그 적용예로서 산적화물선의 중앙부 구조형상을 컴퓨터 그래픽을 이용하여 가시화 하였다. 데이터모델의 구조는 관계형으로 하였으며 선체구조의 접속관계정보를 이용하여 구조부재의 배치형상처리를 용이하게 하였다. 결과로서 나온 데이타 관계형 데이터베이스 관리시스템 'ORACLE'을 통해 저장되고 질의어를 통해 다른 시스템에서 직접 사용될 수 있음을 보였다.

  • PDF

The Effect Factors on the Purchase Intension of Smart Car as of High Innovative Technology and Product; Consumer's Individual Attributes, Perceived Benefit and Switching Cost

  • Ahn, Yeon S.
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권9호
    • /
    • pp.113-119
    • /
    • 2016
  • In this paper, a research model is proved empirically which includes factors related on the purchase intention of smart car as high innovative product in advance of commercialization. As one of relating to consumer's expectation benefit factors, individual attribute factor includes product knowledge, individual innovativeness, and sociality. Consumer's expectation benefit factor includes perceived ease-of-use, usefulness, and enjoyment. As of switching cost variables, there are financial, uncertainty, relational and psychological switching costs factors. Analysis were performed using data from the 257 respondents as random sampling among potential consumers. Purchase intention were affected by individual innovativeness mediated by perceived enjoyment, and individual sociality by perceived ease-of-use and enjoyment also. Relational switching costs factor was only a significant control variable between purchase intention with consumer's expectation benefit factor. This result presents some implications for making the new smart car's detail concept and marketing strategy related to targeting the consumer as high innovative product and technology firms including smart car makers.

Edge-Labeled 그래프 기반의 XML 인스턴스 저장 모델 (A XML Instance Repository Model based on the Edge-Labeled Graph)

  • 김정희;곽호영
    • 인터넷정보학회논문지
    • /
    • 제4권6호
    • /
    • pp.33-42
    • /
    • 2003
  • 본 논문에서는 Edge-Labeled Graph에 기반하여 XML 인스턴스들을 관계형 데이터베이스내에 저장하는 모델을 제안하고 구현한다. 저장 모델은 저장되는 XMI 인스턴스들을 Edge-Labeled Graph에 기반하여 데이터 그래프로 표현하며, 표현한 데이터 그래프상의 정보를 저장하기 위해 데이터베이스 스키마로 제시된 데이터 경로, 요소, 속성, 테이블 인덱스 테이블의 구조에 따라 정의된 값들을 추출하고 Mapper 모듈을 이용하여 저장하며 질의를 지원하기 위해, XPATH를 따르는 질의 언어인 XQL을 SQL로 변환하는 모듈, 또한 저장된 XML 인스턴스를 복원하는 DBtoXML 모듈을 갖도록 하였다. 구현 결과, XML 인스턴스들과 제안한 저장 모델 구조로의 저장 관계가 그래프 기반의 경로를 이용한 표현으로 가능했으며, 동시에, 특정 요소 또는 속성들의 정보들을 쉽게 검색할 수 있는 가능성을 보였다.

  • PDF