• Title/Summary/Keyword: 속성식별

Search Result 155, Processing Time 0.028 seconds

Classification of emotion data using rough set on fuzzy inference (퍼지추론에서 러프집합을 이용한 감성 데이터의 분류)

  • 손창식;정환묵
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2004.10a
    • /
    • pp.145-148
    • /
    • 2004
  • 규칙 기반 추론 시스템에서 규칙의 속성 감축은 다양한 방법으로 제안되어 왔다. 규칙의 속성 감축은 퍼지 추론 시스템을 구현하는데 있어서 처리 시간을 단축시킬 수 있으나 규칙의 종속성 및 상관성을 고려하지 않을 경우 예상하지 못한 추론 결과를 얻을 수 있다. 따라서, 본 논문에서는 복합속성을 가진 규칙의 속성 감축과 상관성을 고려하기 위하여 러프집합의 특성 중 식별가능 행렬과 식별가능 함수를 이용하였다. 그리고 속성 감축에 사용된 규칙은 복합속성(composite attribute)을 가지는 감성 데이터를 이용하였다.

  • PDF

Detecting Tables in HTML Documents (HTML 문서의 테이블 식별)

  • 김연석;이경호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.163-165
    • /
    • 2004
  • HTML의 <TABLE> 태그는 연관된 정보를 기술하기 위한 테이블은 물론이고 웹 문서의 레이아웃을 표현하기 위하여 사용된다 본 논문에서는 웹으로부터 유용한 정보를 추출하기 위한 목적의 일환으로 HTML 문서로부터 테이블을 식별하는 효율적인 방법을 제안한다. 제안된 방법은 전처리와 속성-값 연관관계에 추출의 두 단계로 구성된다. 전처리 단계에서는 진짜 테이블 또는 레이아웃용으로 사용된 <TABLE> 태그의 일반적인 특징을 반영한 규칙을 적용하여 진짜 또는 가짜로 명확히 식별이 가능한 <TABLE> 태그를 추출한다. 속성-값 연관관계 추출 단계에서는 테이블 영역을 속성 및 값 영역으로 구분한 후. 값 영역에 대하여 구문적 일관성 검사를 수행한다 또한 값 영역의 크기가 작아서 구문적 일관성 검사를 수행할 수 없는 경우, 속성-칸 영역의 의미적 일관성을 검사한다. 제안된 방법의 성능을 명가하기 위하여 1,393개의 HTML 문서로부터 추출한 11,477개의 <TABLE> 태그를 대상으로 실험한 결과. 평균적으로 97.54%의 정확률과 99.22%의 재현률을 보여 기존 연구보다 우수하였다.

  • PDF

A Study on Building Identification from the Three-dimensional Point Cloud by using Monte Carlo Integration Method (몬테카를로 적분을 통한 3차원 점군의 건물 식별기법 연구)

  • YI, Chaeyeon;AN, Seung-Man
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.23 no.4
    • /
    • pp.16-41
    • /
    • 2020
  • Geospatial input setting to represent the reality of spatial distribution or quantitative property within model has become a major interest in earth system simulation. Many studies showed the variation of grid resolution could lead to drastic changes of spatial model results because of insufficient surface property estimations. Hence, in this paper, the authors proposed Monte Carlo Integration (MCI) to apply spatial probability (SP) in a spatial-sampling framework using a three-dimensional point cloud (3DPC) to keep the optimized spatial distribution and area/volume property of buildings in urban area. Three different decision rule based building identification results were compared : SP threshold, cell size, and 3DPC density. Results shows the identified building area property tend to increase according to the spatial sampling grid area enlargement. Hence, areal building property manipulation in the sampling frameworks by using decision rules is strongly recommended to increase reliability of geospatial modeling and analysis results. Proposed method will support the modeling needs to keep quantitative building properties in both finer and coarser grids.

An Efficient Algorithm for Detecting Tables in HTML Documents (HTML 문서의 테이블 식별을 위한 효율적인 알고리즘)

  • Kim Yeon-Seok;Lee Kyong-Ho
    • Journal of Korea Multimedia Society
    • /
    • v.7 no.10
    • /
    • pp.1339-1353
    • /
    • 2004
  • < TABLE > tags in HTML documents are widely used for formatting layout of Web documents as well as for describing genuine tables with relational information. As a prerequisite for information extraction from the Web, this paper presents an efficient method for sophisticated table detection. The proposed method consists of two phases: preprocessing and attribute-value relations extraction. For the preprocessing where genuine or ungenuine tables are filtered out, appropriate rules are devised based on a careful examination of general characteristics of < TABLE > tags. The remaining is detected at the attribute-value relations extraction phase. Specifically, a value area is extracted and checked out whether there is a syntactic coherency Futhermore, the method looks for a semantic coherency between an attribute area and a value area of a table that may be inappropriate for the syntactic coherency checkup. Experimental results with 11,477 < TABLE > tags from 1,393 HTML documents show at the method has performed better compared with previous works, resulting in a precision of 97.54% and a recall of 99.22% in average.

  • PDF

A Study on Security Attribute Design in Security Plan of The Design Phase (설계단계의 보안 방안에서 보안 속성 설계에 대한 연구)

  • Shin, Seong-Yoon
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.19 no.5
    • /
    • pp.1125-1130
    • /
    • 2015
  • In this paper, a method to identify components per unit task system is expressed with node, module, and interface. We define security subject per unit task system and explain node, module, and interface per component. According to the defined security standard in design phase, we also perform to design and elaborate security attributes for node and module as identified security subjects in their defined tables. And then we describe the composition standard for security attribute design with some examples, after classifying it into security subject, access subject, access control area, identification or verification area, and encryption.

The Development of Prefix/Suffix Code of DOI Syntax (DOI 구문 식별 코드 개발)

  • 김세정;안계성
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2000.08a
    • /
    • pp.63-66
    • /
    • 2000
  • 본 연구는 인터넷상에서 제공되는 지적콘텐츠에 대한 영속적이고 고유한 식별 체계인 DOI 상용 서비스의 일환으로 DOI 구문을 구성하고 있는 Prefix와 Suffix 식별코드를 개발하였다. 이를 위해서 현재 인터넷상에서 지적콘텐츠를 유통시키고 있는 기관들을 조사 분류하여 콘텐츠 보유기관 식별코드를 개발하였다. 또한 지적콘텐츠의 속성 및 유형 분석을 토대로 Suffix 코드의 구조 및 식별코드를 개발하였으며 관련 콘텐츠간의 연계를 위한 저작권 식별기호를 고려하였다.

  • PDF

Author Entity Identification using Representative Properties in Linked Data (대표 속성을 이용한 저자 개체 식별)

  • Kim, Tae-Hong;Jung, Han-Min;Sung, Won-Kyung;Kim, Pyung
    • The Journal of the Korea Contents Association
    • /
    • v.12 no.1
    • /
    • pp.17-29
    • /
    • 2012
  • In recent years, Linked Data that is published under an open license shows increased growth rate and comes into the spotlight due to its interoperability and openness especially in government of developed countries. However there are relatively few out-links compared with its entire number of links and most of links refer a few hub dataset. These occur because of absence of technology that identifies entities in Linked data. In this paper, we present an improved author entity resolution method that using representative properties. To solve problems of previous methods that utilizes relation with other entities(owl:sameAs, owl:differentFrom and so on) or depends on Curation, we design and evaluate an automated realtime resolution process based on multi-ontologies that respects entity's type and its logical characteristics so as to verify entities consistency. The evaluation of author entity resolution shows positive results (The average of K measuring result is 0.8533.) with 29 author information that has obtained confirmation.

A Study on the Processing of Imprecision Data by Rough Sets (러프집합에 의한 불완전 데이터의 처리에 관한 연구)

  • 정구범;김두완;정환묵
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1998.03a
    • /
    • pp.11-15
    • /
    • 1998
  • 일반적으로 러프집합은 지식베이스 시스템에서 근사공간을 이용한 불확실한 데이터의 분류, 추론 및 의사결정 등에 사용된다. 지식베이스 시스템의 데이터 중에서 연속적인 구간 특성을 갖는 정량적 속성값이 불연속적일 때 중복 또는 불일치 등의 불확실성이 발생된다. 본 논문은 러프집합의 정량적 속성값들의 정성적 속성으로 변환시킬 때 식별 불가능 영역에 있는 정량적 속성값들을 명확한 경계를 갖는 보조구간으로 분리하여 불확실성을 제거함으로써 러프집합의 분류능력을 향상시키는 방법을 제안한다.

  • PDF

A Study on Considerations in the Authority Control to Accommodate LRM Nomen (LRM 노멘을 수용하기 위한 전거제어시 고려사항에 관한 연구)

  • Lee, Mihwa
    • Journal of Korean Library and Information Science Society
    • /
    • v.52 no.1
    • /
    • pp.109-128
    • /
    • 2021
  • This paper is to explore considerations in authority control to accommodate LRM nomen entities through the literature reviews, the analysis of RDA rules, and the opinion survey of domestic catalog experts. As a result, for authority control, considerations were proposed in the aspect of nomen's attribute elements, catalog description, and MARC authority format. First, it is necessary to describe in as much detail as possible the category, the scheme, intended audience, the context of use, the reference source, the language, the script, the script conversion as the attributes of the nomen with the status of identification, note, and indifferentiated name indicators added in RDA. Second, the description method of attribute elements and relational elements of nomen can be unstructured, structured, identifier, and IRI as suggested in RDA, and vocabulary encoding scheme (VES) and string encoding scheme (SES) should be written for structured description, Also, cataloging rules for structuring authorized access points and preferred names/title should be established. Third, an additional expansion plan based on Maxwell's expansion (draft) was proposed in order to prepare the MARC 21 authority format to reflect the LRM nomen. (1) The attribute must be described in 4XX and 5XX so that the attribute can be entered for each nomen, and the attributes of the nomen to be described in 1XX, 5XX and 4XX are presented separately. (2) In order to describe the nomen category, language, script, script conversion, context of use, and date of usage as a nomen attribute, field and subfield in MARC 21 must be added. Accordingly, it was proposed to expand the subfield of 368, 381, and 377, and to add fields to describe the context of use and date of usage. The considerations in authority control for the LRM nomen proposed in this paper will be the basis for establishing an authority control plan that reflects LRM in Korea.

Optimal Object Selection of Integrated Binding Service for Distributed Objects in Wide Area Computing Environments (광역 컴퓨팅 환경에서 분산 객체의 통합 바인딩 서비스의 최적 객체 선정)

  • Jun, Byung-Taek;Jeong, Chang-Won;Joo, Su-Chong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1499-1502
    • /
    • 2002
  • 최근 분산 컴퓨팅 환경은 인터넷 기반으로 규모가 확장됨에 따라 광역 컴퓨팅 환경으로 변화되고 있다. 이러한 환경에서 클라이언트가 원하는 객체나 자원들의 투명성을 제공하는 메커니즘은 필수적이다. 그러나 기준의 네이밍 또는 트레이딩 서비스가 다루는 객체에 대한 식별자는 이름 대 주소 그리고 속성 대 주소의 한쌍으로 이루어져 위치에 따라 객체나 자원에 대한 식별자를 변경해야 하는 문제점을 갖는다. 특히, 이동 객체와 중복객체에 대한 위치 서비스는 더더욱 제공하기 어렵다. 이러한 문제점을 해결하기 위해 식별자를 이름/속성에 따르는 객체 핸들 그리고 컨택 주소로 나누고 각각 독립적인 서비스로 관리하는 통합 바인딩 서비스를 제안하였다. 본 논문에서는 통합 바인딩 서비스에서 위치서비스가 관리하는 컨택 레코드 상에 컨택 주소가 여러 개가 등록이 되어 있을 경우, 중복된 객체를 의미한다. 이러한 중복된 객체들 중에 이들이 존재하는 서버의 부하정보를 이용하여 하나의 컨택 주소를 선택하는 과정을 보였다.

  • PDF