• 제목/요약/키워드: Classification Database

검색결과 937건 처리시간 0.031초

Privacy Disclosure and Preservation in Learning with Multi-Relational Databases

  • Guo, Hongyu;Viktor, Herna L.;Paquet, Eric
    • Journal of Computing Science and Engineering
    • /
    • 제5권3호
    • /
    • pp.183-196
    • /
    • 2011
  • There has recently been a surge of interest in relational database mining that aims to discover useful patterns across multiple interlinked database relations. It is crucial for a learning algorithm to explore the multiple inter-connected relations so that important attributes are not excluded when mining such relational repositories. However, from a data privacy perspective, it becomes difficult to identify all possible relationships between attributes from the different relations, considering a complex database schema. That is, seemingly harmless attributes may be linked to confidential information, leading to data leaks when building a model. Thus, we are at risk of disclosing unwanted knowledge when publishing the results of a data mining exercise. For instance, consider a financial database classification task to determine whether a loan is considered high risk. Suppose that we are aware that the database contains another confidential attribute, such as income level, that should not be divulged. One may thus choose to eliminate, or distort, the income level from the database to prevent potential privacy leakage. However, even after distortion, a learning model against the modified database may accurately determine the income level values. It follows that the database is still unsafe and may be compromised. This paper demonstrates this potential for privacy leakage in multi-relational classification and illustrates how such potential leaks may be detected. We propose a method to generate a ranked list of subschemas that maintains the predictive performance on the class attribute, while limiting the disclosure risk, and predictive accuracy, of confidential attributes. We illustrate and demonstrate the effectiveness of our method against a financial database and an insurance database.

퍼지-뉴럴 네트워크를 이용한 심전도 패턴 분류시스템 설계 (Design of ECG Pattern Classification System Using Fuzzy-Neural Network)

  • 김민수;이승로;서희돈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(5)
    • /
    • pp.273-276
    • /
    • 2002
  • This paper has design of ECG pattern classification system using decision of fuzzy IF-THEN rules and neural network. each fuzzy IF-THEN rule in our classification system has antecedent lingustic values and a single consequent class. we use a fuzzy reasoning method based on a single winner rule in the classification phase. this paper in, the MIT/BIH arrhythmia database for the source of input signal is used in order to evaluate the performance of the proposed system. From the simulation results, we can effectively pattern classification by application of learned from neural networks.

  • PDF

Conceptual Data Modeling on the KRR-1&2 Decommissioning Database

  • Park, Hee-Seoung;Park, Seung-Kook;Lee, Kune-Woo;Park, Jin-Ho
    • Nuclear Engineering and Technology
    • /
    • 제34권6호
    • /
    • pp.610-618
    • /
    • 2002
  • A study of the conceptual data modeling to realize the decommissioning database on the HRR-1&2 was carried out. In this study, the current state of the abroad decommissioning database was investigated to make a reference of the database. A scope of the construction of decommissioning database has been set up based on user requirements. Then, a theory of the database construction was established and a scheme on the decommissioning information was classified . The facility information, work information, radioactive waste information, and radiological information dealing with the decommissioning database were extracted through interviews with an expert group and also decided upon the system configuration of the decommissioning database. A code which is composed of 17 bit was produced considering the construction, scheme and information. The results of the conceptual data modeling and the classification scheme will be used as basic data to create a prototype design of the decommissioning database.

최적 클러스터 분석 모델을 이용한 분류시스템의 데이터베이스 구축 (The database construction of a classification system using an optimal cluster analysis model)

  • 이현숙
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.1045-1050
    • /
    • 1998
  • 데이타의 분류기법은 공장자동화나 로보틱스 분야에서 사용되는 지능시스템의 중요한 기능이다. 일반적으로 이러한 분류시스템을 설계하고자 할때, 준비된 데이타는 레이블링 되어야 하고, 분류하고자하는 클래스의 수도 설정되어야한다. 본 연구에서는 이러한 사전 정보없이 분류 시스템을 설계하고자 최적 클러스터 분석 모델, OFCAM을 제안한다. 이때 사용되는 최적 클러스터 분석 모델은 데이타의 구조에 대한 사전정보 없이, 주어진 데이타의 최적 클러스터의 수와 클러스터 중심점 및 각 데이타에 대한 소속정보를 구해준다. 이를 위하여 OFCAM에서는 목적합수를 가지는 비교사 학습신경망과 클러스터 타당성 전략을 결합하고 있다. OFCAM의 결과를 바탕으로 분류시스템의 데이터베이스, PCSDB가 구축되며 이는 결정 모듈에서 쉽게 활용될 수 있음을 보인다. 이와같은 방법은 하나의 데이타베이스 안에서 필요한 테이블만을 첨가하므로 독립적으로 여러 응용의 분류문제를 다룰 수 있다.

  • PDF

공정관리 과학화를 위한 지하철공사 NAS운영체계 데이터베이스 모델링 구축 (Database Model of Subway Construction NAS Operating System for Scheduling Management Science)

  • Choi, Jaejin;Cho, Byounghoo;Park, Hongtae
    • 한국재난정보학회 논문집
    • /
    • 제13권3호
    • /
    • pp.322-331
    • /
    • 2017
  • 본 연구는 한국건설기술연구원(KICT)에서 제시한 토목공사용 정보분류체계(Information Classification System)를 기반으로 지하철공사의 정보분류체계를 제시하였다. 그리고 이 기준을 근거로 NAS(Network Analysis System) 운영체계인 공사정보분류체계 - 공정도표 - 작업별 투입 자원을 연동하는 데이터 모델링을 구축하여 통합 모형을 제시하였다. 따라서 본 연구에서 제시한 데이터 모델링의 통합모형은 다른 토목시설물공사에서도 동일한 절차와 방법으로 적용할 수 있어, NAS를 기반으로 한 공정관리 과학화를 유도할 수 있을 것으로 확신한다.

민화 DB를 위한 분류체계 설계 (Designing a Classification System for Minhwa DB)

  • 최은진;이영숙
    • 한국멀티미디어학회논문지
    • /
    • 제25권1호
    • /
    • pp.135-143
    • /
    • 2022
  • In order to convert Korean folk paintings called Minhwa, a part of traditional Korean heritage, into DBs, it is necessary to design a classification system suitable for the characteristics of folk paintings. A classification system and the generating of unique codes are required to classify and save them. To realize this, a basic classification system was created by listing objects depicted in folk paintings, and keywords were extracted by reclassifying them for each object. In order to assign a unique code to each piece, we organize the English names of each Minhwa since the English names of the folk painting contain the names of objects. The code name is extracted by applying the order of nouns and consonant priority rules in English names and attaching five Arabic numerals. These codes are later assigned to each image file stored in the database and are input together with the keyword. The Minhwa DB constructed in this way enables storage and search centered on objects and keywords and the intuitive inferring of the type of object from the code name.

신문광고영상 데이터베이스구축을 위한 유사영상 분류 시스템 (Development System of Mimicking Image Classification for Newspaper Advertisements Database Construction)

  • 김기현;김광태;박현우;이동훈;윤태수
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.766-771
    • /
    • 2008
  • 본 논문에서는 광고영상에서 동일한 광고의 다수 매체(신문, 잡지)에 실리는 판형을 효율적으로 관리하는 데이터베이스 시스템을 구축하기 위한 유사광고를 분류하는 시스템을 제안한다. 현재, 신문광고를 데이터베이스화하는 작업은 사람이 직접 매체를 하나씩 스캐너를 이용하여 영상데이터를 획득한 후 포토샵이나 그림판과 같은 이미지 편집 툴을 이용하여 광고영역을 잘라내고 저장하고, 각 광고에 따른 날짜정보, 매체정보, 페이지정보, 광고가 실린 면의 종류, 크기정보 등을 일일이 기록, 저장하기 때문에 비능률적이고 비효율적인 업무형태로 많은 시간과 인력의 낭비를 초래하고 있다. 이러한 문제를 해결하기 위하여 디지털 카메라를 이용하여 신문영상을 획득하고, 영상 전처리 과정을 통하여 광고후보영역을 추출하며, 신문매체광고가 가지는 특성에 따라 광고후보영역을 분류한다. 따라서 본 시스템은 모든 광고영상의 유사성을 비교하여 신규광고인지, 기존의 광고인지를 분류하여 데이터베이스화 한다.

  • PDF

선박 항해통신장비 원격유지보수를 위한 데이터베이스 설계 (A Database Design for Remote Maintenance of Navigation and Communication Equipments in a Vessel)

  • 김주영;옥경석;김주원;조익순
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2052-2060
    • /
    • 2017
  • SOLAS 선박은 SFI group 코드 기준으로 적어도 83종의 장비를 탑재해야 하고, 각각의 장비는 다시 수 개에서 수십 개의 컴포넌트로 구성이 된다. 선박 운항 중에는 이러한 장비의 정상적인 운영이 보장되어야 하고, 문제 발생시 즉각적인 수리를 위하여 원격유지보수의 요구사항이 높다. 본 연구는 항해통신장비의 원격유지보수에 적합한 장비의 분류체계를 제시하고, 적절한 데이터베이스 구조를 도출하고자 했다. 연구 결과, 선박 항해통신장비의 원격유지보수를 위하여, 장비의 분류체계는 장비의 종류, 모델, 컴포넌트로 계층화되어야 하고, 고장모드와 영향분석, 질의응답, 수리이력, 상태정보와 예방정비 등의 테이블을 장비 모델 기준으로 구축하는 것이 효과적임을 알게 되었다. 140개의 항해통신장비 모델과 750개의 컴포넌트에 대하여 데이터베이스를 구축하였고, 실질적인 효과를 평가하기 위하여 선박장비 수리전문가가 클라우드 앱을 이용하여 검색 결과의 유용성을 평가하였다.

지반굴착 흙막이 구조물 설계 및 시공시 중요문제점 분석 (The Analysis of the Important Problems on Designing and Constructing Earth Retaining Structures)

  • 이송;김주현
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제6권2호
    • /
    • pp.167-174
    • /
    • 2002
  • 흙막이 구조물은 한정된 부지의 효율적인 활용 차원에서 고층건물, 개착식 지하철, 지하상가 등의 건설을 위해 시공되는 가설구조물이다. 최근 들어, 교량, 터널, 도로 등의 설계와 시공에 관련된 표준화 작업과 DB화 작업이 활발히 이루어지고 있다. 이러한 구조물의 설계와 시공에 관련된 각종 통계 자료가 축적되고 여러 문제점들이 분석되어 실제 설계 시공에 많이 반영되고 있다. 그러나, 건설현장에서 많이 설계 시공이 되는 흙막이 구조물과 관련해서는 DB화 작업이 전무할 뿐만 아니라 이를 통한 활용이 이루어지지 않고 있다. 따라서, 본 논문은 흙막이 구조물에 관련된 100개 현장의 설계와 시공에 대한 지적사항들을 분류하였으며, 이 자료를 기초로 하여, 분류체계를 구성하였으며, 흙막이 구조물의 설계와 시공에 관련된 중요 고려사항을 DB 프로그램으로 개발하였다.

CANCER CLASSIFICATION AND PREDICTION USING MULTIVARIATE ANALYSIS

  • Shon, Ho-Sun;Lee, Heon-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.706-709
    • /
    • 2006
  • Cancer is one of the major causes of death; however, the survival rate can be increased if discovered at an early stage for timely treatment. According to the statistics of the World Health Organization of 2002, breast cancer was the most prevalent cancer for all cancers occurring in women worldwide, and it account for 16.8% of entire cancers inflicting Korean women today. In order to classify the type of breast cancer whether it is benign or malignant, this study was conducted with the use of the discriminant analysis and the decision tree of data mining with the breast cancer data disclosed on the web. The discriminant analysis is a statistical method to seek certain discriminant criteria and discriminant function to separate the population groups on the basis of observation values obtained from two or more population groups, and use the values obtained to allow the existing observation value to the population group thereto. The decision tree analyzes the record of data collected in the part to show it with the pattern existing in between them, namely, the combination of attribute for the characteristics of each class and make the classification model tree. Through this type of analysis, it may obtain the systematic information on the factors that cause the breast cancer in advance and prevent the risk of recurrence after the surgery.

  • PDF