• Title/Summary/Keyword: 데이터 정형화

Search Result 253, Processing Time 0.074 seconds

Information Management Model for Strategic Use of Enterprise Resources (기업 자원의 전략적 활용을 위한 정보 관리 모델의 설계와 활용 방안에 관한 연구)

  • 노주연;윤용기;이진하;황이현;임춘성
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2002.05a
    • /
    • pp.42-48
    • /
    • 2002
  • 기존 연구에서 정보화전략계획(Information Strategy Planning)과 계획의 실현을 위한 절차와 산출물, 기법을 정형화하는 정보화전략계획 방법론(Methodology)에 관한 논의가 존재해 왔다. 그런데 이들은 기업 모델 도출을 위한 절차와 산출물 기법의 기술과 정형화에 그칠 뿐 그 하위 구성 요소인 데이터의 관리나 입출력 관계, 업무 지식, 경험에 대한 효과적인 관리에 관한 접근은 부족했던 실정이다. 게다가. 비 정형화된 지식이나 경험, 업무 성과 데이터 등의 정형화와 분류체계에 대한 전략적인 접근은 미비하다. 본 연구에서는 기업 자원을 프로세스. 조직. 환경. 정보시스템의 네 관점으로 분류한 기업 정보 분류 체계를 제시하고 그 구성, 내용, 범위를 살펴본다. 이렇게 분류된 데이터간 연관관계의 정의와 그 타당성 검증을 거쳐, 기업 자원의 전략적 관리를 위한 기업 모형 수립 방안을 제시하게 된다. 본 연구의 정보 관리 모델을 통해, 정형화된 데이터 뿐 아니라 비 정형화된 지식과 경험, 선진 업무 지식, 성과 지표를 효과적으로 활용하여 기업의 전략적 방향을 보여줄 수 있다.

  • PDF

Pattern Formalization Technique for Dynamic Analysis of the Medical Image Data (의료이미지 데이터의 동적 분석을 위한 패턴 정형화 기술)

  • Ko, Kwang-man
    • Journal of Digital Contents Society
    • /
    • v.17 no.3
    • /
    • pp.197-202
    • /
    • 2016
  • This paper suggested that medical image database construction technique that generated and recognized from variable medical device and professional medical experts for the formalization and pattern extraction from informal medical images. And then we transformed informal image characteristics to digital data, and generated the meaningful pattern matching informations. Through this experienced works, so many related researchers can easily access the medical images database and use this formalized image informations on the variable fields.

XDBox : Implementation of XML object repository (XDBox : XML 객체 저장소의 구현)

  • 김종익;최일환;이현숙;김형주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.572-574
    • /
    • 2003
  • XML은 반 구조 데이터(semi-structured data)의 일종으로 데이터들이 정형화된 구조를 가지고 있지 않다는 것이 특징이다. 기존의 데이터베이스 시스템은 고정된 스키마를 통해 데이터를 저장 관리하기 때문에 정형화된 구조를 가지지 않는 XML 문서를 저장하기에는 한계가 있다. 본 논문에서는 정형화된 구조를 가지지 못하는 XML문서를 효과적으로 저장하고 관리할 수 있는 저장장치를 구현하고 구현 사항에 대해 설명한다. 본 논문의 저장 장치는 XML을 DOM트리로 표현한 후 DOM트리의 각 노드를 객체로 만들어 저장한다. 본 논문의 저장 장치는 다중 사용자를 지원하기 위해 클라이언트 서버 구조로 구성되어 있으며 각 객체는 전용 파일, 관계형 시스템의 LDB등 다양한 하부 구조에 저장될 수 있다.

  • PDF

A System for Relation Extraction from Job Postings using Convolutional Neural Network (컨볼루션 신경망을 이용한 구인 광고 데이터 정형화 시스템)

  • Kim, Hyeon-Ji;Seo, In;Lee, SeungMin;Hwang, JunSeung;Hong, KiJae;Han, Wook-Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.285-288
    • /
    • 2018
  • 데이터 정형화기술은 자연어 처리 및 인공지능분야, 데이터베이스 등 다양한 분야에서 중요한 핵심적인 기술 중 하나이다. 최근 정형화 문제를 푸는 많은 신경망 기반 알고리즘들이 제안되었으나, 기존의 모든 알고리즘이 키워드의 후보가 입력으로 주어진다고 가정하고 있으며, 알고리즘 대부분은 두 개의 속성(attribute)을 가지는 이진 관계(binary relation)만 처리할 수 있다는 한계가 있다. 본 논문에서는 컨볼루션 신경망을 이용한 N항 관계 정형화 방업을 제안하고, 이를 이용한 구인 광고 정형화 시스템을 개발하고 성능을 평가한다.

A Revising Method using Phoneme Comparison for Databases with Korean Character Set (데이터베이스상의 한글 자모단위 비교를 통한 데이터 정정기법)

  • 김대환;백두권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.532-534
    • /
    • 2003
  • 코드로써 관리되어있지 않은 데이터베이스 내의 다양한 속성들이 시간이 흐름에 따라 정보로써 가치를 갖게 되면서. 비코드성 한글 데이터의 정형화에 대한 요구가 증가하고 있다. 정형화에 있어 한글의 특수성 중에 하나는 한글자료의 경우 KSC5601, CP949등을 사용하여 음절단위의 문자셋을 사용하여 음절단위로 저장 관리한다. 그런데 입력 시정에서는 자판기등을 이용하여 음소단위로 데이터를 입력하면서 발생하는 오류 및 비정형 데이터의 유입의 문제 등을 내포하고 있다. 이러한 문제를 해결하기 위하여 데이터의 저장단위인 음절이 아닌 음소 단위의 비교를 통하여 데이터를 정정하는 기법을 제안하고자 한다.

  • PDF

Development of a Mapping Ontology for Triple Creation and Implement of a Triple Translator (트리플 생성을 위한 매핑 온톨로지 구축 및 이를 이용한 트리플 변환기 구현)

  • Hur, Hong-Soo;Oh, Won-Seok;Kim, Sung-Hyuk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.48-50
    • /
    • 2012
  • 정형화되어 있는 데이터를 트리플 형식의 RDF 데이터로 변환하기 위하여 매핑 온톨로지를 제안하며, 이 온톨로지를 이용하여 실제 데이터를 RDF로 변환하는 변환기를 구현하였다. 본 논문에서는 트리플 변환을 위해 수행하는 매핑 작업을 개념화하고, 일반적인 매핑 타입을 정형화하고 제약사항을 설정하여 온톨로지 스키마로 제공한다. 트리플 생성을 위해 사용자가 매핑 내용을 인스턴스로 생성하면, 이를 이용하여 정형화된 데이터를 RDF로 자동 변환하는 변환기를 구현한다. 제안하는 매핑 온톨로지를 이용한 매핑규칙 작업은 온톨로지 편집툴을 활용하여 작업의 편의성을 제공하며 변환 작업의 안내 역할을 할 것이다.

Standardizing Unstructured Big Data and Visual Interpretation using MapReduce and Correspondence Analysis (맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석)

  • Choi, Joseph;Choi, Yong-Seok
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.2
    • /
    • pp.169-183
    • /
    • 2014
  • Massive and various types of data recorded everywhere are called big data. Therefore, it is important to analyze big data and to nd valuable information. Besides, to standardize unstructured big data is important for the application of statistical methods. In this paper, we will show how to standardize unstructured big data using MapReduce which is a distribution processing system. We also apply simple correspondence analysis and multiple correspondence analysis to nd the relationship and characteristic of direct relationship words for Samsung Electronics and The Korea Economic Daily newspaper as well as Apple Inc.

Information Extraction Using the Ontology (온톨로지를 이용한 정보 추출)

  • Kim, In-Su;Lee, Bog-Ju
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.652-654
    • /
    • 2005
  • 정보 추출은 텍스트로 되어 있는 비 정형화된 데이터로부터 정형화된 정보를 추출하는 분야이다. 기존의 정보 추출이 구문 중심의 방법인데 비해 본 논문에서는 시맨틱 웹과 온톨로지를 이용한 의미 기반의 정보 추출을 시도한다. 또한 본 논문에서는 기존의 정보 추출 모델을 분류해 보고 반자동 정보 추출이라는 새로운 모델을 제시한다. 이 모델에 기반하여 개인 정보를 자동으로 정형화 시켜주는 정보 추출 도구를 개발하고 이를 소개한다.

  • PDF

Design of Formalized message exchanging method using XMDR (XMDR을 이용한 정형화된 메시지 교환 기법 설계)

  • Hwang, Chi-Gon;Jung, Kye-Dong;Choi, Young-Keun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.6
    • /
    • pp.1087-1094
    • /
    • 2008
  • Recently, XML has been widely used as a standard for a data exchange, and there has emerged the tendency that the size of XML document becomes larger. The data transfer can cause problems due to the increase in traffic, especially when a massive data such as Data Warehouse is being collected and analyzed. Therefore, an XMDR wrapper can solve this problem since it analyzes the tree structures of XML Schema, regenerates XML Schema using the analyzed tree structures, and sends it to each station with an XMDR Query. XML documents which are returned as an outcome encode XML tags according to XML Schema, and send standardized messages. As the formalized XML documents decrease network traffic and comprise XML class information, they are efficient for extraction, conversion, and alignment of data. In addition, they are efficient for the conversion process through XSLT, too, as they have standardized forms. In this paper we profuse a method in which XML Schema and XMDR_Query sent to each station are generated through XMDR(extended Meta-Data Registry) and the generation of products and XML conversion occur in each station wrapper.

Development of water elevation prediction algorithm using unstructured data : Application to Cheongdam Bridge, Korea (비정형화 데이터를 활용한 수위예측 알고리즘 개발 : 청담대교 적용)

  • Lee, Seung Yeon;Yoo, Hyung Ju;Lee, Seung Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.121-121
    • /
    • 2019
  • 특정 지역에 집중적으로 비가 내리는 현상인 국지성호우가 빈번히 발생함에 따라 하천 주변 사회기반시설의 침수 위험성이 증가하고 있다. 침수 위험성 판단 여부는 주로 수위정보를 이용하며 수위 예측은 대부분 수치모형을 이용한다. 본 연구에서는 빅데이터 기반의 RNN(Recurrent Neural Networks)기법 알고리즘을 활용하여 수위를 예측하였다. 연구대상지는 조위의 영향을 많이 받는 한강 전역을 대상으로 하였다. 2008년~2018년(10개년)의 실제 침수 피해 실적을 조사한 결과 잠수교, 한강대교, 청담대교 등에서 침수 피해 발생률이 높게 나타났고 SNS(Social Network Services)와 같은 비정형화 자료에서는 청담대교가 가장 많이 태그(Tag)되어 청담대교를 연구범위로 설정하였다. 본 연구에서는 Python에서 제공하는 Tensor flow Library를 이용하여 수위예측 알고리즘을 적용하였다. 데이터는 정형화 데이터와 비정형 데이터를 사용하였으며 정형화 데이터는 한강홍수 통제소나 기상청에서 제공하는 최근 10년간의 (2008~2018) 수위 및 강우량 자료를 수집하였다. 비정형화 데이터는 SNS를 이용하여 민간 정보를 수집하여 정형화된 자료와 함께 전체자료를 구축하였다. 민감도 분석을 통하여 모델의 은닉층(5), 학습률(0.02) 및 반복횟수(100)의 최적값을 설정하였고, 24시간 동안의 데이터를 이용하여 3시간 후의 수위를 예측하였다. 2008년~ 2017년 까지의 데이터는 학습 데이터로 사용하였으며 2018년의 수위를 예측 및 평가하였다. 2018년의 관측수위 자료와 비교한 결과 90% 이상의 데이터가 10% 이내의 오차를 나타내었으며, 첨두수위도 비교적 정확하게 예측되는 것을 확인하였다. 향후 수위와 강우량뿐만 아니라 다양한 인자들도 고려한다면 보다 신속하고 정확한 예측 정보를 얻을 수 있을 것으로 기대된다.

  • PDF