• 제목/요약/키워드: 데이터 정형화

검색결과 254건 처리시간 0.03초

기업 자원의 전략적 활용을 위한 정보 관리 모델의 설계와 활용 방안에 관한 연구 (Information Management Model for Strategic Use of Enterprise Resources)

  • 노주연;윤용기;이진하;황이현;임춘성
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2002년도 춘계공동학술대회
    • /
    • pp.42-48
    • /
    • 2002
  • 기존 연구에서 정보화전략계획(Information Strategy Planning)과 계획의 실현을 위한 절차와 산출물, 기법을 정형화하는 정보화전략계획 방법론(Methodology)에 관한 논의가 존재해 왔다. 그런데 이들은 기업 모델 도출을 위한 절차와 산출물 기법의 기술과 정형화에 그칠 뿐 그 하위 구성 요소인 데이터의 관리나 입출력 관계, 업무 지식, 경험에 대한 효과적인 관리에 관한 접근은 부족했던 실정이다. 게다가. 비 정형화된 지식이나 경험, 업무 성과 데이터 등의 정형화와 분류체계에 대한 전략적인 접근은 미비하다. 본 연구에서는 기업 자원을 프로세스. 조직. 환경. 정보시스템의 네 관점으로 분류한 기업 정보 분류 체계를 제시하고 그 구성, 내용, 범위를 살펴본다. 이렇게 분류된 데이터간 연관관계의 정의와 그 타당성 검증을 거쳐, 기업 자원의 전략적 관리를 위한 기업 모형 수립 방안을 제시하게 된다. 본 연구의 정보 관리 모델을 통해, 정형화된 데이터 뿐 아니라 비 정형화된 지식과 경험, 선진 업무 지식, 성과 지표를 효과적으로 활용하여 기업의 전략적 방향을 보여줄 수 있다.

  • PDF

의료이미지 데이터의 동적 분석을 위한 패턴 정형화 기술 (Pattern Formalization Technique for Dynamic Analysis of the Medical Image Data)

  • 고광만
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권3호
    • /
    • pp.197-202
    • /
    • 2016
  • 이 논문에서는 비정형 의료이미지 정형화 및 패턴 추출을 위해, 의료기기 또는 의료전문가로부터 생성 또는 감지되는 의료이미지 저장을 위한 데이터베이스 구축한다. 이러한 비정형 이미지의 특징을 정형화된 디지털 데이터로 변환한 후 정형화된 디지털 이미지 데이터로부터 의미있는 패턴 정보를 생성한다. 이러한 경험 기술 소개를 통해 많은 연구자들은 의료이미지 데이터베이스를 보다 쉽게 접근할 수 있고 다양한 분야에서 정형화된 의료이미지를 활용할 수 있다.

XDBox : XML 객체 저장소의 구현 (XDBox : Implementation of XML object repository)

  • 김종익;최일환;이현숙;김형주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.572-574
    • /
    • 2003
  • XML은 반 구조 데이터(semi-structured data)의 일종으로 데이터들이 정형화된 구조를 가지고 있지 않다는 것이 특징이다. 기존의 데이터베이스 시스템은 고정된 스키마를 통해 데이터를 저장 관리하기 때문에 정형화된 구조를 가지지 않는 XML 문서를 저장하기에는 한계가 있다. 본 논문에서는 정형화된 구조를 가지지 못하는 XML문서를 효과적으로 저장하고 관리할 수 있는 저장장치를 구현하고 구현 사항에 대해 설명한다. 본 논문의 저장 장치는 XML을 DOM트리로 표현한 후 DOM트리의 각 노드를 객체로 만들어 저장한다. 본 논문의 저장 장치는 다중 사용자를 지원하기 위해 클라이언트 서버 구조로 구성되어 있으며 각 객체는 전용 파일, 관계형 시스템의 LDB등 다양한 하부 구조에 저장될 수 있다.

  • PDF

컨볼루션 신경망을 이용한 구인 광고 데이터 정형화 시스템 (A System for Relation Extraction from Job Postings using Convolutional Neural Network)

  • 김현지;서인;이승민;황중승;홍기재;한욱신
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.285-288
    • /
    • 2018
  • 데이터 정형화기술은 자연어 처리 및 인공지능분야, 데이터베이스 등 다양한 분야에서 중요한 핵심적인 기술 중 하나이다. 최근 정형화 문제를 푸는 많은 신경망 기반 알고리즘들이 제안되었으나, 기존의 모든 알고리즘이 키워드의 후보가 입력으로 주어진다고 가정하고 있으며, 알고리즘 대부분은 두 개의 속성(attribute)을 가지는 이진 관계(binary relation)만 처리할 수 있다는 한계가 있다. 본 논문에서는 컨볼루션 신경망을 이용한 N항 관계 정형화 방업을 제안하고, 이를 이용한 구인 광고 정형화 시스템을 개발하고 성능을 평가한다.

데이터베이스상의 한글 자모단위 비교를 통한 데이터 정정기법 (A Revising Method using Phoneme Comparison for Databases with Korean Character Set)

  • 김대환;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.532-534
    • /
    • 2003
  • 코드로써 관리되어있지 않은 데이터베이스 내의 다양한 속성들이 시간이 흐름에 따라 정보로써 가치를 갖게 되면서. 비코드성 한글 데이터의 정형화에 대한 요구가 증가하고 있다. 정형화에 있어 한글의 특수성 중에 하나는 한글자료의 경우 KSC5601, CP949등을 사용하여 음절단위의 문자셋을 사용하여 음절단위로 저장 관리한다. 그런데 입력 시정에서는 자판기등을 이용하여 음소단위로 데이터를 입력하면서 발생하는 오류 및 비정형 데이터의 유입의 문제 등을 내포하고 있다. 이러한 문제를 해결하기 위하여 데이터의 저장단위인 음절이 아닌 음소 단위의 비교를 통하여 데이터를 정정하는 기법을 제안하고자 한다.

  • PDF

트리플 생성을 위한 매핑 온톨로지 구축 및 이를 이용한 트리플 변환기 구현 (Development of a Mapping Ontology for Triple Creation and Implement of a Triple Translator)

  • 허홍수;오원석;김성혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.48-50
    • /
    • 2012
  • 정형화되어 있는 데이터를 트리플 형식의 RDF 데이터로 변환하기 위하여 매핑 온톨로지를 제안하며, 이 온톨로지를 이용하여 실제 데이터를 RDF로 변환하는 변환기를 구현하였다. 본 논문에서는 트리플 변환을 위해 수행하는 매핑 작업을 개념화하고, 일반적인 매핑 타입을 정형화하고 제약사항을 설정하여 온톨로지 스키마로 제공한다. 트리플 생성을 위해 사용자가 매핑 내용을 인스턴스로 생성하면, 이를 이용하여 정형화된 데이터를 RDF로 자동 변환하는 변환기를 구현한다. 제안하는 매핑 온톨로지를 이용한 매핑규칙 작업은 온톨로지 편집툴을 활용하여 작업의 편의성을 제공하며 변환 작업의 안내 역할을 할 것이다.

맵리듀스와 대응분석을 활용한 비정형 빅 데이터의 정형화와 시각적 해석 (Standardizing Unstructured Big Data and Visual Interpretation using MapReduce and Correspondence Analysis)

  • 최요셉;최용석
    • 응용통계연구
    • /
    • 제27권2호
    • /
    • pp.169-183
    • /
    • 2014
  • 오늘날, 다양한 분야에서 다양한 형태의 빅 데이터들이 축적되고 있다. 이에, 빅 데이터를 분석하고 그 속에서 가치 있는 정보를 찾아내는 것은 매우 중요해지고 있다. 또한, 비정형 빅 데이터를 정형화하여 통계적 기법을 적용할 수 있게 하는 것은 매우 중요해지고 있다. 본 연구에서는 분산처리 시스템인 맵리듀스를 활용하여 비정형 빅 데이터를 정형화하고, 통계적 분석 기법인 단순 대응분석과 다중 대응분석을 적용하여, 한국 경제 신문의 지면에 실린 기사를 이용해 삼성전자와 애플을 언급하고 있는 단어들의 관계와 특성을 각각 파악하였다.

온톨로지를 이용한 정보 추출 (Information Extraction Using the Ontology)

  • 김인수;이복주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.652-654
    • /
    • 2005
  • 정보 추출은 텍스트로 되어 있는 비 정형화된 데이터로부터 정형화된 정보를 추출하는 분야이다. 기존의 정보 추출이 구문 중심의 방법인데 비해 본 논문에서는 시맨틱 웹과 온톨로지를 이용한 의미 기반의 정보 추출을 시도한다. 또한 본 논문에서는 기존의 정보 추출 모델을 분류해 보고 반자동 정보 추출이라는 새로운 모델을 제시한다. 이 모델에 기반하여 개인 정보를 자동으로 정형화 시켜주는 정보 추출 도구를 개발하고 이를 소개한다.

  • PDF

XMDR을 이용한 정형화된 메시지 교환 기법 설계 (Design of Formalized message exchanging method using XMDR)

  • 황치곤;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1087-1094
    • /
    • 2008
  • 최근 들어 XML은 데이터 교환을 위한 표준으로 널리 사용되고 있으며, XML 문서의 크기가 커지는 경향이 나타나고 있다. 특히, 데이터 웨어하우스와 같이 대량의 데이터를 수집하여 분석하는 경우 데이터 이동은 트래픽의 증가로 인해 문제점이 발생할 수 있다. 따라서 이러한 문제를 해결하기 위해 XMDR 래퍼는 XML Schema의 트리 구조를 분석하고, 분석된 트리 구조를 통해 XML Schema를 재생성하여 XMDR_Query와 함께 각 스테이션에 전송한다. 결과로 반환되는 XML 문서는 XML Schema에 따라 XML 태그를 코드화하여 정형화된 메시지를 전달한다. 정형화된 XML 문서는 네트워크의 트래픽을 감소시키고, XML 계층정보를 포함하고 있어 데이터 추출, 변환 및 정렬에 효율적 이라는 장점을 가진다. 뿐만 아니라 정형화된 형식 이므로 XSLT를 통한 변환과정에서도 효율적이다. 각 스테이션에 전송되는 XML Schema와 XMDR_Query는 XMDR(eXtended Meta-Data Registry)을 통해 생성하고, 각 스테이션의 래퍼에서 결과 생성 및 XML 변환이 이루어지도록 하는 방법을 제안한다.

비정형화 데이터를 활용한 수위예측 알고리즘 개발 : 청담대교 적용 (Development of water elevation prediction algorithm using unstructured data : Application to Cheongdam Bridge, Korea)

  • 이승연;유형주;이승오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.121-121
    • /
    • 2019
  • 특정 지역에 집중적으로 비가 내리는 현상인 국지성호우가 빈번히 발생함에 따라 하천 주변 사회기반시설의 침수 위험성이 증가하고 있다. 침수 위험성 판단 여부는 주로 수위정보를 이용하며 수위 예측은 대부분 수치모형을 이용한다. 본 연구에서는 빅데이터 기반의 RNN(Recurrent Neural Networks)기법 알고리즘을 활용하여 수위를 예측하였다. 연구대상지는 조위의 영향을 많이 받는 한강 전역을 대상으로 하였다. 2008년~2018년(10개년)의 실제 침수 피해 실적을 조사한 결과 잠수교, 한강대교, 청담대교 등에서 침수 피해 발생률이 높게 나타났고 SNS(Social Network Services)와 같은 비정형화 자료에서는 청담대교가 가장 많이 태그(Tag)되어 청담대교를 연구범위로 설정하였다. 본 연구에서는 Python에서 제공하는 Tensor flow Library를 이용하여 수위예측 알고리즘을 적용하였다. 데이터는 정형화 데이터와 비정형 데이터를 사용하였으며 정형화 데이터는 한강홍수 통제소나 기상청에서 제공하는 최근 10년간의 (2008~2018) 수위 및 강우량 자료를 수집하였다. 비정형화 데이터는 SNS를 이용하여 민간 정보를 수집하여 정형화된 자료와 함께 전체자료를 구축하였다. 민감도 분석을 통하여 모델의 은닉층(5), 학습률(0.02) 및 반복횟수(100)의 최적값을 설정하였고, 24시간 동안의 데이터를 이용하여 3시간 후의 수위를 예측하였다. 2008년~ 2017년 까지의 데이터는 학습 데이터로 사용하였으며 2018년의 수위를 예측 및 평가하였다. 2018년의 관측수위 자료와 비교한 결과 90% 이상의 데이터가 10% 이내의 오차를 나타내었으며, 첨두수위도 비교적 정확하게 예측되는 것을 확인하였다. 향후 수위와 강우량뿐만 아니라 다양한 인자들도 고려한다면 보다 신속하고 정확한 예측 정보를 얻을 수 있을 것으로 기대된다.

  • PDF