• Title/Summary/Keyword: 데이터 확장

Search Result 3,598, Processing Time 0.045 seconds

Application Examples Applying Extended Data Expression Technique to Classification Problems (패턴 분류 문제에 확장된 데이터 표현 기법을 적용한 응용 사례)

  • Lee, Jong Chan
    • Journal of the Korea Convergence Society
    • /
    • v.9 no.12
    • /
    • pp.9-15
    • /
    • 2018
  • The main goal of extended data expression is to develop a data structure suitable for common problems in ubiquitous environments. The greatest feature of this method is that the attribute values can be represented with probability. The next feature is that each event in the training data has a weight value that represents its importance. After this data structure has been developed, an algorithm has been devised that can learn it. In the meantime, this algorithm has been applied to various problems in various fields to obtain good results. This paper first introduces the extended data expression technique, UChoo, and rule refinement method, which are the theoretical basis. Next, this paper introduces some examples of application areas such as rule refinement, missing data processing, BEWS problem, and ensemble system.

Web Ontology Learning and Population Model using Structured Data Based on MDR (MDR 기반의 구조화 된 데이터를 이용한 웹 온톨로지 학습 및 확장 모델)

  • Jeong, Hye-Jin;Baik, Doo-Kwon;Jeong, Dong-Won
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.05a
    • /
    • pp.393-396
    • /
    • 2009
  • 기존의 웹을 확장한 시맨틱 웹의 등장으로 웹 온톨로지의 구축이 중요시 되고 있다. 이로 인하여 현재 웹 온톨로지의 관리 및 활용을 위한 편집기, 웹 온톨로지 기술언어, 저장소 및 추론 엔진 등 다양한 기술 및 시스템들이 개발되어 웹 온톨로지의 구축이 용이해졌다. 이제는 구축된 웹 온톨로지를 응용 시스템에 활용하기 위한 웹 온톨로지 클래스에 대한 인스턴스를 풍부하게 할 수 있는 웹 온톨로지의 확장에 대한 연구가 요구된다. 웹 온톨로지의 확장을 위해서는 먼저 웹 온톨로지를 보다 정확하게 정의해야 하며 웹 온톨로지를 보다 풍부하게 확장할 수 있는 방법이 개발되어야 한다. 웹 온톨로지의 보다 정확한 정의를 위해서는 표준화 된 공통 개념을 이용하여 웹 온톨로지 스키마를 생성해야하며 이를 기반으로 한 웹 온톨로지 간 상호운용성 향상되어야 한다. 따라서 이 논문에서는 표준화 된 공통 개념을 관리하는 메타데이터 레지스트리(Metadata Registry)를 기반으로 구조화 된 데이터를 이용한 웹 온톨로지의 학습 및 확장 모델을 제안한다. 또한, 제안 모델을 위한 프로토타입을 구현하고 제안 모델의 평가에 대하여 기술한다.

  • PDF

A Design of Generalized View for the Visualization Layer of Performance Monitoring Tool (성능 감시기의 가시화충을 위한 일반화된 뷰의 설계)

  • 마대성;유진호;김병기
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10a
    • /
    • pp.756-758
    • /
    • 1998
  • 본 논문은 병렬 프로그램의 성능 분석을 위한 성능 감시기에 가시화층에 일반화된 뷰를 설계하고 구현하였다. 대부분의 성능 감시기는 하드웨어에 의존적인 특성화에 뷰를 제공함으로서 이식성이나 확장성이 부족하다. 일반화된 뷰를 제공하는 성능 감시기는 데이터 필터층에서 필터링된 성능 분석 데이터를 이용하여 프로그래머가 정의한 데이터의 범위에 따라 뷰를 스스로 확장할 수 있다. 또한 CallBack기능을 제공하여 관심 있는 데이터를 쉽게 볼 수 있다. 프로그래머는 성능 감시기의 일반화된 뷰를 이용하여 다양한 형태의 성능 분석 결과를 볼 수 있다.

  • PDF

A Study on the expansion of the Z39.88 KEVFormat:Sch-Svc for Scientific Data (과학데이터 관련 Z39.88 KEVFormat:Sch-Svc 확장 연구)

  • Kim, sun-tae;Lee, tae-young
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2011.05a
    • /
    • pp.41-42
    • /
    • 2011
  • DataCite 메타데이터 요소를 분석하여 OpenURL 학술 서비스 유형을 기술하기 위한 메타태그를 Key/Encoded-Value (KEV) 형식으로 확장 제안하였다. 학술 서비스 유형 분석을 위해 Scopus와 Web of Science, NDSL 서비스를 비교 검토하여 8개의 학술서비스 유형을 도출하였다. 또한 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 집중적으로 분석하여 9개의 대표속성을 도출 하였다.

  • PDF

Design of XML Schema and XSL for the Track&Trace System (Track&&Trace 시스템의 XML 스키마와 XSL 설계)

  • 유정순;하수철
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05d
    • /
    • pp.700-704
    • /
    • 2002
  • 본 논문은 UML로 모델링 된 Track&Trace 시스템[1]을 확장성과 유연성이 뛰어나며, 웹 상에서 안전하고 신뢰성 있으며 다양하고 광범위한 데이터 교환을 위한 XML로의 설계에 관한 연구이다. 이를 위해 UML 클래스 다이어그램의 클래스, 멤버 데이터와 데이터 타입을 이용해 Well-Formed XML에서 요소와 컨텐츠로 변환한다. 이러한 XML의 구조를 명확하게 정의하기 위해 클래스 다이어그램의 데이터 타입과 다중성을 이용해 DTD를 설계하고, 동시에 확장성을 갖춘 XML 스키마를 설계한다. 또한, XML 문서와 독립적으로 출력을 위한 스타일 지점인 CSS 와 XSL도 설계한다.

  • PDF

3D Region Growing Algorithm based on Eigenvalue of Hessian matrix for Extraction of blood vessels (혈관추출을 위한 Hessian 행렬 고유치 기반 3 차원 영역확장 알고리즘)

  • Lee, Yu-Bu;Choi, Yoo-Joo;Kim, Myoung-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.1641-1644
    • /
    • 2004
  • 3차원 볼륨데이터에서 분할 대상영역의 밝기 값이 다양하면서 밝기 값이 유사한 영역과 인접한 경우 3차원 영역확장(region growing) 방법을 사용하여 영역을 분할하기 위해서는 영역확장의 중요한 요인인 동질성 기준 값의 적절한 선택이 요구된다. 본 논문에서는 영역 복셀(voxel)의 1차 미분 값의 크기인 기울기 크기(gradient magnitude)만으로 영역의 경계를 찾기가 쉽지않은 대상의 분할을 위해 볼륨데이터의 지역적인 밝기 값의 변화의 특징을 고려하면서 분할 대상영역의 복셀의 2차 미분(second partial derivation)을 행렬의 요소(element)로 갖는 Hessian 행렬의 고유치(eigenvalue)를 영역확장의 문턱치 결정에 이용하였다. 제안한 알고리즘은 3차원 영역확장의 결과에 가장 큰 영향을 미치는 적절한 문턱치의 선택으로 대상영역의 분할을 성공적으로 수행하여 3차원 영역확장의 단점을 보완하였다.

  • PDF

Design and Implementation of MPEG-2 Video Drips Decoder for DVB-MHP Set-top Box Middleware (DVB-MHP 셋톱박스 미들웨어를 위한 MPEG-2 비디오 드립 디코더의 설계 및 구현)

  • 김우종;이양선
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.199-202
    • /
    • 2004
  • 데이터 방송은 지상파, 위성, 케이블 둥의 방송망을 이용하여 하나의 송신자가 다수의 수용자에게 디지털 멀티미디어 컨텐츠를 여러 종류의 단말기에 전송하는 것으로 컨텐츠는 프로그램에 연동되는 서비스 및 비연동형 서비스, 또는 대화형 서비스 헝태로 제공되는 다양한 서비스를 포함한다. 방송망을 이용한 데이터방송의 전송 규약은 DSM-CC에서 정의한 캐로셀(carousel) 형태로 전송된다. 캐로셀은 주기적으로 반복 전송되는 데이터 모듈을 가리키며, 캐로셀로 전송되는 데이터 중에는 MPEG-2 비디오로 인코딩되어 광고와 배경 이미지 등으로 사용할 수 있는 영상 데이터가 있다. 이 MPEG-2 비디오 영상 데이터를 TV화면에 출력하기 위해 셋톱박스의 미들웨어는 썬 마이크로시스템즈(Sun Microsystems)에서 만든 자바 기반의 JMF(Java Media Framework) 플레이어를 통해 화면에 출력한다 이렇게 제공되는 MPEG-2 비디오 영상 데이터를 비디오 드립(drips)이라 하고, 비디오 드립을 JMF 플레이어를 통해 화면에 출력하는 모드를 드립피드(drip-feed) 모드라 한다. 그러나 MHP용 셋톱박스를 위한 JMF 버전 1.0은 그대로 사용 할 수 없다. 비디오 드립 모드를 위한 구현이 없기 때문에 별도의 확장을 통해 비디오 드립을 지원하거나, 네이티브(Native) 메소드를 만들어 JMF를 확장하는 방식을 제공해야 한다. 본 논문에서는 데이터 캐로셀로 전송되는 비디오 드림 모드를 구현하기 위해 네이티브 코드로 JMF를 확장해서 비디오 드립을 JMF 플레이어를 통해 TV 화면에 출력하는 MPEG-2 비디오 드립 디코더를 설계하고 구현하였다.

  • PDF

Prompt-based Data Augmentation for Generating Personalized Conversation Using Past Counseling Dialogues (과거 상담대화를 활용한 개인화 대화생성을 위한 프롬프트 기반 데이터 증강)

  • Chae-Gyun Lim;Hye-Woo Lee;Kyeong-Jin Oh;Joo-Won Sung;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.209-213
    • /
    • 2023
  • 최근 자연어 이해 분야에서 대규모 언어모델 기반으로 프롬프트를 활용하여 모델과 상호작용하는 방법이 널리 연구되고 있으며, 특히 상담 분야에서 언어모델을 활용한다면 내담자와의 자연스러운 대화를 주도할 수 있는 대화생성 모델로 확장이 가능하다. 내담자의 상황에 따라 개인화된 상담대화를 진행하는 모델을 학습시키려면 동일한 내담자에 대한 과거 및 차기 상담대화가 필요하지만, 기존의 데이터셋은 대체로 단일 대화세션으로 구축되어 있다. 본 논문에서는 언어모델을 활용하여 단일 대화세션으로 구축된 기존 상담대화 데이터셋을 확장하여 연속된 대화세션 구성의 학습데이터를 확보할 수 있는 프롬프트 기반 데이터 증강 기법을 제안한다. 제안 기법은 기존 대화내용을 반영한 요약질문 생성단계와 대화맥락을 유지한 차기 상담대화 생성 단계로 구성되며, 프롬프트 엔지니어링을 통해 상담 분야의 데이터셋을 확장하고 사용자 평가를 통해 제안 기법의 데이터 증강이 품질에 미치는 영향을 확인한다.

  • PDF

A scalable and automated feature data extraction system for AI analysis of computational science data (계산과학 데이터의 인공지능 분석을 위한 확장성 있는 특징 데이터 추출 자동화 시스템)

  • Ahn, Sunil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.102-105
    • /
    • 2020
  • AI 분석 과정에서 특징 데이터 추출은 분석 성능에 큰 영향을 미칠 뿐만 아니라 가장 많은 시간을 소요하는 과정 중의 하나이다. 계산과학 데이터는 HPC를 활용하여 생산되므로 데이터가 크고 복잡할 뿐 아니라 데이터의 수도 방대한 경우가 많다. 이 때문에 계산과학 데이터로부터 특징 데이터 추출하는 과정은 복잡성이 크고, 소요 시간도 매우 크다. 본 논문은 먼저 계산과학 데이터로부터 특징 데이터 추출하는 과정에 대한 요구사항과 이슈들을 분석한다. 그리고 확장성을 고려한 계산과학 데이터의 인공지능 분석을 위한 특징 데이터 추출 자동화 시스템을 제안한다.

Machine Learning Data Extension Way for Confirming Genuine of Trademark Image which is Rotated (회전한 상표 이미지의 진위 결정을 위한 기계 학습 데이터 확장 방법)

  • Gu, Bongen
    • Journal of Platform Technology
    • /
    • v.8 no.1
    • /
    • pp.16-23
    • /
    • 2020
  • For protecting copyright for trademark, convolutional neural network can be used to confirm genuine of trademark image. For this, repeated training one trademark image degrades the performance of machine learning because of overfitting problem. Therefore, this type of machine learning application generates training data in various way. But if genuine trademark image is rotated, this image is classified as not genuine trademark. In this paper, we propose the way for extending training data to confirm genuine of trademark image which is rotated. Our proposed way generates rotated image from genuine trademark image as training data. To show effectiveness of our proposed way, we use CNN machine learning model, and evaluate the accuracy with test image. From evaluation result, our way can be used to generate training data for machine learning application which confirms genuine of rotated trademark image.

  • PDF