• 제목/요약/키워드: 데이터 논문

검색결과 41,647건 처리시간 0.062초

WeXGene: 웹 기반 XML 데이터 생성기 (WeXGene: Web-based XML Data Generator)

  • 신선미;정회진;이상호
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.199-210
    • /
    • 2005
  • XML 데이터베이스 시스템 성능 평가를 수행하기 위해서는 다양한 형태의 XML 데이터 생성을 필요로 한다. 기존 XML 데이터 생성기들은 특정 성능 평가에 적용 가능한 데이터만을 생성하고, 그 기능 또한 매우 제한적이다. 본 논문에서는 기존 XML 데이터 생성기들의 제한된 기능을 보완하고 동시에 새로운 기능들을 추가한 새로운 XML 데이터 생성기인 "WeXGene"을 제안한다. WeXGene은 열 단위 또는 행 단위의 데이터를 포함하는 사용자 데이터 화일 및 "SDTD(Symbolic DTD)" 또는 입력 파라미터를 명시한 구조 정의 화일을 이용하여 XML 데이터를 생성한다. 또한 사용자 데이터 화일 없이도 임의의 데이터론 포함하는 XML 데이터 생성이 가능하다. 본 논문은 WeXGene의 구체적인 설계 내용, 구조, 데이터 생성과정 등을 기술한다. 또한 타 XML 데이터 생성기와 기능을 비교 분석하였다.

비정형데이터의 AI학습을 위한 영상/이미지 데이터 품질 향상 방법 (Method for improving video/image data quality for AI learning of unstructured data)

  • 김승희;류동주
    • 융합보안논문지
    • /
    • 제23권2호
    • /
    • pp.55-66
    • /
    • 2023
  • 최근 전세계적으로 사회 모든 분야에서 인공지능 학습용 데이터에 관한 선행연구를 기반으로, 인공지능 학습용 데이터의 가치를 높이고 고품질 데이터를 확보하고자 하는 움직임이 늘고 있다. 따라서, 고품질 데이터를 확보하기 위한 구축사업에서는 품질관리가 매우 중요하다. 이에, 본 논문에서는 인공지능 학습용 데이터를 구축할 시 고품질데이터 확보를 위한 품질관리와 그에 따른 구축공정별 개선방안을 제시하였다. 특히, 인공지능 학습을 위해 구축되는 비정형데이터는 데이터 품질의 80% 이상이 구축과정에서 결정된다. 본 논문에서는 비정형데이터 이미지/영상데이터에 대한 품질검사를 통해 구축단계에서의 획득, data cleaning, labeling 모델에서 발생된 검사절차 및 문제 요소를 해결함으로써 고품질 데이터 확보 방안을 제시하였으며, 제시한 방안을 토대로 인공지능 학습용 데이터 구축에 참여하는 연구단체와 사업자들에게 데이터의 품질편차를 극복하기 위한 대안이 될 것으로 기대된다.

메타데이터 주제 국내 연구동향 분석 (A Diagnostic Analysis of Metadata R&D Status in Korea)

  • 유사라
    • 한국문헌정보학회지
    • /
    • 제44권2호
    • /
    • pp.405-426
    • /
    • 2010
  • 본 연구에서는 실무적용 관점에서 중요한 기준인 메타데이터 개발기준, 메타데이터 구성과 메타데이터 서비스, 그리고 메타데이터 적용요건, 디지털도서관 시스템의 메타데이터 개발사례 등을 연구범위로 선정하여 최근 10년(1999-2009)간 국내 메타데이터 주제의 학술지 논문과 학위논문 등을 조사하고 내용을 분석하여 최신의 연구동향을 파악하고 그에 따른 취약한 부분을 진단했다.

사물인터넷 서비스 연동을 위한 블록체인 아키텍처

  • 최종석;허신욱;김호원
    • 정보보호학회지
    • /
    • 제28권5호
    • /
    • pp.20-25
    • /
    • 2018
  • 본 논문에서는 사물인터넷 서비스와 블록체인 플랫폼간의 연동을 위한 아키텍처를 제안한다. 블록체인은 다양한 산업분야에서 데이터 신뢰성 및 안전성 측면에서의 효율성을 제공한다. 반면에 데이터 쓰기 및 읽기에 대한 낮은 성능 때문에 실제 서비스 적용하기 어렵다. 특히 사물인터넷 서비스와 같은 다량의 데이터가 발생하는 분야에서는 블록체인을 실질적으로 적용하기 어렵지만, 사물인터넷은 프라이버시 및 데이터 보안 측면에서 많은 보안 문제를 야기할 수 있는 분야로써, 블록체인을 통한 데이터 추적 및 신뢰성 보안을 필수적으로 요구된다. 본 논문에서는 이와 같이 실시간성과 신뢰성을 보장하기 위한 사물인터넷 연동형 블록체인 플랫폼 아키텍처를 소개한다. 실시간성을 유지하기 위해서 단일 피어 검증을 통한 실시간 데이터 관리를 활용하며, 신뢰성 유지를 위해서 합의를 통한 분산원장을 활용한다. 단일 피어 검증 데이터는 합의 과정을 거치기 이전에 데이터를 수신받은 단일피어가 분산원장과 별도의 상태 데이터베이스를 통해 실시간 데이터를 저장하여 실시간 서비스에 제공한다.

온톨로지 추론을 통한 메타데이터 기반 개인 미디어 검색 (Metadata Base Personal Media Retrieval Using Ontology Reasoning)

  • 서은석;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.356-360
    • /
    • 2007
  • 인터넷의 활용이 매우 활발해진 현재 각 개인 컴퓨터에 저장된 다양한 데이터의 공유 및 미니홈피, 블로그 등을 통한 웹 게시가 급증하고 있다. 그러나 그러한 개인 데이터 사용을 위해 컴퓨터에 저장되어있는 수많은 데이터 중 원하는 데이터를 검색하는 것은 매우 어렵다. 왜냐하면, 파일명, 작성일자 등 매우 제한된 정보를 사용하여 검색을 하기 때문에, 사용자 질의에 합당한 결과를 제시하지 못하는 문제점이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 첫째로, 온톨로지를 정의한다. 둘째로, 온톨로지 기반의 메타데이터를 정의한다. 셋째로, 데이터 간 의미적 연관성을 고려한 추론 기술을 적용한다. 즉, 각 데이터 간 의미를 고려한 검색을 개인 데스크톱 검색에 적용한다. 본 논문은 개인 미디어 검색을 위한 메타데이터 정의 및 추론 기술의 적용에 대하여 기술한다.

  • PDF

휴대형 DMB 단말 환경에서의 시나리오 기반 데이터 방송 부가콘텐츠 제작 모델 연구 (A Study about Data Broadcasting Sub-Content Architecture Model Using Scenario in Mobile DMB Device Environment)

  • 오정민;김경록;문남미
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.139-143
    • /
    • 2007
  • 양방향 데이터 방송 기술이 급속도로 발전하고 전세계적으로 표준화가 진행되고 있는 가운데 데이터 방송 콘텐츠에 대한 수요는 제자리를 맴돌고 있다. 이는 특화된 데이터 방송 콘텐츠에 대한 필요성을 의미하는 것으로 본 논문에서는 시나리오를 기반으로 기존 방송 콘텐츠를 활용하여 데이터 방송 부가 콘텐츠를 제작하는 모델안을 제안한다. 연구 모델은 1)시나리오 기반으로 기존 데이터 방송 콘텐츠 분석, 2)분석된 객체 아이템 메타데이터 스키마 설계 3)부가 콘텐츠 화면 구현의 단계로 구성한다. DMB 단말환경에서 가볍게 움직이는 콘텐츠 제작을 위해 메타데이터를 25개로 제한하고 이 안에서 Content Description, Shot Detection, Object Tracking로 메타데이터를 구분하여 스키마 다이어그램을 설계한다. 본 논문은 기존의 익숙한 콘텐츠를 재가공하여 제공함으로 DMB 수요 활성화 측면과 CP의 제작 비용감소 측면에서 긍정적인 영향을 끼칠 것으로 예상된다.

  • PDF

적응형 미디어 전송을 위한 데이터 분할기술 (Data Partitioning Technique for Adaptive Media Transmission)

  • 김현정;손호신;유관종
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.237-240
    • /
    • 2001
  • 이질적인 환경인 인터넷을 통한 멀티미디어 서비스가 확산됨에 따라 다량의 데이터를 가지는 비디오 스트림의 전송이 늘어나게 되었다. 이로 인해 네트워크 트래픽의 대부분을 멀티미디어 데이터가 차지하게 되었다. 한정된 통신망 자원을 효율적으로 사용하기 위하여 사용자의 컴퓨터 환경이나 통신망 환경을 고려하여 비디오 데이터를 전송함으로서 자원의 낭비를 막고자 계층적 코딩에 관한 연구가 시도되었다. 본 논문에서는 네트워크와 사용자의 환경을 고려하여 MPEG 비디오 데이터를 전송할 수 있도록 하기 위하여 TMS(Temoral and Motion Scaling)기법을 제안한다. TMS기법은 시간 계층적 코딩과 모션벡터를 이용한 데이터 분할 계층적 코딩 방법을 사용하여 비디오 데이터를 분할한다. 본 논문에서 제안하는 기법을 사용하여 MPEG 비디오 데이터를 전송할 때 기존의 제안된 기법들에 대해 적은 데이터로 고화질의 영상을 전송함으로서 효율적으로 통신망 자원을 사용할 수 있게 된다.

  • PDF

원격지도학습데이터의 오류를 처리하는 강화학습기반 관계추출 모델 (Relation Extraction Model for Noisy Data Handling on Distant Supervision Data based on Reinforcement Learning)

  • 윤수지;남상하;김은경;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.55-60
    • /
    • 2018
  • 기계학습 기반인 관계추출 모델을 설계할 때 다량의 학습데이터를 빠르게 얻기 위해 원격지도학습 방식으로 데이터를 수집한다. 이러한 데이터는 잘못 분류되어 학습데이터로 사용되기 때문에 모델의 성능에 부정적인 영향을 끼칠 수 있다. 본 논문에서는 이러한 문제를 강화학습 접근법을 사용해 해결하고자 한다. 본 논문에서 제안하는 모델은 오 분류된 데이터로부터 좋은 품질의 데이터를 찾는 문장선택기와 선택된 문장들을 가지고 학습이 되어 관계를 추출하는 관계추출기로 구성된다. 문장선택기는 지도학습데이터 없이 관계추출기로부터 피드백을 받아 학습이 진행된다. 이러한 방식은 기존의 관계추출 모델보다 좋은 성능을 보여주었고 결과적으로 원격지도학습데이터의 단점을 해결한 방법임을 보였다.

  • PDF

공간 데이터의 특성을 고려한 저장 관리자 (Storage Manager Considering Spatial Data Characteristics)

  • 김종훈;정현민;장성인;정미영
    • 한국멀티미디어학회논문지
    • /
    • 제4권6호
    • /
    • pp.477-488
    • /
    • 2001
  • 공간 데이터베이스 시스템에서의 공간 데이터에 대한 관리는 전제적인 시스템의 성능을 좌우하며 따라서 이를 위한 처리비용을 최소로 줄이는 기법이 요구된다. 하지만 공간 데이터는 기존의 멀티미디어 데이터와는 달리 그 특성상 레이어 단위로는 데이터의 크기가 비교적 비슷하고, 개개의 데이터 단위로는 그 크기가 수 바이트에서 수 테라(Tera)바이트까지 다양하다는 특성을 가지고 있어 최소 저장 단위가 한 페이지 이상인 EXODUS나 Starburst의 대용량 관리 모듈이나 BLOB등의 멀티미디어 데이터 저장 관리 기법을 그대로 적용할 경우 디스크의 공간 낭비 및 시스템의 성능 저하라는 문제를 가지게 된다. 따라서 본 논문에서는 이러한 공간 데이터의 특성을 고려한 공간 데이터 저장 기법을 제시하고자 한다.

  • PDF

순환신경망을 활용한 야구승부예측 (A Prediction of Baseball Game Results Using Recurrent Neural Netowrks)

  • 정경석;김진학;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 딥러닝(Deep-learning)을 활용한 기상 예측, 심리 예측, 교통상황 예측 등 다양한 분야에 걸쳐 여러 모델의 인공신경망이 활용되고 있다. 본 논문에서는 여러 분야 중 스포츠라는 분야에 접근했으며, 딥러닝 모델을 통해 승부를 예측하는 실험을 진행하였다. 야구의 승부는 선수의 능력치, 기상의 변화, 험/어웨이 여부, 교체 여부 등 가늠할 수 없이 수많은 데이터들에 의존하고 있다. 그러나 본 논문에서는 이러한 수많은 데이터 중 경기 외적인 데이터를 제외한 데이터를 활용하여 그 다음 경기의 승부를 예측할 수 있을 지를 연구한다. 날짜 별 경기들이 훈련데이터가 되고 목표는 이전 경기들의 영향으로 예측된 다음 경기의 승/패를 예측한다. 즉 순차적인 데이터의 활용에 적합한 모델, Recurrent Neural-Network을 이용하였다. 이를 위하여 KBreport에서 데이터를 수집하였고, 수집된 데이터를 훈련 데이터 세트로 만들어 Recurrent Neural Network를 통해 훈련시켜 다음 경기의 승패를 예측하였다.