• Title/Summary/Keyword: 확장 데이터

Search Result 3,572, Processing Time 0.028 seconds

The Performance Improvement of U-Net Model for Landcover Semantic Segmentation through Data Augmentation (데이터 확장을 통한 토지피복분류 U-Net 모델의 성능 개선)

  • Baek, Won-Kyung;Lee, Moung-Jin;Jung, Hyung-Sup
    • Korean Journal of Remote Sensing
    • /
    • v.38 no.6_2
    • /
    • pp.1663-1676
    • /
    • 2022
  • Recently, a number of deep-learning based land cover segmentation studies have been introduced. Some studies denoted that the performance of land cover segmentation deteriorated due to insufficient training data. In this study, we verified the improvement of land cover segmentation performance through data augmentation. U-Net was implemented for the segmentation model. And 2020 satellite-derived landcover dataset was utilized for the study data. The pixel accuracies were 0.905 and 0.923 for U-Net trained by original and augmented data respectively. And the mean F1 scores of those models were 0.720 and 0.775 respectively, indicating the better performance of data augmentation. In addition, F1 scores for building, road, paddy field, upland field, forest, and unclassified area class were 0.770, 0.568, 0.433, 0.455, 0.964, and 0.830 for the U-Net trained by original data. It is verified that data augmentation is effective in that the F1 scores of every class were improved to 0.838, 0.660, 0.791, 0.530, 0.969, and 0.860 respectively. Although, we applied data augmentation without considering class balances, we find that data augmentation can mitigate biased segmentation performance caused by data imbalance problems from the comparisons between the performances of two models. It is expected that this study would help to prove the importance and effectiveness of data augmentation in various image processing fields.

A Design and Implementation of Proxy Server for Live-Video Stream Transmission (생방송 비디오 스트림 전송을 위한 프록시 서버의 설계와 구현)

  • 김현민;낭종호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.529-531
    • /
    • 2002
  • 생방송 비디오 프록시는 사용자에게 최신의 비디오 데이터를 전송해야 한다. 그러나 큰 파일을 나누어 미리 캐싱하는 기존의 방법으로는 최신의 데이터를 보여줘야 하는 생방송 VOD의 제약을 만족시킬 수 없다. 본 논문에서는 생방송 비디오 스트림을 대상으로 효과적으로 캐싱할 수 있도록 클라이언트의 요청을 받는 큐와, 생방송 비디오 데이터를 저장하는 버퍼풀을 구성하였고, 이들이 제대로 동작하기 위한 동기화 과정을 설계하였다. 이 구조의 특징은 프록시가 클라이언트들의 요청을 일정시간 동안 모아서, 미디어 서버에게 한번만 요청한다는 데에 있다 미디어 서버는 프록시에게만 요청을 받고 데이터를 전달하게 되며, 모든 부하는 프록시 쪽으로 옮겨간다 결국 프록시 서버의 개수를 늘리거나 성능을 확장하면 서비스 가능한 클라이언트의 수를 확장시진 수 있는, 이른바 확장성의 개선을 기대할 수 있다. 실제로 구현해본 절과 지연시간 개선, 확장성 효과 등 프록시로서 만족할 만한 성능이 나옴을 확인하였다. 비연속적인 비디오 데이터를 대상으로 한 본 논문은, 오디오와 같이 연속적인 성질의 데이터에 대한 처리를 보강한다면 수요가 늘고있는 생방송 VOD서비스에 대비한 프록시 개발에 도움을 줄 것이다.

  • PDF

Data Augmentation of English Reading Comprehension Tutoring Dialogs using ChatGPT (ChatGPT 를 이용한 독해 튜터링 대화 데이터 확장)

  • Hyunyou Kwon;Sung-Kwon Choi;Jinxia Huang;Oh-Woog Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.43-44
    • /
    • 2023
  • 대화형 독해 튜터링 시스템을 위한 학생주도 대화 데이터셋 생성 및 확장에 ChatGPT 의 활용 가능성을 평가하였다. 단순히 수동으로만 구축한 기존의 데이터셋과 ChatGPT 에 의해 반자동으로 확장된 데이터셋을 비교한 결과, 구축량, 소요 시간, 비용 및 반복 작업 측면에서 ChatGPT 가 가진 유용성을 알 수 있었다. 그러나, 유형별 배분의 편중과, 부적절한 데이터 생성 등의 한계도 나타났다. Chat GPT 의 빠른 발전이 예상됨에 따라 대화형 튜터링 분야에 ChatGPT 에 의한 반자동 데이터 확장 방법이 널리 활용될 것으로 기대된다.

Extending UML for Modeling Systems in Data Flow Languages (데이터 흐름 언어로 구현되는 시스템 모델링을 위한 UML확장)

  • Shim, Jae-Keun;Lee, Chong-Won;Lee, Byung-Jeong;Wu, Chi-Su
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.348-353
    • /
    • 2006
  • 데이터의 흐름과 그 데이터의 처리가 중요한 시스템이 있다. 이러한 시스템을 구현하는 데이터 흐름 언어들은 데이터 흐름도로 모델링하는 것이 가장 이해하기 쉽고 정보의 손실이 적은 방법이다. 이러한 시스템은 분산 환경의 중요성이 높아짐에 따라 다른 이종적인 시스템과 같이 개발 될 가능성이 높아지고 있다. 따라서 이종적인 시스템에 대한 일관성 있고 통합적인 설계와 문서화가 필요하게 되었다. UML로 객체 지향 언어로 구현되는 시스템의 모델링과 문서화에 있어서는 사실상의 표준이지만 데이터 흐름의 구성 요소들이 객체 지향적이지 않기 때문에 UML로 데이터 흐름을 나타내는 것은 어렵다. 따라서 우리는 이러한 문제를 해결하기 위한 UML 확장 메커니즘을 제안한다. 데이터 흐름 언어가 객체와 클래스로 사상될 수 있는 특성들을 가지고 있다면 그 특성들을 UML 다이어그램으로 확장할 수 있다. 그러기위해 새로운 스테레오타입들을 정의하여 기존의 UML 다이어그램 구성물과의 차이를 둔다. 이러한 과정을 통해 UML 사용자들은 데이터 흐름 언어의 구성 요소들을 캡슐화 할 수 있다. 데이터 흐름 언어로 구현되는 일반적인 시스템에 적용하기 위해 우리는 UML 메타모델 개요를 제안하는 것으로 스테레오타입들을 정의한다. 그리고 이렇게 확장된 UML 메커니즘을 가지고 데이터 흐름 언어로 구현된 두 개의 시스템을 설계하고 설계에 따라 구현 하였다.

  • PDF

Extended Method of Discovery of Spatial Association Rules (확장된 공간 연관 규칙 탐사기법)

  • Ha, Dan-Shim;Hwang, Bu-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.83-86
    • /
    • 2000
  • 공간 데이터가 증가함에 따라 이를 효율적으로 저장하고 분석할 수 있는 기술이 필요하게 되었다. 공간 데이터 마이닝은 데이터베이스에서 유용한 지식을 추출하는 기술로, 기존의 데이터 마이닝 방법에 공간의 개념을 추가하여 확장함으로써 공간 패턴, 공간 객체들의 연관 관계 둥을 얻을 수 있다. 본 논문에서는 공간 데이터 마이닝의 기법 중의 하나인 공간 연관 규칙 탐사 기법을 제안한다. 제안하는 방법은 공간 관계를 포함한 공간 연관 규칙뿐만 아니라 공간 객체의 비공간 속성도 함께 고려함으로써 보다 확장되고 다양한 공간 연관 규칙을 탐사할 수 있다.

  • PDF

GMS: Spatial Database Management System (GMS: 공간 데이터베이스 관리 시스템)

  • 박상근;박순영;정원일;김명근;배해영
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.04a
    • /
    • pp.217-224
    • /
    • 2003
  • 전통적인 관계형 데이터베이스 시스템에서 관리되고 있는 일반적인 데이터가 아닌 점, 선, 다각형 등의 다양한 공간 데이터를 관리하기 위해서는 확장된 형태의 공간데이터 타입 및 대용량성과 다양한 접근 패턴을 지니는 공간데이터의 특성을 고려한 새로운 데이터베이스 관리 시스템이 요구된다. 본 논문에서는 이와 같은 공간데이터의 특성을 고려한 저장 기법과 공간질의 처리기법을 제공하는 공간 데이터베1이스 관리 시스템인 GMS를 제안한다. GMS는 다양한 크기를 지니는 공간데이터의 특성을 고려하여 공간/비공간 통합 저장관리 및 BLOB 데이터 저장기법을 제공하며, 저장된 공간/비공간 데이터에 대한 다양한 색인기법을 제공하고 있다. 그밖에 공간 연산 및 복잡한 질의처리를 위해 확장된 질의 최적화 및 질의처리 기법을 제공하며, 다중 사용자를 위한 확장된 동시성 제어 기법과 공간/비공간 데이터에 대한 서로 다른 회복 기법을 제공한다.

  • PDF

Virtual Directory Extendible Hash index: An Economic Hash Index Using New Directory Structure (가상 디렉토리 확장 해시 색인: 확장 해싱에서의 새로운 디렉토리 구조를 이용한 저비용 해시 색인)

  • Park, Sang-Keun;Park, Soon-Young;Kim, Myung-Keun;Bae, Hae-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11c
    • /
    • pp.1493-1496
    • /
    • 2003
  • 데이터베이스 관계 연산자 중 프로젝션(projection)과 집단 연산(aggregate function)시 사용되는 GROUP BY절, 그리고 동등 조인(equi join)에 대한 질의 처리는 중복된 튜플 중복된 GROUP BY 필드, 조인 중 발생하는 임시결과에 대한 제거나 집단 연산, 임시 결과의 저장을 위해 정렬이나 해싱 기반 알고리즘을 적용하고 있다. 이 중 해싱 기반 알고리즘은 데이터에 대한 직접적인 접근 방법과 정렬비용이 없다는 장점으로 인해 자주 사용하게 된다. 그러나 이러한 해싱(extendible hashing)[1] 기반 알고리즘은 키 값이 저장되는 버켓(bucket) 페이지의 넘침(overflow)으로 인해 분할(split)이 발생하는 경우, 분할을 야기시킨 버켓 페이지에 대한 정보를 제외한 동일한 내용의 기존 디렉토리 구조를 배로 확장해야 하는 공간 확장과, 확장된 디렉토리 구조의 유지를 위해 많은 비용을 소모하게 된다. 본 논문에서는 다량의 데이터에 대한 접근 기법과 디렉토리 구조의 저장공간, 유지 비용 절감 및 중복 해시 값을 지니는 데이터를 처리하기위한 해시 색인인 가상 디렉토리 확장 해시 색인을 제안한다. 가상 디렉토리 확장 해시 색인은 디렉토리 구조를 다단계 구조로 유지함으로써, 넓은 저장 공간을 필요로 하는 다량의 데이터에 대한 접근경로 문제를 해결하였고, 가상 디렉토리 레벨이라는 새로운 구조를 통해, 기존 디렉토리 구조의 공간 낭비 및 유지 비용을 최소화 시켰으며, 버켓 페이지를 리스트(list) 구조로 유지함으로써 중복 해시 값에 의한 디렉토리 구조의 연쇄적 분할 문제를 해결하였다.

  • PDF

A Modified Fragmentation Technique for Reducing Network Cost in A Scalable and Highly Available Clustered Database (확장 가능한 고가용 데이터 베이스에서 네트워크 비용을 줄이기 위한 변형된 분할기법)

  • 유병섭;이충호;이재동;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.193-195
    • /
    • 2002
  • 최근 근자상거래와 같은 웹 기반 응용프로그램에서는 높은 가용성과 확장성을 가지며 빠른 응답시간을 갖는 데이터베이스에 대한 필요성이 대두되고 있다. 이러한 요구에 대한 해결책의 하나로 비공유 구조의 클러스터 시스템을 구성하고 분활과 복제정책을 사용한다. 즉, 해쉬함수나 범위값에 의해 분할하여 여러 노드에 분산 시키고 서로 다른 노드에 마스터와 백업을 두어 가용성을 높이고 있다. 그러나 기존의 방법은 하나의 갱신 질의에 대해서 마스터와 백업에 각각 질의를 보내주어야 하고 온라인 확장시에는 모든 마스터와 백업의 데이터가 재구성되어야 하므로 네트워크 비용이 크다는 문제점이 있다. 따라서, 본 논문에서는 이러한 네트워크 비용을 줄이기 위한 변형된 분활 기법을 제안한다. 제안된 기법에서 마스터는 기존의 기법과 동일한 방법으로 저장하나 백업은 네트워크를 통해 지정된 노드로 포워딩을 하지 않고 질의를 받은 서버에 그대로 저장함으로써 클러스터를 구성하는 노드 사이에 통신 비용을 줄인다. 또한 온라인 확장에서는 기존의 기법과 달리 백업데이터는 같은 서버의 마스터데이터와 중복되는 것만 이동시킴으로써 데이터 이동비용을 줄이며, 전체 트랜잭션 처리량을 높인다.

  • PDF

An Online Scaling Method for Improving the Availability of a Database Cluster (데이터베이스 클러스터의 가용성 향상을 위한 온라인 확장 기법)

  • Lee, Chung-Ho;Jang, Yong-Il;Bae, Hae-Yeong
    • The KIPS Transactions:PartD
    • /
    • v.10D no.6
    • /
    • pp.935-948
    • /
    • 2003
  • An online scaling method adds new nodes to the shared-nothing database cluster and makes tables be reorganized while the system is running. The objective is to share the workload with many nodes and increase the capacity of cluster systems. The existing online scaling method, however, has two problems. One is the degradation of response time and transactions throughput due to the additional overheads of data transfer and replica's condidtency. The other is and inefficient recovery mechanism in which the overall scaling transaction is aborted by a fault. These problems deteriorate the availability of shared-nothing database cluster. To avoid the additional overheads throughout the scaling period, our scalingmethod consists of twophases : a parallel data transfer phase and a combination phase. The parallel data transferred datausing reduces the size of data transfer by dividing the data into the number of replicas. The combination phase combines the transferred datausing resources of spare nodes. Also, our method reduces the possibility of failure throughout the scaling period and improves the availability of the database cluster.

Extending Bibliographic Information Using Linked Data (링크드 데이터 방식을 통한 서지 정보의 확장에 관한 연구)

  • Park, Zi-Young
    • Journal of the Korean Society for information Management
    • /
    • v.29 no.1
    • /
    • pp.231-251
    • /
    • 2012
  • In this study, Linked Data was used for extending bibliographic data, because Linked Data provides shareable identifiers, data structures, and link information. Linked Data is especially efficient in expanding bibliographic data integrated with bibliographic ontology. Therefore, Linked Data and bibliographic ontologies were analyzed and available Linked Data was suggested. By linking between meta-data schemes, bibliographic data, and authority data, issues for the effective Linked Data sharing were suggested: 1) selecting proper Linked Data for each bibliographic organization, 2) linking between different Linked Data, and 3) developing their own Linked Data for each bibliographic organization.