• 제목/요약/키워드: Multimedia Data Model

검색결과 610건 처리시간 0.024초

CBIR 기반 데이터 확장을 이용한 딥 러닝 기술 (CBIR-based Data Augmentation and Its Application to Deep Learning)

  • 김세송;정승원
    • 방송공학회논문지
    • /
    • 제23권3호
    • /
    • pp.403-408
    • /
    • 2018
  • 딥 러닝의 학습을 위해서 일반적으로 많은 양의 데이터가 필요하다. 그러나 많은 양의 데이터 세트를 만드는 것은 쉽지 않기 때문에, 회전, 반전 (flipping), 필터링 (filtering) 등의 간단한 데이터 확장 (data augmentation) 기법을 통해 작은 데이터 세트를 좀 더 큰 데이터 세트로 만드는 여러 시도들이 있었다. 그러나 이러한 기법들은 이미 보유하고 있는 데이터 세트만을 이용하기 때문에 확장성에 제약을 갖는다. 이런 문제를 해결하기 위해 본고에서는 보유하고 있는 영상 데이터를 이용하여 새로운 영상 데이터를 획득하는 기술을 제안한다. 이는 기존 데이터 세트의 영상 데이터를 CBIR(Contents based image retrieval)의 쿼리로 이용하여 유사 영상들을 검색하여 획득하는 방식으로 이루어진다. 최종적으로 CBIR을 이용해 확장한 데이터를 딥 러닝으로 학습시켜 확장 전후의 성능을 비교하였다.

IP 기반 연속성 보장을 위한 멀티미디어 스트리밍 전송 모델 설계 (A Design of Multimedia Streaming Transmission Model for Continuity Guarantee based on IP)

  • 김형진;유인호
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2305-2310
    • /
    • 2011
  • 최근 들어 데이터, 음성 위주의 통신 산업과 영상중심의 방송 산업이 빠르게 융합되고 있다. 따라서 본 논문에서는 IP 기반을 위한 멀티미디어 스트리밍 전송이 가능하도록 네트워크 대역폭의 사용을 최소화하여 특정 채널에 대한 멀티미디어 서비스뿐만 아니라 여러 채널을 동시에 사용자가 서비스 받을 수 있도록 멀티 접근 방법을 제안하고자 한다. 또한 네트워크의 지연을 흡수 할 수 있는 버퍼링 기법, 안정적인 채널 대역폭 할당 및 유지를 위한 객체 모델을 설계 하고자 한다.

인공지능 데이터 품질검증 기술 및 오픈소스 프레임워크 분석 연구 (An Evaluation Study on Artificial Intelligence Data Validation Methods and Open-source Frameworks)

  • 윤창희;신호경;추승연;김재일
    • 한국멀티미디어학회논문지
    • /
    • 제24권10호
    • /
    • pp.1403-1413
    • /
    • 2021
  • In this paper, we investigate automated data validation techniques for artificial intelligence training, and also disclose open-source frameworks, such as Google's TensorFlow Data Validation (TFDV), that support automated data validation in the AI model development process. We also introduce an experimental study using public data sets to demonstrate the effectiveness of the open-source data validation framework. In particular, we presents experimental results of the data validation functions for schema testing and discuss the limitations of the current open-source frameworks for semantic data. Last, we introduce the latest studies for the semantic data validation using machine learning techniques.

WWW상에서 음란물 검색기법 (Obscene Material Searching Method in WWW)

  • 노경택;김경우;이기영;김규호
    • 한국컴퓨터정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.1-7
    • /
    • 1999
  • WWW은 기존의 인터넷이 단순 문자 자료 중심의 데이타 교환을 멀티미디어화 하기 위한 프로토콜이며, 자료들을 하이퍼텍스트 형태로 저장함으로써 초보자들도 쉽게 원하는 자료를 찾고, 접근할 수 있도록 되어있다. 이러한 WWW의 멀티미디어 데이타의 검색 및 접근의 용이성은 음란물 데이타가 보편화, 멀티미디어화 되는데 결정적인 역활을 하였으며, 음란물의 상업화를 가능케 하는 사회적 문제를 야기하였다. 한편, 이러한 문제를 해결하기 위해 음란물을 제공하는 사이트를 효율적으로 차단하기 연구가 활발하게 진행되고 있다. 본 논문에서는 이러한 음란물을 제공하는 사이트를 효율적으로 검색하여, 미성년자의 음란성 사이트접근을 차단하기 위한 기법을 제시하고 이를 구현하였다. 제안된 기법은 링크를 기반으로 정보 검색 기능을 수행하며, 가장 정확한 결과를 보여 주는 것으로 알려진 확률 모델과 비교한 결과 제안된 모델(Link-Based Model)이 확률 모델보다 평균 재현율과 정확율에서 12%와 8% 성능이 우수하였다. 특히 텍스트 이외의 데이타와 적은 링크를 가진 문서들을 검색하는데 크게 효율성이 향상되었다.

  • PDF

A Salient Based Bag of Visual Word Model (SBBoVW): Improvements toward Difficult Object Recognition and Object Location in Image Retrieval

  • Mansourian, Leila;Abdullah, Muhamad Taufik;Abdullah, Lilli Nurliyana;Azman, Azreen;Mustaffa, Mas Rina
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권2호
    • /
    • pp.769-786
    • /
    • 2016
  • Object recognition and object location have always drawn much interest. Also, recently various computational models have been designed. One of the big issues in this domain is the lack of an appropriate model for extracting important part of the picture and estimating the object place in the same environments that caused low accuracy. To solve this problem, a new Salient Based Bag of Visual Word (SBBoVW) model for object recognition and object location estimation is presented. Contributions lied in the present study are two-fold. One is to introduce a new approach, which is a Salient Based Bag of Visual Word model (SBBoVW) to recognize difficult objects that have had low accuracy in previous methods. This method integrates SIFT features of the original and salient parts of pictures and fuses them together to generate better codebooks using bag of visual word method. The second contribution is to introduce a new algorithm for finding object place based on the salient map automatically. The performance evaluation on several data sets proves that the new approach outperforms other state-of-the-arts.

토러스 연결망 기반의 대용량 멀티미디어용 분산 스토리지 시스템 (Torus Network Based Distributed Storage System for Massive Multimedia Contents)

  • 김재열;김동오;김홍연;김영균;서대화
    • 한국멀티미디어학회논문지
    • /
    • 제19권8호
    • /
    • pp.1487-1497
    • /
    • 2016
  • Explosively growing service of digital multimedia data increases the need for highly scalable low-cost storage. This paper proposes the new storage architecture based on torus network which does not need network switch and erasure coding for efficient storage usage for high scalability and efficient disk utilization. The proposed model has to compensate for the disadvantage of long network latency and network processing overhead of torus network. The proposed storage model was compared to two most popular distributed file system, GlusterFS and Ceph distributed file systems through a prototype implementation. The performance of prototype system shows outstanding results than erasure coding policy of two file systems and mostly even better results than replication policy of them.

A Web-Based Domain Ontology Construction Modelling and Application in the Wetland Domain

  • Xing, Jun;Han, Min
    • 한국멀티미디어학회논문지
    • /
    • 제10권6호
    • /
    • pp.754-759
    • /
    • 2007
  • Methodology of ontology building based on Web resources will not only reduce significantly the ontology construction period, but also enhance the quality of the ontology. Remarkable progress has been achieved in this regard, but they encounter similar difficulties, such as the Web data extraction and knowledge acquisition. This paper researches on the characteristics of ontology construction data, including dynamics, largeness, variation and openness and other features, and the fundamental issue of ontology construction - formalized representation method. Then, the key technologies used in and the difficulties with ontology construction are summarized. A software Model-OntoMaker (Ontology Maker) is designed. The model is innovative in two regards: (1) the improvement of generality: the meta learning machine will dynamically pick appropriate ontology learning methodologies for data of different domains, thus optimizing the results; (2) the merged processing of (semi-) structural and non-structural data. In addition, as known to all wetland researchers, information sharing is vital to wetland exploitation and protection, while wetland ontology construction is the basic task for information sharing. OntoMaker constructs the wetland ontologies, and the model in this work can also be referred to other environmental domains.

  • PDF

웹기반의 건강사정 멀티미디어 컨텐츠 개발 (Development of Web-based Multimedia Content for a Physical Examination and Health Assessment Course)

  • 오복자;김일옥;신성례;정회경
    • 대한간호학회지
    • /
    • 제34권6호
    • /
    • pp.994-1003
    • /
    • 2004
  • Purpose: This study was to develop Web-based multimedia content for Physical Examination and Health Assesment. Method: The multimedia content was developed based on Jung's teaching and learning structure plan model, using the following 5 processes: 1) Analysis Stage, 2) Planning Stage, 3) Storyboard Framing and Production Stage, 4) Program Operation Stage, and 5) Final Evaluation Stage. Results: The web based multimedia content consisted of an intro movie, main page and sub pages. On the main page, there were 6 menu bars that consisted of Announcement center, Information of professors, Lecture guide, Cyber lecture, Q&A, and Data centers, and a site map which introduced 15 week lectures. In the operation of web based multimedia content, HTML, JavaScript, Flash, and multimedia technology(Audio and Video) were utilized and the content consisted of text content, interactive content, animation, and audio & video. Consultation with the experts in context, computer engineering, and educational technology was utilized in the development of these processes. Conclusions: Web-based multimedia content is expected to offer individualized and tailored learning opportunities to maximize and facilitate the effectiveness of the teaching and learning process. Therefore, multimedia content should be utilized concurrently with the lecture in the Physical Examination and Health Assesment classes as a vital teaching aid to make up for the weakness of the face-to- face teaching-learning method.

System Identification of Internet transmission rate control factors

  • Yoo, Sung-Goo;Kim, Young-Seok;Chong, Kil-To
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.652-657
    • /
    • 2004
  • As the real-time multimedia applications through Internet increase, the bandwidth available to TCP connections is oppressed by the UDP traffic, result in the performance of overall system is extremely deteriorated. Therefore, developing a new transmission protocol is necessary. The TCP-friendly algorithm is an example meeting this necessity. The TCP-friendly (TFRC) is an UDP-based protocol that controls the transmission rate based on the available round transmission time (RTT) and the packet loss rate (PLR). In the data transmission processing, transmission rate is determined based on the conditions of the previous transmission period. If the one-step ahead predicted values of the control factors are available, the performance will be improved significantly. This paper proposes a prediction model of transmission rate control factors that will be used for the transmission rate control, which improves the performance of the networks. The model developed through this research is predicting one-step ahead variables of RTT and PLR. A multiplayer perceptron neural network is used as the prediction model and Levenberg-Marquardt algorithm is used for the training. The values of RTT and PLR were collected using TFRC protocol in the real system. The obtained prediction model is validated using new data set and the results show that the obtained model predicts the factors accurately.

  • PDF

형태 군집화를 이용한 입술 형태 모델과 입술 추출 (Lip Shape Model and Lip Localization using Shape Clustering)

  • 장경식
    • 한국멀티미디어학회논문지
    • /
    • 제6권6호
    • /
    • pp.1000-1007
    • /
    • 2003
  • 이 논문은 입술의 모양을 효과적으로 추출하는 방법을 제안하였다. 입술은 Point Distribution Model에 근거하여 점들의 집합으로 표현하였다. Isodata군집 알고리듬을 이용하여 전체 학습 영상을 입술 형태별로 군집화 하고 주성분 분석법을 사용하여 각 군집에 대한 입술의 형태 모델을 구하였다 추출 결과가 입력 영상의 실제 입술 위치를 올바르게 찾았는지 판정하기 위하여 입술 경계선 주변의 화소값들을 이용한 입술의 경계선 모델을 구하고 이를 반영하는 평가함수를 구성하였다. 형태 차이를 반영하여 얻은 입술 형태 모델을 사용하여 입술을 추출하기 때문에 전체 학습 영상의 평균 모양과 많은 차이를 보이는 입술을 정확하게 추출할 수 있었다. 여러 영상을 대상으로 실험하여 약 92%의 성공률을 얻었다.

  • PDF