• 제목/요약/키워드: multimedia data mining

검색결과 84건 처리시간 0.032초

Agriculture Big Data Analysis System Based on Korean Market Information

  • Chuluunsaikhan, Tserenpurev;Song, Jin-Hyun;Yoo, Kwan-Hee;Rah, Hyung-Chul;Nasridinov, Aziz
    • Journal of Multimedia Information System
    • /
    • 제6권4호
    • /
    • pp.217-224
    • /
    • 2019
  • As the world's population grows, how to maintain the food supply is becoming a bigger problem. Now and in the future, big data will play a major role in decision making in the agriculture industry. The challenge is how to obtain valuable information to help us make future decisions. Big data helps us to see history clearer, to obtain hidden values, and make the right decisions for the government and farmers. To contribute to solving this challenge, we developed the Agriculture Big Data Analysis System. The system consists of agricultural big data collection, big data analysis, and big data visualization. First, we collected structured data like price, climate, yield, etc., and unstructured data, such as news, blogs, TV programs, etc. Using the data that we collected, we implement prediction algorithms like ARIMA, Decision Tree, LDA, and LSTM to show the results in data visualizations.

Machine Learning Techniques for Speech Recognition using the Magnitude

  • Krishnan, C. Gopala;Robinson, Y. Harold;Chilamkurti, Naveen
    • Journal of Multimedia Information System
    • /
    • 제7권1호
    • /
    • pp.33-40
    • /
    • 2020
  • Machine learning consists of supervised and unsupervised learning among which supervised learning is used for the speech recognition objectives. Supervised learning is the Data mining task of inferring a function from labeled training data. Speech recognition is the current trend that has gained focus over the decades. Most automation technologies use speech and speech recognition for various perspectives. This paper demonstrates an overview of major technological standpoint and gratitude of the elementary development of speech recognition and provides impression method has been developed in every stage of speech recognition using supervised learning. The project will use DNN to recognize speeches using magnitudes with large datasets.

멀티미디어 추천시스템을 위한 속성 생성 기법 (A Feature Generation Method for Multimedia Recommendation System)

  • 김형일;엄정국
    • 한국멀티미디어학회논문지
    • /
    • 제11권2호
    • /
    • pp.257-268
    • /
    • 2008
  • 멀티미디어 추천시스템은 사용자의 선호도를 분석하여 멀티미디어 상품을 사용자에게 추천하는 시스템이다. 다양한 추천 기법들에서 가장 널리 사용되는 기법은 협동적 여과 방식이다. 그러나 협동적 여과는 정보 부족 문제와 초기 시작 문제가 존재한다. 선호도 정보가 적게 존재하면 유사 사용자 추출이 어려우며, 이러한 문제는 시스템을 처음 사용하는 새로운 사용자에게 더욱 심각한 문제를 발생시킨다. 본 논문에서는 정보 부족 문제를 해결하고 추천 정확도를 향상시키기 위해 사용자와 상품에 대한 속성 생성 기법을 제안한다. 본 논문에서 제안한 기법은 속성의 분포를 이용하여 추가 속성을 생성하고, 추가 속성을 포함한 변형된 데이터를 이용하여 상품을 추천한다. 여러 실험을 통해 제안된 기법의 효과를 확인하였다.

  • PDF

Analyzing Operation Deviation in the Deasphalting Process Using Multivariate Statistics Analysis Method

  • Park, Joo-Hwang;Kim, Jong-Soo;Kim, Tai-Suk
    • 한국멀티미디어학회논문지
    • /
    • 제17권7호
    • /
    • pp.858-865
    • /
    • 2014
  • In the case of system like MES, various sensors collect the data in real time and save it as a big data to monitor the process. However, if there is big data mining in distributed computing system, whole processing process can be improved. In this paper, system to analyze the cause of operation deviation was built using the big data which has been collected from deasphalting process at the two different plants. By applying multivariate statistical analysis to the big data which has been collected through MES(Manufacturing Execution System), main cause of operation deviation was analyzed. We present the example of analyzing the operation deviation of deasphalting process using the big data which collected from MES by using multivariate statistics analysis method. As a result of regression analysis of the forward stepwise method, regression equation has been found which can explain 52% increase of performance compare to existing model. Through this suggested method, the existing petrochemical process can be replaced which is manual analysis method and has the risk of being subjective according to the tester. The new method can provide the objective analysis method based on numbers and statistic.

사용자의 재생 시간을 이용한 멀티미디어 추천 시스템 (A Multimedia Recommender System Using User Playback Time)

  • 권형준;정동근;홍광석
    • 인터넷정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.111-121
    • /
    • 2009
  • 본 논문에서는 사용자의 재생 시간을 이용한 멀티미디어 추천 시스템을 제안한다. 제안하는 시스템은 사용자에 의해 요청된 멀티미디어 콘텐츠와 그것이 재생된 시간을 기록하고, 기록된 데이터를 가지고 퍼지 연관규칙 탐사 방법을 이용하여 사용자가 관심을 보일 만한 멀티미디어 콘텐츠와 사용자에 의해 재생된 시간에 기반하여 선호 등급을 예측한다. 제안하는 방법은 사용자의 선호 정보를 별도로 입력 받지 않고도 예측된 선호 등급에 따라서 추천 목록에 대한 선호정도를 예측할 수 있으며, 거짓된 선호 정보의 유입을 방지하는 장점이 있다. 유효성 검증을 위해 제안하는 시스템을 구현하고 실험한 결과, 사용자로부터 입력 받은 선호 정보를 포함하지 않은 트랜잭션으로부터 사용자가 높은 선호도를 보일 것이라 예상되는 추천 목록을 선별하여 추천 시스템에 적용할 수 있음을 확인하였다.

  • PDF

대용량 웹 로그 마이닝 및 공격탐지를 위한 B-트리 인덱스 벡터 기반 고속 검색 기법 (High-Speed Search Mechanism based on B-Tree Index Vector for Huge Web Log Mining and Web Attack Detection)

  • 이형우;김태수
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1601-1614
    • /
    • 2008
  • 최근 대부분의 인터넷 환경이 쳅 기반 시스템으로 발전하면서 웹 서비스 사용자 수는 꾸준히 증가하고 있다. 따라서 일반 사용자가 대형 포털 사이트 웹 서버 접속시 생성되는 로그 정보를 분석하여 웹 서버에 대한 공격을 탐지하거나 웹 마이닝 기술과 접목하기 위해서는 대용량의 웹 로그 정보에 대한 효율적인 분석 기법이 필요하다. 기존 웹 로그 전처리 기법은 로그 문자열의 순차적인 탐색을 수행하므로 대용량의 웹 로그 고속화 처리에 적합하지 않다. 본 연구에서는 대용량 웹 로그 정보에 대해 B-트리 인덱싱 벡터 구조를 이용하여 필드별 분류 및 고속 검색 알고리즘을 개발하였다 이를 통해 효율적으로 대용량 로고로부터 효율적인 세션 분석 기능과 개선된 검색 성능을 제공할 수 있었으며 웹 서버에 대한 공격 탐지에도 활용할 수 있었다.

  • PDF

규칙유도기법을 이용한 이러닝 시스템의 재이용의도 영향요인 분석 및 예측에 관한 연구 (A study on the Analysis and Forecast of Effect Factors in e-Learning Reuse Intention Using Rule Induction Techniques)

  • 배재권;김진화;정화민
    • Journal of Information Technology Applications and Management
    • /
    • 제17권2호
    • /
    • pp.71-90
    • /
    • 2010
  • Electronic learning(or e-learning) has created hype for companies, universities, and other educational institutions. It has led to the phenomenal growth in the use of web-based learning and experimentation with multimedia, video conferencing, and internet-based technologies. Many researchers are interested in the factors that affect to the performance of e-learning or e-learning services. In this sense, this study is aimed at proposing e-learning system reuse prediction models in which e-learner intention to reuse influence factors(i.e., system accessibility, system stability, information clarity, information validity, self-regulated efficacy, computer self-efficacy, perceived usefulness, perceived ease of use, flow, and parental expectation) affect e-learner intention to reuse positively. A web survey was conducted for the full members of the e-learning education institute A in Seoul, Republic of Korea, an exclusive e-learning company that provides real time video lectures via the desktop conferencing system. The web survey was conducted for 20 days from November 5, 2009, through the e-learning web site of the company A. In this study, three data mining techniques were used : the multivariate discriminant analysis, CART, and C5.0 algorithm. This study was conducted to provide the e-learning service providers, e-learning operators, and contents developers with marketing and management strategies for improving the e-learning service companies, based on the data mining analysis results.

  • PDF

A Web-Based Domain Ontology Construction Modelling and Application in the Wetland Domain

  • Xing, Jun;Han, Min
    • 한국멀티미디어학회논문지
    • /
    • 제10권6호
    • /
    • pp.754-759
    • /
    • 2007
  • Methodology of ontology building based on Web resources will not only reduce significantly the ontology construction period, but also enhance the quality of the ontology. Remarkable progress has been achieved in this regard, but they encounter similar difficulties, such as the Web data extraction and knowledge acquisition. This paper researches on the characteristics of ontology construction data, including dynamics, largeness, variation and openness and other features, and the fundamental issue of ontology construction - formalized representation method. Then, the key technologies used in and the difficulties with ontology construction are summarized. A software Model-OntoMaker (Ontology Maker) is designed. The model is innovative in two regards: (1) the improvement of generality: the meta learning machine will dynamically pick appropriate ontology learning methodologies for data of different domains, thus optimizing the results; (2) the merged processing of (semi-) structural and non-structural data. In addition, as known to all wetland researchers, information sharing is vital to wetland exploitation and protection, while wetland ontology construction is the basic task for information sharing. OntoMaker constructs the wetland ontologies, and the model in this work can also be referred to other environmental domains.

  • PDF

K-means based Clustering Method with a Fixed Number of Cluster Members

  • Yi, Faliu;Moon, Inkyu
    • 한국멀티미디어학회논문지
    • /
    • 제17권10호
    • /
    • pp.1160-1170
    • /
    • 2014
  • Clustering methods are very useful in many fields such as data mining, classification, and object recognition. Both the supervised and unsupervised grouping approaches can classify a series of sample data with a predefined or automatically assigned cluster number. However, there is no constraint on the number of elements for each cluster. Numbers of cluster members for each cluster obtained from clustering schemes are usually random. Thus, some clusters possess a large number of elements whereas others only have a few members. In some areas such as logistics management, a fixed number of members are preferred for each cluster or logistic center. Consequently, it is necessary to design a clustering method that can automatically adjust the number of group elements. In this paper, a k-means based clustering method with a fixed number of cluster members is proposed. In the proposed method, first, the data samples are clustered using the k-means algorithm. Then, the number of group elements is adjusted by employing a greedy strategy. Experimental results demonstrate that the proposed clustering scheme can classify data samples efficiently for a fixed number of cluster members.

데이터 마이닝을 활용한 효소 대사물의 분석 (Enzyme Metabolite Analysis Using Data Mining)

  • 정희택;박춘구
    • 한국전자통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.969-982
    • /
    • 2016
  • 최근 천연물로부터 신약 후보물질을 개발하려는 연구가 활발히 이루어지고 있다. 인체 내에서 천연물은 주로 효소에 의해 대사된다. 본 연구는 화합물의 인체내 대사반응과 주로 관련된 효소에 의한 대사반응의 특징을 연관규칙마이닝을 활용하여 분석한다. 화합물이 인체 내에서 효소 대사반응과 관련된 데이터를 BRENDA(: BRaunschweig ENzyme DAtabase)로부터 수집하였다. 수집된 데이터를 효소대사반응의 기본 틀에 근거하여, 대사물들을 기질대사물, 생성대사물, 억제대사물, 그리고 활성대사물들로 구분한다. 이러한 대사물들로 이루어진 기질대사물 트랜잭션, 생성대사물 트랜잭션, 그리고 모든 대사물들을 포함한 효소반응트랜잭션들을 구성하였다. 또한 종 정보를 반영한 6개의 트랜잭션들로 구성하였다. 연관규칙 마이닝을 활용하여 6개의 트랜잭션에서 빈발대사물 및 패턴을 분석하였다. 또한 대사물들 사이의 관련성을 분석하였다. 그 결과 효소대사반응에 참여하는 대사물들의 분포와 패턴을 식별할 수 있었다. 더욱이 기질에만 속하는 순수 기질대사물들을 식별하였고 이들 대부분이 아주 낮은 지지도임을 확인할 수 있었다. 연구결과는 순수 기질대사물은 효과적인 대사변환 예측 모델 개발에 활용될 수 있다.