• 제목/요약/키워드: Network Mining

검색결과 1,041건 처리시간 0.024초

Increasing Splicing Site Prediction by Training Gene Set Based on Species

  • Ahn, Beunguk;Abbas, Elbashir;Park, Jin-Ah;Choi, Ho-Jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권11호
    • /
    • pp.2784-2799
    • /
    • 2012
  • Biological data have been increased exponentially in recent years, and analyzing these data using data mining tools has become one of the major issues in the bioinformatics research community. This paper focuses on the protein construction process in higher organisms where the deoxyribonucleic acid, or DNA, sequence is filtered. In the process, "unmeaningful" DNA sub-sequences (called introns) are removed, and their meaningful counterparts (called exons) are retained. Accurate recognition of the boundaries between these two classes of sub-sequences, however, is known to be a difficult problem. Conventional approaches for recognizing these boundaries have sought for solely enhancing machine learning techniques, while inherent nature of the data themselves has been overlooked. In this paper we present an approach which makes use of the data attributes inherent to species in order to increase the accuracy of the boundary recognition. For experimentation, we have taken the data sets for four different species from the University of California Santa Cruz (UCSC) data repository, divided the data sets based on the species types, then trained a preprocessed version of the data sets on neural network(NN)-based and support vector machine(SVM)-based classifiers. As a result, we have observed that each species has its own specific features related to the splice sites, and that it implies there are related distances among species. To conclude, dividing the training data set based on species would increase the accuracy of predicting splicing junction and propose new insight to the biological research.

Advanced discretization of rock slope using block theory within the framework of discontinuous deformation analysis

  • Wang, Shuhong;Huang, Runqiu;Ni, Pengpeng;Jeon, Seokwon
    • Geomechanics and Engineering
    • /
    • 제12권4호
    • /
    • pp.723-738
    • /
    • 2017
  • Rock is a heterogeneous material, which introduces complexity in the analysis of rock slopes, since both the existing discontinuities within the rock mass and the intact rock contribute to the degradation of strength. Rock failure is often catastrophic due to the brittle nature of the material, involving the sliding along structural planes and the fracturing of rock bridge. This paper proposes an advanced discretization method of rock mass based on block theory. An in-house software, GeoSMA-3D, has been developed to generate the discrete fracture network (DFN) model, considering both measured and artificial joints. Measured joints are obtained from the photogrammetry analysis on the excavation face. Statistical tools then facilitate to derive artificial joints within the rock mass. Key blocks are searched to provide guidance on potential reinforcement measures. The discretized blocky system is subsequently implemented into a discontinuous deformation analysis (DDA) code. Strength reduction technique is employed to analyze the stability of the slope, where the factor of safety can be obtained once excessive deformation of slope profile is observed. The combined analysis approach also provides the failure mode, which can be used to guide the choice of strengthening strategy if needed. Finally, an illustrated example is presented for the analysis of a rock slope of 20 m height inclined at $60^{\circ}$ using combined GeoSMA-3D and DDA calculation.

빅데이터 분석을 활용한 인공지능 인식에 관한 연구 (A Study on Recognition of Artificial Intelligence Utilizing Big Data Analysis)

  • 남수태;김도관;진찬용
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.129-130
    • /
    • 2018
  • 빅데이터 분석은 데이터베이스에 잘 정리된 정형 데이터뿐만 아니라 인터넷, 소셜 네트워크 서비스, 모바일 환경에서 생성되는 웹 문서, 이메일, 소셜 데이터 등 비정형 데이터를 효과적으로 분석하는 기술을 말한다. 대부분의 빅데이터 분석 기술 방법들은 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식 등이 이에 해당된다. 글로벌 리서치 기관들은 빅데이터 분석을 2011년 이래로 가장 주목받는 신기술로 지목해오고 있다. 따라서 대부분의 산업에서 기업들은 빅데이터의 적용을 통해 새로운 가치 창출을 위해 노력을 하고 있다. 본 연구에서는 다음 커뮤니케이션의 빅데이터 분석 도구인 소셜 매트릭스를 활용하여 분석하였다. 2018년 5월 19일 시점 1개월 기간을 설정하여 "인공지능" 키워드에 대한 대중들의 인식을 분석하였다. 빅데이터 분석의 결과는 다음과 같다. 첫째, 인공지능에 대한 1위 연관 검색어는 중국(4,122)인 것으로 나타났다. 결과를 바탕으로 연구의 한계와 시사점을 제시하고자 한다.

  • PDF

블로그 월드에서 비명시적 관계를 고려한 정보 파급 모델 (An Information Diffusion Model Considering Non-explicit Relationships in the Blog World)

  • 권용석;김상욱;박선주;임승환;이재범
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.360-364
    • /
    • 2009
  • 블로그 월드에서의 정보의 파급에 대한 기존의 연구들은 블로그들 간에 명시적 관계를 설정하고, 정보가 파급되는 요인으로서 이 관계를 통해서 발생하는 입소문 효과만을 고려하였다. 그러나 본 연구자들의 선행 연구 결과에 따르면 블로그 월드에서 실제 발생하는 정보의 파급 현상들의 약 85%는 비명시적 관계를 통해서 발생한 것이다. 따라서 본 논문에서는 명시적 관계, 비명시적 관계를 통한 정보의 파급을 함께 고려하여 이들 관계를 통한 정보의 파급 현상을 효과적으로 분석할 수 있는 새로운 정보 파급 모델을 제안한다. 또한, 실제 블로그 연결망에서 제안하는 기법과 기존의 기법을 이용하여 정보의 파급 분석의 수행 성능을 비교함으로써 제안하는 기법의 우수성을 검증한다.

표정 분류 연구 (Analysis of facial expression recognition)

  • 손나영;조현선;이소현;송종우
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.539-554
    • /
    • 2018
  • 최근 등장하는 다양한 사물인터넷 기기 혹은 상황인식 기반의 인공지능에서는 사용자와 기기의 상호작용이 중요시 된다. 특히 인간을 대상으로 상황에 맞는 대응을 하기 위해서는 인간의 표정을 실시간으로 인식하여 빠르고 정확한 판단을 내리는 것이 필요하다. 따라서, 보다 빠르고 정확하게 표정을 인식하는 시스템을 구축하기 위해 얼굴 이미지 분석에 대한 많은 연구들이 선행되어 왔다. 본 연구에서는 웹사이트 Kaggle에서 제공한 48*48 8-bit grayscale 이미지 데이터셋을 사용하여 얼굴인식과 표정분류로 구분된 두 단계를 거치는 얼굴표정 자동 인식 시스템을 구축하였고, 이를 기존의 연구와 비교하여 자료 및 방법론의 특징을 고찰하였다. 분석 결과, Face landmark 정보에 주성분분석을 적용하여 단 30개의 주성분만으로도 빠르고 효율적인 예측모형을 얻을 수 있음이 밝혀졌다. LDA, Random forest, SVM, Bagging 중 SVM방법을 적용했을 때 가장 높은 정확도를 보이며, LDA방법을 적용하는 경우는 SVM 다음으로 높은 정확도를 보이며, 매우 빠르게 적합하고 예측하는 것이 가능하다.

빅데이터 기법을 활용한 직업훈련 요구분석 (Analysis of Vocational Training Needs Using Big Data Technique)

  • 성보경;유연우
    • 한국융합학회논문지
    • /
    • 제9권5호
    • /
    • pp.21-26
    • /
    • 2018
  • 본 연구는 고용노동부가 운영하는 직업훈련 통합전산망인 'HRD-NET(http://hrd.go.kr)'을 통해 구직자가 필요로 하는 직업훈련 정보 등이 원활하게 제공되고 있는지를 확인하기 위해 질문게시판을 빅데이터 기법에 가장 최적화된 'R'프로그램을 이용해서 추출하였다. 따라서, 이를 통해 직업훈련제도의 유효성, 적절성, 시각화, 빈도 분석, 연관분석 등을 실시하였으며, 연구결과는 다음과 같다. 첫째, 직업훈련 카드발급 및 동영상 시청, 공인인증서 문제, 등록오류 이 발견되었으며, 둘째, 내일배움카드에 대한 노동관서에서의 관리 및 처리절차가 복잡하고 까다로워 제도개선이 필요한 것으로 나타났다. 또한, 교육훈련의 수강에 있어 훈련직종 및 과정, 훈련기관에 따라서 차등화 된 훈련비 시스템과 환급구조가 애로요인으로 작용하는 것으로 분석되었다. 본 논문 기초로 하여 향후 고용노동부의 훈련시스템 뿐만 아니라 정부부처의 다양한 훈련 전산망시스템에 대한 전반적인 빅데이터 분석을 통한 개선점 등을 연구하고자 한다.

Load-Balancing Rendezvous Approach for Mobility-Enabled Adaptive Energy-Efficient Data Collection in WSNs

  • Zhang, Jian;Tang, Jian;Wang, Zhonghui;Wang, Feng;Yu, Gang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권3호
    • /
    • pp.1204-1227
    • /
    • 2020
  • The tradeoff between energy conservation and traffic balancing is a dilemma problem in Wireless Sensor Networks (WSNs). By analyzing the intrinsic relationship between cluster properties and long distance transmission energy consumption, we characterize three node sets of the cluster as a theoretical foundation to enhance high performance of WSNs, and propose optimal solutions by introducing rendezvous and Mobile Elements (MEs) to optimize energy consumption for prolonging the lifetime of WSNs. First, we exploit an approximate method based on the transmission distance from the different node to an ME to select suboptimal Rendezvous Point (RP) on the trajectory for ME to collect data. Then, we define data transmission routing sequence and model rendezvous planning for the cluster. In order to achieve optimization of energy consumption, we specifically apply the economic theory called Diminishing Marginal Utility Rule (DMUR) and create the utility function with regard to energy to develop an adaptive energy consumption optimization framework to achieve energy efficiency for data collection. At last, Rendezvous Transmission Algorithm (RTA) is proposed to better tradeoff between energy conservation and traffic balancing. Furthermore, via collaborations among multiple MEs, we design Two-Orbit Back-Propagation Algorithm (TOBPA) which concurrently handles load imbalance phenomenon to improve the efficiency of data collection. The simulation results show that our solutions can improve energy efficiency of the whole network and reduce the energy consumption of sensor nodes, which in turn prolong the lifetime of WSNs.

Use of Graph Database for the Integration of Heterogeneous Biological Data

  • Yoon, Byoung-Ha;Kim, Seon-Kyu;Kim, Seon-Young
    • Genomics & Informatics
    • /
    • 제15권1호
    • /
    • pp.19-27
    • /
    • 2017
  • Understanding complex relationships among heterogeneous biological data is one of the fundamental goals in biology. In most cases, diverse biological data are stored in relational databases, such as MySQL and Oracle, which store data in multiple tables and then infer relationships by multiple-join statements. Recently, a new type of database, called the graph-based database, was developed to natively represent various kinds of complex relationships, and it is widely used among computer science communities and IT industries. Here, we demonstrate the feasibility of using a graph-based database for complex biological relationships by comparing the performance between MySQL and Neo4j, one of the most widely used graph databases. We collected various biological data (protein-protein interaction, drug-target, gene-disease, etc.) from several existing sources, removed duplicate and redundant data, and finally constructed a graph database containing 114,550 nodes and 82,674,321 relationships. When we tested the query execution performance of MySQL versus Neo4j, we found that Neo4j outperformed MySQL in all cases. While Neo4j exhibited a very fast response for various queries, MySQL exhibited latent or unfinished responses for complex queries with multiple-join statements. These results show that using graph-based databases, such as Neo4j, is an efficient way to store complex biological relationships. Moreover, querying a graph database in diverse ways has the potential to reveal novel relationships among heterogeneous biological data.

Experimental and modelling study of clay stabilized with bottom ash-eco sand slurry pile

  • Subramanian, Sathyapriya;Arumairaj, P.D.;Subramani, T.
    • Geomechanics and Engineering
    • /
    • 제12권3호
    • /
    • pp.523-539
    • /
    • 2017
  • Clay soils are typical for their swelling properties upon absorption of water during rains and development of cracks during summer time owing to the profile desorption of water through the inter-connected soil pores by water vapour diffusion leading to evaporation. This type of unstable soil phenomenon by and large poses a serious threat to the strength and stability of structures when rest on such type of soils. Even as lime and cement are extensively used for stabilization of clay soils it has become imperative to find relatively cheaper alternative materials to bring out the desired properties within the clay soil domain. In the present era of catastrophic environmental degradation as a side effect to modernized manufacturing processes, industrialization and urbanization the creative idea would be treating the waste products in a beneficial way for reuse and recycling. Bottom ash and ecosand are construed as a waste product from cement industry. An optimal combination of bottom ash-eco sand can be thought of as a viable alternative to stabilize the clay soils by means of an effective dispersion dynamics associated with the inter connected network of pore spaces. A CATIA model was created and imported to ANSYS Fluent to study the dispersion dynamics. Ion migration from the bottom ash-ecosand pile was facilitated through natural formation of cracks in clay soil subjected to atmospheric conditions. Treated samples collected at different curing days from inner and outer zones at different depths were tested for, plasticity index, Unconfined Compressive Strength (UCS), free swell index, water content, Cation Exchange Capacity (CEC), pH and ion concentration to show the effectiveness of the method in improving the clay soil.

트위터를 활용한 감성 기반의 영화 유사도 측정 (Measuring Similarity Between Movies Based on Sentiment of Tweets)

  • 김경민;김동윤;이지형
    • 한국지능시스템학회논문지
    • /
    • 제24권3호
    • /
    • pp.292-297
    • /
    • 2014
  • 최근 소셜 네트워크 서비스가 보편화되면서, 이를 활용하여 사람들의 의견이나 감성 등을 파악하기 위한 감성분석 연구가 다양한 분야 진행되고 있다. 기존의 영화 관련 연구의 경우, 대부분이 영화평에 대해 단순 긍/부정으로 감성분석을 하여, 영화에 대한 선호도를 파악하는 데 그쳤다. 사람의 감성은 단순 긍/부정이 아닌 다양한 감성으로 분류될 수 있는데 반해, 이분법적 감성분석은 영화의 평점 정보에서 손쉽게 얻을 수 있는 선호도와 유사한 분석을 하는데 그친다. 따라서 영화의 평점보다 다양하고 유용한 정보를 얻기 위해서는, 영화 리뷰를 세분화된 감성으로 분석하여 영화에 대해 느낀 감성을 다양한 기준으로 분류할 필요가 있다. 본 논문에서는 Thayer 모델을 기반으로 감성 분류 기준을 세우고, 수집한 영화 관련 트윗을 이용하여 각 영화에 대해 대중이 느끼는 감성을 분석한다. 분석된 영화에 대한 감성 비율을 유클리드거리, 코사인유사도, 피어슨 상관계수를 이용하여 영화간의 유사도를 측정하였다. IMDB에서 제공하는 유사 영화 정보를 바탕으로 본 논문에서 제안하는 방식의 유용성을 검증하였다.