• 제목/요약/키워드: Learning Repository

검색결과 107건 처리시간 0.023초

소셜 코딩 사이트를 활용한 소프트웨어 교육 사례 연구 (Case Study on Software Education using Social Coding Sites)

  • 강환수;조진형;김희천
    • 디지털융복합연구
    • /
    • 제15권5호
    • /
    • pp.37-48
    • /
    • 2017
  • 최근 소프트웨어 교육 분야의 컴퓨터방식 사고력은 향후 경제발전의 핵심수단으로 인식되고 있으므로 소프트웨어 교육의 중요성이 매우 커지고 있다. 또한 4차 산업혁명을 주도할 인재는 융합과 창의력이 필요하며, 비판적 사고와 소통, 협업 작업 기반 컴퓨팅방식 사고력은 창의력 교육에 효과적이라고 알려져 있다. 소프트웨어 분야도 관심을 공유하는 개발자들의 협업과 오픈 소스 개발 방법 등의 사회적인 이슈를 반영한 교육이 필요한 시점이다. 소셜 코딩 서비스인 깃허브는 오픈 소프트웨어 개발 과정에서 개발자들 간의 협업 작업을 쉽게 도와주며 커뮤니티 활동을 지원하는 대표적인 사이트이다. 본 연구에서 깃허브를 소프트웨어 교육에 활용하여 소셜 코딩을 위한 기본 학습, 수업에서의 소스와 결과물의 저장 서버로 활용, 개방형 협업 학습 등의 사례를 운영하여, 깃허브 소개, 개인 저장소 사용, 소셜 코딩 활용, 개인 포트폴리오 작성과 평가의 4단계로 구성된 교육 모델을 제안한다. 본 논문의 깃허브를 활용한 소프트웨어 교육은 학생에게 자부심과 함께 흥미와 관심을 유도하여 소프트웨어 교육에 효과적이다.

3차원 탄성파자료의 층서구분을 위한 패치기반 기계학습 방법의 개선 (Improvements in Patch-Based Machine Learning for Analyzing Three-Dimensional Seismic Sequence Data)

  • 이동욱;문혜진;김충호;문성훈;이수환;주형태
    • 지구물리와물리탐사
    • /
    • 제25권2호
    • /
    • pp.59-70
    • /
    • 2022
  • 최근의 연구들을 통해 기계학습은 탄성파 해석 분야에 그 적용 범위를 확장하고 있으며, 탄성파 해석에서 중요한 탄성파 층서 구분을 수행하는 합성곱 신경망들의 개발도 수행되었다. 하지만 지도 학습의 경우 대량의 학습 자료가 필요하며, 비용과 시간의 한계로 탄성파 층서구분의 지도학습은 학습 자료의 부족이 문제가 될 수 있다. 이번 연구에서는 자료 부족 문제를 보완하기위해 탄성파 단면에 패치 분할과 자료증강을 적용하였다. 또한 패치 분할로 손실될 수 있는 공간정보를 제공하기 위해 깊이를 고려할 수 있는 인공 채널을 생성하여 추가하였다. 실험을 위한 학습 모델로 U-Net을 사용하였으며, 층서 구분을 위한 학습 자료가 제공되는 F3 block 자료를 이용하여 학습과 예측 결과에 대한 평가를 수행하였다. 분석 결과 자료증강과 인공 채널의 추가로 패치 기반의 층서 구분 학습 모델을 개선할 수 있음을 확인하였다.

Increasing Splicing Site Prediction by Training Gene Set Based on Species

  • Ahn, Beunguk;Abbas, Elbashir;Park, Jin-Ah;Choi, Ho-Jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권11호
    • /
    • pp.2784-2799
    • /
    • 2012
  • Biological data have been increased exponentially in recent years, and analyzing these data using data mining tools has become one of the major issues in the bioinformatics research community. This paper focuses on the protein construction process in higher organisms where the deoxyribonucleic acid, or DNA, sequence is filtered. In the process, "unmeaningful" DNA sub-sequences (called introns) are removed, and their meaningful counterparts (called exons) are retained. Accurate recognition of the boundaries between these two classes of sub-sequences, however, is known to be a difficult problem. Conventional approaches for recognizing these boundaries have sought for solely enhancing machine learning techniques, while inherent nature of the data themselves has been overlooked. In this paper we present an approach which makes use of the data attributes inherent to species in order to increase the accuracy of the boundary recognition. For experimentation, we have taken the data sets for four different species from the University of California Santa Cruz (UCSC) data repository, divided the data sets based on the species types, then trained a preprocessed version of the data sets on neural network(NN)-based and support vector machine(SVM)-based classifiers. As a result, we have observed that each species has its own specific features related to the splice sites, and that it implies there are related distances among species. To conclude, dividing the training data set based on species would increase the accuracy of predicting splicing junction and propose new insight to the biological research.

명제화된 어트리뷰트 택소노미를 이용하는 나이브 베이스 학습 알고리즘 (Propositionalized Attribute Taxonomy Guided Naive Bayes Learning Algorithm)

  • 강대기;차경환
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2357-2364
    • /
    • 2008
  • 본 논문에서는 명제화된 어트리뷰트 택소노미를 이용하여 간결하고 강건한 분류기를 생성하는 문제를 고려한다. 이 문제를 해결하기 위해 명제화된 어트리뷰트 택소노미(Propositionalized Attribute Taxonomy)를 이용하는 나이브 베이스 학습 알고리즘(Naive Bayes Learner)인 PAT-NBL을 소개한다. PAT-NBL은 명제화된 어트리뷰트들의 택소노미를 선험 지식으로 이용하여 간결하고 정확한 분류기를 귀납적으로 학습하는 알고리즘이다. PAT-NBL은 주어진 택소노미에서 지역적으로 최적의 컷(cut)을 찾아내기 위해 하향식 탐색과 상향식 탐색을 사용한다. 찾아낸 최적의 컷은 명제화된 어트리뷰트 택소노미와 데이터로부터 그에 상응하는 인스턴스 공간(instance space)을 구성 할 수 있게 해준다. University of California-Irvine (UCI) 저장소의 기계학습 벤치마크 데이터에 대한 실험 결과를 보면, 제안된 알고리즘이 표준적인 나이브 베이스 학습 알고리즘에 의해 만들어진 분류기들과 비교해 볼 때, 가끔은 보다 간결하고 더 정확한 분류기를 생성해 낸다는 사실을 알 수 있었다.

분산 유전 알고리즘에서 자동 마이그레이션 조절방법 (Distributed Genetic Algorithm using Automatic Migration Control)

  • 이현정;나용찬;양지훈
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.157-162
    • /
    • 2010
  • 본 논문에서는 분산된 거대한 네트워크상의 데이터에서 유용한 정보를 추출하는 새로운 마이그레이션 조절방법을 이용한 유전 알고리즘을 제안한다. 제안된 알고리즘의 주된 아이디어는 부분 개체군 사이에서 개체들의 이동에 필요한 파라미터들을 적응적으로 결정하는 것이다. 또 이동된 개체들이 새로운 부분 개체군에서 도태되지 않고 적응 할 수 있기 위한 방법을 제시한다. UCI 기계학습 관련 데이터 셋에서 중앙 집중적 단일 유전 알고리즘과 제안된 알고리즘을 비교하기 위해 여섯 개의 데이터를 사용했다. 결론적으로 분산 유전 알고리즘을 적용한 특징 부분 집합이 단일 유전 알고리즘을 적용한 것 보다 좋은 성능을 보였다.

Context-based 클러스터링에 의한 Granular-based RBF NN의 설계 (The Design of Granular-based Radial Basis Function Neural Network by Context-based Clustering)

  • 박호성;오성권
    • 전기학회논문지
    • /
    • 제58권6호
    • /
    • pp.1230-1237
    • /
    • 2009
  • In this paper, we develop a design methodology of Granular-based Radial Basis Function Neural Networks(GRBFNN) by context-based clustering. In contrast with the plethora of existing approaches, here we promote a development strategy in which a topology of the network is predominantly based upon a collection of information granules formed on a basis of available experimental data. The output space is granulated making use of the K-Means clustering while the input space is clustered with the aid of a so-called context-based fuzzy clustering. The number of information granules produced for each context is adjusted so that we satisfy a certain reconstructability criterion that helps us minimize an error between the original data and the ones resulting from their reconstruction involving prototypes of the clusters and the corresponding membership values. In contrast to "standard" Radial Basis Function neural networks, the output neuron of the network exhibits a certain functional nature as its connections are realized as local linear whose location is determined by the values of the context and the prototypes in the input space. The other parameters of these local functions are subject to further parametric optimization. Numeric examples involve some low dimensional synthetic data and selected data coming from the Machine Learning repository.

속성값 기반의 정규화된 로지스틱 회귀분석 모델 (Value Weighted Regularized Logistic Regression Model)

  • 이창환;정미나
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1270-1274
    • /
    • 2016
  • 로지스틱 회귀분석은 통계학 등의 분야에서 예측을 위한 기술 혹은 변수 간의 상관관계를 설명하기 위하여 오랫동안 사용되어 왔다. 이러한 로지스틱 회귀분석 방법에서 현재 각 속성들은 목적 값에 대하여 동일한 중요도를 가지고 있다. 본 연구에서는 이러한 가중치 계산을 좀더 세분화하여 각 속성의 값이 서로 다른 중요도를 가지는 새로운 학습 방법을 제시한다. 알고리즘의 성능을 최대화하는 각 속성값 가중치의 값을 계산하기 위하여 점진적 하강법을 이용하여 개발하였다. 본 연구에서 제안된 방법은 다양한 데이터를 이용하여 실험하였고 속성값 기반 로지스틱 회귀분석 방법은 기존의 로지스틱 회귀분석보다 우수한 학습 능력을 보임을 알 수 있었다.

THE USE OF NUMERICAL MODELS IN SUPPORT OF SITE CHARACTERIZATION AND PERFORMANCE ASSESSMENT STUDIES FOR GEOLOGICAL REPOSITORIES

  • Neerdael, Bernard;Finsterle, Stefan
    • Nuclear Engineering and Technology
    • /
    • 제42권2호
    • /
    • pp.145-150
    • /
    • 2010
  • The paper is describing work being developed in the frame of a 5-year IAEA Coordinated Research Programme (CRP) started in late 2005. Participants gained knowledge of modelling methodologies and experience in the development and use of rather sophisticated simulation tools in support of site characterization and performance assessment calculations. These goals were achieved by a coordinated effort, in which the advantages and limitations of numerical models are examined and demonstrated through a comparative analysis of simplified, illustrative test cases. This knowledge and experience should help them address these issues in their own country's nuclear waste program. Coordination efforts during the first three years of the project aimed at enabling this transfer of expertise and maximizing the learning experience of the participants as a group. This was accomplished by identifying common interests of the participants (i.e., Process Modelling and Total System Performance Assessment methodology), and by defining complementary tasks that are solved by the members. Synthesis of all available results by comparative assessments is planned in the coming months. The project will be completed end of 2010. This paper is summarizing activities up to November 2009.

K-means 클러스터링을 이용한 자율학습을 통한 잠재적간 질환 환자의 분류를 위한 계층 정의 (Identifying Classes for Classification of Potential Liver Disorder Patients by Unsupervised Learning with K-means Clustering)

  • 김준범;오교중;오근휘;최호진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.195-197
    • /
    • 2011
  • This research deals with an issue of preventive medicine in bioinformatics. We can diagnose liver conditions reasonably well to prevent Liver Cirrhosis by classifying liver disorder patients into fatty liver and high risk groups. The classification proceeds in two steps. Classification rules are first built by clustering five attributes (MCV, ALP, ALT, ASP, and GGT) of blood test dataset provided by the UCI Repository. The clusters can be formed by the K-mean method that analyzes multi dimensional attributes. We analyze the properties of each cluster divided into fatty liver, high risk and normal classes. The classification rules are generated by the analysis. In this paper, we suggest a method to diagnosis and predict liver condition to alcoholic patient according to risk levels using the classification rule from the new results of blood test. The K-mean classifier has been found to be more accurate for the result of blood test and provides the risk of fatty liver to normal liver conditions.

Improved marine predators algorithm for feature selection and SVM optimization

  • Jia, Heming;Sun, Kangjian;Li, Yao;Cao, Ning
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권4호
    • /
    • pp.1128-1145
    • /
    • 2022
  • Owing to the rapid development of information science, data analysis based on machine learning has become an interdisciplinary and strategic area. Marine predators algorithm (MPA) is a novel metaheuristic algorithm inspired by the foraging strategies of marine organisms. Considering the randomness of these strategies, an improved algorithm called co-evolutionary cultural mechanism-based marine predators algorithm (CECMPA) is proposed. Through this mechanism, search agents in different spaces can share knowledge and experience to improve the performance of the native algorithm. More specifically, CECMPA has a higher probability of avoiding local optimum and can search the global optimum quickly. In this paper, it is the first to use CECMPA to perform feature subset selection and optimize hyperparameters in support vector machine (SVM) simultaneously. For performance evaluation the proposed method, it is tested on twelve datasets from the university of California Irvine (UCI) repository. Moreover, the coronavirus disease 2019 (COVID-19) can be a real-world application and is spreading in many countries. CECMPA is also applied to a COVID-19 dataset. The experimental results and statistical analysis demonstrate that CECMPA is superior to other compared methods in the literature in terms of several evaluation metrics. The proposed method has strong competitive abilities and promising prospects.