• 제목/요약/키워드: classification modeling

검색결과 600건 처리시간 0.029초

기계 학습 방법을 이용한 활동 프로파일 기반의 스마트 시니어 분류 모델 개발 (Development of Smart Senior Classification Model based on Activity Profile Using Machine Learning Method)

  • 윤유동;양영욱;지혜성;임희석
    • 한국융합학회논문지
    • /
    • 제8권1호
    • /
    • pp.25-34
    • /
    • 2017
  • 최근 스마트폰의 보급 및 웹 서비스의 도입으로 온라인 사용자들은 대규모의 콘텐츠를 시간과 장소에 관계없이 접할 수 있게 되었다. 그러나 사용자들은 대규모의 콘텐츠 사이에서 원하는 콘텐츠를 찾는 데 어려움을 겪게 되었다. 이러한 문제를 해결하기 위해 다양한 분야에서 사용자 모델링 및 추천 시스템에 대한 연구가 활발하게 수행되었다. 그러나 정보 환경의 변화에 따른 시니어 계층의 적극적인 변화에도 불구하고 시니어 계층에 초점을 맞춘 사용자 모델링 및 추천 시스템에 대한 연구는 매우 부족한 실정이다. 이에 본 논문에서는 기계 학습 방법을 기반으로 스마트 시니어 계층의 선호도를 파악할 수 있는 모델링 방법을 제안하고, 스마트 시니어 분류 모델을 개발한다. 이 결과, 스마트 시니어 계층의 선호도를 파악할 수 있을 뿐만 아니라 스마트 시니어 분류 모델 개발을 통해 시니어 사용자에게 가장 적합한 활동 및 콘텐츠를 제공하는 콘텐츠 추천 연구에 대한 발판을 마련하였다.

구조방정식 모형에 의한 독서 플로우의 유형 분류와 검사도구 개발에 관한 연구 (A Study on Type Classification and Test Instruments Development of Reading Flow Using Structure Modeling)

  • 이병기
    • 한국도서관정보학회지
    • /
    • 제42권1호
    • /
    • pp.29-49
    • /
    • 2011
  • 사서교사가 독서교육을 성공적으로 수행하기 위해서는 독서에 관한 학생들의 특성을 파악하고 있어야 한다. 그러나 현재 학생들의 독서 관련 특성을 파악하기 위한 도구가 미흡한 실정이다. 이에 본 연구에서는 구조방정식 모형을 이용하여 독서 플로우 유형을 분류하고 독서 플로우 유형을 측정할 수 있는 검사도구를 제안하였다. 독서 플로우의 유형을 분류하기 위해서 4개의 연구모형(워너, 던과 던, MBTI, flow 구성모형)을 설정하고 각 모형을 AMOS 구조방정식 모형에 대입하여 적합성을 검증하였다. 그 결과 4개의 연구모형 중 flow 구성 모형이 가장 적합한 모형임을 확인하였다. flow 구성 모형을 바탕으로 독서 플로우 유형을 분류하고 독서 플로우 유형 검사를 위한 도구를 제안하였다. 제안한 독서 플로우 유형은 4 차원 16 가지의 세부 유형으로 구성되고 있고 검사도구는 4개 영역, 28개 문항으로 설정하였다. 본 연구에서 사용한 데이터는 본 연구자의 선행연구를 위해 수집한 1,836개의 데이터를 재사용하였다.

교수-학습지원시스템에서 학습자 질의응답 자동분류를 위한 토픽 모델링 (Topic modeling for automatic classification of learner question and answer in teaching-learning support system)

  • 김경록;송혜진;문남미
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권2호
    • /
    • pp.339-346
    • /
    • 2017
  • 기사와 댓글, 질의응답과 같은 비정형 데이터에 기반한 텍스트 분석에 대한 관심이 증가하고 있다. 이는 사람들의 견해인 비정형 텍스트 데이터로부터 특징을 파악하고, 평가, 예측 및 추천에 활용할 수 있기 때문이다. TEL 분야에서도 MOOC 서비스의 확대로 교수학습지원시스템 기반 토론, 질의응답 서비스를 자동화하기 위한 관심이 증가하고 있다. 시스템에 축적된 질의응답 데이터를 기반으로 질의 토픽을 생성하고, 새로운 질의에 대해 토픽을 자동분류하기 위해서이다. 따라서 본 연구에서는 새로운 질의 토픽을 자동분류 할 수 있도록 LDA기법을 활용한 토픽 모델링을 제안하고자 한다. 이를 바탕으로 질의 토픽 사전을 생성하고 새로운 질의에 대해 토픽을 자동분류 할 수 있다. 일부 질의에서는 0.7 이상의 높은 자동 분류를 보였으며, 새로운 질의가 여러 토픽에 포함될수록 좀 더 좋은 자동분류 결과를 보였다.

Semantic Segmentation 기반 딥러닝을 활용한 건축 Building Information Modeling 부재 분류성능 개선 방안 (A Proposal of Deep Learning Based Semantic Segmentation to Improve Performance of Building Information Models Classification)

  • 이고은;유영수;하대목;구본상;이관훈
    • 한국BIM학회 논문집
    • /
    • 제11권3호
    • /
    • pp.22-33
    • /
    • 2021
  • In order to maximize the use of BIM, all data related to individual elements in the model must be correctly assigned, and it is essential to check whether it corresponds to the IFC entity classification. However, as the BIM modeling process is performed by a large number of participants, it is difficult to achieve complete integrity. To solve this problem, studies on semantic integrity verification are being conducted to examine whether elements are correctly classified or IFC mapped in the BIM model by applying an artificial intelligence algorithm to the 2D image of each element. Existing studies had a limitation in that they could not correctly classify some elements even though the geometrical differences in the images were clear. This was found to be due to the fact that the geometrical characteristics were not properly reflected in the learning process because the range of the region to be learned in the image was not clearly defined. In this study, the CRF-RNN-based semantic segmentation was applied to increase the clarity of element region within each image, and then applied to the MVCNN algorithm to improve the classification performance. As a result of applying semantic segmentation in the MVCNN learning process to 889 data composed of a total of 8 BIM element types, the classification accuracy was found to be 0.92, which is improved by 0.06 compared to the conventional MVCNN.

Tree size determination for classification ensemble

  • Choi, Sung Hoon;Kim, Hyunjoong
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권1호
    • /
    • pp.255-264
    • /
    • 2016
  • Classification is a predictive modeling for a categorical target variable. Various classification ensemble methods, which predict with better accuracy by combining multiple classifiers, became a powerful machine learning and data mining paradigm. Well-known methodologies of classification ensemble are boosting, bagging and random forest. In this article, we assume that decision trees are used as classifiers in the ensemble. Further, we hypothesized that tree size affects classification accuracy. To study how the tree size in uences accuracy, we performed experiments using twenty-eight data sets. Then we compare the performances of ensemble algorithms; bagging, double-bagging, boosting and random forest, with different tree sizes in the experiment.

지하철 구조물 유지관리 시스템을 위한 BIM 개발 (Development of BIM for a Maintenance System of Subway Infrastructures)

  • 심창수;김성욱;송현혜;윤누리
    • 한국BIM학회 논문집
    • /
    • 제1권1호
    • /
    • pp.6-12
    • /
    • 2011
  • 시설물 전생애주기에 걸쳐 정보가 공유되고 피드백 될 수 있는 BIM(Building Information Modeling) 기술의 등장은 유지보수 관리자들에 게 가장 필요한 유지관리점검 도구의 의미를 지님과 동시에, 정보모델을 기반으로 주요 기술영역 및 사업주체간 원활한 의사소통이 가능해지도록 한다. 효율적인 지하철 터널의 유지관리를 위해서는 체계적으로 조직된 데이터가 필수적이다. 이 논문에서는 건설정보분류체계에 기반하고 유지관리 업무의 점검 단위를 고려한 분류체계를 개발하였다. 이를 통해 기존의 유지관리 프로세서에 정보모델링 프로세서를 도입하여 유지관리 작업의 흐름을 최적화하고 표준화하는 방안을 제안하였다. 또한 기존 유지관리 업무 프로세서의 불필요한 절차 및 시간을 효율적으로 절감하여 시설물의 총 생애주기비용을 절감하고 객체의 수선교체시 소요되는 시간을 절감하였다. 게다가 터널정보 모델링 프로세서 모델을 유지관리 정보의 이력관리에 도입하여 기존 정보관리보다 체계적인 관리가 가능하도록 하였다.

교량 구성요소의 기능적 특징을 고려한 PLIB 기반 제품 분류체계 - 형상 정보모델링을 중심으로 - (A PLIB-based New Bridge Breakdown System Considering Functional Properties - Focused on Geometric Modeling -)

  • 이상호;이혁진;박상일;최규원;권태호
    • 한국전산구조공학회논문집
    • /
    • 제29권4호
    • /
    • pp.335-345
    • /
    • 2016
  • 기존의 건설정보 분류체계는 객체들 간의 관계성 표현 제한으로 인해 교량 구조물에 그대로 적용하기에는 한계가 있다. 본 연구에서는 이러한 문제점을 보완하기 위하여 분류체계 기술의 국제표준인 PLIB Part 42를 활용하여 이종의 도메인 간 정보공유의 기본이 되는 형상 정보모델링에 특화된 교량 구성요소의 제품 분류체계를 제시하였다. 특히, 제안한 분류체계는 교량 구성요소의 기능적 특징을 고려한 부품의 의미적 정보가 포함 가능하도록 하였다. 또한 본 연구에서 제안한 분류체계를 실제 모델링에 활용하기 위한 기본 프레임워크를 제안하고 이를 활용한 교량 모델을 생성함으로써 제안한 분류체계가 실무에서 활용 가능함을 보였다.

학습률 적용에 따른 흉부영상 폐렴 유무 분류 비교평가 (Comparative Evaluation of Chest Image Pneumonia based on Learning Rate Application)

  • 김지율;예수영
    • 한국방사선학회논문지
    • /
    • 제16권5호
    • /
    • pp.595-602
    • /
    • 2022
  • 본 연구는 딥러닝을 이용한 흉부 X선 폐렴 영상에 대하여 정확하고 효율적인 의료영상의 자동진단을 위해서 가장 효율적인 학습률을 제시하고자 하였다. Inception V3 딥러닝 모델에 학습률을 0.1, 0.01, 0.001, 0.0001로 각각 설정한 후 3회 딥러닝 모델링을 수행하였다. 그리고 검증 모델링의 평균 정확도 및 손실 함수 값, Test 모델링의 Metric을 성능평가 지표로 설정하여 딥러닝 모델링의 수행 결과로 획득한 결과값의 3회 평균값으로 성능을 비교 평가하였다. 딥러닝 검증 모델링 성능평가 및 Test 모델링 Metric에 대한 성능평가의 결과, 학습률 0.001을 적용한 모델링이 가장 높은 정확도와 우수한 성능을 나타내었다. 이러한 이유로 본 논문에서는 딥러닝 모델을 이용한 흉부 X선 영상에 대한 폐렴 유무 분류 시 학습률을 0.001로 적용할 것을 권고한다. 그리고 본 논문에서 제시하는 학습률의 적용을 통한 딥러닝 모델링 시 흉부 X선 영상에 대한 폐렴 유무 분류에 대한 인력의 보조적인 역할을 수행할 수 있을 거라고 판단하였다. 향후 딥러닝을 이용한 폐렴 유무 진단 분류 연구가 계속해서 진행될 시, 본 논문의 논문 연구 내용은 기초자료로 활용될 수 있다고 여겨지며 나아가 인공지능을 활용한 의료영상 분류에 있어 효율적인 학습률 선택에 도움이 될 것으로 기대된다.

Application of Topic Modeling Techniques in Arabic Content: A Systematic Review

  • Maram Alhmiyani;Huda Alhazmi
    • International Journal of Computer Science & Network Security
    • /
    • 제23권6호
    • /
    • pp.1-12
    • /
    • 2023
  • With the rapid increase of user generated data on digital platforms, the task of categorizing and classifying theses huge data has become difficult. Topic modeling is an unsupervised machine learning technique that can be used to get a summary from a large collection of documents. Topic modeling has been widely used in English content, yet the application of topic modeling in Arabic language is limited. Therefore, the aim of this paper is to provide a systematic review of the application of topic modeling algorithms in Arabic content. Using a well-known and trusted databases including ScienceDirect, IEEE Xplore, Springer Link, and Google Scholar. Considering the publication date from 2012 to 2022, we got 60 papers. After refining the papers based on predefined criteria, we resulted in 32 papers. Our result show that unfortunately the application of topic modeling techniques in Arabic content is limited.

Application of Multispectral Remotely Sensed Imagery for the Characterization of Complex Coastal Wetland Ecosystems of southern India: A Special Emphasis on Comparing Soft and Hard Classification Methods

  • Shanmugam, Palanisamy;Ahn, Yu-Hwan;Sanjeevi , Shanmugam
    • 대한원격탐사학회지
    • /
    • 제21권3호
    • /
    • pp.189-211
    • /
    • 2005
  • This paper makes an effort to compare the recently evolved soft classification method based on Linear Spectral Mixture Modeling (LSMM) with the traditional hard classification methods based on Iterative Self-Organizing Data Analysis (ISODATA) and Maximum Likelihood Classification (MLC) algorithms in order to achieve appropriate results for mapping, monitoring and preserving valuable coastal wetland ecosystems of southern India using Indian Remote Sensing Satellite (IRS) 1C/1D LISS-III and Landsat-5 Thematic Mapper image data. ISODATA and MLC methods were attempted on these satellite image data to produce maps of 5, 10, 15 and 20 wetland classes for each of three contrast coastal wetland sites, Pitchavaram, Vedaranniyam and Rameswaram. The accuracy of the derived classes was assessed with the simplest descriptive statistic technique called overall accuracy and a discrete multivariate technique called KAPPA accuracy. ISODATA classification resulted in maps with poor accuracy compared to MLC classification that produced maps with improved accuracy. However, there was a systematic decrease in overall accuracy and KAPPA accuracy, when more number of classes was derived from IRS-1C/1D and Landsat-5 TM imagery by ISODATA and MLC. There were two principal factors for the decreased classification accuracy, namely spectral overlapping/confusion and inadequate spatial resolution of the sensors. Compared to the former, the limited instantaneous field of view (IFOV) of these sensors caused occurrence of number of mixture pixels (mixels) in the image and its effect on the classification process was a major problem to deriving accurate wetland cover types, in spite of the increasing spatial resolution of new generation Earth Observation Sensors (EOS). In order to improve the classification accuracy, a soft classification method based on Linear Spectral Mixture Modeling (LSMM) was described to calculate the spectral mixture and classify IRS-1C/1D LISS-III and Landsat-5 TM Imagery. This method considered number of reflectance end-members that form the scene spectra, followed by the determination of their nature and finally the decomposition of the spectra into their endmembers. To evaluate the LSMM areal estimates, resulted fractional end-members were compared with normalized difference vegetation index (NDVI), ground truth data, as well as those estimates derived from the traditional hard classifier (MLC). The findings revealed that NDVI values and vegetation fractions were positively correlated ($r^2$= 0.96, 0.95 and 0.92 for Rameswaram, Vedaranniyam and Pitchavaram respectively) and NDVI and soil fraction values were negatively correlated ($r^2$ =0.53, 0.39 and 0.13), indicating the reliability of the sub-pixel classification. Comparing with ground truth data, the precision of LSMM for deriving moisture fraction was 92% and 96% for soil fraction. The LSMM in general would seem well suited to locating small wetland habitats which occurred as sub-pixel inclusions, and to representing continuous gradations between different habitat types.