• 제목/요약/키워드: matrix learning

검색결과 354건 처리시간 0.027초

X-means 확장을 통한 효율적인 집단 개수의 결정 (Extensions of X-means with Efficient Learning the Number of Clusters)

  • 허경용;우영운
    • 한국정보통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.772-780
    • /
    • 2008
  • K-means는 알고리즘의 단순함과 효율적인 구현이 가능함으로 인해 군집화를 위해 현재까지 널리 사용되는 방법 중 하나이다. 하지만 K-means는 집단의 개수가 사전에 결정되어야 하는 근본적인 문제점이 있다. 이 논문에서는 BIC(Bayesian information criterion) 점수를 이용하여 효율적으로 집단의 개수를 추정할 수 있는 X-means 알고리즘을 확장한 두 가지 알고리즘을 제안한다. 제안한 방법은 기본적으로 X-means 방법을 따르면서 집단이 임의의 분산 행렬을 가질 수 있도록 함으로써 X-means 알고리즘이 원형 집단만을 허용함에 따른 over-fitting을 개선한다. 제안한 방법은 하나의 집단에서 시작하여 계속해서 집단을 나누어가는 하향식 방법으로, BIC score를 최대로 증가시키는 집단을 분할해 나간다. 제안한 알고리즘은 Modified X-means(MX-means)와 Generalized X-means(GX-means)의 두 가지로, 전자는 K-means 알고리즘을, 후자는 EM 알고리즘을 사용하여 현재 주어진 집단들에서 최적의 분할을 찾아낸다. MX-means는 GX-means보다 그 속도에서 앞서지만 집단들이 중첩 된 경우에는 올바른 집단을 찾아낼 수 없는 단점이 있다. GX-means는 실행 속도가 느린 단점이 있지만 집단들이 중첩된 경우에도 안정적으로 집단들을 찾아낼 수 있다. 이러한 점들은 일련의 실험을 통해서 확인할 수 있으며, 제안한 방법들이 기존의 방법들에 비해 나은 성능을 보임을 확인할 수 있다.

딥러닝 얼굴인식 기술을 활용한 방문자 출입관리 시스템 설계와 구현 (Design and Implementation of Visitor Access Control System using Deep learning Face Recognition)

  • 허석렬;김강민;이완직
    • 디지털융복합연구
    • /
    • 제19권2호
    • /
    • pp.245-251
    • /
    • 2021
  • 1,2인 가구가 꾸준하게 늘어나고 있는 추세에 비어 있는 시간대에 집을 방문하는 외부인이 누구인지 확인하고 싶은 요구가 증가하고 있다. 얼굴인식 기술은 많은 연구를 통해 여러 가지 모델이 제안되었는데 OpenCV의 Harr Cascade와 Dlib의 Hog가 대표적인 오픈소스 모델이다. 두 모델은 사용 환경에 따른 장단점을 가지고 있는데, 본 연구에서 초점을 둔 실내 현관 앞과 제한된 거리에서는 Dlib의 Hog가 강점을 가진다. 본 논문에서는 딥러닝 오픈 소스인 Dlib에 기반을 둔 얼굴인식 방문자 출입관리 시스템을 설계하고 구현하였다. 전체 시스템은 프론트 모듈과 서버모듈, 모바일모듈로 구성되며 세부적으로는 얼굴등록, 얼굴인식, 실시간 방문자 확인 및 원격제어, 동영상 저장 기능을 포함한다. 인터넷에서 공개된 사진을 이용하여 거리임계 값의 변화에 따른 정밀도, 특이도, 정확도를 구하고 선행연구 결과와 비교하였다. 실험 결과 구현된 시스템이 정상적으로 동작하는 것을 확인 하였으며 Dlib에서 보고한 것과 비슷한 결과를 보이는 것을 확인 하였다.

저선량 흉부 CT를 이용한 VGGNet 폐기종 검출 유용성 평가 (Effectiveness of the Detection of Pulmonary Emphysema using VGGNet with Low-dose Chest Computed Tomography Images)

  • 김두빈;박영준;홍주완
    • 한국방사선학회논문지
    • /
    • 제16권4호
    • /
    • pp.411-417
    • /
    • 2022
  • 본 연구에서는 저선량 흉부 CT 영상을 이용하여 VGGNet을 학습시키고 폐기종 검출 모델을 구현하고 성능을 확인하고자 한다. 연구에 사용된 저선량 흉부 CT 영상은 정상 진단 8000장, 폐기종 진단 3189장이며, 모델 학습을 위해 정상 데이터와 폐기종 데이터를 train, validation, test dataset으로 각각 60%, 24%, 16%로 무작위 추출하여 구분하였다. 학습을 위한 인공신경망은 VGGNet 중 VGG16과 VGG19를 사용하였으며, 학습이 완료된 모델 평가를 위해 정확도, 손실율, 오차 행렬, 정밀도, 재현율, 특이도, F1-score의 평가지표를 사용하였다. 폐기종 검출 정확도와 손실율은 VGG16과 VGG19 각각 92.35%, 95.88%, 0.21%, 0.09%, 정밀도는 91.60%, 96.55%, 재현율은 98.36%, 97.39%, 특이도는 77.08%, 92.72%, F1-score는 94.86%, 96.97%였다. 위의 평가지표를 통해 VGG19 모델의 폐기종 검출 성능이 VGG16 모델에 비해 우수하다고 판단된다. 본 연구를 통해 VGGNet과 인공신경망을 이용한 폐기종 검출 모델 연구에 기초자료로 사용할 수 있을 것으로 사료된다.

키워드 출현 빈도 분석과 CONCOR 기법을 이용한 ICT 교육 동향 분석 (Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique)

  • 이영석
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.187-192
    • /
    • 2023
  • 본 연구는 기계학습의 키워드 출현 빈도 분석과 CONCOR(CONvergence of iteration CORrealtion) 기법을 통한 ICT 교육에 대한 흐름을 탐색한다. 2018년부터 현재까지의 등재지 이상의 논문을 'ICT 교육'의 키워드로 구글 스칼라에서 304개 검색하였고, 체계적 문헌 리뷰 절차에 따라 ICT 교육과 관련이 높은 60편의 논문을 선정하면서, 논문의 제목과 요약을 중심으로 키워드를 추출하였다. 단어 빈도 및 지표 데이터는 자연어 처리의 TF-IDF를 통한 빈도 분석, 동시 출현 빈도의 단어를 분석하여 출현 빈도가 높은 49개의 중심어를 추출하였다. 관계의 정도는 단어 간의 연결 구조와 연결 정도 중심성을 분석하여 검증하였고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 군집을 도출하였다. 분석 결과 첫째, '교육', '연구', '결과', '활용', '분석'이 주요 키워드로 분석되었다. 둘째, 교육을 키워드로 N-GRAM 네트워크 그래프를 진행한 결과 '교육과정', '활용'이 가장 높은 단어의 관계로 나타났다. 셋째, 교육을 키워드로 군집분석을 한 결과, '교육과정', '프로그래밍', '학생', '향상', '정보'의 5개 군이 형성되었다. 이러한 연구 결과를 바탕으로 ICT 교육 동향의 분석 및 트렌드 파악을 토대로 ICT 교육에 필요한 실질적인 연구를 수행할 수 있을 것이다.

토픽모델링을 이용한 약어 중의성 해소 (Abbreviation Disambiguation using Topic Modeling)

  • 이운교;김자희;양준기
    • 한국시뮬레이션학회논문지
    • /
    • 제32권1호
    • /
    • pp.35-44
    • /
    • 2023
  • 최근 텍스트 분석으로 트렌드 분석이나 연구 동향 분석을 하는 연구 사례가 많다. 텍스트 분석을 위한 자료 수집에 사용되는 검색어가 약어일 때 약어의 특성상 의미 중의성 해소가 필요하다. 다수의 연구에서는 연구에 필요한 자료를 찾기 위해 수작업으로 자료를 하나씩 읽어 문서를 분류하고 있다. 약어의 의미 중의성 해소를 위한 연구는 단어의 의미를 명확화하는 연구가 대부분이고 지도학습을 이용하고 있다. 약어 중의성 해소를 위한 선행 방법은 약어로 검색된 자료에서 연구 대상 자료를 찾는 문서 분류에는 적합하지 않으며 관련 연구도 부족하다. 본 연구에서는 데이터 전처리 단계에서 비지도 학습 방법인 비음수 행렬 분해 방법으로 토픽 모델링을 진행하여 약어로 수집된 문서를 반자동으로 분류하는 방법을 제시한다. 이를 검증하기 위해 'MSA'라는 약어 검색어로 학술 데이터베이스에서 논문 자료를 수집했다. 수집된 논문 1,401편에서 제안된 방법으로 316편의 Micro Services Architecture와 관련된 논문을 찾았다. 제안된 방법의 문서 분류 정확도는 92.36%로 측정되었다. 제안된 방법이 수작업에 따른 연구자의 시간과 비용을 줄일 수 있기를 기대한다.

의사결정나무 및 랜덤포레스트 분류 모델을 이용한 교량 안전등급 예측 (Prediction of Safety Grade of Bridges Using the Classification Models of Decision Tree and Random Forest)

  • 홍지수;전세진
    • 대한토목학회논문집
    • /
    • 제43권3호
    • /
    • pp.397-411
    • /
    • 2023
  • 국내에서 공용연수 30년 이상인 노후 교량의 수가 급증하고 있다. 이에 따라 교량 노후도, 상태 및 성능 예측을 바탕으로 한 첨단 유지관리 기술의 중요성이 점차 주목받고 있다. 이 연구에서는 머신러닝 기반의 의사결정나무 및 랜덤포레스트 분류 모델을 사용하여 교량의 안전등급을 예측하는 방법을 제안하였다. 일반국도상 교량 8,850개를 대상으로 해당 모델들을 혼동행렬, 균형 정확도, 재현율, ROC 곡선 및 AUC와 같이 여러가지 평가 지표를 통해 분석한 결과 전반적으로 랜덤포레스트가 의사결정나무보다 더 나은 예측 성능을 보유하였다. 특히 랜덤포레스트 중 랜덤 언더 샘플링 기법은 노후도가 비교적 커서 유지관리에 주의를 기울여야 하는 C, D등급 교량에 대해 재현율 83.4%로 다른 샘플링 기법들보다 예측 성능이 더 뛰어난 것으로 나타났다. 제안된 모델은 최근 점검이 실시되지 않은 교량들의 신속한 안전등급 파악 및 효율적이고 경제적인 유지관리 계획 수립에 유용하게 활용될 수 있을 것으로 기대된다.

Intervention Mapping 설계를 통한 중학생 대상 흡연음주예방 교육프로그램 개발 (Development of a Smoking and Drinking Prevention Program for Adolescents using Intervention Mapping)

  • 계수연;최슬기;박기호
    • 한국학교ㆍ지역보건교육학회지
    • /
    • 제12권3호
    • /
    • pp.1-15
    • /
    • 2011
  • Objectives: We describe the development of a smoking and drinking prevention program for adolescents, using intervention mapping. Methods: The study sample consisted of 1,000 high school second-grade students from 6 high schools in Seoul. The PRECEDE model was applied for the needs assessment. We carried out a social diagnosis by assessing the factors such as the quality of life, happiness level, and satisfaction with school life; an epidemiological diagnosis on the perceived health status, stress levels, and priority of health issues; a behavioral diagnosis on the smoking and drinking rate and the intention to smoke and drink; and an educational diagnosis on knowledge, beliefs, attitudes, self-efficacy, outcome expectations, social norms and life skills. Results: The development process included a needs assessment, identifying factors that influence smoking and drinking among adolescents. Intention, knowledge, perceived norms, perceived benefit, perceived cost, perceived susceptibility, self-efficacy, and life skills were identified as determinants. Three performance objectives were formulated to describe what an individual needs to do in order to avoid smoking and drinking. Subsequently, we constructed an intervention matrix by crossing the performance objectives with the selected determinants. Each cell describes the learning objectives of the smoking and drinking prevention program. The program used methods from the transtheoretical model, such as consciousness raising, outcome expectations, self-reevaluation, self-liberation, counterconditioning, environmental reevaluation, and stimulus control. The program deals with the effects of smoking and drinking, self-improvement, decision making, understanding advertisements, communication skills, social relationships, and assertiveness. Conclusions: By using the process of intervention mapping, the program developer was able to ensure a systematical incorporation of empirical and new data and theories to guide the intervention design. Programs targeting other health-related behavior and other methods or strategies can also be developed using this intervention mapping process.

  • PDF

심층신경망 모델을 이용한 고해상도 KOMPSAT-3 위성영상 기반 토지피복분류 (Land Cover Classification Based on High Resolution KOMPSAT-3 Satellite Imagery Using Deep Neural Network Model)

  • 문갑수;김경섭;정윤재
    • 한국지리정보학회지
    • /
    • 제23권3호
    • /
    • pp.252-262
    • /
    • 2020
  • 원격탐사 분야에서 토지피복분류에는 머신러닝 기반의 SVM 모델이 대표적으로 활용되고 있는 한편, 신경망 모델을 이용한 연구도 지속적으로 수행되고 있다. 다목적실용위성의 고해상도 영상을 이용한 연구는 미흡한 실정이며, 따라서 본 연구에서는 고해상도 KOMPSAT-3 위성영상을 이용하여 신경망 모델의 토지피복분류 정확도를 평가하고자 하였다. 경주시 인근 해안지역의 위성영상을 취득하여 훈련자료를 제작하고, 물과 식생 및 육지의 세 항목에 대해 SVM, ANN 및 DNN 모델로 토지피복을 분류하였다. 분류 결과의 정확도를 오차 행렬을 통해 정량적으로 평가한 결과 DNN 모델을 활용한 토지피복분류가 92.0%의 정확도로 가장 우수한 결과를 나타냈다. 향후 다중 시기의 위성영상을 통해 훈련자료를 보완하고, 다양한 항목에 대한 분류를 수행 및 검증한다면 연구의 신뢰성을 높일 수 있을 것으로 판단된다.

Partially Observable Markov Decision Processes (POMDPs) and Wireless Body Area Networks (WBAN): A Survey

  • Mohammed, Yahaya Onimisi;Baroudi, Uthman A.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권5호
    • /
    • pp.1036-1057
    • /
    • 2013
  • Wireless body area network (WBAN) is a promising candidate for future health monitoring system. Nevertheless, the path to mature solutions is still facing a lot of challenges that need to be overcome. Energy efficient scheduling is one of these challenges given the scarcity of available energy of biosensors and the lack of portability. Therefore, researchers from academia, industry and health sectors are working together to realize practical solutions for these challenges. The main difficulty in WBAN is the uncertainty in the state of the monitored system. Intelligent learning approaches such as a Markov Decision Process (MDP) were proposed to tackle this issue. A Markov Decision Process (MDP) is a form of Markov Chain in which the transition matrix depends on the action taken by the decision maker (agent) at each time step. The agent receives a reward, which depends on the action and the state. The goal is to find a function, called a policy, which specifies which action to take in each state, so as to maximize some utility functions (e.g., the mean or expected discounted sum) of the sequence of rewards. A partially Observable Markov Decision Processes (POMDP) is a generalization of Markov decision processes that allows for the incomplete information regarding the state of the system. In this case, the state is not visible to the agent. This has many applications in operations research and artificial intelligence. Due to incomplete knowledge of the system, this uncertainty makes formulating and solving POMDP models mathematically complex and computationally expensive. Limited progress has been made in terms of applying POMPD to real applications. In this paper, we surveyed the existing methods and algorithms for solving POMDP in the general domain and in particular in Wireless body area network (WBAN). In addition, the papers discussed recent real implementation of POMDP on practical problems of WBAN. We believe that this work will provide valuable insights for the newcomers who would like to pursue related research in the domain of WBAN.

비선형 특징 추출을 위한 온라인 비선형 주성분분석 기법 (On-line Nonlinear Principal Component Analysis for Nonlinear Feature Extraction)

  • 김병주;심주용;황창하;김일곤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권3호
    • /
    • pp.361-368
    • /
    • 2004
  • 본 논문에서는 온라인 학습 자료의 비선형 특징(feature) 추출을 위한 새로운 온라인 비선형 주성분분석(OL-NPCA : On-line Nonlinear Principal Component Analysis) 기법을 제안한다. 비선형 특징 추출을 위한 대표적인 방법으로 커널 주성분방법(Kernel PCA)이 사용되고 있는데 기존의 커널 주성분 분석 방법은 다음과 같은 단점이 있다. 첫째 커널 주성분 분석 방법을 N 개의 학습 자료에 적용할 때 N${\times}$N크기의 커널 행렬의 저장 및 고유벡터를 계산하여야 하는데, N의 크기가 큰 경우에는 수행에 문제가 된다. 두 번째 문제는 새로운 학습 자료의 추가에 의한 고유공간을 새로 계산해야 하는 단점이 있다. OL-NPCA는 이러한 문제점들을 점진적인 고유공간 갱신 기법과 특징 사상 함수에 의해 해결하였다. Toy 데이타와 대용량 데이타에 대한 실험을 통해 OL-NPCA는 다음과 같은 장점을 나타낸다. 첫째 메모리 요구량에 있어 기존의 커널 주성분분석 방법에 비해 상당히 효율적이다. 두 번째 수행 성능에 있어 커널 주성분 분석과 유사한 성능을 나타내었다. 또한 제안된 OL-NPCA 방법은 재학습에 의해 쉽게 성능이 항상 되는 장점을 가지고 있다.