• 제목/요약/키워드: Feature extraction

검색결과 2,569건 처리시간 0.028초

드론 식별 시스템을 위한 합성곱 신경망 기반 이미지 분류 모델 성능 비교 (Performance Comparison of CNN-Based Image Classification Models for Drone Identification System)

  • 김영완;조대균;박건우
    • 문화기술의 융합
    • /
    • 제10권4호
    • /
    • pp.639-644
    • /
    • 2024
  • 최근 전장에서의 드론 활용이 정찰뿐만 아니라 화력 지원까지 확장됨에 따라, 드론을 조기에 자동으로 식별하는 기술의 중요성이 더욱 증가하고 있다. 본 연구에서는 드론과 크기 및 외형이 유사한 다른 공중 표적들인 새와 풍선을 구분할 수 있는 효과적인 이미지 분류 모델을 확인하기 위해, 인터넷에서 수집한 3,600장의 이미지 데이터셋을 사용하고, 세 가지 사전 학습된 합성곱 신경망 모델(VGG16, ResNet50, InceptionV3)의 특징 추출기능과 추가 분류기를 결합한 전이 학습 접근 방식을 채택하였다. 즉, 가장 우수한 모델을 확인하기 위해 세 가지 사전 학습된 모델(VGG16, ResNet50, InceptionV3)의 성능을 비교 분석하였으며, 실험 결과 InceptionV3 모델이 99.66%의 최고 정확도를 나타냄을 확인하였다. 본 연구는 기존의 합성곱 신경망 모델과 전이 학습을 활용하여 드론을 식별하는 새로운 시도로써, 드론 식별 기술의 발전에 크게 기여 할 것으로 기대된다.

음악 장르 분류를 위한 데이터 생성 및 머신러닝 적용 방안 (Generating Data and Applying Machine Learning Methods for Music Genre Classification)

  • 엄빛찬;조동휘;남춘성
    • 인터넷정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.57-64
    • /
    • 2024
  • 본 논문은 머신러닝을 활용하여 많은 양의 음악 데이터를 분류하여 장르 정보가 입력되어 있지 않은 음악 장르 분류 정확도 향상을 목표로 한다. 음악의 장르를 구분하기 위해 기존 연구에서 많이 사용되던 GTZAN 데이터 세트 대신 직접 데이터를 수집하고 전처리하는 방안을 제시한다. 이를 위해 GTZAN 데이터 세트보다 분류 성능이 뛰어난 데이터 세트를 생성하기 위해 Onset의 에너지 레벨이 가장 높은 일정 구간을 추출한다. 학습에 사용하는 음악 데이터의 주요 특성으로는 Mel Frequency Cepstral Coefficient(MFCC)를 포함한 57개의 특성을 이용한다. 전처리된 데이터를 통해 Support Vector Machine(SVM) 모델을 이용하여 Blues, Classical, Jazz, Country, Disco, Pop, Rock, Metal, Hiphop으로 분류한 학습 정확도가 85%를 기록하였고, 테스트 정확도가 71%를 보여주었다.

MPEG-7 기반 의미적 메타데이터 모델을 이용한 멀티미디어 주석 및 검색 시스템의 개발 (Development of Multimedia Annotation and Retrieval System using MPEG-7 based Semantic Metadata Model)

  • 안형근;고재진
    • 정보처리학회논문지D
    • /
    • 제14D권6호
    • /
    • pp.573-584
    • /
    • 2007
  • 최근 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 멀티미디어 데이터에 대한 다양한 검색은 매우 중요한 이슈가 되고 있다. 멀티미디어 데이터를 효율적으로 처리하기 위해서는 멀티미디어 데이터가 가지고 있는 의미 내용을 추출할 수 있는 의미 기반 검색 기법이 필요하다. 기존 연구되어온 멀티미디어 데이터의 검색은 주석 기반 검색, 특징 기반 검색, 주석과 특징 기반 검색의 통합 검색시스템이 있다. 이러한 시스템들은 검색 데이터의 생성을 위해 주석자의 많은 노력과 시간을 요구하고 특징 추출을 위한 복잡한 계산을 요구하며, 생성된 데이터는 변화되지 않는 정적인 검색을 수행하는 단점이 있다. 또한, 인간에게 좀 더 친숙하고 의미적인 형태의 검색 방법을 제공하지 못하고 있는 실정이다. 본 논문에서는 MPEG-7을 이용하여 멀티미디어 데이터를 구조적으로 표현하고 효율적으로 추출하기 위한 의미적 메타데이터 기반의 멀티미디어 주석 및 검색시스템(S-MARS)을 구현 제안한다. 본 시스템은 멀티미디어 데이터에 대한 주석이나 검색, 브라우징을 위한 그래픽 인터페이스를 제공하며 멀티미디어 정보를 표현하기 위해 의미적 메타데이터 모델을 기반으로 구현하였다. 멀티미디어 데이터에 대한 의미적 메타데이터 모델은 MPEG-7 표준에 정의되어 있는 멀티미디어 묘사 스키마를 기반으로 XML 스키마를 이용하여 작성하였다. 결론적으로, 제시한 멀티미디어 데이터에 대한 의미적 메타데이터를 XML 형태로 표현하고, XML을 지원하는 데이터베이스 시스템을 이용하여 표준적인 데이터의 상호 교환이 용이하게 이루어질 수 있으며, 의미적 메타데이터를 활용하여 삽입 기반 검색 알고리즘 방법을 제공함으로써 검색에 대한 정확성과 사용자의 검색 만족도를 극대화 시킬 수 있다. 마그마 저장소로의 유입과 마그마 저장소 아래에서 공급되는 모마그마의 성분변화에 의해서 미량원소 함량이 급격하게 변한 것으로 해석된다./^4He$ 비와 $^4He/^{20}Ne$ 비는 $0.0143{\times}10^{-6}{\sim}0.407{\times}10^{-6}$ 범위와 $6.49{\sim}584{\times}10^{-6}$ 범위를 각각 보여주어 대기와 지각성분의 혼합선상에 도시된다. 이는 온천수내 헬륨가스의 대부분이 지각기원임을 의미한다. 죽림온천(JR1)의 경우 맨틀기원의 헬륨가스의 혼합율이 다른 온천에 비해 다소 높은 비율을 보여준다. 이들 동위원소비와 온천수의 pH와는 대체적으로 정의 상관관계가 확인되었다. 아울러 $^{40}Ar/^{36}Ar$비가 $292.3{\times}10^{-6}{\sim}304.1{\times}10^{-6}$ 범위로 대기기원임을 지시한다. Gram 양성, Gram 음성 균주는 Escherichia coli KCCM 11591를 제외하고는 0.8 - 0.95 cm로 항균력이 강했으며, Gram negitive의 Pseudomonas aeruginosa KCTC 1750 에서는 43% 발효주에는 0.95 cm, 45% 고은 발효주에는 0.95 cm의 항균성을 나타냈으며 관능평가에서도 가장 높게 났다. 관능평가에서는 45% 고온 발효주가 가장 높게 나타났으며, 항산화성 실험에 나타난 저온 45%의 갈색도의 측정과는 항산화성에서는 좀 다른 결과를 나타낸다. 그러나 항균성이 가장 높게 나타난 43-45%와 관능평가에서 가장 높게 나타난 45% 고온 발효주를 볼 때 본 연구에서는 고온 발효주 45%가

Airborne MSS 자료를 이용한 수질인자의 분광특성 분석 (The Analysis of Spectral characteristics of Water Quality Factors Uisng Airborne MSS Data)

  • Dong-Ho Jang;Gi-Ho Jo;Kwang-Hoon Chi
    • 대한원격탐사학회지
    • /
    • 제14권3호
    • /
    • pp.296-306
    • /
    • 1998
  • Airborne MSS 자료는 수질오염을 효과적으로 감시하고 분석할 수 있는 자료이다. 본 연구에서는 다목적 실용위성(KOMPSAT)에 탑재될 저해상도카메라(LRC)의 다중분광 영상자료를 수질오염 분석에 활용할 목적으로 수질인자의 분광반사도를 측정하였으며, 고해상도 원격탐사 자료인 Airborne MSS 자료를 이용하여 수역에서의 수질인자 추출 가능성을 조사하였다. 특히 부영양화와 관련된 환경인자 추출을 시도하였다. 수질인자는 클로로필-a, 부유물질, 탁도 등을 선정하여 분광반사 특성 및 처리기법을 개발하였다. 그 결과는 다음과 같다 첫째, 수면에 도달하는 태양광 스펙트럼은 가시광 영역인 0.4~0.7$\mu\textrm{m}$에서 전체 복사량의 50% 정도가 반사되며, 0.50$\mu\textrm{m}$ 부근에서 가장 높다. 둘째, 클로로필-a는 녹색 파장대인 0.52$\mu\textrm{m}$, 부유물질의 반사도는 0.8$\mu\textrm{m}$, 탁도는 0.57$\mu\textrm{m}$에서 높은 반사율을 보였다. 셋째, Airborne MSS자료를 이용하여 수질인자 분석결과, 클로로필-a는 Band 3과 Band 7을 비연산처리를 하여 분포도를 작성하였다. 부유물질은 Band 7에서 분포도를 작성할 수 있었으며, PCA를 수행하였을 때 PC 1에서 유용함을 알 수 있었다. 탁도는 PCA 분석시 PC 4에서 현장자료와 유사한 분포패턴을 나타내었다. 이상의 결과들은 계절적, 시간적 변화에 따라 파장대역이 달라질 수 있으므로, LRC 자료를 이용하여 보다 정확한 수질환경 인자를 분석하기 위해서는 현장실측 자료 및 수역의 분광반사 특성 등을 지속적으로 조사할 필요가 있다. 추후 본 연구에서는 저해상도 위성영상 및 현장 분광반사도 측정을 통한 수역의 분광반사 특성을 지속적으로 분석하고, 수역의 수질분석자료 확보 및 수질오염 유형을 분석 할 것이다.

확률적 퍼지 룰 기반 학습에 의한 개인화된 미디어 제어 방법 (Personalized Media Control Method using Probabilistic Fuzzy Rule-based Learning)

  • 이형욱;김용휘;이태엽;박광현;김용수;조준면;변증남
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.244-251
    • /
    • 2007
  • 사용자 의도 파악(intention reading) 기술은 스마트 홈과 같은 복잡한 유비쿼터스(ubiquitous) 환경에서 사용자에게 보다 편리하고 개인화된(personalized) 서비스 제공이 가능하도록 해준다. 또한 학습 기능(learning capability)은 지식 발견(knowledge discovery)의 관점에서 의도 파악 기술의 핵심 요소 기술의 하나로 자리 매김하고 있다 이 논문에서는 스마트 홈(smart home) 환경에서 제공 가능한 개인화된 서비스 중의 하나로, 개인화된 미디어 제어 방법에 대한 내용을 다룬다. 특히, 사람의 행동 패턴과 같은 데이터는 패턴 분류의 관점에서 구분해야 할 클래스(class)에 비해 입력 정보가 불충분한 경우가 많아서 비일관적인(inconsistent) 데이터가 많으므로, 퍼지 논리(fuzzy logic)와 확률 (probability)의 개념을 효과적으로 병행해야 의미 있는 지식을 추출해 낼 수 있다. 이를 위하여 반복 퍼지 지도 클러스터링(IFCS; Iterative Fuzzy Clustering with Supervision) 알고리즘에 기반하여 주어진 데이터 패턴으로부터 확률적 퍼지 룰(probabilistic fuzzy rule)을 얻어 내는 방법에 대해 설명한다. 또한 이를 이용한 다양한 학습 제어 구조를 바탕으로 개인화된 미디어 서비스를 추천해 줄 수 있는 방법에 대해서 설명하도록 하고, 실험 결과를 통해 제안된 시스템의 효용성을 보이도록 한다.

시각정보획득과정에 나타난 주사판정과 성별 주시특성 - 지하철 홀 공간을 대상으로 - (Scanning Determination & Observation Features by Sex shown in the Process of Acquiring Visual Information - With the Object of Subway Station Hall Space -)

  • 김종하;최계영
    • 한국실내디자인학회논문집
    • /
    • 제23권6호
    • /
    • pp.115-124
    • /
    • 2014
  • This study has carried out scanning tests in order to figure out the features of scanning search by sex of space users, with the result of which the validity of data has been estimated. In this research, the scanning patterns were set up for verifying the typology of scanning paths and then the reason for determining scanning paths and the validity of estimation method were reviewed. Since the observation features depends on sex, the analysis of visual activities for acquiring any information in a space will reveal the intention and purpose of space users. The findings by analyzing the features of scanning pattern by sex which were found at the determination of scanning patterns can be defined as the followings. First, for estimating the process of space-information search, the movement distance at each point of continuative-observation data from the angle of eye-movement has been extracted, on the ground of which the fixation and movement of eye have been defined for the establishment of scanning-cut characteristics. Second, the scanning times were estimated for the extraction of effective observation data that would be used for comparative analysis, which showed that men had more data (3,398.2/64.4%) than women (2,998.2/55.6%). This enables the acknowledgment that the scanning cut of men was relatively less, which indicates that men will acquire more information on space than women in the process of observing any space. Third, men's scanning times (58.0 times/2.02 seconds) were less than those of women (71.9 times/1.39 seconds) while the scanning time of the former was longer than that of the latter, which shows the feature that it takes longer for men than women in scanning while the scanning times of the former is less than those of the latter. Fourth, the observation features can be determined that the combination of this result with the predominance character by sex for a general viewpoint to be employed indicates that while men employ mixed-scanning for observation activities to acquire space-information spending for longer time, women, by concentrated-scanning, focus on a single point for shorter time or stay at one location for a considerably long time for space-information acquirement.

머신러닝 플랫폼을 활용한 소프트웨어 교수-학습 모형 개발 (The Development of Software Teaching-Learning Model based on Machine Learning Platform)

  • 박대륜;안중민;장준혁;유원진;김우열;배영권;유인환
    • 정보교육학회논문지
    • /
    • 제24권1호
    • /
    • pp.49-57
    • /
    • 2020
  • 현대사회는 21세기 초반 지식정보사회를 지나 지능정보사회로 바뀌어 가고 있다. 본 연구에서는 지능정보사회에서 요구되는 학습자의 핵심역량을 신장시키기 위하여 인공지능의 한 분야인 머신러닝을 기반으로 소프트웨어 교육 교수-학습 모형을 개발하였다. 본 모형은 인공지능 자체에 대한 학습의 부담감을 줄이고, 머신러닝을 활용하여 문제를 해결하는 과정에서 핵심역량을 신장시키는 것에 중점을 두었다. 개발된 모형의 구체적인 단계는 문제인식 및 분석, 데이터 수집, 데이터 가공 및 선별, ML모델 훈련 및 평가, ML프로그래밍, 적용 및 해결, 공유 및 환류의 7단계로 구성되어 있다. 본 연구에서 개발한 모형을 학생과 학부모를 대상으로 적용한 결과 긍정적인 반응을 얻을 수 있었으며, 이를 통해 머신러닝 기반의 소프트웨어 교육 프로그램의 개발 및 운영에 작은 밑거름을 제시할 수 있을 것으로 기대한다.

비선형 피부색 변화 모델을 이용한 실감적인 표정 합성 (Synthesis of Realistic Facial Expression using a Nonlinear Model for Skin Color Change)

  • 이정호;박현;문영식
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.67-75
    • /
    • 2006
  • 얼굴의 표정은 얼굴의 구성요소같은 기하학적 정보와 조명이나 주름 같은 세부적인 정보들로 표현된다. 얼굴 표정은 기하학적 변형만으로는 실감적인 표정을 생성하기 힘들기 때문에 기하학적 변형과 더불어 텍스처 같은 세부적인 정보도 함께 변형해야만 실감적인 표현을 할 수 있다. 표정비율이미지 (Expression Ratio Image)같은 얼굴 텍스처의 세부적인 정보를 변형하기 위한 기존 방법들은 조명에 따른 피부색의 변화를 정확히 표현할 수 없는 단점이 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위해 서로 다른 조명 조건에서도 실감적인 표정 텍스처 정보를 적용할 수 있는 비선형 피부색 모델 기반의 표정 합성방법을 제안한다. 제안된 방법은 동적 외양 모델을 이용한 자동적인 얼굴 특징 추출과 와핑을 통한 표정 변형 단계, 비선형 피부색 변화 모델을 이용한 표정 생성 단계, 유클리디 거리 변환 (Euclidean Distance Transform)에 의해 계산된 혼합 비율을 사용한 원본 얼굴 영상과 생성된 표정의 합성 등 총 3 단계로 구성된다. 실험결과는 제안된 방법이 다양한 조명조건에서도 자연스럽고 실감적인 표정을 표현한다는 것을 보인다.

얼굴인식의 향상을 위한 스테레오 영상기반의 3차원 정보를 이용한 인식 (Recognition method using stereo images-based 3D information for improvement of face recognition)

  • 박장한;백준기
    • 전자공학회논문지CI
    • /
    • 제43권3호
    • /
    • pp.30-38
    • /
    • 2006
  • 본 논문에서는 스테레오 얼굴영상으로부터 3차원 정보인 거리와 깊이 정보를 이용해 거리에 따라 얼굴인식률이 떨어지는 것을 개선하였다. 단안 영상은 객체의 거리, 크기, 이동, 회전, 깊이 등의 불확실한 정보로 인해 인식률이 떨어지는 문제점이 있다. 또한 얼굴의 회전, 조명, 표정변화 등의 영상정보가 취득되지 않으면 인식률이 매우 저하되는 단점이 있다. 그래서 본 연구는 이와 같은 문제점을 해결하고자 한다. 제안된 방법은 눈 검출 알고리듬, 얼굴의 회전 방향분석, PCA(Principal Component Analysis)로 구성된다. 또한 제한된 영역에서 얼굴을 고속으로 검출하기 위해 RGB컬러공간에서 YCbCr공간으로 변환한다. 얼굴후보 영역에서 다층 상대적인 밝기 맵을 생성하여 얼굴의 기하학적인 구조로부터 얼굴인지를 판별한다. 스테레오 얼굴영상으로부터 거리 및 눈과 입의 깊이 정보를 취득하고, 거리에 따라 확대, 축소, 이동, 회전 등의 정규화를 통해 $92{\times}112$ 크기의 얼굴을 검출한다. 검출된 왼쪽 얼굴영상과 추정된 방향의 차를 PCA로 학습한다. 제안된 방법은 정면에서 최대 95.8%(100cm), 포즈변화에 따라 98.3%의 인식률을 얻을 수 있었다. 따라서 실험을 통하여 제안된 방법은 거리에 따라 확대, 축소와 회전 등의 정확한 정규화로 높은 인식률을 얻을 수 있음을 보였다.

EIS 기반 전압신호 분석을 통한 당뇨병 진단 가능성 평가 (Diagnosis of Diabetes Using Voltage Analysis Based on EIS (Electro Interstitial Scan))

  • 배장한;김수찬;카니티카 케오칸네트;전민호;김재욱
    • 전자공학회논문지
    • /
    • 제53권11호
    • /
    • pp.114-122
    • /
    • 2016
  • EIS (Electro interstitial scan, 전기체간스캔법)는 전극을 이용해 미세전류를 인체에 인가하고 그에 따른 전기적 반응을 분석하여 생리적인 정보를 얻는 방법으로, 비침습적이고 간단한 검사가 가능하다는 장점이 있다. 특히 당뇨병 진단을 위한 스크린용으로 적합하다는 연구들이 진행되어 왔으나 대부분 진단 원리에 대한 구체적인 논의가 이루어지지 않았다. 본 연구에서는 EIS 방법이 당뇨병 스크리닝 및 임상에 유용하게 활용될 수 있을지 분석해 보기위해 당뇨병 환자와 정상인을 대상으로 EIS 장비의 원 신호인 전압 변동 데이터를 특정경로에서 측정하였다. 전압 신호의 특징점을 추출하고 두 그룹 사이의 AUC (Area under the curve)를 계산한 결과 7개의 변수들이 60% 이상의 분류 정확도를 보였다. 또한 이 변수들을 k-NN 분류기로 학습한 결과, 왼쪽 손에서의 전압 변동 크기를 기준으로 분석했을 때 분류 정확도를 76.2%까지 높일 수 있었다. EIS 기반의 전압신호 분석법으로 비침습적인 당뇨병 스크리닝의 가능성을 보였다.