• 제목/요약/키워드: K-Means 클러스터링

검색결과 363건 처리시간 0.026초

메탄 가스 기반 가스 누출 위험 예측을 위한 다변량 특이치 제거 (Multivariate Outlier Removing for the Risk Prediction of Gas Leakage based Methane Gas)

  • 홍고르출;김미혜
    • 한국융합학회논문지
    • /
    • 제11권12호
    • /
    • pp.23-30
    • /
    • 2020
  • 본 연구에서는, 천연가스(NG) 데이터와 가스 관련 환경 요소 간의 관계를 기계학습 알고리즘을 사용하여 가스 누출 데이터를 직접 측정하지 않고 가스 누출 위험 수준을 예측하였다. 이번 연구는 서버가 제공하는 오픈 데이터인 IoT 기반 원격 제어 피카로(Picarro) 가스 센서 사양을 기반으로 사용했다. 천연 가스는 공기 중으로 누출이 되며, 대기 오염, 환경, 그리고 건강에 큰 문제가 된다. 본 연구에서 제안하는 방법은 천연 가스의 누출 위험 예측을 위한 랜덤 포레스트(Random Forest) 분류 기반 다변량 특이치 제거 방법이다. 비지도 k-평균 클러스터링 후에 실험 데이터 집합은 불균형 데이터이다. 따라서 우리는 제안된 모델이 중간과 높은 위험 수준을 가장 잘 예측할 수 있다는 점에 초점을 맞춘다. 이 경우 각 분류 모델에 대한 수신자 조작 특성(ROC) 곡선, 정확도, 평균 표준 오차(MSE)를 비교했다. 실험 결과로 정확도, 수신자 조작 특성의 곡선 아래 영역(AUC, Area Under the ROC Curve), MSE가 각각 MOL_RF의 경우 99.71%, 99.57%, 및 0.0016의 결과 값을 얻었다.

Bass Diffusion 모델을 활용한 스마트폰 시장의 성장 규모 예측: 몽골 사례 (Forecasting the Growth of Smartphone Market in Mongolia Using Bass Diffusion Model)

  • ;신광섭
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.193-212
    • /
    • 2022
  • 1969년에 처음 고안되어 확산에 대한 마케팅 연구를 이끈 Bass Diffusion Model은 일반적으로 마케팅 연구 및 경영 과학에서 가장 성공적인 모델 중 하나다. 본 연구는 휴대전화 가입 확산을 토대로 Bass 확산 모델의 사용을 설명하며 Bass 확산 모델을 3대 선진국 시장인 한국, 일본, 중국과 신흥시장인 베트남, 태국, 카자흐스탄, 몽골에 적용했다. 실험에서는 비선형 최소자승법을 사용하여 Bass확산 모델의 매개변수를 추정하였고 휴대전화 가입의 확산은 모든 경우에 S 곡선을 따른다. m, p 및 q 매개변수를 획득한 후 국가를 세 그룹으로 그룹화하기 위해 k-평균 클러스터 분석을 사용했으며 국가를 클러스터링함으로써 확산 속도와 패턴이 유사하며 신흥시장이 있는 국가가 선진국의 발자취를 따를 수 있음을 제안한다. 연구의 목적은 시장 성숙도의 시기와 규모를 예측하고 데이터가 Bass 모델의 혁신의 일반적인 확산 곡선을 따르는지 여부를 판단하는 것이다.

카드소팅을 활용한 디지털 신기술 과정 핵심역량 군집화에 관한 연구 (A Study on Clustering of Core Competencies to Deploy in and Develop Courseworks for New Digital Technology)

  • 이지운;이호;권정흠
    • 실천공학교육논문지
    • /
    • 제14권3호
    • /
    • pp.565-572
    • /
    • 2022
  • 카드소팅(Card sorting)은 항목 간의 관계에 대한 사용자의 인식을 이해하는 데 유용한 데이터 수집 방법으로서, 일반적으로 카드소팅은 사용자 조사 및 평가에 매우 유용한 직관적이고 비용 효율적인 기술이다. 본 연구에서는 각 분야 직업별 핵심역량들은 코스 개발을 위하여 다음 단계인 카드소팅 단계에서 활용되는 역량카드로 사용하고, 결과를 군집화 하기 위해 K-평균 알고리즘을 적용하여 군집화 결과를 도출하였다. 카드소팅 결과 각 분야 직업별 핵심역량들에 대한 역량 군집화는 Participant-Centric Analysis (PCA)를 바탕으로 검증하였고, 이를 바탕으로 역량에 따른 직업별 코스 및 역량 분류 결과와 클러스터링에 의한 카드 유사성 정도는 각 직업별 핵심 역량 카드수에 대해 소팅 참여자 수 대비 군집화에 적합하게 동의한 참여자의 수와 카드 유사성 정도를 도출하였다.

Prompt engineering to improve the performance of teaching and learning materials Recommendation of Generative Artificial Intelligence

  • Soo-Hwan Lee;Ki-Sang Song
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.195-204
    • /
    • 2023
  • 본 연구에서는 GPT, Stable Diffusion과 같은 생성형 인공지능을 이용한 교수·학습 자료 추천 성능 향상을 위해 프롬프트를 개선하는 프롬프트 엔지니어링에 대해 탐색하였다. 분석할 교수·학습 자료의 종류는 그림 자료이다. 프롬프트 구성에 따른 영향을 탐색하기 위해 명령만 담긴 Zero-Shot 프롬프트, 학습 대상 학년 정보가 담긴 프롬프트, 학습 목표가 담긴 프롬프트, 학습 대상 학년과 학습 목표가 모두 담긴 프롬프트를 설계하여 각각을 GPT-3.5모델에 입력하고 응답을 수집하였다. 수집한 응답을 Sentence Transformers로 임베딩 하고 t-SNE를 활용하여 차원 축소하여 시각화 한 다음 프롬프트와 응답 간의 관계를 탐색하였다. 그리고 각 응답을 k-means clustering algorithm을 활용하여 군집화 한 다음 가장 넓은 클러스터의 첫 번째 값을 대표로 선택하여 Stable Diffusion을 이용하여 이미지화 한 다음 교수·학습자료 평가 기준에 따라 초등학교 교사 30명에게 평가 받았다. 초등학교 교사 30인은 추천한 4종의 그림 자료 중 3종은 교육적 가치가 있다고 판단하였으며, 그 중 2종은 실제 수업에 사용할 수 있다고 하였다. 가장 가치 있는 그림 자료를 추천한 프롬프트는 대상 학년과 학습 목표가 모두 담긴 프롬프트로 나타났다.

미세먼지(PM10) 추세를 고려한 환경계획 적용 방향 제안 (Application of Environmental Planning Considering the Trend of PM10 in Ambient Air)

  • 윤은주
    • 환경영향평가
    • /
    • 제29권3호
    • /
    • pp.210-218
    • /
    • 2020
  • 대기 중의 미세먼지(PM10) 농도가 꾸준히 저감되어 왔음에도, 미세먼지관리에 대한 대국민 인식은 악화되었다. 그 이유에는 첫째, 여전히 WHO기준을 상회하는 미세먼지 연평균 농도, 둘째, 환경기준(150 mg/㎥) 초과일수의 증가, 셋째, 체계적으로 지역 특성을 고려한 환경계획 수립 미비 등이 있으며, 이러한 현안을 보완하는 것이 시급하다. 특히, 국내 미세먼지의 관리는 배출원 저감에만 집중되어 있기 때문에, 지역별 미세먼지의 발생원인과 현상을 분석하고 차별성, 시급성, 적용 가능성 등을 복합적으로 고려하여 실효성 있는 환경계획을 수립하는 것이 필요하다. 본 연구에서는 2010년 이후 10년간 전국 69개 도시의 미세먼지의 농도변화 추세와 현재 수준을 고려하여 4가지 유형으로 분류하고, 각 유형별 미세먼지의 관리방향을 제시하였다. 특히 과거 10년 동안 미세먼지 개선정도가 미비하였던 관리유형 III(중부 내륙지역에 분포)과 IV(대도시, 남해·동해에 인접)를 중심으로 그린인프라 확충, 바람길 및 적응대책(노출의 제한) 도입 등의 보완 조치가 우선 필요함을 제안하였다. 본 연구에서는 미세먼지 발생 원인을 함께 고려하지 못하였지만, 과거의 경향에 기초하고 현재의 여건을 고려한 중·장기적 미세먼지 환경관리계획을 수립하는데 필요한 통계적 기법 제시와 방향을 제안하였다는 의의가 있다.

기술예측을 위한 특허 키워드 네트워크 분석 (Keyword Network Analysis for Technology Forecasting)

  • 최진호;김희수;임남규
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.227-240
    • /
    • 2011
  • 특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다. 본 연구에서는 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행하였다. 분석 결과는 다음과 같다. 첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다. 이러한 사실은 단기(4년) 장기(10년) 두 기간 모두 동일하게 나타났다. 나아가 본 연구에서 제시한 방법론을 통해 도출된 특허 키워드 조합 정보를 활용하면 미래에 어떤 개념들이 합쳐져서 새로운 특허 단위로 만들어 질지 가늠해볼 수 있고, 새로운 특허를 개발할 때 참고할 수 있는 유용한 정보로 활용할 수 있다.

밀리미터파 레이더 기반 손동작 인식 시스템 및 알고리즘에 관한 연구 (Study on the Hand Gesture Recognition System and Algorithm based on Millimeter Wave Radar)

  • 이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.251-256
    • /
    • 2019
  • 본 연구에서는 손동작을 인식하기 위하여 밀리미터파 기반 레이더에서 얻어진 손동작의 주파수 반향 특성을 이용하는 알고리즘 및 시스템을 제안하였다. 제안된 시스템은 밀리미터파 아날로그 송수신부, ADC부 및 신호 처리부가 원칩으로 구현된 시스템을 이용하여 데이터를 수집하도록 구성하였고, 제안한 알고리즘은 반사된 주파수 영상의 제르니케모멘트로부터 얻어진 전역 및 지역 디스크립터로 구성된 BoF에서 K-means 클러스터링을 이용하여 코드 워드를 생성하고 SVM을 이용한 손동작 분류를 수행하였다. 수행 결과는 혼동행렬에서 얻어진 정밀도, 민감도 및 정확도를 이용하여 평가였다. 정확도 평가에서는 제안한 방법은 GZM방법 및 LZM방법과 비교하여 성능 평가를 위한 인덱스에서 제안한 방법이 95.6%의 성능을 보였고 비교한 나머지 두 방법은 88.4% 및 84%을 나타내어 제안한 방법이 기존의 두 방법에 비하여 7~8% 성능이 향상되었으며 정밀도 및 민감도에서도 나머지 두 방법에 대하여 향상된 성능을 나타내었다. 제안한 방법은 소형화된 밀리미터파 기반 레이더를 이용하여 동작 인식을 할 수 있는 임베디드 시스템의 응용가능성을 보여준다.

다중 클래스 이상치 탐지를 위한 계층 CNN의 효과적인 클래스 분할 방법 (Effective Classification Method of Hierarchical CNN for Multi-Class Outlier Detection)

  • 김지현;이세영;김예림;안서영;박새롬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.81-84
    • /
    • 2022
  • 제조 산업에서의 이상치 검출은 생산품의 품질과 운영비용을 절감하기 위한 중요한 요소로 최근 딥러닝을 사용하여 자동화되고 있다. 이상치 검출을 위한 딥러닝 기법에는 CNN이 있으며, CNN을 계층적으로 구성할 경우 단일 CNN 모델에 비해 상대적으로 성능의 향상을 보일 수 있다는 것이 많은 선행 연구에서 나타났다. 이에 MVTec-AD 데이터셋을 이용하여 계층 CNN이 다중 클래스 이상치 판별 문제에 대해 효과적인지를 탐구하고자 하였다. 실험 결과 단일 CNN의 정확도는 0.7715, 계층 CNN의 정확도는 0.7838로 다중 클래스 이상치 판별 문제에 있어 계층 CNN 방식 접근이 다중 클래스 이상치 탐지 문제에서 알고리즘의 성능을 향상할 수 있음을 확인할 수 있었다. 계층 CNN은 모델과 파라미터의 개수와 리소스의 사용이 단일 CNN에 비하여 기하급수적으로 증가한다는 단점이 존재한다. 이에 계층 CNN의 장점을 유지하며 사용 리소스를 절약하고자 하였고 K-means, GMM, 계층적 클러스터링 알고리즘을 통해 제작한 새로운 클래스를 이용해 계층 CNN을 구성하여 각각 정확도 0.7930, 0.7891, 0.7936의 결과를 얻을 수 있었다. 이를 통해 Clustering 알고리즘을 사용하여 적절히 물체를 분류할 경우 물체에 따른 개별 상태 판단 모델을 제작하는 것과 비슷하거나 더 좋은 성능을 내며 리소스 사용을 줄일 수 있음을 확인할 수 있었다.

  • PDF

한국어 정보 검색에서 의미적 용어 불일치 완화 방안 (Alleviating Semantic Term Mismatches in Korean Information Retrieval)

  • 윤보현;박성진;강현규
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3874-3884
    • /
    • 2000
  • 정보검색시스템은 색인어와 질의어가 정확히 일치하지 않더라도 사용자 질의에 적합한 문서를 검색할 수 있어야 한다. 그러나, 색인어와 질의어간의 용어 불일치는 검색성능의 개선에 심각한 장애요소로 작용해 왔다. 따라서, 본 논문에서는 문서 코퍼스의 단어들간에 자동 용어 정규화를 수행하고, 용어 정규화의 산물을 한국어 정보검색 시스템에 적용하는 방안을 제시한다. 용어 불일치를 완화하기 위해 두가지 용어 정규화, 동치부류와 공기단어 클러스터를 수행한다. 첫째, 음역어, 절차오류, 그리고 동의어를 위해 문맥 유사도를 이용하여 동치부류로 구축하는 작업이다. 둘째, 상호정보와 단어 문맥의 조합을 이용하여 단어 유사도를 계산하고 문맥 기반 용어를 정규화한다. 그런 다음, K-means 알고리즘을 이용하여 자율 클러스터링을 수행하고 공기단어 클러스터를 구축한다. 본 논문에서는 이러한 용어 정규화의 산물들을 용어 불일치를 완화하기 위해 질의어 확장과정에서 사용한다. 다시 말해서 동치부류와 공기단어 클러스터는 새로운 용어로 질의를 확장하는 자원으로서 사용된다. 이러한 질의확장으로 사용자는 질의어에 음역어를 추가하여 질의어를 포괄적으로 만들거나 특정어를 추가하여 질의어를 세밀하게 만들 수 있다. 질의어 확장을 위해 두 가지 상호보완적인 방법인 용어 제시와 용어 적합성 피드백을 이용한다. 실험 결과는 제안된 시스템이 의미적 용어 불일치를 완화할 수 있고, 적절한 유사도 값을 제공할 수 있음을 보여준다. 결과적으로 제안한 시스템이 정보 검색 시스템의 검색 효율을 향상시킬 수 있음을 알 수 있다.

  • PDF

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

  • 권오륜;민경필;전준철
    • 인터넷정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.19-32
    • /
    • 2007
  • 본 논문에서는 실시간 얼굴인증 시스템의 구축을 위한 LVQ 신경망 기반의 새로운 얼굴 인식 방법을 제안한다. 기존의 연구에서 PCA, LDA 변환이 많이 적용되며 신경망을 결합한 형태가 제안되고 있지만 신경망 학습 시간이 오래 걸리는 단점을 가지고 있다. LVQ 신경망은 학습 시간이 짧고 클래스간의 분리도를 최대화할 수 있는 교사학습방법이다. 따라서, 본 논문에서 제안된 방법은 동영상으로부터 실시간으로 입력되는 얼굴영상을 PCA와 LDA변환을 순차적으로 적용하여 부분공간상의 변환된 특징벡터로부터 LVQ 신경망의 학습을 통하여 얼굴을 인식한다. 외부조명의 영향에 강건한 인식시스템을 구축하기 위하여 얼굴검출 단계에서 검출된 얼굴영역은 밝기값의 최대-최소 정규화 방법에 의해 보정된 정규화 영상을 생성한다. 정규화된 얼굴영상은 PCA와 LDA 변환을 통해 부분공간상의 특징벡터로 변환된다. 변환된 훈련 데이터로부터 LVQ 신경망의 초기 중심 벡터를 결정하고 신경망의 학습률 향상을 위해 K-Means 클러스터링 알고리즘을 적용하며, 초기 중심 벡터를 이용하여 LVQ2 학습 방법에 의해 학습된 중심벡터는 클래스의 대표 벡터가 된다. 결국 각 클래스의 대표 벡터로부터 입력 영상의 특징벡터간의 유클리디언 거리 비교법을 적용하여 얼굴 인식을 수행한다. ORL 데이터베이스를 이용한 정지 영상에 대한 인식과 실시간으로 입력되는 영상에 대한 인식 등 두 가지 형태의 영상을 기반으로 실험한 결과 두 경우에 모두 제안된 방법이 기존의 인식 방법보다 인식률에서 우수함을 입증할 수 있었다.

  • PDF