• 제목/요약/키워드: K-mean Clustering

검색결과 280건 처리시간 0.022초

연관관계 군집 분할 방법을 이용한 아이템 필터링 시스템 (Item Filtering System Using Associative Relation Clustering Split Method)

  • 조동주;박양재;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.1-8
    • /
    • 2007
  • 전자상거래에서 많은 아이템 중에 사용자에게 적합한 아이템을 추천하기 위해서는 많은 시간과 노력이 소요된다. 그러므로 추천 시스템이 사용자들을 대신하여 적합한 아이템을 추천해줄 수 있다면 만족을 얻을 수 있다. 본 논문에서는 정확성과 확장성을 향상시키기 위해서 협력적 필터링에서 연관관계 군집 분할 방법을 제안하였다. 평가한 데이터를 사용하여 연관 아이템간의 향상도를 산출하고 연관관계 군집의 효율성을 높이기 위해서 아이템으로 구성된 노드 군집을 분할하였다. 이는 군집들 중 하나의 아이템만이 연관성을 달리하고, 나머지 아이템들은 군집의 연관성이 충족되어진다면 결합하는 방법이다. 성능을 평가하기 위해서 MovieLens 데이터 집합에서 K-means와 EM에 의한 군집과 비교 평가하였다.

Regularization을 이용한 Possibilistic Fuzzy C-means의 확장 (An Extension of Possibilistic Fuzzy C-means using Regularization)

  • 허경용;남궁영환;김성훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.43-50
    • /
    • 2010
  • Fuzzy c-means(FCM)와 possibilistic c-means(PCM)는 퍼지 클러스터링 영역에서 대표적인 두 가지 방법으로 많은 패턴 인식 문제들에 성공적으로 활용되어져 왔다. 하지만 이들 방법 역시 잡음 민감성과 중첩 클러스터 문제를 가지고 있다. 이들 문제점을 극복하기 위해, 최근 두 방법을 결합하려는 시도가 있어왔고, possibilistic fuzzy c-means(PFCM)는 FCM과 PCM을 목적 함수 단계에서 통합함으로써 두 방법이 가지는 문제점을 완화시키는 성공적인 결과를 보여주었다. 이 논문에서는 PFCM에 regularization을 도입함으로써 PFCM의 잡음 민감성을 한층 더 줄여줄 수 있는 향상된 PFCM을 소개한다. Regularization은 해공간을 평탄화 함으로써 잡음의 영향을 줄이는 대표적인 방법 중 하나이다. 제안한 방법은 PFCM의 장점과 더불어 regularization에 의해 잡음의 영향을 더욱 줄일 수 있으며, 이는 실험을 통해 확인할 수 있다.

풍력 데이터를 이용한 발전 패턴 예측 (Predicting Power Generation Patterns Using the Wind Power Data)

  • 서동혁;김규익;김광득;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.245-253
    • /
    • 2011
  • 화석 연료의 무분별한 사용으로 환경이 심각하게 오염되고, 화석 연료의 고갈에 대한 문제가 대두됨에 따라서 화석 연료에 대한 문제를 해결 할 수 있는 대체 에너지원에 대해 관심이 집중되기 시작하였다. 현재 신재생 에너지 중에서 가장 각광을 받고 있는 에너지는 중에 하나가 풍력에너지이다. 풍력에너지 발전단지와 기존의 전력 발전소는 소비되는 전력에 대한 생산의 균형을 맞춰야하며, 풍력에너지단지에서 균형적인 생산을 하기 위해서는 풍력에너지에 대한 분석 및 예측이 필요하다. 이를 위해서 데이터마이닝 분야의 예측 기법이 활용 될 수 있다. 본 논문에서는 풍력 데이터를 이용하여 발전 패턴을 예측하기 위해 SOM(Self-Organizing Feature Map) Clustering 기법과 의사결정나무(decision tree)를 이용한 연구를 진행하였다. 즉, 1) 풍력 데이터의 누락된 데이터와 이상치 데이터를 처리하기 위하여, 전처리 과정을 수행하였고, 이 과정에서 특징 벡터를 추출하였다. 2) 전처리 단계를 거쳐 정제되고 정규화된 데이터 집합을 MIA(Mean Index Adequacy) 척도와 SOM Clustering 기법에 적용하여 대표 발전 패턴을 찾아내고 각각의 데이터에 해당하는 대표 패턴을 클래스 레이블로 할당하도록 하였다. 3) 의사결정나무 기반의 분류 기법에 데이터 집합을 적용시켜 새로운 풍력에너지에 대한 분석 및 예측 모델을 생성하였다. 실험 결과, 의사결정나무를 통한 풍력에너지 발전 패턴을 예측하기 위한 모델을 구축하였다.

Prompt engineering to improve the performance of teaching and learning materials Recommendation of Generative Artificial Intelligence

  • Soo-Hwan Lee;Ki-Sang Song
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.195-204
    • /
    • 2023
  • 본 연구에서는 GPT, Stable Diffusion과 같은 생성형 인공지능을 이용한 교수·학습 자료 추천 성능 향상을 위해 프롬프트를 개선하는 프롬프트 엔지니어링에 대해 탐색하였다. 분석할 교수·학습 자료의 종류는 그림 자료이다. 프롬프트 구성에 따른 영향을 탐색하기 위해 명령만 담긴 Zero-Shot 프롬프트, 학습 대상 학년 정보가 담긴 프롬프트, 학습 목표가 담긴 프롬프트, 학습 대상 학년과 학습 목표가 모두 담긴 프롬프트를 설계하여 각각을 GPT-3.5모델에 입력하고 응답을 수집하였다. 수집한 응답을 Sentence Transformers로 임베딩 하고 t-SNE를 활용하여 차원 축소하여 시각화 한 다음 프롬프트와 응답 간의 관계를 탐색하였다. 그리고 각 응답을 k-means clustering algorithm을 활용하여 군집화 한 다음 가장 넓은 클러스터의 첫 번째 값을 대표로 선택하여 Stable Diffusion을 이용하여 이미지화 한 다음 교수·학습자료 평가 기준에 따라 초등학교 교사 30명에게 평가 받았다. 초등학교 교사 30인은 추천한 4종의 그림 자료 중 3종은 교육적 가치가 있다고 판단하였으며, 그 중 2종은 실제 수업에 사용할 수 있다고 하였다. 가장 가치 있는 그림 자료를 추천한 프롬프트는 대상 학년과 학습 목표가 모두 담긴 프롬프트로 나타났다.

항만 경쟁력 평가를 위한 유사도 기반의 이산형 평균 알고리즘 (A Dispersion Mean Algorithm based on Similarity Measure for Evaluation of Port Competitiveness)

  • 추봉성;이철영
    • 한국항해항만학회지
    • /
    • 제28권3호
    • /
    • pp.185-191
    • /
    • 2004
  • 평균법과 클러스터링은 다속성 평가문제에서 널리 쓰이고 있는 중요한 데이터 마이닝 기법들이다. 그러나, 다양한 다속성 평가 문제에서 데이터 마이닝을 할 때, 데이터들의 특징은 그 중요성이 달라질 수 있기 때문에 이러한 데이터의 중요도 차이를 고려해야 할 필요가 있다. 따라서, 이러한 기법들은 데이터의 선택 및 중요도 등과 같이 그 특징을 얼마나 잘 반영하는 지가 중요하다. 게다가, 산술평균법의 경우에는 우선순위 및 가중치로 정의되는 평가구조에서 적합한 결과를 산출하기에는 한계가 있을뿐 만 아니라, 평가자 그룹별 특징을 반영하기 곤란하다. 따라서, 본 연구에서는 기하학적 도형을 바탕으로 유사도를 평가하여, 평가자 그룹별로 특징지어지는 이산적인 환경에서의 평균을 산출하는 알고리즘을 제안하였다. 본 알고리즘의 핵심사항 중 하나는, 항목별 우선순위의 혼돈없이 유사도를 평가할 수 있다는 점이다.

k-means 클러스터링을 이용한 CCTV의 효율적인 운영 설계 (Design of video surveillance system using k-means clustering)

  • 홍지훈;김승호;이근호
    • 사물인터넷융복합논문지
    • /
    • 제3권2호
    • /
    • pp.1-5
    • /
    • 2017
  • CCTV 기술이 발달하면서 여러 분야에서 사용하고 있다. 현제 CCTV 운영에 대해서 구체적으로 알아보고자 하며 또한 많은 분야에서 CCTV가 생기면서 운영에 대한 문제점이 생기고 있는데 문제점을 해결하기 위해 새로운 시스템을 설계하고자한다. 본 논문에서는 CCTV가 효율적으로 운영될 수 있도록 K-means을 이용하여 데이터 분석을 진행하고 영상기술도 증가시키고 효율적으로 운영이 가능하도록 기존 시스템에 새로운 기술을 및 기능을 추가하여 문제점을 해결하고 더 좋은 기술로 발전하고자 한다. 또한 관제센터에서 효율적으로 CCTV를 운영할 수 있도록 k-means를 이용하여 CCTV 기술에 새로운 시스템을 설계하여 문제점을 해결 효율적 관리를 위해 제안하고자 한다.

Mapping of Education Quality and E-Learning Readiness to Enhance Economic Growth in Indonesia

  • PRAMANA, Setia;ASTUTI, Erni Tri
    • Asian Journal of Business Environment
    • /
    • 제12권1호
    • /
    • pp.11-16
    • /
    • 2022
  • Purpose: This study is aimed to map the provinces in Indonesia based on the education and ICT indicators using several unsupervised learning algorithms. Research design, data, and methodology: The education and ICT indicators such as student-teacher ratio, illiteracy rate, net enrolment ratio, internet access, computer ownership, are used. Several approaches to get deeper understanding on provincial strength and weakness based on these indicators are implemented. The approaches are Ensemble K-Mean and Fuzzy C Means clustering. Results: There are at least three clusters observed in Indonesia the education quality, participation, facilities and ICT Access. Cluster with high education quality and ICT access are consist of DKI Jakarta, Yogyakarta, Riau Islands, East Kalimantan and Bali. These provinces show rapid economic growth. Meanwhile the other cluster consisting of six provinces (NTT, West Kalimantan, Central Sulawesi, West Sulawesi, North Maluku, and Papua) are the cluster with lower education quality and ICT development which impact their economic growth. Conclusions: The provinces in Indonesia are clustered into three group based on the education attainment and ICT indicators. Some provinces can directly implement e-learning; however, more provinces need to improve the education quality and facilities as well as the ICT infrastructure before implementing the e-learning.

역광 이미지의 효율적인 컬러 색상 보정을 위한 Retinex 알고리즘의 성능 개선 (Retinex Algorithm Improvement for Color Compensation in Back-Light Image Efficently)

  • 김영탁;유재형;한헌수
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.61-69
    • /
    • 2011
  • 본 논문은 상대적으로 대비도 차이가 크게 나타나는 역광 이미지에 대해서 Retinex 알고리즘을 적용하여 보정 했을 경우 발생하는 밝은 영역에서의 컬러성분의 손실을 개선하기 위한 새로운 기법을 제안한다. 역광 이미지의 경우 밝은 영역과 어두운 영역에 대한 밝기 차이가 매우 크게 발생하기 때문에 Retinex 알고리즘을 이용하여 영상의 대비도를 향상시킬 경우 밝은 영역에서의 컬러 성분이 손실되는 현상이 발생한다. 이러한 손실을 보완하기 위해서 원본 영상의 밝은 영역에 해당하는 컬러 성분을 Retinex 알고리즘으로 보정된 영상에 추가해준다. K-mean 알고리즘을 이용하여 원본 영상에서의 밝은 영역, 어두운 영역, 중간 영역을 분리하고 밝은 영역에 대해서의 컬러 성분을 추가적으로 복원해 주며, 중간 영역에 대해서는 히스토그램에서의 위치를 기준으로 밝고 어두운 성분에 대한 비율을 고려하여 각 비율에 따라 원본 영상과 Retinex 복원 영상의 밝기 값을 함께 이용하도록 한다. 제안하는 알고리즘의 성능 평가를 위해 역광 현상이 강하게 나타나는 자연영상들을 대상으로 적용하여 기존의 Retinex 알고리즘보다 우수한 성능을 가지고 있음을 보였다.

군집기법을 이용한 연강수량 예보개선에 관한 연구 (A Study on the Improvement of Quantitative Precipitation Forecast using a Clustering Method)

  • 김광섭;조소현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.94-97
    • /
    • 2009
  • 연 및 계절강수량의 정확한 예보는 수자원관리에 매우 중요하다. 예보 정확도를 높이기 위한 다양한 연구가 계속 진행되어 왔다. 그럼에도 불구하고 강수자료가 가지는 매우 큰 불확실성 때문에 예보의 정확도 향상은 계속되는 숙제로 우리에게 남아 있다. 이를 개선하기 위하여 본 연구에서는 군집화 기법을 이용한 연 및 계절 강수량 예측개선에 대한 연구 결과를 제시하였다. 이를 위하여 연강수량, 계절강수량 및 월강수량의 예측을 위하여 전구에서 일어나는 각종 기후 인자들과의 상관성 분석은 대단히 중요하다. 전 세계적으로 어느 특정 지역에서의 선행 기후인자 변화 양상이 우리나라의 강수량에 높은 상관성을 가지며 영향을 미친다면 예측을 위한 매우 유용한 정보라 하겠으나 국내 강수량과 기후 지수 사이의 선형 상관성은 매우 낮을 뿐만 아니라 지체상관성도 특정 지체에서 매우 큰 상관성을 보이는 인자를 찾기 어려움을 알 수 있다. 이를 극복하기 위하여 본 연구에서는 k-mean clustering을 이용하여 우리나라 주변의 기후조건을 분류하고 기후조건에 따른 강수량의 변화를 분석하였다. 남중국해역($105^{\circ}E\;^{\sim}\;135^{\circ}E$, $0^{\circ}N\;^{\sim}\;35^{\circ}N$), 우리나라 연안 해역 ($110^{\circ}E\;^{\sim}\;150^{\circ}E$, $20^{\circ}N\;^{\sim}\;40^{\circ}N$), 인도양 해역 ($75^{\circ}E\;^{\sim}\;105^{\circ}E$, $0^{\circ}N\;^{\sim}\;25^{\circ}N$) 및 아라비아 해역 ($45^{\circ}E\;^{\sim}\;75^{\circ}E$, $0^{\circ}N\;^{\sim}\;30^{\circ}N$ 평균 해수면 온도 변화에 따라 8개 군집으로 분류한 분석결과로 분석결과 2008년도는 그룹 5에 해당하며 그룹 5의 기후 상태는 근해와 남중국해역의 평균 해수면 온도가 평년보다 낮고 인도양 해역과 아라비아 해역의 평균 해수면 온도는 평년값과 비슷한 상태를 나타낸다. 그룹 5에 해당하는 기후조건에서 차년의 강수평균은 평년값 보다 적음을 보였다. 이러한 특성은 전체 유역에 걸쳐 동일하게 나타났다. 이에 대한 계절적 평균 분포는 군집 5에 대한 차년도 강수의 평균 계절분포는 전체적으로 평년값보다 낮게 나타났다. 이에 근거하여 올해 연 평균 강수량은 평년값보다 적을 것이며 전체 계절에 대하여도 평년값보다 적은 강수량이 올 것으로 판단된다. 이는 기상청의 2009년 봄철 기후전망과 유사한 예측 결과를 보여준다.

  • PDF

퍼지클러스터링 기법과 신경회로망을 이용한 고장표시기의 고장검출 능력 개선에 관한 연구 (A Study on the Improvement of Fault Detection Capability for Fault Indicator using Fuzzy Clustering and Neural Network)

  • 홍대승;임화영
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.374-379
    • /
    • 2007
  • 본 논문은 전력계통의 배전계통시스템에서 FRTU(Feeder remote terminal unit)의 고장검출 알고리즘의 개선에 관한 연구이다. FRTU는 상과 지락에 관한 고장검출을 할 수 있다. 특히 고장픽업 기능과 돌입억제기능은 일반적인 부하전류로부터 고장전류를 구별할 수 있다. FRTU는 돌입전류 또는 설정값을 초과한 고장전류가 발생하면 고장표시기(FI)로 고장을 발생한다. 짧은 시간 푸리에 변환(STFT) 분석은 주파수와 시간에 관한 정보론 제공하고, 퍼지 중심 평균 클러스터링(FCM) 알고리즘은 고조파의 특성을 추출한다. 고장 검출기의 신경회로망 시스템은 최급강하법을 이용하여 고장상태로부터 돌입전류를 구별하도록 학습된다. 본 논문에서는 FCM과 신경회로망을 이용하여 고장검출기법을 개선하였다. 검증에 사용된 데이터는 22.9KV 배전계통 시스템에서 실제 측정된 데이터이다.