• 제목/요약/키워드: 직접 군집

검색결과 171건 처리시간 0.026초

추천 시스템의 예측 정확도 향상을 위한 전처리 방법 (Preprocessing Methods for Improving Prediction Accuracy in Recommender Systems)

  • 박석인;김택헌;류영석;양성봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.247-249
    • /
    • 2002
  • 협력적 여과(collaborative filtering) 방법을 사용하는 추천 시스템에서 예측 정확도를 높이는 방법들 중 하나는 군집화(clustering)방법이 있다. 군집화 방법은 선호도가 유사한 사용자들을 미리 같은 군집으로 만들고, 군집 내에 속한 사용자들을 이웃으로 선정하여 예측을 수행하기 때문에 군집화의 결과가 예측의 정확도에 직접적인 영향을 주게 된다. 본 연구에서는 군집화 결과의 향상을 위해 데이터를 전 처리하는 두 가지 방법과 군집화의 특성을 이용한 새로운 예측식을 제안하고, 기존 연구 방법과의 비교 실험을 통해 실험결과를 분석한다.

  • PDF

사람인식 및 클러스터링 기법을 이용한 군집분석 시스템 (Crowd Analysis System Using Human Recognition and Clustering Techniques)

  • 박태정;박지호;서보윤;신준하;최경환;유홍석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.485-487
    • /
    • 2023
  • 최근 코로나 19 방역지침 해제로 인한 대면적인 활동이 많아지면서 사람에 대한 서비스 제공이 중요한 이슈가 되었다. 하지만 사람들이 밀집되어있는 곳에서는 서비스가 원할하게 이루어지지 않는 경우가 대부분이다. 본 논문에서는 객체인식 알고리즘 기술인 Yolo와 OpenCv를 통해 카메라로 영상 속의 사람들을 인식하여 군집화 기술인 K-means 클러스터링을 이용해서 사람에 대한 군집화를 진행후 우선순위를 선정하고 좌표를 지정하여서 로봇이 군집의 좌표로 이동하여서 사람들에게 직접 접근하여 서비스를 제공할 수 있도록 하였다.

  • PDF

개선된 군집화 단계의 NofM 알고리즘을 이용한 훈련된 신경망으로부터의 규칙추출 (Rule extraction from trained neural network using NofM algorithm with improved clustering step)

  • 이한율;나종회;김문현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.581-584
    • /
    • 2001
  • 신경망이 만들어내는 출력에 대한 정보는 수치적으로 분산되어 신경망에 저장되므로, 인간이 직접 해석하기가 힘들다. 본 논문에서는 LRE(link rule extraction)기법인 NofM 알고리즘의 6단계 중에서 초기 단계인 가중치 군집화 단계를 개선하여 추출되는 규칙들의 전제부에 들어가는 규칙 조건들의 수를 조절함으로써, 추출된 규칙이 입력 특성에 대한 정보를 과잉 일반화하거나, 과잉 구체화하는 것을 피할 수 있음을 실험을 통해 보였다. 일반적으로 NofM 알고리즘에서 가중치들을 군집화한 때는 Join 알고리즘을 사용하는데, 본 논문에서는 Join 알고리즘의 Join condition을 0.05부터 0.25까지 0.05씩 점진적으로 확대하여 클러스터링을 하여줌으로써 신경망의 출력에 중요한 역할을 하는 가중치들을 효과적으로 군집화함을 보였다.

  • PDF

파노라마 생성을 위한 특징점 클러스터링 (Feature Points Clustering For Panorama Construction)

  • 김태우
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2007년도 추계학술발표논문집
    • /
    • pp.209-210
    • /
    • 2007
  • 불변 특징 기반의 파노라마 생성 방법은 직접 방법에 비해 비교적 처리 속도가 빠르다. 파노라마 생성 과정에서 특징점 추출과 특징 정합에 대부분의 시간이 소요된다. 본 논문에서는 파노라마 생성을 위한 특징점 클러스터링 방법을 제안한다. LoG 영상에서 특징점들을 추출한 후, 클러스터링을 통해 특징점들을 군집화한다. 군집도가 강한 특징점들은 그렇지 않은 특징점들보다 더 의미 있으므로, 파노라마 생성에서 군집도가 약한 군집을 배제함으로써 정확도가 높아지고 처리 시간이 빨라지는 장점이 있다. 실험에서 $320{\times}240$ 크기의 칼라 영상에 대해 제안한 방법의 처리 시간이 약2.0초로 클러스터링 처리를 하지 않는 방법에 비해 약 2배 빠른 결과를 보였다.

  • PDF

자기조직화지도에서 연결강도에 기반한 새로운 군집타당성지수 (A new cluster validity index based on connectivity in self-organizing map)

  • 김상민;김재직
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.591-601
    • /
    • 2020
  • 자기조직화지도는 고차원의 원자료를 노드들로 이루어진 저차원의 공간으로 투영하는 비지도학습 방법이다. 이 방법은 고차원의 자료를 노드들을 사용하여 2 또는 3차원의 공간에서 시각화할 수 있고, 이를 통해 자료의 특성을 탐색하는데 유용하다. 자료의 구조를 파악하기 위해 종종 노드들에 대한 군집분석을 시도하는데, 군집분석의 중요한 문제중 하나는 군집의 개수를 결정하는 것이다. 이 문제를 해결하기 위해 다양한 군집타당성지수들이 지금까지 개발되어 왔고, 이러한 지수들은 자기조직화지도의 노드들의 군집분석에 직접적으로 적용될 수 있다. 그러나, 자기조직화 지도가 원자료의 위상적 특성을 저차원 공간에 반영할 수 있다는 특징을 갖는데 반해, 이러한 일반적인 지수들은 이를 고려하지 않는 문제가 있다. 이에 본 연구에서는 원자료의 위상적 특성을 고려한 노드들 사이의 연결강도를 기반으로 하는 군집타당성지수를 제안한다. 이 새로운 군집타당성지수의 성능은 모의실험을 통해 기존의 군집타당성지수들과의 비교되고 검증된다.

군집 애니메이션을 이용한 유비쿼터스 사이버 아쿠아리움 (Ubiquitous Cyber Aquarium Using Schooling Animation)

  • 김종찬;조승일;김응곤
    • 한국멀티미디어학회논문지
    • /
    • 제11권10호
    • /
    • pp.1427-1435
    • /
    • 2008
  • 사이버 공간 및 게임 콘텐츠 상에 존재하는 수많은 캐릭터의 행동을 표현하기 위하여 개개의 움직임을 수작업으로 일일이 제작하여 제공하는 것이 거의 불가능하고 비효율적이기 때문에 이를 자동화하여 보다 사실적이고 효율적으로 표현하기 위해서는 군집 애니메이션 기술이 필요하다. 본 논문에서는 프로그래머가 가상현실이나 게임 응용 프로그램에서 군집행동을 프로그래밍 하는데 직접 활용하기 위한 군집행동 라이브러리로 사이버 아쿠아리움을 구현하고, 사람이 사이버 아쿠아리움으로 접근하는 것을 거리로 측정하는 센서 보드를 제작하여 물고기들의 능동적인 군집 행동을 유발하는 센서 기반의 유비쿼터스 사이버 아쿠아리움을 구축한다

  • PDF

신경망 GHSOM을 이용한 의료 문헌 정보의 군집화 (Medical Document Clustering using the Growing Hierarchical SOM)

  • 허진석;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.519-522
    • /
    • 2002
  • 일반적으로 PubMed와 같은 인터넷을 이용한 대규모 의료 문헌정보 검색시스템에서 포괄적인 주제어나 간결한 주제어를 이용한 검색을 시도할 경우, 종종 매우 다양한 세부주제의 문헌리스트들이 다량으로 검색된다. 이러한 경우 이용자는 실제로 본인이 원했던 세부주제에 부합되는 문헌들을 찾기 위해서는 검색결과로 주어진 긴 문헌리스트상의 문헌 하나하나에 대해 다시 문헌제목이나 혹은 요약 등의 내용을 직접 읽어보고 내용을 확인하여야 한다. 이러한 작업은 매우 번거럽고 시간과 노력을 많이 필요로 한다. 따라서 본 논문에서는 이러한 노력을 줄이기 위한 한 가지 방안으로, PubMed 시스템의 주제어 검색결과로 주어진 문헌들에 대해 내용의 유사성과 차별성에 따라 자동으로 몇 개의 그룹으로 나누어주는 군집화시스템 MedCluster의 설계와 구현에 대해 소개한다. MedCluster의 큰 특징은 기존의 문서 군집화 방법과는 다른 신경망 GHSOM을 이용한 군집화 방법을 사용하는 점이다. GHSOM은 미리 문서 그룹의 개수를 정해줄 필요가 없고 다양한 레벨의 문서 그룹들을 얻을 수 있는 계층적 군집화를 이루어낸다는 장점을 가지고 있다. 본 논문에서는 신경망 GHSOM의 구조와 특성에 대해 간략히 살펴보고, GHSOM을 채용한 의료문헌 군집화시스템 MedCluster의 설계와 구현에 대해 설명한다.

  • PDF

인자점수와 자기조직화지도를 이용한 희소한 문서데이터의 군집화 (Sparse Document Data Clustering Using Factor Score and Self Organizing Maps)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제22권2호
    • /
    • pp.205-211
    • /
    • 2012
  • 통계학과 기계학습의 다양한 기법을 이용하여 문서집합을 군집화하기 위해서는 우선 군집화분석에 적합한 데이터구조로 대상 문서집합을 변환해야 한다. 문서군집화를 위한 대표적인 구조가 문서-단어행렬이다. 각 문서에서 발생한 특정단어의 빈도값을 갖는 문서-단어행렬은 상당부분의 빈도값이 0인 희소성문제를 갖는다. 이 문제는 문서군집화의 성능에 직접적인 영향을 주어 군집화결과의 성능감소를 초래한다. 본 논문에서는 문서-단어행렬의 희소성문제를 해결하기 위하여 인자분석을 통한 인자점수를 이용하였다. 즉, 문서-단어행렬을 문서-인자점수행렬로 바꾸어 문서군집화의 입력데이터로 사용하였다. 대표적인 문서군집화 알고리즘인 자기조직화지도에 적용하여 문서-단어행렬과 문서-인자점수행렬에 대한 문서군집화의 결과들을 비교하였다.

고속도로 구간별 통행속도의 패턴과 영향에 따른 군집분석 (Cluster analysis for highway speed according to patterns and effects)

  • 김병수;안소영;손정민;박혜미
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.949-960
    • /
    • 2016
  • 본 논문은 고속도로 전 구간에 대해 2년간(2014년 1월-2015년 12월) 15분 단위로 관측한 고속도로 통행속도 데이터(VDS)를 사용하였다. 본 연구의 첫 번째 목적은 월 요일 시간대의 시간변수에 따라 반복적으로 나타나는 패턴이 비슷한 구간들의 군집을 구하는 것이다. 115개의 시간변수를 주성분분석으로 축약한 후 군집분석을 한 결과 시간변수에 따라 다양한 패턴을 보이는 군집들을 얻었으며, 이 결과는 실시간이 아닌 미래의 통행속도 예측을 위한 모형을 만드는데 활용될 수 있다. 두 번째 목적은 통행속도에 있어서 직접적으로 또는 간접적으로 영향을 주고받는 등 밀접한 관계가 있는 같은 영향권에 있는 구간들을 묶기 위해 군집분석을 하는 것이다. 구간끼리의 순수한 영향 정도를 보기 위해 각 구간별로 통행속도에 대한 백색화한 후 계산한 교차상관함수를 이용하여 군집분석을 하였다. 군집분석 결과 지리적으로 가까운 군집들이 다수 도출되었으며, 이 결과는 실시간 예측에 도움이 될 것이다.

행동 시계열 데이터와 k-평균 군집화를 통한 젖소의 일일 행동패턴 검출 (Daily Behavior Pattern Extraction using Time-Series Behavioral Data of Dairy Cows and k-Means Clustering)

  • 이성훈;박기철;박재화
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권1호
    • /
    • pp.83-92
    • /
    • 2021
  • 지난 동안 낙농업계에서는 다양한 센서 기술과 ICT 응용이 도입되어왔으며 축적된 낙농 데이터를 토대로 과학적인 낙농생산관리가 가능해졌다. 그러나 이러한 시도들은 젖소의 출산이나 우유 생산량과 같은 낙농 생산성에 직접적으로 관여하는 요인들에 대해서만 집중적으로 이루어졌으며 이러한 결과에 근본적으로 관여하는 생리학적 혹은 동물심리학적 요인에 대해서는 연구가 더딘 실정이다. 이 논문에서는 이러한 연구의 일환으로서 젖소의 시간별 행동 데이터로부터 일일 행동패턴을 검출하는 기초적인 방안을 제시하였다. k-평균 군집화를 통해 한 젖소의 1594일간 행동을 네 개의 군집으로 구분하였으며 각 군집에 속한 데이터와 군집의 대푯값을 시각화하여 군집 형성의 합리성을 확인하였다. 또한 개체의 일별 군집 변화를 토대로 군집 개수의 적정성을 판단하였다. 이 연구 결과가 향후 젖소의 이상상태나 질병징후의 포착 연구에 기여하기를 기대한다.