• 제목/요약/키워드: 소프트웨어 클러스터링

검색결과 148건 처리시간 0.022초

통신이력 데이타에 기반한 교우관계 분석 (Peer Relationship Analysis Based on Communication History Records)

  • 문양세;최훈영;김진호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.730-740
    • /
    • 2006
  • 최근 청소년의 교우관계에 있어서 집단 따돌림과 불량 그룹이 사회적으로 큰 문제가 되고 있다. 본 논문에서는 학생들의 교우관계를 보다 객관적으로 분석하는 방법을 제안한다. 분석을 위한 객관적인 데이타로는 교우관계 정보를 묵시적으로 내포하고 있는 통신이력 데이타를 사용하며, 체계적 분석을 위하여 데이타 마이닝 기법을 활용한다. 제안하는 분석 방법은 다음과 같다. 첫째, 교우간 친밀도 (degree of familiarity) 개념을 정형적으로 정의하고, 여러 통신도구에서 발생한 통신이력 데이타를 기반으로 교우 간 친밀도를 수학적으로 계산하는 방법을 제안한다. 제안하는 방법은 학생 x가 y로 통신을 많이 시도할수록, 학생 x 의 y 에 대한 교우간 친밀도가 높다는 직관을 사용한다. 둘째, 계산한 교우간 친밀도를 사용하여 집단 따돌림의 가능성이 높은 학생을 파악한다. 이는 집단 따돌림 가능성이 높은 학생은 다른 학생으로부터의 통신 시도가 적을 것이라는 직관에 기반한다. 셋째, 교우간 친밀도를 데이타 마이닝 기법 중 하나인 클러스터링으로 분석하여 의미 있는 교우집단을 파악한다. 클러스터링 기법을 사용하기 위하여, 본 논문에서는 교우간 친밀도를 기반으로 교우간 유사도 (similarity) 개념을 정형적으로 정의하고, 이를 사용하여 클러스터링을 수행한다. 마지막으로, 제안한 방법의 실용성을 입증하기 위하여, 실제 구현 및 분석 실험을 수행하고, 그 의미를 해석한다. 이 같은 결과를 볼 때, 본 연구는 학생들의 교우관계를 보다 객관적으로 파악할 수 있는 효과적인 방법론이라 사료된다.

전력데이터 분석에서 이상점 추출을 위한 데이터 클러스터링 아키텍처에 관한 연구 (A Novel of Data Clustering Architecture for Outlier Detection to Electric Power Data Analysis)

  • 정세훈;신창선;조용윤;박장우;박명혜;김영현;이승배;심춘보
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권10호
    • /
    • pp.465-472
    • /
    • 2017
  • 과거에는 전력데이터를 분석하는 기법으로 주로 기계학습의 지도학습 기법을 많이 활용하였고 데이터 마이닝 기법을 통한 패턴 검출을 주로 연구하였다. 그러나 전력데이터의 규모 커지고 실시간 데이터 공급이 가능해진 현재에는 과거의 데이터 분류 및 분석 기법을 통한 데이터 분석 연구는 한계가 존재한다. 이에 본 논문에서는 큰 규모의 전력데이터를 분석할 수 있는 클러스터링 아키텍처를 제안한다. 제안하는 클러스터링 프로세스는 비지도학습기법인 K-means 알고리즘의 문제점을 보완하고 전력데이터 수집과 분석까지의 모든 과정을 자동화할 수 있는 프로세스이다. 총 3 Level로 구분하여 Row Data Level, Clustering Level, User Interface Level로 구분하여 전력데이터를 분류 및 분석한다. 또한 클러스터링의 효율성 향상을 위하여 주성분분석 및 정규분포기반의 최적의 클러스터 수 K값 추출과 이상점으로 분류되는 데이터 감소를 위한 변형된 K-means 알고리즘을 제시한다.

트레이닝 데이터 감소를 위한 병렬 평면 기반의 Support Vector Machine (Support Vector Machine Using Parallel Hyperplane for Reduction of Training Data)

  • 이태호;김민우;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.115-116
    • /
    • 2019
  • SVM (Support Vector Machine)은 견고성으로 인해 다양한 분류 문제에 적용 할 수 있는 효율적인 기계 학습 기술이다. 그러나 훈련 데이터의 수가 증가함에 따라 시간 복잡도가 급격히 증가하므로 대규모 데이터 세트의 경우 SVM이 비실용적이다. 본 논문에서는 SVM을 사용하여 중복 된 학습 데이터를 효율적으로 제거하는 새로운 병렬 평면(Parallel Hyperplane) 기법을 소개한다. 제안 기법에서 PH는 재귀 적으로 형성되는 반면 PH의 외부에 있는 데이터 포인트의 클러스터는 매 반복마다 제거된다. 시뮬레이션 결과 제안 기법은 기존의 클러스터링 기반 감축 기법과 SMO 기법에 비해 학습 시간을 크게 단축시키면서 데이터 축소 없이 분류의 정확성을 높일 수 있음을 확인 하였다.

  • PDF

렌더링 가속화 기술 동향 (The Recent Trends of Rendering Acceleration Technologies)

  • 남승우;김해동;김성수;최진성
    • 전자통신동향분석
    • /
    • 제22권4호통권106호
    • /
    • pp.12-23
    • /
    • 2007
  • 컴퓨터 그래픽스를 이용한 디지털 콘텐츠를 제작 및 생산함에 있어서 마지막 단계에서 렌더링 과정을 꼭 거쳐야 하기 때문에 렌더링 부분은 아주 중요하다. 렌더링해야 할 디지털 콘텐츠에는 게임과 같이 실시간성이 아주 중요한 콘텐츠가 있으며, 영화와 같이 영상의 높은 품질을 요구하는 콘텐츠가 있다. 본 고에서는 영화와 같이 고품질을 요구하는 콘텐츠에 대한 렌더링 기술에 대하여 다루고자 한다. 영화의 한 장면과 같이 복잡하며 높은 해상도를 갖는 영상을 기존 단일 CPU 및 소프트웨어 렌더러를 이용하여 렌더링하는 데 아주 많은 시간이 걸린다. 본 고에서는 렌더링 시간을 줄이며 높은 품질의 렌더링 결과를 얻는 기술을 3가지 부분에서 소개하고자 한다. 첫번째 방법에는 수십 개에서 수천 개의 CPU를 이용하거나 PC를 클러스터링하는 방법이고, 두번째는 기존 GPU의 기술이 아주 빨리 발전하여 CPU 보다 빠른 성능을 갖기 때문에 GPU를 활용하여 가속화하는 방법이 있으며, 세번째는 전용 하드웨어를 제작하여 렌더링을 가속하는 방법이 있다. 위의 방법들에 대한 기술 동향에 대하여 살펴보도록 한다.

시간열 데이터 마이닝을 이용한 게임 사용자 모델 분석 (Game Player Model Analysis with Time-series Data Mining)

  • 김종인;황지안;정기철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.293-296
    • /
    • 2007
  • 컴퓨터 게임 산업이 발전함에 따라 사용자의 흥미를 측정하거나 불법 소프트웨어 구별을 위해 사용자 분석에 관한 연구가 진행 중이다. 그 예로 최근에 사용자 분석을 통하여 게임 레벨 디자인을 하거나 이를 게임 균형에 이용하는 연구들이 있다. 본 논문은 개인적인 게임 환경에서 사용자의 적절한 게임 경험을 위해 시간열 데이터 마이닝 개념을 이용하여 게임 사용자 모델 분석을 제안한다. 본 논문은 사용자가 게임을 하고 있는 동안 의미 있는 사용자 행동을 저장하고 차원감소와 SOM을 이용하여 4가지 행동 유형으로 클러스터링하고 행동 유형에 따른 사용자를 분석한다.

  • PDF

전자상거래에서의 인터넷 경매를 위한 마진 푸쉬 멀티 에이전트 시스템 (Margin Push Multi-agent System for Internet Auction in Electronic Commerce)

  • 이종희;이용준;김정재;이근왕;오해석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.337-339
    • /
    • 2000
  • 현재 전자상거래에서의 이용률이 저조한 경매시스템을 지능적인 소프트웨어 에이전트를 이용하여 사용자 측면에서 더욱 효율적이고 효과적인 경매시스템을 연구 및 개발은 커다란 이슈가 되고 있다. 따라서, 단순한 게시판 형식의 인터넷 경매 시스템의 인공지능 에이전트를 도입하여 해당 경매 상품에 대해 판매자에게 적정한 경매 시기와 초기값을 계산 및 예측하여 최대한의 마진을 남길 수 있도록 해주는 에이전트 시스템의 연구가 본 논문의 목적이다. 상품을 인터넷 경매에 올리는 판매자가 판매 하고자 하는 경매 상품에 대한 정보를 인터넷 경매 시스템의 에이전트에게 메일로 보내면 에이전트 해당 상품고 유사한 상품에 대해 클러스터링하여 이미 학습되어져 있는 유사 상품에 대한 정보 즉, 데이터 베이스에 저장되어 있는 경매 상품에 대한 입찰 히스토리와 경매시간, 경매방법, 낙찰가격 등을 계산하여 해당 상품에 대해 판매자가 어느 시기에 얼마의 초기 가격으로 경매를 시작하면 최대한의 마진을 남길 수 있는지에 대해 정보를 메일로 푸쉬해 주는 시스템을 설계하면 마진 알고리즘을 이용하여 만진 결정 에이전트에 의해 마진을 생성하며 생성된 마진은 푸쉬에이전트에 의해 경매자에게 메일로 결과값을 전송해 주는 시스템을 제안한다.

  • PDF

진화 프로그램을 이용한 퍼지 클러스터링 (Fuzzy Clustering using Evolution Program)

  • 정창호;임영희;박주영;박대희
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권1호
    • /
    • pp.130-130
    • /
    • 1999
  • In this paper, we propose a novel design method for improving performance of existing FCM-type clustering algorithms. First, we define the performance measure which focuses on bothcompactness and separation of clusters. Next, we optimize this measure using evolution program.Especially the proposed method has following merits: ① using evolution program, it solves suchproblems as initialization, number of clusters, and convergence to local optimum ② it reduces searchspace and improves convergence speed of algorithm since it represents chromosome with possiblepotential centers which are selected possible candidates of centers by density measure ③ it improvesperformance of clustering algorithm with the performance index which embedded both compactnessand separation Properties ④ it is robust to noise data since it minimizes its effect on center search.

SPC-10기반 소프트웨어 PLC 컴파일러 개발 (Development of an Software Programmable Logic Control Compiler based on SPC-10)

  • 조영임
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.206-209
    • /
    • 2005
  • 본 논문에서는 국내에서 상용화되고 있는 삼성전자의 SPC-10의 IEC1131-3 표준 언어(LD, SFC, FBD, ST)가 상호 호환성을 갖도록 목적 언어인 IL로 변환하여 컴파일 될 수 있는 IL 컴파일러를 개발하고자 한다. 개발하려는 IL 컴파일러는 IL언어의 활용성을 매우 높여주며, 실제네트워크 디바이스에 다운로드 하여 사용할 수 있는 IL 언어를 생성하고 실행시키는 점이 특징이다. 이 시스템은 SPC-10에서 많이 사용되는 언어를 패턴인식에 의해 클러스터링하여 자동적으로 IL 언어로 변환이 되며, 컴파일에 의해 PLC 프로그램의 동작이 가능하다. 이 시스템에서는 또한 사용자가 발생할 수 있는 문법오류는 물론 논리오류를 지능적 에이전트에 의해 검색하여 수정함으로써 최적화된 환경에서 PC 기반 제어가 가능하도록 해준다.

  • PDF

빅 데이터의 분석을 통한 정보 자동 요약 시스템 (Automatic Information Summary System using by Big Data Analysis)

  • 윤다영;이현화;송재오;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.415-416
    • /
    • 2014
  • 오늘날 인터넷상에서는 무수히 많은 디지털 데이터가 생성되고 있으며, 그 디지털 데이터는 기존의 소프트웨어로는 처리할 수 없을 정도로 그 양이 방대해지고 있다. 이러한 데이터들을 사용자의 검색의도에 따라 문장 분석, 키워드 추출, 요약문 생성 등의 방법을 통하여, 사용자에게 개인화된 정보를 제공하기 위한 빅 데이터의 분석을 이용한 정보 자동 요약 시스템을 제안한다.

  • PDF

OODBMS 성능향상을 위한 객체 선인출 전략 (An Adaptable Object Prefetch for Enhancing OODBMS Performance)

  • 안정호;김형주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권2호
    • /
    • pp.191-202
    • /
    • 1999
  • 객체지향 데이터베이스에서 객체 접근의 성능은 효율적인 객체 선인출을 통해 이루어질 수 있다. 본 연구에서는 고급의 객체 시맨틱을 사용하지 않고 세그먼트를 단위로 선택적인 객체 선인출을 수행하는 동적 SEOF(Selective Eager Object Fetch)방법을 고안하였다. 본 알고리즘은 객체 인출의 상관 관계와 빈도수를 모두 고려하였으며, 다른 기존의 객체 선인출 방법들과는 달리 시스템의 부하에 따라 선인출의 정도를 동적으로 조정함으로써 클라이언트의 메모리나 스왑 자원을 효율적으로 이용하여 시스템의 성능을 향상시킨다. 또한 제안된 방법은 객체 버퍼의 사용을 제한하여 자원의 고갈을 막을 수 있으며 , 클러스터링의 정도나 데이터베이스의 크기에 대해 효과적으로 대응한다. 본 논문에서는 다양한 다중 클라이언트 환경에서의 시뮬레이션을 통해 제안된 알고리즘의 성능 평가를 실시하였다.