• 제목/요약/키워드: 이슈 클러스터링

검색결과 45건 처리시간 0.018초

소프트웨어 공수 예측의 정확성에 대한 이상치 제거의 영향 분석 (Analyzing Influence of Outlier Elimination on Accuracy of Software Effort Estimation)

  • 서영석;윤경아;배두환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.589-599
    • /
    • 2008
  • 정확한 소프트웨어 공수 예측은 소프트웨어 관련 여러 커뮤니티들에서 예전부터 항상 이슈가 되어 왔다. 소프트웨어 공수 예측의 정확도를 향상시키기 위해 지금까지 많은 연구들에서는 데이타 품질이 공수 예측에 중요한 요소들 중 하나임에도 불구하고 이것에 대한 고려 없이 공수 예측 기법들에만 초점을 맞추어 왔다. 본 연구에서는 소프웨어어 공수 예측 기법과 이상치 제거 기법들 사이의 영향 관계를 공수 예측 정확도의 관점에서 실험적으로 살펴본다. 두 개의 프로젝트 데이타들(ISBSG와 국내의 한 금융 조직으로부터 수집된 데이타)에 대해 일반적으로 많이 사용되는 세 가지 공수 예측 기법(최소제곱법, 신경망 네트워크, 그리고 베이지안 네트워크)과 두 가지 이상치 제거 기법(최소절사제곱법과 K-means 클러스터링)을 적용시켜 결과들을 서로 비교해 보고 이상치 제거 기법을 적용하지 않은 결과와도 비교해 본다.

역방향 인덱스 기반의 저장소를 이용한 이상 탐지 분석 (Anomaly Detection Analysis using Repository based on Inverted Index)

  • 박주미;조위덕;김강석
    • 정보과학회 논문지
    • /
    • 제45권3호
    • /
    • pp.294-302
    • /
    • 2018
  • 정보통신 기술의 발전에 따른 새로운 서비스 산업의 출현으로 개인 정보 침해, 산업 기밀 유출 등 사이버 공간의 위험이 다양화 되어, 그에 따른 보안 문제가 중요한 이슈로 떠오르게 되었다. 본 연구에서는 기업 내 개인 정보 오남용 및 내부 정보 유출에 따른, 대용량 사용자 로그 데이터를 기반으로 기존의 시그니처(Signature) 보안 대응 방식에 비해, 실시간 및 대용량 데이터 분석기술에 적합한 행위 기반 이상 탐지방식을 제안하였다. 행위 기반 이상 탐지방식이 대용량 데이터를 처리하는 기술을 필요로 함에 따라, 역방향 인덱스(Inverted Index) 기반의 실시간 검색 엔진인 엘라스틱서치(Elasticsearch)를 사용하였다. 또한 데이터 분석을 위해 통계 기반의 빈도 분석과 전 처리 과정을 수행하였으며, 밀도 기반의 군집화 방법인 DBSCAN 알고리즘을 적용하여 이상 데이터를 분류하는 방법과 시각화를 통해 분석을 간편하게 하기위한 한 사례를 보였다. 이는 기존의 이상 탐지 시스템과 달리 임계값을 별도로 설정하지 않고 이상 탐지 분석을 시도하였다는 것과 통계적인 측면에서 이상 탐지 방식을 제안하였다는 것에 의의가 있다.

무선 센서 네트워크에서 확률 기반의 클러스터링을 이용한 계층적 데이터 전송 프로토콜 (A Probability-based Clustering Protocol for Data Dissemination in Wireless Sensor Networks)

  • 김문성;조상훈;임형진;추현승
    • 인터넷정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.153-160
    • /
    • 2009
  • 무선 센서 네트워크를 위한 데이터 전송의 설계 중에서 가장 중요한 이슈 중 하나는 에너지 효율적인 측면이다. 이를 위해 최근 여러 연구들이 진행되고 있으며 그중에서 가장 대표적인 프로토콜은 SPMS이다. SPMS의 주요 특징 중 하나는 에너지 소비를 줄이기 위한 수단으로 최단경로를 사용한다는 것이다. 그러나 반복적인 최단 경로의 사용으로 인하여 네트워크 라이프타임의 최대화는 불가능하다. 본 논문에서는 에너지 잔존량과 거리를 메트릭으로 사용하는 확률 함수 기반의 데이터 전송 프로토콜을 제안한다. 시뮬레이션 결과, 제안 프로토콜은 에너지 효율적인 데이터 전송을 하며 SPMS보다 네트워크 라이프타임이 약 78%증가하였다.

  • PDF

사용자 맞춤형 건강정보 추천 앱 구현 (Implementation of App System for Personalized Health Information Recommendation)

  • 박성민;박정수;이윤규;채우준;신문선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.316-318
    • /
    • 2019
  • 최근 고령화사회의 진입으로 건강수명이 이슈가 되고 있으며 삶의 질 향상을 위한 지속적 건강관리에 관심이 높아지고 있다. 본 논문에서는 사용자들의 편리한 건강관리를 위한 사용자 맞춤형 건강정보 추천 앱 시스템을 구현하였다. 사용자는 생활습관, 질병, 신체조건 등의 기본 정보를 입력하고 입력된 사용자의 PHR(Personal Health Record)는 서버에 저장된다. 저장된 다수의 사용자들을 PHR프로파일에 따라 유사한 군집으로 분류하여 유사 사용자들에게 헬스케어 관련 콘텐츠를 제공하고자 하였다. 사용자의 PHR에 따른 유사군집의 생성을 위하여 K-Means 클러스터링을 적용하였으며 지식베이스에 저장된 건강정보 콘텐츠들을 맞춤형으로 제공하기 위하여 개미군집 알고리즘을 사용하였다. 개발된 앱은 사용자의 PHR 프로파일로 분류된 군집에 따라 위험한 질병, 개선해야 할 생활 습관 등에 대한 정보를 제공하여 사용자의 자가 헬스케어에 활용될 수 있다.

  • PDF

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.