• 제목/요약/키워드: 시간 마이닝

검색결과 400건 처리시간 0.029초

Unified Process의 분석 클래스에 대한 복잡도 척도 (Complexity Metrics for Analysis Classes in the Unified Software Development Process)

  • 김유경;박재년
    • 정보처리학회논문지D
    • /
    • 제8D권1호
    • /
    • pp.71-80
    • /
    • 2001
  • 구조적 개발 방법론에 적용하도록 만들어진 복잡도 척도들은 클래스, 상속성, 메시지 전달 그리고 캡슐롸와 같은 객체지향의 개념에 직접적으로 적용할 수 없다. 또한, 기존이 객체지향 소프트웨어에 대한 척도의 연구는 프로그램의 복잡도나, 설계 단계의 척도가 대부분이었다. 실제로 분석 단계 클래스의 복잡도를 낮춤으로써, 시스템의 개발 노력이나 비용 및 유지보수 단계에서의 노력이 크게 줄어들게 되므로, 분석 클래스에 대한 복잡도를 측량하기 위한 척도가 필요하다. 본 논문에서는 객체지향 개발방법론인 Unified Process의 분석 단계에서 추출되는 분석 클래스에 대하여 복잡도를 측정할 수 있는 새로운 척도를 제안한다. 협력의 복잡도 CC(Collaboration Complexity)는 가능한 협력의 최대 수로서 클래스가 잠재적으로 얼마나 복잡할 수 있는지를 측정하기 위한 척도이며, 각 협력자들의 인터페이스를 이해하는 것과 관련된 총체적 어려움을 측정하는 인터페이스 복잡도 IC(Interface Complexity)를 정의하였다. 제안된 척도는 클래스의 크기 및 상속성에 대하여 수학적인 증명을 하였으며, Weyuker의 9가지 공리적 성질에 대하여 이론적인 검증을 하였다. 또한, 텍스트 마이닝 기법을 사용하여 사용자의 질문에 자동으로 응답하는 시스템의 분석 클래스에 대하여 제안된 척도를 사용하여 복잡도를 측정하였고 기존의 복잡도 척도인 CBO와 WMC의 값을 계산하여 비교하였다. CC와 CBO, IC와 WMC의 값을 비교해 본 결과 제안된 복잡도 척도의 계산 결과 제안된 복잡도 척도의 계산 결과 값이 그 값들보다 좀 더 복잡도를 잘 표현하고 있었다. 이로써 소프트웨어 개발 주기의 초기에 클래스에 대한 복잡도를 평가해 보고, 나머지 단계에 필요한 시간과 노력을 예측함으로써 보다 비용-효과적인 객체지향 소프트웨어를 개발할 수 있는 가능성이 높아진다.

  • PDF

사용자 리뷰를 이용한 상품 특징 추출 및 평점 분배 (Product Feature Extraction and Rating Distribution Using User Reviews)

  • 손수빈;전종훈
    • 한국전자거래학회지
    • /
    • 제22권1호
    • /
    • pp.65-87
    • /
    • 2017
  • 온라인 쇼핑몰에서 상품에 대한 사용자 리뷰와 평점을 분석하여 상품의 특징을 자동으로 추출하고 평점이 어떤 특징에 의해 부여된 것인지 판단하여 각 특징에 분배하여 점수화함으로써 상품의 특징을 파악할 수 있는 방법을 제안한다. 기존 방식은 상품 구매 여부를 결정하기 위해서 많은 리뷰와 평점을 읽는데 시간을 허비하거나, 상품의 장단점을 파악하기 어려울 뿐더러 상품에 부여된 평점이 어떠한 특징에 의해서 부여되었는지 알 수 없는 구조로 되어있다. 따라서 본 논문에서는 이러한 문제를 해소하기 위하여 사용자 리뷰에서 상품의 특징을 자동으로 추출하고 각 특징별 평점을 전체 평점에서 자동으로 분배 계산하여 보여주는 방법을 제안한다. 제안하는 방법은 상품별 리뷰와 평점을 수집하여 형태소 분석을 수행하고 이를 통해 상품의 특징과 이에 대한 감성어를 추출한다. 또한, 상품의 특징을 파악할 수 있도록 각 특징에 대한 가중치를 특징이 출현한 문장의 극성을 판단하여 부여하는 방법을 기술한다. 실험을 통하여 얻은 결과와 기존 방법을 비교하는 설문조사를 통하여 제안하는 방법의 유용성을 입증하였고, 상품 리뷰 전문가의 분석과 실험의 결과를 비교함으로써 타당성을 입증하였다.

상황인식형 비즈니스 차트 추천기 개발을 위한 개방형 온라인 텍스트로부터의 시각화 규칙 추출 방법 연구 (A Method of Mining Visualization Rules from Open Online Text for Situation Aware Business Chart Recommendation)

  • ;권오병
    • 한국전자거래학회지
    • /
    • 제25권1호
    • /
    • pp.83-107
    • /
    • 2020
  • 데이터의 성격과 시각화의 목적에 따라 비즈니스 차트를 선택하는 것은 비즈니스 분석에 유용한 지식이다. 그러나 현재 시각화 도구에는 상황에 맞는 비즈니스 차트를 선택할 수 있는 기능이 부족하다. 또한 매번마다 시각화 방법에 대해 전문가의 도움을 요청하는 것은 비용과 시간이 소요된다. 따라서 본 연구의 목적은 온라인으로 게시된 문서로부터 비즈니스 차트 선정 규칙에 대한 지식을 추출하여 비즈니스 차트 생산성을 향상시키는 방법을 제안하는 것이다. 이를 위해 인터넷에서 비즈니스 차트를 묘사하는 한국어, 영어 및 중국어 비정형 데이터를 수집하고 TF-IDF를 사용하여 컨텍스트와 비즈니스 차트 간의 관계를 계산했다. 또한 Galois 래티스를 사용하여 비즈니스 차트 선택 규칙을 생성했다. 제안된 방법으로 생성된 규칙의 품질을 평가하기 위해 실험군과 대조군에 대해 실험을 수행했다. 그 결과 제안된 방법으로 의미 있는 규칙이 추출되었음을 확인했다. 본 연구의 결과물로 시각화 전문가의 도움 없이도 사무직 직원들이 비즈니스 차트를 효율적으로 선택할 수 있을 것으로 기대된다. 또한 작업 중인 문서를 기반으로 비즈니스 차트를 추천함으로 직원 교육에 유용할 것이다.

객체지향 분석 단계에서의 클래스 복잡도 측정 (Measurement of Classes Complexity in the Object-Oriented Analysis Phase)

  • 김유경;박재년
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권10호
    • /
    • pp.720-731
    • /
    • 2001
  • 구조적 개발 방법론에 적용하도록 만들어진 복잡도 척도들을 클래스의 상속성, 다형성, 메시지 전달 그리고 캡슐화와 같은 객체지향의 개념에 직접적으로 적용할 수 없다. 또한 기존의 객체지향 소프트웨어에 대한 척도의 연구는 프로그램의 복잡도나, 설계 단계의 척도가 대부분이었다. 실제로 분석단계 클래스의 복잡도를 낮춤으로서 시스템의 개발 노력이나 비용 및 유지보수 단계에서의 노력이 크게 줄어들게 되므로, 분석 클래스에 대한 복잡도를 측량하기 위한 척도가 필요하다. 본 논문에서는 객체지향 개발방법론인 RUP(Rational Unified Process)의 분석 단계에서 추출되는 분석 클래스에 대해서 복잡도를 측정할 수 있는 새로운 척도를 제안한다. 협력 복잡도CC(Collaboration Complexity)는 가능한 협력의 최대 수로서 클래스가 잠재적으로 얼마나 복잡할 수 있는지를 측정하기 위한 척도이며, 각 협력자들의 인터페이스를 이해하는 것과 관련된 총체적 어려움을 측정하는 인터페이스 복잡도 IC(Interface Complexity)를 정의하였다. 제안된 척도는 Weyuker의 9가지 공리적 성질에 대하여 이론적인 검증을 하였으며, 텍스트 마이닝 기법을 사용하여 사용자의 질문에 자동으로 응답하는 시스템의 분석 클래스에 대하여 제안된 척도를 적용하여 복잡도를 측정하였다. 제안된 CC와 IC의 값과 Chidamber와 Kemerer가 제안된 CBO와 WMC의 값을 비교해 본 결과, 제안된 복잡도 척도의 계산결과 값이 큰 클래스의 경우에는 설계 이후 단계에서도 역시 복잡도가 커지게 되는 것을 알 수 있었다. 이로써 소프트웨어개발 주기의 초기에 클래스에 대한 복잡도를 평가해 보고, 나머지 단계에 필요한 시간과 노력을 예측함으로써 보다 비용-효과적인 객체지향 소프트웨어를 개발할 수 있는 가능성이 높아질 것으로 기대된다.

  • PDF

로그 회귀분석 및 CART를 활용한 수력사업의 CDM 승인여부 예측 모델에 관한 연구 (Predicting the success of CDM Registration for Hydropower Projects using Logistic Regression and CART)

  • 박종호;구본상
    • 한국건설관리학회논문집
    • /
    • 제16권2호
    • /
    • pp.65-76
    • /
    • 2015
  • 청정개발체제(CDM) 사업은 신재생에너지사업의 보조를 통해 지구온난화 가스의 감축을 꾀하는 대표적인 국가 및 기업 간 배출권 거래(cap and trade)제도이다. 재래식 발전 방식에 비해 수익성이 낮은 태양광, 풍력, 수력 등의 사업이 CDM 사업으로 승인을 받으면 매년 탄소배출권(CER)을 제공받고, 이의 판매를 통해 발생한 추가 수익으로 인해 사업 타당성이 향상될 수 있다. 그러나 CDM 사업으로 인정받기 위해서는 환경적, 기술적, 경제적 추가성(Additionality)를 입증해야 하는데, 해당 적용 기술, 베이스라인 측정 방법론, 온실 가스 감축량, 사업 내부 수익률(IRR) 등 다수의 변수에 따라 결과가 달라지기 때문에 사전적으로 승인여부를 파악하기가 어렵다. 본 연구에서는 신재생에너지로 분류되는 수력 사업의 CDM 승인여부를 예측할 수 있는 모델을 개발하는 것을 목표로 하였다. 구체적으로 UNFCCC에서 제공하는 수력 사업 데이터를 활용하여 로그 회귀분석 및 CART 분석을 실시하여 예측모델을 개발하였으며 이와 함께 승인 여부에 유의하게 영향을 미치는 핵심 인자들을 파악하였다. 구축된 로그 회귀 및 CART 예측모델은 AUC가 각각 0.7674 및 0.7231로 예측 정확성이 비교적 높게 나왔다. 또한 수력 사업에서는 온실가스 저감량 대비 투자액, 시간당 발전량 및 내부수익률이 승인여부에 유의한 변수들로 파악되었고, 이에 비해 특정 기술이나 측정 방법론은 영향이 없는 것으로 드러났다. 즉, 특정 기술을 불문하고 온실가스를 투자 대비 가장 효율적으로 저감하는 사업과 수력사업들 중 상대적으로 소규모로 진행되는 사업이 CDM 사업으로 승인될 가능성이 높다는 것으로 해석된다.

SNS감성 분석을 이용한 주가 방향성 예측: 네이버 주식토론방 데이터를 이용하여 (Stock Price Prediction Using Sentiment Analysis: from "Stock Discussion Room" in Naver)

  • 김명진;류지혜;차동호;심민규
    • 한국전자거래학회지
    • /
    • 제25권4호
    • /
    • pp.61-75
    • /
    • 2020
  • 주식의 가격을 이해하고 예측하기 위해서 활용되는 데이터의 범위는 기존의 정형화된 데이터에서 비정형화된 다양한 종류의 데이터로 확대되고 있다. 본 연구는 SNS에서 수집된 댓글 데이터가 주식의 미래 가격의 변동에 영향을 미치는지를 조사한다. 가장 많은 주식투자자가 참여하는 커뮤니티인 네이버 주식토론방에서 20개 종목에 대한 6개월 간의 댓글 데이터를 수집하여, 이들 데이터가 1시간 후의 가격 변동의 방향과 가격 변동의 폭에 대한 예측력을 가지는지 조사한다. 예측 관계는 LSTM과 CNN등의 딥뉴럴네트워크 기법을 활용하여 모델링하였다. 20개 종목에 대해 조사하여 13개 종목에서 미래의 주가 이동 방향을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었고, 16개 종목에서 미래의 주가 변동폭을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었다. 본 연구는 네이버 주식토론방과 같은 SNS에서 형성된 여론이 주식 종목의 수급에 영향을 주어 가격의 변동 요인으로도 작용할 수 있다는 점을 확인한다.

지노믹트리 Microarray 토탈솔루션

  • 오태정
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2006년도 Principles and Practice of Microarray for Biomedical Researchers
    • /
    • pp.46-55
    • /
    • 2006
  • (주)지노믹트리는 DNA 마이크로어레이 기술을 기반으로 하는 분자진단회사로서, 다음의 세가지 사업에 전력하고 있다. 첫째는 독창적이며 특화된 바이오마커 발굴기술 (MAGIC system)을 바탕으로 각종 암진단을 위한 바이오마커 개발연구 두 번째는 당사의 원천 기술인 다중동시검출 시스템을 이용한 질병 진단 시스템 및 증폭시스템 세 번째는 마이크로어레이 기술을 이용한 유전자 발현 분석, Array CGH, DNA 메틸레이션 분석 그리고 miRNA 검출 등의 지노믹스시대의 연구를 위한 토탈솔루션을 제공하고 있다. 지난 5년간의 마이크로어레이 기반기술을 이용한 자체연구 활동을 수행하면서 축적된 마이크로어레이 관련기술 노-하우들을 국내 마이크로어레이 연구자들에게 공급하기 위하여 노력하고 있다. 특히 당사의 지노믹서비스 부문은 유전자 발현 분석 솔루션 제공을 위해서 자체적으로 제작하여 공급하고 있는 human cDNA(17K/25K) 및 rat cDNA (5.0K) 마이크로어레이, Human (22K) 및 mouse (10K) 올리고뉴클레오타이드 마이크로 어레이 그리고 미생물 연구를 위한 대장균 (6K) 및 폐렴균 (2.2K) 올리고뉴클레오타이드 마이크로어레이 제공 및 이를 이용한 유전자 발현 분석 서비스를 제공하고 있다. 체적으로 제작되는 마이크로어레이 서비스는 2001년 도입한 ISO9001 품질인증시스템의 기반하에서 제작부터 생산까지의 엄격한 품질관리 과정을 거쳐서 고품질의 마이크로어레이를 이용한 분석서비스를 제공 하고 있다. 또한 고객요구형 서비스를 위하여 국외 유수의 마이크로어레이 회사 (Agilent, Microarray Inc, TIGR, Eurogentec 등)의 whole genome 기반의 마이크로어레이 제품을 이용한 분석서비스를 제공하고 있으며 마이크로어레이 실험을 위해서 필수적으로 이용되고 있는 시약 (labeling kit), 마이크로어레이 hybridization을 위한 hardware (hybridization chamber, hnay centrifuge)등을 자체적으로 개발하여 공급하고 있다. DNA copy number 측정을 위한 Array CGH 분석을 위해서는 자체적으로 제작공구하고 있는 human cDNA 마이크로어레이 (17K/25K) 그기고 rat (5.0K) 마이크로어레이를 이용한 분석서비스 및 whole genome 기반의 Agilent 올리고뉴클레오타이드 CGH 어레이 (44K, 35Kb resolution)를 이용한 분석서비스를 제공하고 있다. Epigenetic study를 하는 연구자들을 위한 메틸레이션 마이크로어레이 분석 서비스를 제공하고 있다. 기존분석법인 Bisulfite 처리기반의 분석이 아닌 enzyme digestion후 PCR 증폭방법을 이용한 분석방법을 이용함으로써, bisulfite 처리에 의한 DNA 손실문제를 최소화 하였다. 현재 50개의 문헌을 통해 잘 보고된 메틸레이션 유전자들에 대한 분석서비스를 제공하고 있으며, 지속적으로 표적컨텐츠의 숫자를 증가시킬 예정이다. 최근 많은 연구자들의 관심을 끌고 있는 micro RNA 검출을 위한 DNA 마이크로어레이 서비스를 제공할 예정이다 (2006년 3월 출시). 현재 까지 알려진 약 320개의 모든 miRNA를 탑재하고 있는 소형 DNA 마이크로어레이를 이용한 분석서비스로서 1장의 마이크로어레이 실험을 통하여 알려진 모든 miRNA의 비교분석이 가능하다. 마이크로어레이 실험 뿐만 아니라 data 분석을 위한 software도 상당히 중요한 비중을 차지하고 있다 이를 위하여 (주)지노믹트리는 Agilent에서 개발한 GeneSpring GX (유전자 발현 분석), Signet (마이크로어레이 database) 및 GeneSpring GT (SNP 분석)를 공급하고 있다. 통계적인 기반 지식의 없은 일반 user들을 위한 간편하면서도 종합적인 기능을 포함하고 있는 우수한 프로그램으로 이미 국제적으로 많은 인정을 받고 있다. (주)지노믹트리는 국내외 많은 연구자들의 경제적, 시간적 연구여건을 고려한 마이크로어레이 토탈솔루션을 제공하고 있으며, 실험 분석에서 data 마이닝 그리고 마이크로어레이 실험 디자인에 이르는 토탈솔루션을 제공하고 있다.

  • PDF

데이터마이닝 알고리즘의 분류 및 분석 (Classification and Analysis of Data Mining Algorithms)

  • 이정원;김호숙;최지영;김현희;용환승;이상호;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.279-300
    • /
    • 2001
  • 지식탐사 프로세스의 핵심적인 역할을 담당하는 데이터마이닝 단계에서는 여러 가지 목적에 따라 알고리즘을 선택하여 사용한다. 최근 통계, 비즈니스, 전자 상거래, 의학, 생물학 등의 분야에서 데이터마이닝 기술아 적극적으로 활용되고 있으며, 이를 위해 다양한 알고리즘들이 계속해서 연구.개발되고 있다. 그러나 시간이 지나면 이들 중 각 분야 별로 우수한 응용성을 보이는 알고리즘이나 방대한 양의 데이터를 다루는데 있어 좋은 성능을 보이는 몇몇 알고리즘만이 남게 될 것이며 또한 앞으로는 이러한 알고리즘들만을 선별하여 집중 연구할 필요가 있다. 따라서 본 논문에서는 데이터마이닝에 널리 사용되고 활발한 연구가 진행중인 알고리즘들 중에서 연관규칙(association rule), 클러스터링(clustering), 신경망(neural network), 결정트리(decision tree), 유전자 알고리즘(genetic algorithm), 베이지안 네트워크(bayesian network), 메모리 기반 추론(memory-based reasoning)등 7가지 카테고리에 속하는 알고리즘들을 선정하여 분류.분석하였다. 우선 각 알고리즘의 계통과 특성들을 분석하였고 이를 토대로 비교.분석을 위한 14가지의 분류 기준을 제시하였다. 이러한 분류 기준에 근거하여 세부 알고리즘들을 분석해 보고 비교 가능한 일부 알고리즘은 여러 특징과 성능을 중심으로 각각 최상의 알고리즘을 도출해 보았다. 본 연구 결과는 데이터마이닝 분야의 흔재된 알고리즘들을 분류.분석함으로써 마이닝 기술 적용시 사용자에게 알고리즘 선택의 지표를 제시할 수 있을 것이다.

  • PDF

인공신경망 기반 온실 외부 온도 예측을 통한 난방부하 추정 (Outside Temperature Prediction Based on Artificial Neural Network for Estimating the Heating Load in Greenhouse)

  • 김상엽;박경섭;류근호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권4호
    • /
    • pp.129-134
    • /
    • 2018
  • 최근, 인공신경망 모델은 예측, 수치제어, 로봇제어, 패턴인식 등의 분야에서 촉망되는 기술이다. 본 연구에서는 인공신경망 모델을 이용하여 온실 외부 온도를 예측하고 이를 온실제어에 활용하는데 목적이 있다. 예측 모델의 성능 평가를 위해 다중회귀모델과 SVM 모델과의 비교분석을 수행하였다. 평가 방법으로는 10-Fold Cross Validation을 사용하였으며, 예측 성능 향상을 위해 상관관계분석 통해 데이터 축소를 수행하였고, 측정 데이터로부터 새로운 Factor 추출하여 데이터의 신뢰성을 확보하였다. 인공신경망 구축을 위해 Backpropagation algorithm을 사용하였으며, 다중회귀모델은 M5 method로 구축하였고, SVM 모델을 epsilon-SVM으로 구축하였다. 각 모델의 비교분석 결과 각각 0.9256, 1.8503과 7.5521로 나타났다. 또한 예측모델을 온실 난방부하 계산에 적용함으로써 온실에 사용되는 에너지 비용 절감을 통한 수입증대에 기여할 수 있다. 실험한 온실의 난방부하는 3326.4kcal/h이며, 총 난방시간이 $10000^{\circ}C/h$일 때 연료소비량은 453.8L로 예측된다. 아울러 데이터 마이닝 기술 중 하나인 인공신경망을 정밀온실제어, 재배기법, 수확예측 등 다양한 농업 분야에 적용함으로써 스마트 농업으로의 발전에 기여할 수 있다.

기업 직무 정보를 활용한 OOPP(Optimized Online Portfolio Platform)설계 (A Design of the OOPP(Optimized Online Portfolio Platform) using Enterprise Competency Information)

  • 정보근;박진욱;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.493-506
    • /
    • 2018
  • 본 논문에서는 직무별로 취업에 필요한 역량을 나타내고, 구직자가 온라인상에서 포트폴리오를 효율적으로 작성하고 관리하는 OOPP(Optimized Online Portfolio Platform)를 제안한다. 제안하는 OOPP는 세 가지 모듈로 구성된다. 첫째, JDCM(Job Data Collection Module)은 직업정보 사이트의 구인 광고들을 수집하여 스프레드시트에 저장한다. 둘째, CSM(Competency Statistical Medel)은 수집한 구인 광고들을 텍스트 마이닝하여 직무별로 요구되는 핵심 역량을 분류한다. 셋째, OBBM(Optimize Browser Behavior Module)은 브라우저의 처리속도를 개선하여 사용자가 데이터를 빠르게 조회할 수 있게 한다. OBBM은 검색엔진의 연산을 최적화하는 PSES(Parallel Search Engine Sub-Module)과 이미지 텍스트 등의 로드를 최적화하는 OILS(Optimized Image Loading Sub-Module)로 구성된다. 제안하는 OOPP의 성능분석 결과 CSM로 분석된 데이터의 정확도는 최대 100%, 최소 99.4%로 실제 광고와 분석된 데이터의 차이가 거의 발생하지 않았으며, OBBM을 이용한 브라우저 최적화를 실행하면, 작업시간이 약 68.37%가 감소한다. 결과적으로 OOPP는 직현재 직업정보 사이트의 구인 광고를 정확하게 분석하여 사용자가 분석한 결과를 웹페이지에서 신속하게 조회할 수 있다.