• 제목/요약/키워드: Datamining

검색결과 87건 처리시간 0.02초

풍력 데이터를 이용한 발전 패턴 예측 (Predicting Power Generation Patterns Using the Wind Power Data)

  • 서동혁;김규익;김광득;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.245-253
    • /
    • 2011
  • 화석 연료의 무분별한 사용으로 환경이 심각하게 오염되고, 화석 연료의 고갈에 대한 문제가 대두됨에 따라서 화석 연료에 대한 문제를 해결 할 수 있는 대체 에너지원에 대해 관심이 집중되기 시작하였다. 현재 신재생 에너지 중에서 가장 각광을 받고 있는 에너지는 중에 하나가 풍력에너지이다. 풍력에너지 발전단지와 기존의 전력 발전소는 소비되는 전력에 대한 생산의 균형을 맞춰야하며, 풍력에너지단지에서 균형적인 생산을 하기 위해서는 풍력에너지에 대한 분석 및 예측이 필요하다. 이를 위해서 데이터마이닝 분야의 예측 기법이 활용 될 수 있다. 본 논문에서는 풍력 데이터를 이용하여 발전 패턴을 예측하기 위해 SOM(Self-Organizing Feature Map) Clustering 기법과 의사결정나무(decision tree)를 이용한 연구를 진행하였다. 즉, 1) 풍력 데이터의 누락된 데이터와 이상치 데이터를 처리하기 위하여, 전처리 과정을 수행하였고, 이 과정에서 특징 벡터를 추출하였다. 2) 전처리 단계를 거쳐 정제되고 정규화된 데이터 집합을 MIA(Mean Index Adequacy) 척도와 SOM Clustering 기법에 적용하여 대표 발전 패턴을 찾아내고 각각의 데이터에 해당하는 대표 패턴을 클래스 레이블로 할당하도록 하였다. 3) 의사결정나무 기반의 분류 기법에 데이터 집합을 적용시켜 새로운 풍력에너지에 대한 분석 및 예측 모델을 생성하였다. 실험 결과, 의사결정나무를 통한 풍력에너지 발전 패턴을 예측하기 위한 모델을 구축하였다.

통신 데이터를 활용한 도보관광코스 유동인구 추정 및 분석 (Estimation of Flow Population of Seoul Walking Tour Courses Using Telecommunications Data)

  • 박예림;강영옥
    • 지적과 국토정보
    • /
    • 제49권1호
    • /
    • pp.181-195
    • /
    • 2019
  • 본 연구의 목적은 통신 데이터를 통해 구축한 유동인구 데이터를 활용하여 서울시 도심도보관광코스 내 유동인구 특성을 파악하고 효과적으로 시각화하여 공간적인 맥락을 분석하는 것이다. 도로에 따른 유동인구 추정을 위해 유동인구 데이터 정제 기법을 개발하여 도보관광코스 별 유동인구 데이터를 구축하였다. 도보관광코스 분석에 적합한 형태로 정제하기 도로 주변 유동인구 값을 고려한 유동인구 추정하여 도보관광코스 내 유동인구를 할당하였다. 정제된 데이터를 바탕으로 서울도보관광 18개 코스 각각의 유동인구 특성과 공간 특성을 도출하였다. 도보관광코스 내 유동인구의 공간 밀도와 집중 구간을 분석하기 위해 커널 밀도분석과 Getis-Ord $G^*_i$ 통계를 적용하였으며 3D 시각화를 통해 서울도보관광 18개 코스별 유동인구 특성을 성, 연령, 시간, 요일에 따라 정량적으로 파악하였다. 그 결과 청계천 제1코스, 경희궁-서대문코스, 인사동-운현궁 코스 순으로 유동인구 규모가 크게 나타났으며 주중에는 인사동-운현궁, 주말에는 성북동 코스의 유동인구가 많았다. 남성 유동인구 비율이 가장 높은 코스는 청계천 제1코스, 여성 유동인구 비율이 가장 높은 코스는 몽촌토성 코스였다. 주말 유동인구 비율이 가장 높은 도보관광코스는 성북동 코스임을 확인할 수 있었다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

중소기업 기술 유출에 대한 조기경보시스템 개발에 대한 연구 (Development on Early Warning System about Technology Leakage of Small and Medium Enterprises)

  • 서봉군;박도형
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.143-159
    • /
    • 2017
  • 급속한 IT의 발전으로 인해 개인정보뿐만 아니라 기업이 보유하고 있는 핵심 기술 및 정보에 대한 유출 위협이 중요한 이슈로 인식되고 있다. 기업에게 있어서 보유하고 있는 핵심 기술은 기업의 생존 및 지속적으로 경쟁 우위를 차지하기 위해 매우 중요한 부분이다. 최근 기술 침해 사례가 많이 일어나고 있는데, 기술 유출은 기업에게 있어서 주가하락 등의 막대한 재무적인 손실을 가져올 뿐만 아니라, 기업의 신뢰에 손상을 입게 되고, 기업의 발전을 지연시키게 되는 악영향을 미치게 된다. 특히, 대기업에 비해 핵심기술이 기업 내 중요한 많은 부분을 차지하는 중소기업에 있어서 기술 유출에 대한 대비는 기업의 존립에 있어서 필수적인 요소로 볼 수 있다. 이처럼 정보 보안 관리의 필요성과 중요성이 대두되면서 기업 입장에서 조기에 기술 침해 위협에 대해 확인하고 대비할 필요가 있다. 본 연구에서는 기술 유출에 영향을 미치는 요인들을 탐색하는 실증 분석을 수행하고, 인공지능 알고리즘을 통해 기술유출 조기경보시스템을 개발하고자 한다. 구체적으로 본 연구에서는 중소기업이 보유한 기술 유출에 영향을 미치는 요인들을 로지스틱 회귀분석을 통해 확인해보고, 통계분석을 통해 검증된 요인들을 기반으로 인공지능 여러 기법들 중 하나인 Support Vector Machine을 활용하여 기술침해 가능성을 조기에 알려주는 모형을 개발하였다. 본 연구에서 제안하는 기술 유출 가능성에 대한 조기 경보 모형을 통해 기업 및 정부 관점에서 기술 유출을 미리 예방할 수 있는 기회를 제공할 수 있을 것으로 기대된다.

인공신경망을 이용한 경제 위기 예측 (The Prediction of Currency Crises through Artificial Neural Network)

  • 이형용;박정민
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.19-43
    • /
    • 2016
  • 이 연구에서 Asia 금융 위기의 원인을 고찰하여 보고, European Monetary Systems의 금융 위기와 비교하여 본다. Asian 신흥 국가들은 1997년도에 금융 위기를 경험하였고, European Monetary Systems의 국가들도 1992년도에 동일한 경험을 하였다. 또한, 중남미의 신흥 경제국가인 Mexico 역시 1994년에 금융위기를 겪었다. 이 연구의 목적은 이들 금융위기의 내면을 고찰하고 그 결과로부터 일반화된 법칙을 추출하는 것이다. 이 연구에서는 금융위기를 경험한 한국과 영국과 멕시코를 각각 세가지 다른 모형으로 연구하고 비교하였다. 이 접근 방법은 체계적인 조사를 통하여 세 국가의 차이점을 보여주고 또한 공통적인 내재 요인을 관찰한다. 이전의 많은 연구 방법들은 대부분 선형 회귀식을 통한 causal model에 초점을 맞추고 있지만, 이러한 선형 회귀 모형의 약점을 보완하여서 현실에 산재하며 존재하는 비 선형의 문제를 해결하기 위하여 또 다른 방법을 제안하여 본다. 이 연구에서 사용한 구조 방정식(Structural Equation Model) 모형은 현실로부터 원인을 추출하고 분석하는 연구에 적합하며, 신경망(Artificial Neural Network) 모형은 선형모형의 단점을 보완하여서 비 선형 요인을 설명해 준다. 구조방정식 모형에 적용하기 위하여서 LISREL(LInear Structural RELationship)을 사용하였다. LISREL은 확인적 요인분석과 계량경제학에서 개발된 연립방정식모델에 토대를 둔 다중회귀분석 및 경로분석 등이 결합된 성격을 갖는 방법론으로 다양한 연구에 적용된다. 또한 인공지능(Artificial Intelligence) 기법 중의 하나인 신경망 모형은 선형회귀 분석과 다른 형태의 결과를 도출한다. 세가지 방법론의 우수성을 비교하기 위하여 Hit ratio를 각 국가/ 각 방법론 별로 구분하여서 비교한 결과 다른 방법론 보다 신경망이 더 좋은 성과를 나타내고 있는 것을 확인할 수 있었다. 세가지 방법론에 각각 일반적인 환율 예측에 사용되는 변수를 사용하였다. 소비자 물가지수(Consumer Price Index), 국내총생산(Gross Domestic Product), 이자율(Interest rate), 주가지수(Stock Index), 경상수지(Current Account), 외환보유고(Foreign Reserves)의 6가지 변수를 이용하여서 환율을 예측하여서 급격한 환율 변화로 초래되는 경제위기를 예측하려고 하였다. 각각의 국가의 데이터는 대한민국은 1991년부터 1999년까지, 영국은 1986년부터 1995년까지, 멕시코는 1988년부터 1998년까지의 기간을 정하여서 시계열자료를 분기별로 사용하였다. 각각의 데이터는 Data Stream과 한국은행(Bank of Korea)의 데이터를 이용하여서 분석하였다. 선형회귀방정식을 이용한 분석과 구조방정식인 LISREL을 이용한 분석은 각각 Hit ratio가 국가별로 순위가 변동되기도 하였으나, 인공지능 방법론인 인공신경망의 경우는 모든 국가에서 가장 좋은 예측 결과를 나타내고 있었다. 이 논문은 환율의 변동에 대한 다양한 예측 모형을 비교하고 평가하여서 연구에서 제시하는 개념을 검토하였다는 점에서 의의를 갖는다.

데이터마이닝을 활용한 소프트웨어 개발인력의 업무 지속수행의도 결정요인 분석 (A Study of Factors Associated with Software Developers Job Turnover)

  • 전인호;박선웅;박윤주
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.191-204
    • /
    • 2015
  • 국내 소프트웨어(SW) 개발인력의 미충원율은 매우 높으며, 특히 2년 이상의 현장경력이 있는 고급 개발자의 부족문제는 심각하다. 최근 정부도 이를 인식하고, 정책적으로 SW개발 신규인력 양성에 힘을 기울이고 있다. 그러나, 이러한 노력은 초급개발자의 수급문제를 해결하는데 효과적일 수 있지만, 업계에서 요구하는 고급 개발자의 부족현상을 해결하는 근본적인 대책으로 인식되지는 못하고 있다. SW 전문개발자를 양성하기 위해서는 초급개발자들이 지속적으로 직무를 수행하여 풍부한 업무경험을 갖춘 고급 개발자로 성장해야 하기 때문이다. 이에, 본 연구는 국내 SW업체에서 근무하고 있는 개발관련 인력들의 업무 지속수행 의도를 조사하고, 이에 영향을 주는 주요요인들을 분석하였다. 이를 위해, 2014년 9월부터 10월까지 국내 SW업체에 근무하고 있는 현직 개발자 총 130명을 대상으로 설문조사를 수행하였으며, 이를 기반으로 SW개발업무 지속수행의도 및 이에 영향을 주는 요인들을 개발자의 특성, 직무환경, 그리고 SW개발자에 대한 사회적 인식 및 산업전망 등의 측면에서 분석하였다. 분석에는 데이터마이닝 기법들 중에서, 분석과정에서의 설명능력이 있는 회귀분석과 의사결정나무가 사용되었다. 회귀분석 결과, SW개발자가 스스로 인식하는 근무 가능한 연령이 높을수록, 내성적인 성향을 가질수록, 또한 적성에 맞아서 직무를 선택한 경우, 지속적 직무 수행 의도가 높은 것으로 나타났다. 이와 더불어, 선형회귀분석에서는 유의하지 않았으나, 규칙기반의 의사결정나무 분석에서 파악된 추가적 요인으로, 새로운 기술에 대한 학습능력 및 SW산업에 대한 전망이 직무 지속수행의도에 영향을 미치는 것으로 나타났다. 이러한 연구결과는 기업의 인적자원관리 및 고급 SW인력 양성정책에 활용될 수 있을 것으로 생각되며, 궁극적으로 SW개발인력의 직무 지속성을 증진시키는 데 기여할 수 있을 것으로 기대된다.

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발 (Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining)

  • 윤승진;김수환;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.1-17
    • /
    • 2015
  • 최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.