• 제목/요약/키워드: 연관성분석

검색결과 4,843건 처리시간 0.028초

과실 생산량과 기상요소간의 연관분석 마이닝 (Association rule Mining between Climate factors and Fruits yields)

  • 우종선;;류근호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.23-25
    • /
    • 2016
  • 이 논문에서는 기후조건과 농업 생산량을 포함하는 농업/기상 데이터에 데이터 마이닝의 연관규칙 기법을 적용하여 농업 생산의 기반이 되는 기후요인들과 생산량 간의 연관성을 분석하고자 한다. 기후 속성들의 값을 포함하고 있는 기상청 기후 데이터와 농업 생산량을 포함하는 통계청의 데이터를 통합 한 후 기후 속성들의 값을 이산화 하여 연관규칙 기법을 적용한다. 실험 결과 각 기후요소들과 생산량 간의 연관 규칙을 표현 할 수 있었다. 이를 통해 기후조건 변화에 따른 농업생산기반 취약성을 예방하는 지표를 마련하고 농업 생산성 향상에 기여 할 수 있을 것으로 기대한다.

  • PDF

연관규칙 분석을 통한 건설공사 분쟁유형과 분쟁원인의 연관성 분석에 관한 연구 (Association Rules Analysis Between the Types and Causes of Disputes in Construction Projects)

  • 장세림;김한수
    • 한국건설관리학회논문집
    • /
    • 제23권5호
    • /
    • pp.3-14
    • /
    • 2022
  • 건설공사는 이해관계자들 간에 클레임(claim)이 발생할 가능성이 높은 특징을 지니고 있다. 클레임 그 자체가 분쟁은 아니지만, 당사간에 이견이나 갈등으로 인해 상호간 합의가 이루어지지 않으면 이는 분쟁으로 발전하게 될 가능성이 높다. 발주자와 건설사 간에 분쟁이 발생하게 되면 양측 모두에게 부정적인 영향을 끼치며, 건설분쟁을 최소화 하거나 선제적으로 대응하기 위해서는 발주자의 역할이 더욱 중요하다. 본 연구의 목적은 연관규칙 분석(Association Rules Analysis)을 바탕으로 분쟁유형과 분쟁원인의 연관성을 도출하고 주요 특징 및 발주자 관점의 시사점을 제시하는데 있다. 본 연구를 통해 분쟁유형과 분쟁원인간의 연관성을 파악할 수 있었으며 연관성이 높은 규칙을 도출할 수 있었다. 또한 연관규칙 분석을 통해 분쟁유형과 분쟁원인의 연관성을 도출함으로서 단순한 기술통계(빈도수)에 의존하는 것과 비교하여 보다 체계적인 분석을 실시하였다. 사례 분석을 통해 발주자 관점의 시사점으로 분쟁원인을 해소하기 위한 방향도 제시하였다. 본 연구의 결과를 통해 분쟁유형과 분쟁원인의 연관성에 대한 이해를 높일 수 있으며 건설공사의 분쟁을 선제적으로 대응하는데 유용하게 활용될 수 있다.

텔레비전 뉴스 영상의 구조적 요소와 주제연관성 시계열 분석 (Time Analysis of Structural Element and Theme Association of Television News Imagery)

  • 박덕춘
    • 한국콘텐츠학회논문지
    • /
    • 제11권7호
    • /
    • pp.100-109
    • /
    • 2011
  • 본 논문은 텔레비전 뉴스에 있어서 '현장성'과 '사실성'의 지표가 될 수 있는 뉴스 영상의 구조적 요소와 주제연관성이 시대적 배경에 따라 어떤 차이가 있는지 그리고 그 함의가 무엇인지 살펴본 내용연구이다. 기존의 텔레비전 뉴스에 관한 여러 연구들은 대부분 동시대의 뉴스를 대상으로 한 횡적 연구에 집중하여 시대적 변화를 반영하는 종적 연구에는 상대적으로 소홀한 감이 없지 않았다. 따라서 본 연구에서는 1987년부터, 2007년까지 MBC뉴스데스크에서 방송된 뉴스를 대상으로, 5년 간격으로 체계적 무선표집방법을 통해 추출한 총 729개 아이템의 11,945개의 샷을 분석하였다. 본 연구를 통해서 1987년과 2007년의 텔레비전 뉴스 영상에는1992년과 2002년에 비해 '현장성'과 '사실성'을 충실히 반영한 '사운드바이트'와 '사건화면', 그리고 주제와의 연관성이 높은 '직접연관' 화면의 비중이 높게 나타났으나, 1997년에는 이들 요소의 비중이 상대적으로 낮게 나타나고, '현장성'과 '사실성' 측면에서 취약한 '로케이션 화면', '구성화면' '자료화면', 그리고 '간접연관'과 '축어적 연관' 화면의 비중이 크게 나타남으로써, 현실기반의 뉴스 보도가 충실히 이루어지지 못하였음을 알 수 있었다.

강화학습을 사용한 연관성 피드백 (Relative Feedback with Reinforcement Learning)

  • 이승준;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.280-282
    • /
    • 2002
  • 본 논문은 웹 문서 여과시 사용자 모델링을 위해 사용되는 연관성 피드백 방법을 강화 학습 프레임웍에서 분석하고 강화학습 기반의 새로운 연관성 피드백 알고리즘을 제안한다. 제안된 방법은 강화 학습 프레임책상에서 기존의 방법을 일반화한 것으로 기존의 연관성 피드백 방법이 현재의 프로파일만을 상태로 사용하는 데 비해 과거 history부터 얻는 추가 정보를 사용하는 방법이다

  • PDF

지방자치단체별 만족도 지표 연관성 분석 (Correlation Analysis of Satisfaction Indicators by Local Governments)

  • 김석훈;임광혁
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.293-294
    • /
    • 2020
  • 생활수준이 높아지면서 단순히 먹고 사는 수준을 넘어서 삶의 만족도에 대한 관심이 높아지고 있다. 통계 정보를 살펴보더라도 근로여건 만족도, 녹지환경 만족도, 의료서비스 만족도, 소득만족도, 소비생활 만족도, 여가활동 만족도, 학생의 학교생활만족도 등 다양한 만족도 지표를 발견할 수 있다. 본 연구는 지방자치단체 통합데이터베이스 및 e지방지표를 이용하여 지방자치단체에 속한 구성원들의 다양한 만족도 지표의 연관성을 분석하고자 한다.

  • PDF

집단 및 가족기반연구에서의 유전적 연관성 분석 고찰: 방법론과 소프트웨어 (A Review of Genetic Association Analyses in Population and Family Based Data: Methods and Software)

  • 이효정;김민지;박미라
    • 응용통계연구
    • /
    • 제23권1호
    • /
    • pp.95-111
    • /
    • 2010
  • 최근 단일염기다형성 및 일배체형을 이용한 질병-유전자간 연관성연구가 많이 진행되고 있으며, 이를 위한 다양한 분석방법과 분석도구가 개발되고 있다. 그러나 통합 소프트웨어는 충분히 확립되지 못하였으며, 각 소프트웨어가 제공하는 분석방법 및 양식에 차이가 많아 연구자가 적절한 것을 선택하기가 쉽지 않다. 본고에서는 유전적 연관성연구를 사전분석단계, 집단기반연구방법, 가족기반연구방법으로 나누어 각각의 목적에 따른 분석방법을 고찰하고, 이의 분석을 위한 주요 소프트웨어로서 FBAT, SAS/Genetics, SAGE, R의 지원내용과 방법을 비교하였다.

분류 모형 구축에 유용한 신뢰도 측도 간의 비교 (Comparison of confidence measures useful for classification model building)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.365-371
    • /
    • 2014
  • 데이터 마이닝 기법 중에서 연관성 규칙은 하나의 거래나 사건에 포함되어 있는 항목들의 관련성을 파악하기 위한 탐색적 자료 분석 방법이다. 이 기법은 지지도, 신뢰도, 향상도 등과 같은 흥미도 측도들을 이용하여 연관성 규칙을 생성한다. 일반적인 연관성 규칙에서는 최소 지지도를 만족하는 빈발항목집합을 생성한 후 최저 신뢰도를 만족하는 것을 연관성 규칙으로 채택하게 된다. 이 때 규칙 여부를 결정하기 위해 가장 많이 사용되는 신뢰도는 고려하는 항목의 순서가 바뀌게 되면 그 값이 달라지는 비대칭적 측도가 되는 동시에 항상 양의 값을 가진다. 따라서 신뢰도 값의 크기로는 양의 연관성이 있는지, 아니면 음의 연관성이 있는지를 알 수 없다. 본 논문에서는 이러한 문제를 극복하기 위해 분류 모형 구축에 유용한 신뢰도 측도들을 소개하고, 신뢰도들 간의 비교 분석을 통해 유용성을 평가하였다. 그 결과, 인과적 확인 신뢰도가 연관성의 방향을 보다 정확하게 나타내고 있다는 사실을 확인 하였다.

오차를 허용하는 주기적 연관규칙 탐사를 통한 오차의 경향성에 관한 연구 (Discovery Of Cyclic Association Rule With Loose Cycle and Error Cycle over Loose Cycle)

  • 배수균;남도원;이동하;이전영
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.317-324
    • /
    • 2000
  • 주기적인 연관규칙은 타겟데이터베이스를 일정 단위시간으로 나누었을 때 연관규칙이 만족하는 구간이 일정한 주기마다 발생하는 패턴을 탐색하는 방법이다. 하지만, 이 방법은 엄격한 주기를 가지도록 하여 실제 데이터에 그대로 적용하기가 어려웠다. 예를 들이 편의점 데이터에서 매일 오전 7시-8시 사이에 주기적으로 발생하는 연관규칙을 발견할 때, 이러한 연관규칙을 주기적인 연관규칙이라고 한다. 하지만, 실제 데이터에서는 날씨와 같이 사람의 행동에 영향을 미치는 다른 요인 때문에 항상 일정한 주기를 가지는 연관규칙을 찾기는 어렵다. 본 논문에서는 주기가 일정하지 않은 연관규칙을 찾기 위해서 연관규칙의 주기성을 허용 오차를 포함하며 재정의하고, 오차를 허용하기 위한 탐색 알고리즘을 보완하였다. 반면에, 오차를 허용함으로써 오차를 허용하지 않는 경우보다 더 많은 주기성을 찾을 수 있을 뿐만 아니라, 동일한 주기를 가지지만 오프셋이 다른 여러 개의 비슷한 주기가지 찾게 되어 사용자가 의미 있는 연관규칙을 찾는데 방해가 된다. 본 논문에서는 이를 해결하기 위해서 오차를 허용하는 주기적 연관규칙의 오차의 정도를 측정하기 위한 단위로 집중도(intensity)와 경향성(tendency)을 제안한다. 주기적 연관규칙이 매 주기마다 정확한 세그먼트에 나타나는 정도를 나타내는 집중도와, 최소 평균오차를 의미하는 경향성을 이용하여 유사한 주기들 중에서 대표주기만을 찾을 수 있도록 한다. 또한, 오차를 허용하는 주기적 연관규칙에서 오차가 주로 발생하는 패턴을 분석함으로써 고객들의 수요 경향성을 더 잘 파악할 수 있다. 예를 들어, 평소에는 매일 오진 7시∼8시에 나타나던 연관성이 지각하는 사람들이 같은 월요일에는 1시간 늦은 8시∼9시에 나타난다는 오타 정보까지 파악할 수 있다. 이러한 월요일마다 1시간 늦게 나타나는 오차의 경향성을 나타내는 오차 주기(error cyc1e)를 이용함으로써 고객들의 수요의 경향성을 좀 더 세밀한 부분까지 파악할 수 있게 해 준다.

  • PDF

연구자 네트워크의 중심성과 연구성과의 연관성 분석 - 국내 기록관리학 분야 학술논문을 중심으로 - (Analytical Study on the Relationship between Centralities of Research Networks and Research Performances)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제44권3호
    • /
    • pp.405-428
    • /
    • 2013
  • 본 연구는 국내 기록관리학 분야의 학술논문을 대상으로 3가지 연구자 네트워크(공저 네트워크, 저자동시인용 네트워크, 저자서지결합 네트워크)를 구성하고, 각 네트워크에 나타난 중심성과 연구성과의 연관성뿐만 아니라 중심성들 간의 연관성을 분석하였다. 주요한 분석결과를 정리하면 다음과 같다. 첫째, 공저 네트워크에서 3가지 중심성이 높은 연구자들은 연구성과도 높게 나타났다. 둘째, 저자동시인용 네트워크와 저자서지결합 네트워크에서 매개 중심성은 연구성과와 연관성이 있는 것으로 나타났다. 셋째, 3가지 연구자 네트워크에서 각각의 중심성들 간에는 연관성이 높게 나타났다. 넷째, 3가지 연구자 네트워크의 모든 중심성들 간에는 높은 연관성을 나타내지 않았다.

연관분석을 위한 베이지안 모형 선택: 상호상관성 변수를 중심으로 (Bayesian Model Selection for Linkage Analyses: Considering Collinear Predictors)

  • 서영주
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.533-541
    • /
    • 2005
  • 본 저자는 앞선 연구에서 제안한 SSVS 방법을 이용하여 한 양적형질에 대한 연관분석에 있어, QTL에 가까이 있는 관련된 표지유전자들의 위치를 정하고자 한다. 본 논문에서는 QTL에 연관되어 있고 동시에 서로 연관되어 있는 몇 가지 표지유전자들을 대상으로 하는데, 이 유전자 좌위들의 i.b.d. 값들을 상호 상관이 있는 예측변수로서 고려하여, SSVS 방법으로 분석한다. 두개의 QTL에 강하게 연관되어 있는 표지유전자들 만을 동시에 고려한 분석의 결과, QTL에 가장 가까이 위치한 표지 유전자가 다른 유전자들보다 더 분명하게 양적형질과의 관련성을 보여주었다. SSVS를 이용한 상호 상관이 있는 표지 유전자들의 분석의 결과는 전통적인 다중회귀분석을 이용한 결과와 거의 일치했다. 본 모의실험을 바탕으로, 복합 양적형질에 대하여 서로 연관된 다중의 표지유전자들을 동시에 연관분석을 수행하는 데에 SSVS 방법이 상당히 유용하다고 결론 내린다.