• 제목/요약/키워드: association rule analysis

검색결과 371건 처리시간 0.026초

연관규칙 분석을 통한 ESG 우려사안 키워드 도출에 관한 연구 (A Study on the Keyword Extraction for ESG Controversies Through Association Rule Mining)

  • 안태욱;이희승;이준서
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권1호
    • /
    • pp.123-149
    • /
    • 2021
  • Purpose The purpose of this study is to define the anti-ESG activities of companies recognized by media by reflecting ESG recently attracted attention. This study extracts keywords for ESG controversies through association rule mining. Design/methodology/approach A research framework is designed to extract keywords for ESG controversies as follows: 1) From DeepSearch DB, we collect 23,837 articles on anti-ESG activities exposed to 130 media from 2013 to 2018 of 294 listed companies with ESG ratings 2) We set keywords related to environment, social, and governance, and delete or merge them with other keywords based on the support, confidence, and lift derived from association rule mining. 3) We illustrate the importance of keywords and the relevance between keywords through density, degree centrality, and closeness centrality on network analysis. Findings We identify a total of 26 keywords for ESG controversies. 'Gapjil' records the highest frequency, followed by 'corruption', 'bribery', and 'collusion'. Out of the 26 keywords, 16 are related to governance, 8 to social, and 2 to environment. The keywords ranked high are mostly related to the responsibility of shareholders within corporate governance. ESG controversies associated with social issues are often related to unfair trade. As a result of confidence analysis, the keywords related to social and governance are clustered and the probability of mutual occurrence between keywords is high within each group. In particular, in the case of "owner's arrest", it is caused by "bribery" and "misappropriation" with an 80% confidence level. The result of network analysis shows that 'corruption' is located in the center, which is the most likely to occur alone, and is highly related to 'breach of duty', 'embezzlement', and 'bribery'.

Interrelationship Analysis between Causal Factors of Construction Defect Using Association Rule Mining

  • Lee, Sang-Deok;Han, Sang-Won;Hyun, Chang-Taek
    • 국제학술발표논문집
    • /
    • The 6th International Conference on Construction Engineering and Project Management
    • /
    • pp.627-628
    • /
    • 2015
  • Construction defect which can causes economic damage such as schedule delay, cost overrun is a considerably important factor in construction industry. In general, a construction defect features a difficulty to find out causes precisely because it occurs when several interrelated causes combine. Yet, studies have tried to understand the interrelationships between factors are limited. In addition, despite of a tremendous amount of construction data, it's not still enough to analyze them, but tends to depend on experience or know-how of practitioners. Thus, it is necessary to identify underlying causes in influential factors by utilizing related data. This paper analyses Interrelationships between causal factors using Association Rule Mining to discover root causes of construction defects. Confidence and Lift that can be used for presenting the interrelationships of the causes were extracted from 1241 cases in 30 projects in Korea. It is expected that this paper allows the construction managers to discover key factors and make right decisions to reduce occurrence of construction defects. Furthermore, analysis of interrelationships can improve understanding of structural patterns of construction defects.

  • PDF

미국연방해사위원회의 대체적 분쟁 해결방안에 관한 소고 - 최종 규칙 분석을 중심으로 - (A Study on the FMC′s ADR in U.S. With the Emphasis on the Final Rule analysis.)

  • 박영태;김웅진
    • 한국중재학회지:중재연구
    • /
    • 제11권1호
    • /
    • pp.145-179
    • /
    • 2001
  • The Federal Maritime Commission is issuing new regulations implementing the Administrative dispute Resolution Act. The new regulations expand the Commission's Alternative dispute resolution(“ADR”) services, addressing guidelines and procedures for arbitration and providing for mediation and other ADR services. This rule replaces current subpart U-(Conciliation Service), with a new subpart U-(Alternative Dispute Resolution), that contains a new Commission ADR policy and provisions for various means of ADR. The rule also revises certain other regulations to conform to the Commission's new ADR policy. So, this paper object was to study on the FMC's ADR in U.S. with the emphasis on the final rule analysis.

  • PDF

Mining Association Rules of Credit Card Delinquency of Bank Customers in Large Databases

  • Lee, Young-Chan;Shin, Soo-Il
    • 지능정보연구
    • /
    • 제9권2호
    • /
    • pp.135-154
    • /
    • 2003
  • Credit scoring system (CSS) starts from an analysis of delinquency trend of each individual or industry. This paper conducts a research on credit card delinquency of bank customers as a preliminary step for building effective credit scoring system to prevent excess loan or bad credit status. To serve this purpose, we use association rules as a rule generating data mining technique. Specifically, we generate sets of rules of customers who are in bad credit status because of delinquency by association rule mining. We expect that the sets of rules generated by association rule mining could act as an estimator of good or bad credit status classifier and basic component of early warning system.

  • PDF

A Post-analysis of the Association Rule Mining Applied to Internee Shopping Mall

  • Kim, Jae-Kyeong;Song, Hee-Seok
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.253-260
    • /
    • 2001
  • Understanding and adapting to changes of customer behavior is an important aspect for a company to survive in continuously changing environment. The aim of this paper is to develop a methodology which detects changes of customer behavior automatically from customer profiles and sales data at different time snapshots. For this purpose, we first define three types of changes as emerging pattern, unexpected change and the added / perished rule. Then we develop similarity and difference measures for rule matching to detect all types of change. Finally, the degree of change is evaluated to detect significantly changed rules. Our proposed methodology can evaluate degree of changes as well as detect all kinds of change automatically from different time snapshot data. A case study for evaluation and practical business implications for this methodology are also provided.

  • PDF

관세 정형 빅데이터를 활용한 우범공급망 거래패턴 선별 (Transaction Pattern Discrimination of Malicious Supply Chain using Tariff-Structured Big Data)

  • 김성찬;송사광;조민희;신수현
    • 한국콘텐츠학회논문지
    • /
    • 제21권2호
    • /
    • pp.121-129
    • /
    • 2021
  • 본 연구에서는 데이터마이닝(Data Mining) 기법 중 하나인 연관관계분석(Association Rule Mining)을 적용하여 위험화물 선별모델을 구축함으로써 관세위험을 최소화하고자 한다. 이를 위해 관세청 수입신고서 빅데이터를 활용하여 연관관계분석 알고리즘인 어프라이어리 알고리즘(Apriori Algorithm)을 적용하고 공급망 간의 위험정도를 계산한다. 대규모의 수입신고 데이터로부터 해외공급자와 수입업체 간의 세율관련(과세가격, 품목, 중수량 등), 원산지표시 위반 등에 관련한 적발결과 관한 규칙셋(Rule Set)과 이 규칙들의 신뢰도(Confidence)을 확보하여 우범공급망 간의 거래패턴을 예측할 수 있는 선별모델을 구축한다. 총 2년 6개월 치의 수입신고 데이터를 활용하여 5-겹 교차검증(5-fold cross validation)을 수행한 결과 16.6%의 Precision과 33.8%의 Recall을 보였다. 이는 빈도기반 방법보다 Precision 기준 약 3.4배 Recall 기준 약 1.5배 높은 결과이다. 이로써 논문에서 제안하고 있는 방법이 관세위험을 줄일 수 있는 효과적인 방법임을 확인하였다.

트리거와 점진적 갱신기법을 이용한 연관규칙 탐사의 능동적 후보항목 관리 모델 (An Active Candidate Set Management Model on Association Rule Discovery using Database Trigger and Incremental Update Technique)

  • 황정희;신예호;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.1-14
    • /
    • 2002
  • 연관규칙 탐사는 지지도와 신뢰도를 바탕으로 연관성 있는 강한 항목들을 탐사한다. 탐사된 연관규칙은 장바구니 분석 등과 같이 전자 상거래 및 대형 소매점 등의 판매 패턴에 대한 분석에 유용하게 적용될 수 있다. 이와 같은 연관규칙 탐사는 대규모로 축적되어 트랜잭션 데이터를 대상으로 하는 기법으로서 대규모 데이터에 대한 반복적 스캔연산을 수반한다. 그러므로 매우 높은 연산 부하를 안고 있으며 이로 인해 동적 환경에서 실시간 제한사항을 탐사에 대한 시도를 하지 못하고 있다. 따라서 이 논문에서는 연관규칙 탐사의 비 실시간적 제한사항을 위하여 트리거와 점진적 갱신 기법을 이용한 능동적 후보항목 관리 모델을 제안하였다. 아울러 제안 모델을 구현하기 위해 점진적 갱신 기법을 이용한 능동적 후보항목 관리 모델을 제한하였다. 아울러 제안 모델을 구현하기 위해 점진적 갱신 연산의 구현 모델을 제시하고 이의 구현 및 실험을 통해 성능 특성을 분석하였다.

교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교 (Comparison of Association Rule Learning and Subgroup Discovery for Mining Traffic Accident Data)

  • 김정민;류광렬
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다. 연관규칙 학습기법은 비지도 학습 기법의 하나로 데이터 내에서 동시에 많이 등장하는 아이템(item)들을 찾아 규칙의 형태로 가공해 주며, 서브그룹 발견기법은 사용자가 지정한 대상 속성이 결론부에 나타나는 규칙을 학습하는 지도학습 기반 기법으로 일반성과 흥미도가 높은 규칙을 학습한다. 규칙 학습 시 사용자의 의도를 반영하기 위해서는 하나 이상의 관심 속성들을 조합한 합성 속성을 만들어 규칙을 학습할 수 있다. 규칙이 도출되고 나면 후처리 과정을 통해 중복된 규칙을 제거하고 유사한 규칙을 일반화하여 규칙들을 더 단순하고 이해하기 쉬운 형태로 가공한다. 교통사고 데이터를 대상으로 두 기법을 적용한 결과 대상 속성을 지정하지 않고 연관규칙 학습기법을 적용하는 경우 사용자가 쉽게 알기 어려운 속성 사이의 숨겨진 관계를 발견할 수 있었으며, 대상 속성을 지정하여 연관규칙 학습기법과 서브그룹 발견기법을 적용하는 경우 파라미터 조정에 많은 노력을 기울여야 하는 연관규칙 학습기법에 비해 서브그룹 발견기법이 흥미로운 규칙들을 더 쉽게 찾을 수 있음을 확인하였다.

동시 비 발생 빈도를 고려한 유사성 측도의 연관성 규칙 평가 기준 활용 방안 (Association rule thresholds of similarity measures considering negative co-occurrence frequencies)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1113-1121
    • /
    • 2011
  • 최근 여러 분야에서 다양한 데이터 마이닝 방법들을 현업에 적용하고 있는 추세이다. 가장 많이 활용되고 있는 데이터 마이닝 기법 중의 하나인 연관성 규칙은 대용량 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화하여 그들 간의 연관 정도를 나타내는 기법이다. 의미 있는 연관성 규칙을 생성하기 위해 지지도, 신뢰도, 향상도 등의 측도가 가장 기본적으로 활용되고 있다. 본 논문에서는 군집 분석이나 다차원 분석법에서 많이 활용되고 있는 유사성 측도들 중에서 동시 비 발생 빈도를 고려한 유사성 측도를 연관성 평가 기준으로 제안한 후, 예제를 통하여 기존의 신뢰도 및 지지도와 비교함으로써 그 유용성을 알아보았다. 모의실험 결과를 종합해볼 때, 동시 발생 빈도 또는 동시 비 발생 빈도가 증가하면 본 논문에서 고려한 모든 유사성 측도들은 지지도 및 신뢰도와 마찬가지로 증가하며, 불일치 계수의 값이 증가하면 이 측도들은 감소하게 된다는 사실을 알 수 있었다. 또한 이들 유사성 측도들은 지지도 및 신뢰도와 매우 유의한 상관관계가 있는 것으로 나타났으며, 전항과 후항이 바뀌더라도 값의 변화가 없기 때문에 신뢰도 보다 더 바람직한 연관성 규칙 평가 기준이라고 할 수 있다.

건축공사감리 문서 기반 연관규칙 및 비용효율성 분석 모델 (A Study on Association Rule and Cost Efficiency Analysis Model Using Construction Supervision Reports)

  • 송태근;유위성
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2023년도 봄 학술논문 발표대회
    • /
    • pp.389-390
    • /
    • 2023
  • To improve the cost performance of construction sites, various systems and standards are constantly being developed and implemented. Although legal requirements for these system and standard improvements have been increasing, the cost efficiency performance of construction sites remains stagnant. We have digitized documents generated through construction supervision work at 39 building construction sites and proposed a model that can support decision-making in cost efficiency evaluation. This model selects key keywords that are considered to be highly related to cost efficiency by identifying the patterns and relationships of keywords through associated rule analysis and social network analysis using keywords derived from documents. In addition, it is expected to be used as a decision-making aid to determine the cost efficiency of a specific building construction site by establishing a logistic regression model using core keywords. As a systematic database of construction supervision documents and an integrated system of massive data generated by digital technology are established in the future, the accuracy and reliability of the cost efficiency evaluation model are expected to be reinforced.

  • PDF