• 제목/요약/키워드: Information Mining

검색결과 3,368건 처리시간 0.029초

오피니언 마이닝 기반 SNS 감성 정보 분석 전략 설계 (A Design of SNS Emotional Information Analysis Strategy based on Opinion Mining)

  • 정은희;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.544-550
    • /
    • 2015
  • 현재, SNS으로 소통되는 의견들이 증가하고 있기 때문에 SNS 메시지로부터 의미 있는 정보를 유추해내는 오피니언 마이닝(Opinion mining) 기술이 중요해지고 있다. 본 논문은 반의어와 부사의 위치에 따라 가중치를 다르게 설정하여 SNS의 감성 정보를 정확하게 추출하는 오피니언 마이닝 기반 SNS 감성 정보 분석 전략(SEIAS, SNS Emotional Information Analysis Strategy)을 제안한다. 제안하는 SEIAS(SNS Emotional Information Analysis Strategy)는 첫째, 오피니언 마이닝 분석에 필요한 감성사전을 구축하고, 둘째, SNS 데이터를 실시간으로 수집하고, 수집된 SNS 데이터와 감성사전를 비교하여 SNS 데이터의 의견값을 산출한다. 특히, 데이터의 의견값을 산출할 때, 반의어, 부사의 위치에 따라 가중값을 다르게 설정함으로써 기존의 SO-PMI와 비교하였을 때 오피니언 분석결과의 정확도를 향상시켰다.

시공간 데이터를 위한 클러스터링 기법 성능 비교 (Performance Comparison of Clustering Techniques for Spatio-Temporal Data)

  • 강나영;강주영;용환승
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.15-37
    • /
    • 2004
  • 최근 데이터 양이 급증하면서 데이터 마이닝에 대한 연구가 활발하게 진행되고 있으며 특히 GPS 시스템, 감시시스템, 기상 관측 시스템과 같은 다양한 응용 시스템으로부터 수집된 데이터를 분석하고자 하는 시공간 데이터 마이닝 연구에 대한 관심이 더욱 높아지고 있다. 기존의 시공간 데이터 마이닝 연구들에서는 비시공간 데이터 기반의 일반적인 클러스터링 기법들을 그대로 적용하고 있으나 데이터의 속성이 다른 시공간 데이터 마이닝에서 기존의 알고리즘들이 어느 정도의 성능을 보장하는지, 데이터의 시공간 속성에 따라 적절한 마이닝 알고리즘을 선택하기 위한 기준이 무엇인지 등에 대한 연구는 미흡한 실정이다. 본 논문에서는 기존의 시공간 데이터 마이닝 연구에서 일반적으로 많이 사용되어 온 알고리즘인 SOM(Self-Organizing Map)을 기반으로 시공간 데이터 마이닝 모듈을 개발하고, 개발된 클러스터링 모듈의 성능을 K-means과 두 가지 응집 계층(Hierarchical Agglomerative) 알고리즘들과 균질도, 분리도, 반면영상 너비, 정확도의 네 가지 평가 기준을 기반으로 비교하였다. 또한 입력 데이터의 특성 가시화 및 클러스터링 결과의 정확한 분석을 위해 시공간 데이터 클러스터링을 위한 가시화 모듈을 개발하였다.

  • PDF

454 Pyrosequencing Analysis of Bacterial Diversity Revealed by a Comparative Study of Soils from Mining Subsidence and Reclamation Areas

  • Li, Yuanyuan;Chen, Longqian;Wen, Hongyu;Zhou, Tianjian;Zhang, Ting;Gao, Xiali
    • Journal of Microbiology and Biotechnology
    • /
    • 제24권3호
    • /
    • pp.313-323
    • /
    • 2014
  • Significant alteration in the microbial community can occur across reclamation areas suffering subsidence from mining. A reclamation site undergoing fertilization practices and an adjacent coal-excavated subsidence site (sites A and B, respectively) were examined to characterize the bacterial diversity using 454 high-throughput 16S rDNA sequencing. The dominant taxonomic groups in both the sites were Proteobacteria, Acidobacteria, Bacteroidetes, Betaproteobacteria, Actinobacteria, Gammaproteobacteria, Alphaproteobacteria, Deltaproteobacteria, Chloroflexi, and Firmicutes. However, the bacterial communities' abundance, diversity, and composition differed significantly between the sites. Site A presented higher bacterial diversity and more complex community structures than site B. The majority of sequences related to Proteobacteria, Gemmatimonadetes, Chloroflexi, Nitrospirae, Firmicutes, Betaproteobacteria, Deltaproteobacteria, and Anaerolineae were from site A; whereas those related to Actinobacteria, Planctomycetes, Bacteroidetes, Verrucomicrobia, Gammaproteobacteria, Nitriliruptoria, Alphaproteobacteria, and Phycisphaerae originated from site B. The distribution of some bacterial groups and subgroups in the two sites correlated with soil properties and vegetation due to reclamation practice. Site A exhibited enriched bacterial community, soil organic matter (SOM), and total nitrogen (TN), suggesting the presence of relatively diverse microorganisms. SOM and TN were important factors shaping the underlying microbial communities. Furthermore, the specific plant functional group (legumes) was also an important factor influencing soil microbial community composition. Thus, the effectiveness of 454 pyrosequencing in analyzing soil bacterial diversity was validated and an association between land ecological system restoration, mostly mediated by microbial communities, and an improvement in soil properties in coal-mining reclamation areas was suggested.

연관성 모델에 기반한 오피년마이닝 시스템의 설계 및 구현 (Design and Implementation of Opinion Mining System based on Association Model)

  • 김근형
    • 한국정보통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.133-140
    • /
    • 2011
  • 특정 제품이나 서비스에 대한 네티즌의 의견들은 고객들의 구매 행위에서의 참고대상일 뿐만 아니라 기업 입장에서도 마케팅이나 경영전략을 수립하기 위한 중요한 자료가 될 수 있기 때문에 온라인 고객리뷰를 분석하는 것은 매우 중요하다. 본 논문에서는 비정형(unformatted) 데이터형인 자연어(natural language) 형태로 웹상에 게시된 고객 의견들을 분석할 수 있는 새로운 오피년마이닝 기법을 제안한다. 기존 데이터마이닝 기법 중의 하나인 연관규칙탐사 기법을 수정하여 오피년마이닝 과정에 보다 효율적이고 효과적으로 적용하기 위한 방안을 고찰하고 이를 기반으로 실제 시스템을 설계하고 구현하였다.

Implementation of Subsequence Mapping Method for Sequential Pattern Mining

  • Trang Nguyen Thu;Lee Bum-Ju;Lee Heon-Gyu;Park Jeong-Seok;Ryu Keun-Ho
    • 대한원격탐사학회지
    • /
    • 제22권5호
    • /
    • pp.457-462
    • /
    • 2006
  • Sequential Pattern Mining is the mining approach which addresses the problem of discovering the existent maximal frequent sequences in a given databases. In the daily and scientific life, sequential data are available and used everywhere based on their representative forms as text, weather data, satellite data streams, business transactions, telecommunications records, experimental runs, DNA sequences, histories of medical records, etc. Discovering sequential patterns can assist user or scientist on predicting coming activities, interpreting recurring phenomena or extracting similarities. For the sake of that purpose, the core of sequential pattern mining is finding the frequent sequence which is contained frequently in all data sequences. Beside the discovery of frequent itemsets, sequential pattern mining requires the arrangement of those itemsets in sequences and the discovery of which of those are frequent. So before mining sequences, the main task is checking if one sequence is a subsequence of another sequence in the database. In this paper, we implement the subsequence matching method as the preprocessing step for sequential pattern mining. Matched sequences in our implementation are the normalized sequences as the form of number chain. The result which is given by this method is the review of matching information between input mapped sequences.

Suicide in the Australian Mining Industry: Assessment of Rates among Male Workers Using 19 Years of Coronial Data

  • Tania King;Humaira Maheen;Yamna Taouk;Anthony D. LaMontagne
    • Safety and Health at Work
    • /
    • 제14권2호
    • /
    • pp.193-200
    • /
    • 2023
  • Background: International evidence shows that mining workers are at greater risk of suicide than other workers; however, it is not known whether this applies to the Australian mining sector. Methods: Using data from the National Coronial Information System, rates of suicide among male mining workers were compared to those of three comparators: construction workers, mining and construction workers combined, and all other workers. Age-standardized suicide rates were calculated for 2001-2019 and across three intervals '2001-2006', '2007-2011', and '2012-2019'. Incidence rate ratios for suicide were calculated to compare incidence rates for mining workers, to those of the three comparative groups. Results: The suicide rate for male mining workers in Australia was estimated to be between 11 and 25 per 100,000 (likely closer to 25 per 100,000) over the period of 2001-2019. There was also evidence that the suicide rate among mining workers is increasing, and the suicide rate among mining workers for the period 2012-2019 was significantly higher than the other worker group. Conclusions: Based on available data, we tentatively deduce that suicide mortality among male mining workers is of concern. More information is needed on both industry and occupation of suicide decedents in order to better assess whether, and the extent to which, mining workers (and other industries and occupations) are at increased risk of suicide.

확률 기법에 기반한 근접 빈발 패턴 마이닝 기법의 성능평가 (Performance evaluation of approximate frequent pattern mining based on probabilistic technique)

  • 편광범;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.63-69
    • /
    • 2013
  • 근접 빈발 패턴 마이닝은 향상된 효율성을 위해 정확한 패턴보다 허용되는 범위 안에서 근접 빈발 패턴을 마이닝한다. 데이터베이스의 크기가 증대함에 따라 거대한 데이터베이스를 처리하기 위해서 더 빠른 마이닝 기법이 필요하게 되고 있다. 또한, 노이지나 데이터의 다양성 때문에 패턴을 마이닝 하는 것에 대한 정확한 결과를 찾기가 더 어렵다. 이러한 경우들에 대해, 근접 빈발 패턴 마이닝을 함으로 실행시간, 메모리 사용량, 그리고 확장성의 관점에서 더 효율적인 마이닝을 수행할 수 있다. 이 논문에서는 확률 기법에 근간한 근접 패턴 마이닝 알고리즘에 대한 특성을 살펴보고 척도가 되는 확률 기법에 기반한 근접 패턴 마이닝 알고리즘에 대해 성능 평가를 한다. 최종적으로 성능의 향상을 위해 테스트 결과를 분석한다.

소셜네트워크서비스에 활용할 비표준어 한글 처리 방법 연구 (Research on Methods for Processing Nonstandard Korean Words on Social Network Services)

  • 이종화;레환수;이현규
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.35-46
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 관계망을 구축해주는 온라인 서비스인 소셜네트워크서비스(SNS), 자신의 관심사에 따라 자유롭게 글, 사진, 동영상 등을 올릴 수 있는 공간인 블로그(Blog) 등은 자신을 알리고 표현하는 사회현상으로 자리 매김하고 있다. 이러한 SNS나 블로그를 통해 사용자들이 자유롭게 표현한 글들을 분석하여 의미있는 정보와 가치, 그리고 패턴을 찾기 위한 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 의미 분석(Semantic Analysis) 등의 연구가 활발히 이루어지고 있다. 또한, 연구자들의 연구 효율을 보다 높이기 위하여 키워드 기반 연구들도 이루어져있다. 하지만 대부분의 연구들은 한글의 맞춤법에 많은 한계점을 나타내고 있다. 본 연구는 어근을 찾기 힘든 이상한 외계 언어, 무분별하게 표현되는 속어, 알기 힘든 한글 이모티콘 인터넷 언어, 마이닝 처리 과정에서 파악하기 어려운 단어들을 데이터베이스에 구축하여 데이터 사전 기반 마이닝 처리 기법의 한계를 극복하고자 한다. 특정 주제에 대한 주관적 견해로 구성된 블로그를 사례 분석 대상으로 연구를 진행하였으며 유니코드를 활용한 비표준어 추출은 텍스트 마이닝 처리에 유용함을 발견할 수 있었다.

A Three-way Handshaking Access Mechanism for Point to Multipoint In-band Full-duplex Wireless Networks

  • Zuo, Haiwei;Sun, Yanjing;Lin, Changlin;Li, Song;Xu, Hongli;Tan, Zefu;Wang, Yanfen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권7호
    • /
    • pp.3131-3149
    • /
    • 2016
  • In-band Full-duplex (IBFD) wireless communication allows improved throughput for wireless networks. The current Half-duplex (HD) medium access mechanism Request to Send/Clear to Send (RTS/CTS) has been directly applied to IBFD wireless networks. However, this is only able to support a symmetric dual link, and does not provide the full advantages of IBFD. To increase network throughput in a superior way to the HD mechanism, a novel three-way handshaking access mechanism RTS/SRTS (Second Request to Send)/CTS is proposed for point to multipoint (PMP) IBFD wireless networks, which can support both symmetric dual link and asymmetric dual link communication. In this approach, IBFD wireless communication only requires one channel access for two-way simultaneous packet transmissions. We first describe the RTS/SRTS/CTS mechanism and the symmetric/asymmetric dual link transmission procedure and then provide a theoretical analysis of network throughput and delay using a Markov model. Using simulations, we demonstrate that the RTS/SRTS/CTS access mechanism shows improved performance relative to that of the RTS/CTS HD access mechanism.

Thermal Model for Power Converters Based on Thermal Impedance

  • Xu, Yang;Chen, Hao;Lv, Sen;Huang, Feifei;Hu, Zhentao
    • Journal of Power Electronics
    • /
    • 제13권6호
    • /
    • pp.1080-1089
    • /
    • 2013
  • In this paper, the superposition principle of a heat sink temperature rise is verified based on the mathematical model of a plate-fin heat sink with two mounted heat sources. According to this, the distributed coupling thermal impedance matrix for a heat sink with multiple devices is present, and the equations for calculating the device transient junction temperatures are given. Then methods to extract the heat sink thermal impedance matrix and to measure the Epoxy Molding Compound (EMC) surface temperature of the power Metal Oxide Semiconductor Field Effect Transistor (MOSFET) instead of the junction temperature or device case temperature are proposed. The new thermal impedance model for the power converters in Switched Reluctance Motor (SRM) drivers is implemented in MATLAB/Simulink. The obtained simulation results are validated with experimental results. Compared with the Finite Element Method (FEM) thermal model and the traditional thermal impedance model, the proposed thermal model can provide a high simulation speed with a high accuracy. Finally, the temperature rise distributions of a power converter with two control strategies, the maximum junction temperature rise, the transient temperature rise characteristics, and the thermal coupling effect are discussed.