• 제목/요약/키워드: text mining Approach

검색결과 205건 처리시간 0.026초

인용 정보를 고려한 미발견 공공 지식 추출: Swanson의 ABC 모델 재현 및 확장 (Detection of Hidden Knowledge Using a Citation-Based Approach Based on Swanson's ABC Model)

  • 함정은;송민
    • 정보관리학회지
    • /
    • 제32권2호
    • /
    • pp.87-103
    • /
    • 2015
  • 많은 연구들 가운데 살펴볼 가치가 있는 대상을 찾아 제시해주는 문헌기반 발견의 접근법은 연구자들에게 매우 유용할 것이다. 문헌기반 발견 연구의 대표 이론인 Swanson의 ABC 모델은 기존에 검증되지 않은 개체들의 관계를 연구할 것을 제안해 준다. 본 연구는 Swanson의 ABC 모델에 인용 정보를 고려하여 유의한 관계에 있는 개체들을 더 효율적으로 찾아내고자 하였다. 수집 논문들의 참고문헌 목록에서 인용 정보를 확인하고 논문의 표제와 초록을 대상으로 텍스트 마이닝 기법으로 중요한 단어들을 추출하였다. Swanson의 연구들 중 어유와 레이노드 질병 및 증상의 관계를 재현하였으며 기존의 접근법으로 확인되는 개체들과 어떤 차이가 있는지 분석하였다.

Prevention through Design (PtD) of integrating accident precursors in BIM

  • Chang, Soowon;Oh, Heung Jin;Lee, JeeHee
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.94-102
    • /
    • 2022
  • Construction workers are engaged in many activities that may expose them to serious hazards, such as falling, unguarded machinery, or being struck by heavy construction equipment. Despite extensive research in building information modeling (BIM) for safety management, current approaches, detecting safety issues after design completion, may limit the opportunities to prevent predictable and potential accidents when decisions of building materials and systems are made. In this respect, this research proposes a proactive approach to detecting safety issues from the early design phase. This research aims to explore accident precursors and integrate them into BIM for tracking safety hazards during the design development process. Accident precursors can be identified from construction incident reports published by OSHA using a text mining technique. Through BIM-integrated accident precursors, construction safety hazards can be identified during the design phase. The results will contribute to supporting a successful transition from the design stage to the construction stage that considers a safe construction workplace. This will advance the body of knowledge about construction safety management by elucidating a hypothesis that safety hazards can be detected during the design phase involving decisions about materials, building elements, and equipment. In addition, the proactive approach will help the Architecture, Engineering and Construction (AEC) industry eliminate occupational safety hazards before near-miss situations appear on construction sites.

  • PDF

Visualization of University Curriculum for Multidisciplinary Learning: A Case Study of Yonsei University, South Korea

  • Geonsik Yu;Sunju Park
    • Journal of Information Science Theory and Practice
    • /
    • 제12권1호
    • /
    • pp.77-86
    • /
    • 2024
  • As the significance of knowledge convergence continues to grow, universities are making efforts to develop methods that promote multidisciplinary learning. To address this educational challenge, our paper applies network theory and text mining techniques to analyze university curricula and introduces a graphical syllabus rendering method. Visualizing the course curriculum provides a macro and structured perspective for individuals seeking alternative educational pathways within the existing system. By visualizing the relationships among courses, students can explore different combinations of courses with comprehensive search support. To illustrate our approach, we conduct a detailed demonstration using the syllabus database of Yonsei University. Through the application of our methods, we create visual course networks that reveal the underlying structure of the university curriculum. Our results yield insights into the interconnectedness of courses across various academic majors at Yonsei University. We present both macro visualizations, covering 18 academic majors, and visualizations for a few selected majors. Our analysis using Yonsei University's database not only showcases the value of our methodology but also serves as a practical example of how our approach can facilitate multidisciplinary learning.

IMPLEMENTATION OF SUBSEQUENCE MAPPING METHOD FOR SEQUENTIAL PATTERN MINING

  • Trang, Nguyen Thu;Lee, Bum-Ju;Lee, Heon-Gyu;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.627-630
    • /
    • 2006
  • Sequential Pattern Mining is the mining approach which addresses the problem of discovering the existent maximal frequent sequences in a given databases. In the daily and scientific life, sequential data are available and used everywhere based on their representative forms as text, weather data, satellite data streams, business transactions, telecommunications records, experimental runs, DNA sequences, histories of medical records, etc. Discovering sequential patterns can assist user or scientist on predicting coming activities, interpreting recurring phenomena or extracting similarities. For the sake of that purpose, the core of sequential pattern mining is finding the frequent sequence which is contained frequently in all data sequences. Beside the discovery of frequent itemsets, sequential pattern mining requires the arrangement of those itemsets in sequences and the discovery of which of those are frequent. So before mining sequences, the main task is checking if one sequence is a subsequence of another sequence in the database. In this paper, we implement the subsequence matching method as the preprocessing step for sequential pattern mining. Matched sequences in our implementation are the normalized sequences as the form of number chain. The result which is given by this method is the review of matching information between input mapped sequences.

  • PDF

Implementation of Subsequence Mapping Method for Sequential Pattern Mining

  • Trang Nguyen Thu;Lee Bum-Ju;Lee Heon-Gyu;Park Jeong-Seok;Ryu Keun-Ho
    • 대한원격탐사학회지
    • /
    • 제22권5호
    • /
    • pp.457-462
    • /
    • 2006
  • Sequential Pattern Mining is the mining approach which addresses the problem of discovering the existent maximal frequent sequences in a given databases. In the daily and scientific life, sequential data are available and used everywhere based on their representative forms as text, weather data, satellite data streams, business transactions, telecommunications records, experimental runs, DNA sequences, histories of medical records, etc. Discovering sequential patterns can assist user or scientist on predicting coming activities, interpreting recurring phenomena or extracting similarities. For the sake of that purpose, the core of sequential pattern mining is finding the frequent sequence which is contained frequently in all data sequences. Beside the discovery of frequent itemsets, sequential pattern mining requires the arrangement of those itemsets in sequences and the discovery of which of those are frequent. So before mining sequences, the main task is checking if one sequence is a subsequence of another sequence in the database. In this paper, we implement the subsequence matching method as the preprocessing step for sequential pattern mining. Matched sequences in our implementation are the normalized sequences as the form of number chain. The result which is given by this method is the review of matching information between input mapped sequences.

토픽 모델링 분석을 통한 수학교육 연구 주제 분석 (Analysis of trends in mathematics education research using text mining)

  • 진미르;고호경
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제33권3호
    • /
    • pp.275-294
    • /
    • 2019
  • 본 연구는 최근 수학교육 연구 논문들의 연구 동향을 파악하기 위하여 2016년 이후의 수학교육 학술지 논문들을 대상으로 텍스트마이닝 기법 중 토픽 모델링과 트랜드 분석 기법을 활용하여 분석을 실시하였다. 분석 결과 빈도수가 높은 단어들을 조합하여 5개의 토픽을 추출하였으며 이를 통해 최근 활발히 이루어지고 있는 수학교육 연구 주제들을 파악할 수 있었다. 이는 다시 기 수행된 동향 연구들과 차이점과 유사한 점들을 도출할 수 있었는데, 이와 같은 동향 분석을 통해 최근 연구자들이 수학교육 연구에서 중요시 여기는 관점을 읽어 나감과 동시에 향후 주목하여야할 연구 주제 및 방향에 대한 시사점을 제공한다.

TLS 마이닝을 이용한 '정보시스템연구' 동향 분석 (Analysis on the Trend of The Journal of Information Systems Using TLS Mining)

  • 윤지혜;오창규;이종화
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권1호
    • /
    • pp.289-304
    • /
    • 2022
  • Purpose The development of the network and mobile industries has induced companies to invest in information systems, leading a new industrial revolution. The Journal of Information Systems, which developed the information system field into a theoretical and practical study in the 1990s, retains a 30-year history of information systems. This study aims to identify academic values and research trends of JIS by analyzing the trends. Design/methodology/approach This study aims to analyze the trend of JIS by compounding various methods, named as TLS mining analysis. TLS mining analysis consists of a series of analysis including Term Frequency-Inverse Document Frequency (TF-IDF) weight model, Latent Dirichlet Allocation (LDA) topic modeling, and a text mining with Semantic Network Analysis. Firstly, keywords are extracted from the research data using the TF-IDF weight model, and after that, topic modeling is performed using the Latent Dirichlet Allocation (LDA) algorithm to identify issue keywords. Findings The current study used the summery service of the published research paper provided by Korea Citation Index to analyze JIS. 714 papers that were published from 2002 to 2012 were divided into two periods: 2002-2011 and 2012-2021. In the first period (2002-2011), the research trend in the information system field had focused on E-business strategies as most of the companies adopted online business models. In the second period (2012-2021), data-based information technology and new industrial revolution technologies such as artificial intelligence, SNS, and mobile had been the main research issues in the information system field. In addition, keywords for improving the JIS citation index were presented.

텍스트 마이닝 기반의 그래프 모델을 이용한 미발견 공공 지식 추론 (Inferring Undiscovered Public Knowledge by Using Text Mining-driven Graph Model)

  • 허고은;송민
    • 정보관리학회지
    • /
    • 제31권1호
    • /
    • pp.231-250
    • /
    • 2014
  • 정보통신기술의 발달로 학술 정보의 양이 기하급수적으로 증가하였고 방대한 양의 텍스트 데이터를 처리하기 위한 자동화된 텍스트 처리의 필요성이 대두되었다. 생의학 문헌에서 생물학적 의미와 치료 효과 등에 대한 정보를 발견해내는 바이오 텍스트 마이닝은 문헌 내의 각 개념들 간의 유의미한 연관성을 발견하여 의학 영역에서 상당한 시간과 비용을 줄여준다. 문헌 기반 발견 연구로 새로운 생의학적 가설들이 발견되었지만 기존의 연구들은 반자동화된 기법으로 전문가의 개입이 필수적이며 원인과 결과의 한가지의 관계만을 밝히는 제한점이 있다. 따라서 본 연구에서는 중간 개념인 B를 다수준으로 확장하여 다양한 관계성을 동시출현 개체와 동사 추출을 통해 확인한다. 그래프 기반의 경로 추론을 통해 각 노드 사이의 관계성을 체계적으로 분석하여 규명할 수 있었으며 새로운 방법론적 시도를 통해 기존에 밝혀지지 않았던 새로운 가설 제시의 가능성을 기대할 수 있다.

수학 교수학적 어휘의 변화: 텍스트 마이닝 기법을 이용한 교실수업 어휘 연구의 확장 (Changes in mathematics pedagogical lexicons: Extension research of the International Classroom Lexicon using a text mining approach)

  • 이기마;김희정
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제61권4호
    • /
    • pp.559-579
    • /
    • 2022
  • 어휘와 언어에 대한 연구는 이를 사용하는 개인들이 포함된 공동체의 관심과 가치, 실천 관행에 대한 이해도를 높일 수 있다. 이러한 맥락에서 10개국이 참여한 국제 교실수업 어휘 프로젝트(The International Classroom Lexicon Project)는 자국의 수학 교실 수업과 관련하여, 교사가 바라보고 명명하는 구어적 입장에서 수학 교실수업 어휘 연구를 진행하여 어휘를 확인하고 정리하였다. 본 연구는 이 국제 교실수업 어휘 프로젝트 연구의 확장으로, 전국수학교사모임에서 발행하는 수학교사 전문 잡지인 「수학과 교육」에 사용된 교수학적 어휘를 텍스트 마이닝 기법을 이용하여 조사하고, 통시적 관점에서 최근 10년간 시간의 흐름에 따라 이러한 교수학적 어휘가 양적으로 어떻게 변화하였는지를 관찰하였다. 연구 결과, 선행연구에서 발견되지 않은 새로운 교수학적 어휘를 발견할 수 있었다. 또한, 이러한 교수학적 어휘 중 시간의 흐름에 따라 출현 빈도가 유의하게 증가하는 어휘와 단기간에 갑자기 출현(급증)하는 어휘를 발견할 수 있었으며, 이를 통해 수학교사를 위한, 그리고 수학교사에 의한 전문 잡지를 중심으로 이루어진 문어적 공동체 수학교사의 관심의 변화를 살펴볼 수 있었고, 나아가 이러한 관심의 변화를 사회문화적·사건적·시대적 맥락에 비추어 봄으로써 이들의 가치와 시대적 정신의 변화를 조심스럽게 해석할 수 있었다. 이러한 점에서 본 연구는 지난 10년간 시대의 변화에 따른 한국의 수학교사 공동체에서의 수학교육에 대한 관심과 가치, 시대적 정신을 이해하는 첫 걸음으로서 가치를 지니고 있다. 또한, 텍스트 마이닝 기법이 이러한 시대변화에 따른 관심과 가치, 시대적 정신의 변화에 대한 연구를 수행할 수 있는 방법론적인 기여를 제공한다.

Emerging Gender Issues in Korean Online Media: A Temporal Semantic Network Analysis Approach

  • Lee, Young-Joo;Park, Ji-Young
    • Journal of Contemporary Eastern Asia
    • /
    • 제18권2호
    • /
    • pp.118-141
    • /
    • 2019
  • In South Korea, as awareness of gender equality increased since the 1990s, policies for gender equality and social awareness of equality have been established. Until recently, however, the gap between men and women in social and economic activities has not reached the globally desired level and led to social conflict throughout the country. In this study, we analyze the content of online news comments to understand the public perception of gender equality and the details of gender conflict and to grasp the emergence and diffusion process of emerging issues on gender equality. We collected text data from the online news that included the word 'gender equality' posted from January 2012 to June 2017 and also collected comments on each selected news item. Through text mining and the temporal semantic network analysis, we tracked the changes in discourse on gender equality and conflict. Results revealed that gender conflicts are increasing in the online media, and the focus of conflict is shifting from 'position and role inequality' to 'opportunity inequality'.