• Title/Summary/Keyword: Natural Language Processing

Search Result 912, Processing Time 0.038 seconds

Analysis of Construction Accident Incident Using Latent Dirichlet Allocation-based Topic Modeling (잠재 디리클레 할당 기반 토픽 모델링을 통한 건설재해 사례 분석)

  • Kim, Changjae;Kim, Harim;Lee, Changsu;Cho, Hunhee
    • Proceedings of the Korean Institute of Building Construction Conference
    • /
    • 2022.04a
    • /
    • pp.31-32
    • /
    • 2022
  • The construction industry has more safety accidents than other industries. Although there have been more attempts to reduce safety hazards in the industry such as the enforcement of the "Serious Accidents Punishment Act (SAPA)", construction accident has not been reduced enough. In this study, analysis of safety risk factors has been made through Latent Dirichlet Allocation (LDA)-based topic modeling. Risk analysis in construction site would be improved with natural language processing and topic modeling.

  • PDF

SARS-CoV-2 Variant Prediction Algorithm Using the Protein-Protein Interaction Model with BERT Mask-Filling (BERT Mask-Filling과 단백질-단백질 상호작용 모델을 이용한 SARS-CoV-2 변이 예측 알고리즘)

  • Kong, Hyunseung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.283-284
    • /
    • 2021
  • 최근 SARS-CoV-2 백신들의 예방접종이 진행됨에 따라 코로나 19 팬데믹의 종결이 예상되고 있다. 하지만 계속해서 출현 중인 변종 바이러스들은 팬데믹 종결의 위험요소로 남아있다. 본 논문에서는 사전학습된 단백질 BERT와 단백질-단백질 상호작용 모델을 활용한 SARS-CoV-2 스파이크 단백질의 변이 예측 분석 알고리즘을 제안한다. 제안하는 기술은 변이 단백질 서열의 예측과 변이 단백질과 human ACE2 수용체의 친화도에 따른 자연선택으로 이루어진다. 이를 통해 시간이 지나며 나타날 수 있는 변종 바이러스들을 시뮬레이션 할 수 있어 변종 바이러스들의 해결에 기여할 것으로 기대된다.

  • PDF

A Study for Conflict in Public Construction Projects Based on Online News (온라인 뉴스 기반 공공건설사업 갈등지수 산정에 관한 기초연구)

  • Baek, Seungwon;Han, Seung Heon;Yun, Sungmin;Lim, Jonglok;Nam, Jihyun
    • Proceedings of the Korean Institute of Building Construction Conference
    • /
    • 2021.05a
    • /
    • pp.277-278
    • /
    • 2021
  • Conflict in public construction projects has increased for the last decades. It not only entails enormous social and economic costs but also makes stakeholders suffer from unnecessary expense and time waste. This study defines the the conflict index for public construction projects based on news data, and calculates conflict index for representative past and current public construction projects that has been deepened conflicts at the national level. The result indicates that the major conflict issue of the 2nd Jeju Airport Project are the environment and location whereas that of the Gaduk New Airport Project are the safety, location and necessity. This approach is expected to enable construction project managers to manage conflicts quantitatively based on comparing with past cases.

  • PDF

Sentiment Analysis of Korean Sentences using a Neural Network Model (신경망 모델을 활용한 한국어 감성분석)

  • Kim, Dong-Hyeon;Kim, Tae-Yeong;Kim, Hyo-Jeong;Moon, Yoo-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.01a
    • /
    • pp.7-8
    • /
    • 2022
  • 본 연구에서는 한국어 SNS 대화에서 나타나는 문장들의 감성을 분석하고자 신경망 모델을 활용하여 시스템을 구축하였다. 현재 해외 SNS 감성분석에 대한 연구는 많이 진행된 상황이지만, 한국어 범용 대화에 대해 적절한 모델이 무엇인지는 연구가 부족한 실정이었다. 따라서 한국어 대화에 적합한 모델을 채택해 보다 정확한 감성분석을 수행하였다. 이를 위해 한국어 SNS 대화 데이터에 대해 신경망 모델을 적용하여, 82% 성공률로 기존 모델 72% 성공률보다 훨씬 더 우수한 성능을 보였다. 또한 본 연구의 결과는 악플 추적 등 실용적인 분야에도 기여할 수 있다고 사료된다.

  • PDF

A Method Name Suggestion Model based on Abstractive Text Summarization (추상적 텍스트 요약 기반의 메소드 이름 제안 모델)

  • Ju, Hansae;Lee, Scott Uk-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.137-138
    • /
    • 2022
  • 소스 코드 식별자의 이름을 잘 정하는 것은 소프트웨어 엔지니어링에서 중요한 문제로 다루어지고 있다. 프로그램 엔티티의 의미있고 간결한 이름은 코드 이해도에 중요한 역할을 하며, 소프트웨어 유지보수 관리 비용을 줄이는 데에 큰 효과가 있다. 이러한 코드 식별자 중 평균적으로 가장 복잡한 식별자는 '메소드 이름'으로 알려져 있다. 본 논문에서는 메소드 내용과 일관성 있는 적절한 메소드 이름 생성을 자연어 처리 태스크 중 하나인 '추상적 텍스트 요약'으로 치환하여 수행하는 트랜스포머 기반의 인코더-디코더 모델을 제안한다. 제안하는 모델은 Github 오픈소스를 크롤링한 Java 데이터셋에서 기존 최신 메소드 이름 생성 모델보다 약 50% 이상의 성능향상을 보였다. 이를 통해 적절한 메소드 작명에 필요한 비용 절감 달성 및 다양한 소스 코드 관련 태스크를 언어 모델의 성능을 활용하여 해결하는 데 도움이 될 것으로 기대된다.

  • PDF

Keywords-based Video Summary System using FastText Algorithm (FastText 알고리즘을 이용한 사용자 지정 키워드 기반 동영상 요약 시스템)

  • Kyungmin Kim;Seungmin Park
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.693-694
    • /
    • 2023
  • 본 논문에서는 FastText 알고리즘을 기반으로 한 사용자 지정 키워드 기반 동영상 요약 시스템을 제안한다. 사용자가 키워드를 입력하면 시스템은 해당 키워드와 관련된 단어들을 FastText를 통해 추출하며, 이를 STT (Speech-to-Text)로 변환된 동영상에서 타임 스탬프 기반으로 인식한다. 인식된 키워드와 관련된 내용은 클립 형식으로 요약되어 사용자에게 제공된다. 본 연구의 목적은 숏폼 콘텐츠 환경에서 효과적인 콘텐츠 추출 및 제공을 통해 사용자 경험과 정보 제공의 효율성을 향상시키기 위함이다. 제안된 시스템은 사용자 지정 키워드에 맞춰 다양한 동영상 플랫폼에서 효율적인 영상 요약을 제공함으로써 온라인 동영상 환경에서 큰 혁신을 이끌어낼 것으로 기대된다.

  • PDF

Conveyed Message in YouTube Product Review Videos: The discrepancy between sponsored and non-sponsored product review videos

  • Kim, Do Hun;Suh, Ji Hae
    • The Journal of Information Systems
    • /
    • v.32 no.4
    • /
    • pp.29-50
    • /
    • 2023
  • Purpose The impact of online reviews is widely acknowledged, with extensive research focused on text-based reviews. However, there's a lack of research regarding reviews in video format. To address this gap, this study aims to explore the connection between company-sponsored product review videos and the extent of directive speech within them. This article analyzed viewer sentiments expressed in video comments based on the level of directive speech used by the presenter. Design/methodology/approach This study involved analyzing speech acts in review videos based on sponsorship and examining consumer reactions through sentiment analysis of comments. We used Speech Act theory to perform the analysis. Findings YouTubers who receive company sponsorship for review videos tend to employ more directive speech. Furthermore, this increased use of directive speech is associated with a higher occurrence of negative consumer comments. This study's outcomes are valuable for the realm of user-generated content and natural language processing, offering practical insights for YouTube marketing strategies.

Advanced Faceted Classification Scheme and Semantic Similarity Measure for Reuse of Software Components (소프트웨어 부품의 재사용을 위한 개선된 패싯 분류 방법과 의미 유사도 측정)

  • Gang, Mun-Seol
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.4
    • /
    • pp.855-865
    • /
    • 1996
  • In this paper, we propose a automation of the classification process for reusable software component and construction method of structured software components library. In order to efficient and automatic classification of software component, we decide the facets to represent characteristics of software component by acquiring semantic and syntactic information from software components descriptions in natural language, and compose the software component identifier or automatic extract terms corresponds to each facets. And then, in order to construct the structured software components library, we sore in the near location with software components of similar characteristic according to semantic similarity of the classified software components. As the result of applying proposed method, we can easily identify similar software components, the classification process of software components become simple, and the software components store in the structured software components library.

  • PDF

Development of Korean Opinion Analysis System using Semantic Dictionary and Inverse Opinion Processing (의미 사전과 반전 의견 처리를 이용한 한국어 의견 분석 시스템 개발)

  • Chang, Jae-Khun;Park, Jin-Soo;Ryoo, Seung-Taek
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.11 no.8
    • /
    • pp.3070-3075
    • /
    • 2010
  • Through Web 2.0 days, the end users express their opinions and thoughts for blogs and community spaces on the Internet. These opinions and thoughts are used to purchase products, however, users only refer to a few comments not overall opinions. Opinion Analysis System is an opinion search, developed from a natural language search, which analyzes the product's positive or negative evaluations using opinions of products and services on the Internet. In this paper, we suggest a syntactic analysis and inverse processing system that studies and processes 'Positive', 'Negative', 'Neutral' in addition to 'Inverse' information to analyze 'positive' or 'negative' for the core of sentences in Opinion Analysis Service.

Discriminator of Similar Documents Using the Syntactic-Semantic Tree Comparator (구문의미트리 비교기를 이용한 유사문서 판별기)

  • Kang, Won-Seog
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.10
    • /
    • pp.636-646
    • /
    • 2015
  • In information society, the need to detect document duplication and plagiarism is increasing. Many studies have progressed to meet such need, but there are limitations in increasing document duplication detection quality due to technological problem of natural language processing. Recently, some studies tried to increase the quality by applying syntatic-semantic analysis technique. But, the studies have the problem comparing syntactic-semantic trees. This paper develops a syntactic-semantic tree comparator, designs and implements a discriminator of similar documents using the comparator. To evaluate the system, we analyze the correlation between human discrimination and system discrimination with the comparator. This analysis shows that the proposed discrimination has good performance. We need to define the document type and improve the processing technique appropriate for each type.