• 제목/요약/키워드: Semantic management

검색결과 609건 처리시간 0.023초

Towards Improving Causality Mining using BERT with Multi-level Feature Networks

  • Ali, Wajid;Zuo, Wanli;Ali, Rahman;Rahman, Gohar;Zuo, Xianglin;Ullah, Inam
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권10호
    • /
    • pp.3230-3255
    • /
    • 2022
  • Causality mining in NLP is a significant area of interest, which benefits in many daily life applications, including decision making, business risk management, question answering, future event prediction, scenario generation, and information retrieval. Mining those causalities was a challenging and open problem for the prior non-statistical and statistical techniques using web sources that required hand-crafted linguistics patterns for feature engineering, which were subject to domain knowledge and required much human effort. Those studies overlooked implicit, ambiguous, and heterogeneous causality and focused on explicit causality mining. In contrast to statistical and non-statistical approaches, we present Bidirectional Encoder Representations from Transformers (BERT) integrated with Multi-level Feature Networks (MFN) for causality recognition, called BERT+MFN for causality recognition in noisy and informal web datasets without human-designed features. In our model, MFN consists of a three-column knowledge-oriented network (TC-KN), bi-LSTM, and Relation Network (RN) that mine causality information at the segment level. BERT captures semantic features at the word level. We perform experiments on Alternative Lexicalization (AltLexes) datasets. The experimental outcomes show that our model outperforms baseline causality and text mining techniques.

의무 기록 문서 분류를 위한 자연어 처리에서 최적의 벡터화 방법에 대한 비교 분석 (Comparative Analysis of Vectorization Techniques in Electronic Medical Records Classification)

  • 유성림
    • 대한의용생체공학회:의공학회지
    • /
    • 제43권2호
    • /
    • pp.109-115
    • /
    • 2022
  • Purpose: Medical records classification using vectorization techniques plays an important role in natural language processing. The purpose of this study was to investigate proper vectorization techniques for electronic medical records classification. Material and methods: 403 electronic medical documents were extracted retrospectively and classified using the cosine similarity calculated by Scikit-learn (Python module for machine learning) in Jupyter Notebook. Vectors for medical documents were produced by three different vectorization techniques (TF-IDF, latent sematic analysis and Word2Vec) and the classification precisions for three vectorization techniques were evaluated. The Kruskal-Wallis test was used to determine if there was a significant difference among three vectorization techniques. Results: 403 medical documents were relevant to 41 different diseases and the average number of documents per diagnosis was 9.83 (standard deviation=3.46). The classification precisions for three vectorization techniques were 0.78 (TF-IDF), 0.87 (LSA) and 0.79 (Word2Vec). There was a statistically significant difference among three vectorization techniques. Conclusions: The results suggest that removing irrelevant information (LSA) is more efficient vectorization technique than modifying weights of vectorization models (TF-IDF, Word2Vec) for medical documents classification.

사출성형 공정에서 유발되는 냄새의 후각 감성 특성 (Olfactory Sensitivity Characteristics of Odors from Injection Molding Processing)

  • 류영재;김보성;이예현;곽승현;서상혁;류태범;민병찬
    • 산업경영시스템학회지
    • /
    • 제39권4호
    • /
    • pp.67-71
    • /
    • 2016
  • The purpose of this study was to explore olfactory sensitivity of odors from injection molding processing. To do this, the experiment was carried out in an injection molding factory, and participants were exposed to the environment where odor-substances (Formaldehyde, Benzene, Toluene, Ethylbenzene, Xylene, Styrene) exist. In addition, we used the subjective scale using semantic adjectives as an olfactory sensitivity. As a result, the assessment structure of olfactory sensitivity was composed of eight factors (irritant, thermal, tense, unique, like-dislike, active, stable, masculine), and the main factor which was irritant characteristics explained 20% of the total olfactory sensibility. These results suggested that odors from injection molding processing would cause more negative emotional responses than the flavor which is mainly used in olfactory sensitivity. This study, as a basic study of the improvement in a factory environment for the efficiency of work, has limits in that it was conducted to the extent of identifying the olfactory sensitivity structure of those who were at a laboratory and who were exposed to the environment of odor substance induced in the injection molding processing. Therefore, for the method of removing malodorous substance, the effect of materials which can neutralize it, and the comparison of a direct performance in the environment where negative sensitivity structure exists, a series of studies which aim to improve the environment of injection molding factories, such as performance assessment in the environment of a factory and an office need to be conducted. It is expected that when these studies are put together, the improvement guidelines will be provided as a type that can maximize the effectiveness of work in the factory environment where injection molding processing is done.

A Study of Holism based Service Experience Analysis System

  • Kim, Sung-Su;Lee, Eun-Jong
    • 대한인간공학회지
    • /
    • 제31권1호
    • /
    • pp.49-61
    • /
    • 2012
  • Objective: The aim of this study is to offer a holism based Service Experience Analysis System(HSEAS) for service design. Background: Customer experience has been focused in a lot of service area. But it is difficult to understand the customer's needs and their experiences because it's so complex and uncertain. Thus it needs holistic approach that means it's difficult to explain general character merely through the understanding of small parts that composes an object and it must be analyzed within the overall context. Method: Accordingly, the thesis paper proposes the Service Experience Analysis System that satisfies the four following needs. (1) Need of solid Experience Framework in which the special quality of the service experience is considered, (2) need of support for the semantic cohesion between different kinds of data, (3) need of support for the management and search of vast data, and (4) need of building the knowledge base system for collaborative research. Results: HSEAS combines the short information in the customers' words and behaviors or situations and circumstances and provides a place of analysis where the context of the general experience can be read and allows concrete understanding of the actual state and factor of the problem as a Combined Data Analysis Tool. Conclusion: HSEAS becomes the center of information management, analysis and connection and it provides a free collaboration place where physical condition has no relations to as a knowledge base system based on network. Application: It is expected that length and width will be added to the analysis and assistance for effectively accumulating information will be provided in the area of diverse service.

일상생활 맥락 정보요구 기반의 이미지 접근점 확장에 관한 연구 (An Approach Toward Image Access Points based on Image Needs in Context of Everyday Life)

  • 정은경;정선영
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.273-294
    • /
    • 2012
  • 세대적 특성과 정보기술의 발달은 이미지의 생산과 이용을 가속화한다. 본 연구는 이미지 이용자의 일상생활 맥락에서 정보요구를 분석하여 이미지 접근점 확장에 관한 논의를 목적으로 하였다. 이를 위하여 소셜 Q&A 서비스인 네이버 지식인에서 이미지를 검색하고자 하는 질문 105건을 추출하였다. 이미지 질문은 이용 목적과 이미지 속성으로 구분한 프레임워크를 이용하여 분석하였다. 분석결과로서 이용 목적은 총 8가지로, 이미지를 데이터로서 이용하고자 하는 목적이 두드러졌으며, 이중에서 '보고그리기'는 기존 연구결과에서 찾아볼 수 없었던 이용 목적으로 새롭게 도출되었다. 이미지 속성에서는 의미, 비시각적, 구성 측면에서 의미와 비시각적 속성이 우세하게 나타났다. 전통적으로 이미지 검색과 접근에서 의미 측면의 속성은 중요하게 인식되어 왔으나, 본 연구의 분석결과에서 보여주는 바와 같이 비시각적 측면 특히, 맥락 요소의 비중은 접근점 제공에 있어서 중요한 시사점으로 볼 수 있다.

다중 비주얼 특징을 이용한 어학 교육 비디오의 자동 요약 방법 (Automatic Summary Method of Linguistic Educational Video Using Multiple Visual Features)

  • 한희준;김천석;추진호;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제7권10호
    • /
    • pp.1452-1463
    • /
    • 2004
  • 양방향 방송 서비스로의 전환을 맞아 다양한 사용자 요구 및 기호에 적합한 컨텐츠를 제공하고, 증가하는 방송 컨텐츠를 효율적으로 관리, 이용하기 위해 비디오의 자동 에 대한 요구가 증가하고 있다. 본 논문에서는 내용 구성이 잘 갖추어진 어학 교육 비디오의 자동 에 대한 방법을 제안한다. 내용 기반을 자동으로 생성하기 위해 먼저 디지털 비디오로부터 샷 경계를 검출한 후, 각 샷을 대표하는 키프레임으로부터 비주얼 특징들을 추출한다. 그리고 추출된 다중 비주얼 특징을 이용해 어학 교육 비디오의 세분화된 내용 정보를 결정한다. 마지막으로, 결정된 내용 정보를 기술하는 요약문을 MPEG-7 MDS(Multimedia Description cheme)에 정의된 계층적 (Hierarchical Summary) 구조에 맞추어 XML 문서로 생성한다. 외국어 회화 비디오에 대해 실험하여 제안한 자동 방법의 효율성을 검증하였으며, 제안한 방법이 교육 방송용 컨텐츠의 다양한 서비스 제공 및 관리를 위한 비디오 요약 시스템에 효율적으로 적용 가능함을 확인하였다.

  • PDF

도시 단독주택 정원의 공간적 특징과 유지.관리에서 보이는 거주자의 정원 인식에 관한 연구 (Research on the Characteristics of Garden Design and Dwellers' Understanding of Garden Maintenance in Single Detached Urban Dwellings)

  • 조동범;김수란;김근호
    • 한국조경학회지
    • /
    • 제34권6호
    • /
    • pp.54-65
    • /
    • 2007
  • There is little research on the exterior spaces or gardens of single detached urban dwellings in Korea because apartments are the general housing type of most inhabitants. However there is an increasing demand for idyllic houses in the urban fringe and for environmentally friendly dwellings or healthy houses that is represented in urban residents gardening activities. The purpose of this research is to analyze residents' preferences and problems in gardening and management of single detached urban dwellings, and to evaluate the possibility of gardens as biotopes. It also addresses the issue of providing public amenities in the urban landscape. One hundred thirty-six dwellings were selected in residential areas of the city of Gwangju. The layout and plant composition, residents' evaluation and understanding of their own gardens, and maintenance and management were investigated. The results indicated that residents associate gardening with mental health and recognized a lack of space as one environmental restriction. Watering was seen as a primary difficulty for maintaining gardens. This research suggests that providing space for gardening could be a tool for participatory community making. When considering the important aspects of gardening, residents responded that gardens offer naturalness, scenic beauty, and practicality and also felt that gardens provide a buffer from environmental pollution and relief from mental duress. Results from the factor analysis using 15 semantic differential variables showed that 'spatial openness', 'natural variety' and 'familiarity' were representative factors. Although a garden is mainly considered as a space for the appreciation of nature with plant material, our results suggest that meaning and environmental symbolism are important elements.

인문학 및 사회과학 분야 국내 학술논문의 저자키워드 출현빈도와 피인용횟수의 상관관계 연구 (A Study on the Correlation between the Appearance Frequency of Author Keyword and the Number of Citation in the Humanities and Social Science Journal Articles of the Korea Citation Index (KCI))

  • 고영만;송민선;김비연;민혜령
    • 정보관리학회지
    • /
    • 제30권2호
    • /
    • pp.227-243
    • /
    • 2013
  • 본 연구의 목적은 저자키워드의 출현빈도와 해당 키워드가 속한 논문들의 총피인용횟수 간 상관관계 여부를 확인하고자 하는 것이다. 연구의 배경은 인문사회과학 분야 학술용어사전을 구축하는데 있어서 실제 연구에서의 활용도가 높고 다른 키워드와의 의미적 연관관계가 많은 학술용어를 추출하기 위한 방법론을 개발해 보고자 하는 것이다. 본 연구의 목적을 이루기 위해 한국연구재단 한국학술지인용색인(KCI)에 수록된 2007년에서 2011년까지의 인문학 및 사회과학 분야 학술지 논문의 저자키워드와 피인용횟수를 분석하였다. 분석 결과 저자키워드의 출현빈도와 해당 키워드가 속한 논문들의 총피인용횟수는 통계적으로 상관관계가 있으며, 저자키워드의 출현빈도가 늘어날수록 논문의 총피인용횟수도 많아지는 것으로 나타났다.

한국학 연구 논문의 텍스트 구조 기반 메타데이터 검색 시스템 개발 연구 (A Study on Developing a Metadata Search System Based on the Text Structure of Korean Studies Research Articles)

  • 송민선;고영만;이승준
    • 정보관리학회지
    • /
    • 제33권3호
    • /
    • pp.155-176
    • /
    • 2016
  • 본 연구는 한국학 연구 논문 텍스트의 의미 구조를 기반으로 하는 메타데이터를 적용한 학술정보시스템을 구축하여 기존 유사 시스템과의 비교를 통해, 텍스트 구조 기반 메타데이터의 활용 가능성을 확인해 보고자 하는 것을 목적으로 한다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)에서 일정 기준을 충족하는 한국학 분야 연구 논문 데이터를 대상으로 의미 구조 메타데이터 항목을 적용한 시범적 검색 시스템(Korean Studies Metadata Database, KMD)을 구축하였으며, 동일한 검색 키워드를 적용하여 기존의 KCI 시스템과 비교했을 때 어떤 특징과 차이점을 갖는지 비교해 보았다. 연구 결과, KMD 시스템이 KCI에 비해 이용자의 검색 의도에 맞는 결과를 보다 효율적으로 보여주는 것으로 확인되었다. 즉 검색하고자 하는 키워드의 조합이나 조건식이 기존 시스템과 동일하더라도 검색 결과를 통해 최종적으로 연구 진행과 관련해 찾고자 하는 연구 목적, 연구의 대상 데이터나 시공간적 배경 등에 따른 검색 결과를 다양하게 보여줄 수 있는 것으로 나타났다.

VIVO를 활용한 국가적 전거구축모델에 관한 연구 (Constructing a Model for National Authority Control Utilizing VIVO)

  • 오삼균;한상은;손태익;김성훈
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.165-187
    • /
    • 2018
  • 전거데이터 공동구축을 목표로 하는 많은 국내 연구가 시행되었음에도 불구하고 국가전거구축의 협업 환경은 표준 전거의 제정, 표준 전거 구축원칙의 제정, 기존 전거구축 기관의 업무 개편, 공동구축 업무의 핵심기관 선정 등과 같은 전제 조건의 미비로 인해 그 실질적 조성이 막혀 있다. 국가전거를 공동으로 구축하고 원활하게 활용하기 위해서는 기존 전거구축기관의 업무에 지장을 초래하지 않는 현실적 협업 방안과 지속적 추진력을 보유한 국가기관의 참여와 아울러 다수 기관의 데이터 병합을 가능케 하는 표준식별체계가 요구된다. 본 연구의 목적은 국가전거의 공동 구축을 위한 여건 조성에 있어서 필수사항이 무엇인가를 문헌조사로 밝히고, 시맨틱웹 기반으로 구축되어 상호운용성이 우수한 VIVO 온톨로지 모델의 활용을 통해 구현 가능한 국가전거 구축모델을 제시하는 것이다.