Group Technology를 이용한 설계정보관리 시스템의 개발 (The Development of the Drawing Information Management System Based on Group Technology)

  • H.S. Moon;Kim, S.H.
    • 한국정밀공학회지
    • 제14권1호
    • pp.58-68
    • 1997
  • In order to provide economic high-quality products to customers in a timely manner, companies have tried much effort to decrease the time period of engineering design and information management. As a part of this effort, we have developed the Drawing Information Management System(DIMS) based ofn GT(Group Technology) that could decrease design processing time by speedy and rational management of design processes. The characteristics of DIMS are as follows: First, the concept of Concurrent Engineering was applied to DIMS. Through LAN, reviewers are able to attach comments to dlectronic documents by anno- tation functions called Mark-up. The reviewer annotations are collected and combind with the original document to revise the documents. Second, we have developed a Classification and Coding(C&C) system suitable for electronic component parts bassed on GT(Group Technology). The C&C system makes both parts and drawing with similar characteriscs into families and helps users search existing documents or create new drawings promptly. Finally, DIMS provides the Engineering BOM(Bill of Material) using the concept of Family BOM based on model options.

문서 내용의 계층화를 이용한 문서 비교 방법 (Document Clustering Methods using Hierarchy of Document Contents)

  • 황명권;배용근;김판구
    • 한국정보통신학회논문지
    • 제10권12호
    • pp.2335-2342
    • 2006
  • 웹의 비약적인 성장으로 웹에는 무수한 정보를 축적하고 있으며, 특히 텍스트 문서는 인간에 의해 가장 쉽게 그리고 많이 이용되는 형식이라 하겠다. 텍스트 문서의 효율적 검색을 위해 많은 연구가 이루어졌으며, 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등이 제안되었다. 그러나 이러한 기존의 방법들은 문서의 특징을 정확하게 반영할 수 없고, 의미적 검색이 이루어지지 않는 단점을 가지고 있다 이에 본 논문은 문서를 미리 분류하는 기존의 방법을 개선하기 위해, 유사한 문서를 의미적으로 찾아내기 위한 새로운 문서 분류의 척도를 제안하며 이를 적용하는 방법을 제시한다. 본 방법은 문서의 내용을 의미적인 계층으로 표현하고 중요 도메인에 가중치를 두며, 문서들간의 도메인 가중치와 도메인 내의 개념 일치도를 이용하여 유사도를 구한다.

XML 트리의 노드와 레벨을 사용한 군집화 방법 (Clustering Technique Using a Node and Level of XML tree)

  • 김우생
    • 한국정보통신학회논문지
    • 제17권3호
    • pp.649-655
    • 2013
  • 최근 들어 인터넷에서 많이 사용되는 XML 문서들을 효율적으로 접근, 질의, 관리하는 방법들이 연구되고 있다. 본 논문은 XML 문서들을 효율적으로 군집화 하는 새로운 기법을 제안한다. XML 문서의 원소는 대응하는 트리의 노드에 대응하며, 문서에서의 내포 관계는 대응하는 트리의 레벨 관계에 대응한다. 따라서 유사한 XML 문서들은 대응하는 트리들에서 노드의 이름과 레벨이 유사하다. 본 논문에서는 XML 문서의 특징으로 대응하는 트리의 노드 이름과 레벨을 사용하여 군집화를 수행하였다. 제안하는 기법이 좋은 결과를 얻을 수 있음을 실험을 통하여 보였다.

비음수 행렬 분해와 군집의 응집도를 이용한 문서군집 (Document Clustering Method using Coherence of Cluster and Non-negative Matrix Factorization)

  • 김철원;박선
    • 한국정보통신학회논문지
    • 제13권12호
    • pp.2603-2608
    • 2009
  • 문서군집은 정보검색의 많은 응용분야에 사용되는 중요한 문서 분석 방법이다. 본 논문은 비음수 행렬 분해 (NMF, non-negative matrix factorization)를 군집방법과 군집의 응집도(coherence of cluster)를 이용한 군집 내 문서들의 정제를 이용한 새로운 문서군집방법을 제안한다. 제안된 방법은 문서집합의 내부구조를 나타내는 의미특징행렬과 의미변수행렬 이용하여 문서군집의 성능을 높일 수 있고, 문장들 간의 유사도에 기반 한 군집의 응집도를 이용하여 군집내의 문서들을 정제하여서 재 할당함으로써 군집의 효율을 향상시킬 수 있다. 실험결과 제안방법을 적용한 문서군집방법이 다른 문서군집 방법에 비하여 좋은 성능을 보인다.

부모-자식 행렬을 사용한 XML 문서 유사도 측정과 군집 기법 (Similarity Measure and Clustering Technique for XML Documents by a Parent-Child Matrix)

  • 이윤구;김우생
    • 한국정보통신학회논문지
    • 제19권7호
    • pp.1599-1607
    • 2015
  • 최근 들어, 인터넷에서 자주 사용되는 XML 문서들에 대한 접근, 질의와 관리를 위한 효율적인 기법들이 연구 되어 왔다. 이 논문에서, 우리는 XML 문서를 효율적으로 군집화하기 위해 부모-자식 행렬 기법을 제안한다. 부모-자식 행렬은 XML 문서의 내용과 구조의 특징들을 분석한다. 부모-자식 행렬의 각 셀은 XML 트리 노드의 값이거나, 트리에서 부모-자식 관계가 존재할 때의 자식 노드의 값이 된다. 따라서 두 XML 문서의 유사도는 대응하는 부모-자식 행렬들의 유사도로 측정된다. 실험을 통해 우리가 제안하는 기법이 좋은 결과를 냄을 보였다.

Application of Domain-specific Thesaurus to Construction Documents based on Flow Margin of Semantic Similarity

  • Youmin PARK;Seonghyeon MOON;Jinwoo KIM;Seokho CHI
    • 국제학술발표논문집
    • The 10th International Conference on Construction Engineering and Project Management
    • pp.375-382
    • 2024
  • Large Language Models (LLMs) still encounter challenges in comprehending domain-specific expressions within construction documents. Analogous to humans acquiring unfamiliar expressions from dictionaries, language models could assimilate domain-specific expressions through the use of a thesaurus. Numerous prior studies have developed construction thesauri; however, a practical issue arises in effectively leveraging these resources for instructing language models. Given that the thesaurus primarily outlines relationships between terms without indicating their relative importance, language models may struggle in discerning which terms to retain or replace. This research aims to establish a robust framework for guiding language models using the information from the thesaurus. For instance, a term would be associated with a list of similar terms while also being included in the lists of other related terms. The relative significance among terms could be ascertained by employing similarity scores normalized according to relevance ranks. Consequently, a term exhibiting a positive margin of normalized similarity scores (termed a pivot term) could semantically replace other related terms, thereby enabling LLMs to comprehend domain-specific terms through these pivotal terms. The outcome of this research presents a practical methodology for utilizing domain-specific thesauri to train LLMs and analyze construction documents. Ongoing evaluation involves validating the accuracy of the thesaurus-applied LLM (e.g., S-BERT) in identifying similarities within construction specification provisions. This outcome holds potential for the construction industry by enhancing LLMs' understanding of construction documents and subsequently improving text mining performance and project management efficiency.

국외 BIM 발주지침 분석을 통한 국내 토목 분야 BIM 가이드라인 개발 방향 제시에 관한 연구 - 싱가폴 토목 사업 과업지시서를 중심으로- (Analysis of Singapore's BIM tender documents for the development of infrastructure BIM guidelines in Korea)

  • 구본상;옥현;유영수;정래규
    • 한국BIM학회 논문집
    • 제8권2호
    • pp.19-28
    • 2018
  • Recent increase in the interest and adoption of BIM for infrastructure projects has created a need for formal BIM guidelines in the civil engineering domain. Currently a BIM guideline has been developed in Korea exclusively for the road sector. However, the guideline has gaps in the specification of how BIM models should be generated, managed and applied for maximum effect in projects. This study reviewed the guidelines and tender documents of Singapore to determine potential improvements to adopt in Korea. Results showed that Korea's guideline should focus more on process integration as to stipulating BIM deliverables, encourage a common data environment, clearly distinguish between compulsory and selective BIM applications, and require data and models that can be leveraged in the operation phase of the facility.

검색 엔진에서 사용자 프로파일을 이용한 문서 순위결정 방법 (Ranking Decision Method of Retrieved Documents Using User Profile from Searching Engine)

  • 김용호;김형균
    • 한국정보통신학회논문지
    • 제10권9호
    • pp.1590-1595
    • 2006
  • 본 논문에서는 검색된 수많은 결과 중에서 특정 사용자의 선호도를 고려 한 최적의 문서만을 제공하기 위하여 사용자 프로파일을 이용한 문서 순위 결정기법을 제안한다. 사용자 프로파일을 구축하여 사용자의 선호도를 표현하고 검색결과 문서들을 대상으로 잠재적 구조를 분석 한 다음, 사용자 프로파일과 분석 결과로 표현된 문서들과의 유사성을 비교한다. 그리고 적합성 정도에 따라 사용자에게 최적의 문서를 제공하는 데에 목적이 있다.

A Study on Effective Internet Data Extraction through Layout Detection

  • Sun Bok-Keun;Han Kwang-Rok
    • International Journal of Contents
    • 제1권2호
    • pp.5-9
    • 2005
  • Currently most Internet documents including data are made based on predefined templates, but templates are usually formed only for main data and are not helpful for information retrieval against indexes, advertisements, header data etc. Templates in such forms are not appropriate when Internet documents are used as data for information retrieval. In order to process Internet documents in various areas of information retrieval, it is necessary to detect additional information such as advertisements and page indexes. Thus this study proposes a method of detecting the layout of Web pages by identifying the characteristics and structure of block tags that affect the layout of Web pages and calculating distances between Web pages. This method is purposed to reduce the cost of Web document automatic processing and improve processing efficiency by providing information about the structure of Web pages using templates through applying the method to information retrieval such as data extraction.

온라인 텍스트문서의 계층적 트리 기반 주제탐색 기법 (A Novel Technique of Topic Detection for On-line Text Documents: A Topic Tree-based Approach)

  • 현만;김한준
    • 한국정보처리학회:학술대회논문집
    • 한국정보처리학회 2012년도 추계학술발표대회
    • pp.396-399
    • 2012
  • Topic detection is a problem of discovering the topics of online publishing documents. For topic detection, it is important to extract correct topic words and to show the topical words easily to understand. We consider a topic tree-based approach to more effectively and more briefly show the result of topic detection for online text documents. In this paper, to achieve the topic tree-based topic detection, we propose a new term weighting method, called CTF-CDF-IDF, which is simple yet effective. Moreover, we have modified a conventional clustering method, which we call incremental k-medoids algorithm. Our experimental results with Reuters-21578 and Google news collections show that the proposed method is very useful for topic detection.