• Title/Summary/Keyword: Dictionary Construction

Search Result 113, Processing Time 0.03 seconds

A Study on Development of Service System for Construction Terminology Dictionary (건설용어사전 표준 서비스 체계 구축에 관한 연구)

  • OK, Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.872-875
    • /
    • 2012
  • 최근 정보기술의 발전으로 책자 형태의 건설용어사전 보다는 인터넷을 통한 다양한 건설용어사전이 제공되어 있으며, 특히 정부기관을 비롯하여 건설관련 학회 및 협회, 건설관련 포탈 및 정보시스템 등에서 자체적인 건설용어사전을 개발하여 제공하고 있다. 이처럼 건설분야에서 활용되고 있는 건설용어 사전은 다양하게 서비스 되고 있으나, 아직까지 건설용어에 관한 표준 체계가 정립되지 않아, 건설용어사전에서 정의하고 있는 건설용어가 서로 상이하며 현업에서는 아직도 관행처럼 외래어를 사용함에 따라 건설공사 수행시 참여주체 간에 의사소통의 저해 요인으로 작용하고 있다. 따라서 본 연구에서는 국내외 건설용어사전의 유형을 살펴보고, 건설용어 표준 활동 사례의 분석을 통해 국내 실정에 적합한 건설용어사전 서비스 체계 구축을 위한 방안을 제시하고자 한다.

RIMS project application raising for a public transportation immediacy operation (공공교통 전동차 안전운행을 위한 RIMS 프로젝트 적용 제고)

  • Son Young-Jin;Lee Kang-won;Bang yeon-goon;Lee do-sun
    • Proceedings of the KSR Conference
    • /
    • 2005.11a
    • /
    • pp.897-901
    • /
    • 2005
  • 21 century as the knowledge information anger society now our society industry of all fields the rolling stock maintenance conservative standardization enterprise where information anger is being turning out construction Ministry of Transportation supported with continuous development of the supply section substitution quantity information processing system which the information highway is quick and the Korean railroad technical research worker propelled the enterprise as the subjective agency, it contracted this for a vehicle field information anger system construction in link of the enterprise our construction and an agreement, information technique composed the consortium t9day and it propelled a system codevelopment. The SMSC who is a front-runner of Maj loach city railroad operation agency to 'here business relates with a vehicle field maintenance conservativeness an immediacy operation and generally and information anger it will plan it will integrate it will own jointly and business efficiency and in the dictionary an obstacle occurrence electromotive car maintenance conservative information and it will improve only maintenance conservativeness of preventive maintenance of the electromotive car it knows it will prevent to construct the maintenance conservative system of the preventive maintenance, it applied the RIMS project to sleep.

  • PDF

A Study on the Analysis of Disaster Safety Lexicon Patterns in Social Media (소셜미디어를 통해 본 재난안전 분야 어휘 사용 양상 분석)

  • Kim, Tae-Young;Lee, Jung-Eun;Oh, Hyo-Jung
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.10
    • /
    • pp.85-93
    • /
    • 2017
  • Standardization of disaster safety lexicon is important as the most basic process for successful accident prevention and response. A lack of understanding of disaster safety lexicon leads lack of communication and information sharing, which can be a problem in communicating with appropriate responses in case of a disaster. Currently disaster and safety control agencies produce and manage heterogeneous information and they also develop and use word dictionaries individually. To solve this problem, identifying differences of disaster safety lexicon patterns by the user are essential for standardization. In this paper, we conducted lexicon patterns analysis based on social media and revealed the characteristics according to pattern types. At the result, we proposed the standardization and construction methods of disaster safety word dictionary.

A Comparative Study between Stock Price Prediction Models Using Sentiment Analysis and Machine Learning Based on SNS and News Articles (SNS와 뉴스기사의 감성분석과 기계학습을 이용한 주가예측 모형 비교 연구)

  • Kim, Dongyoung;Park, Jeawon;Choi, Jaehyun
    • Journal of Information Technology Services
    • /
    • v.13 no.3
    • /
    • pp.221-233
    • /
    • 2014
  • Because people's interest of the stock market has been increased with the development of economy, a lot of studies have been going to predict fluctuation of stock prices. Latterly many studies have been made using scientific and technological method among the various forecasting method, and also data using for study are becoming diverse. So, in this paper we propose stock prices prediction models using sentiment analysis and machine learning based on news articles and SNS data to improve the accuracy of prediction of stock prices. Stock prices prediction models that we propose are generated through the four-step process that contain data collection, sentiment dictionary construction, sentiment analysis, and machine learning. The data have been collected to target newspapers related to economy in the case of news article and to target twitter in the case of SNS data. Sentiment dictionary was built using news articles among the collected data, and we utilize it to process sentiment analysis. In machine learning phase, we generate prediction models using various techniques of classification and the data that was made through sentiment analysis. After generating prediction models, we conducted 10-fold cross-validation to measure the performance of they. The experimental result showed that accuracy is over 80% in a number of ways and F1 score is closer to 0.8. The result can be seen as significantly enhanced result compared with conventional researches utilizing opinion mining or data mining techniques.

Design and Implementation of a System for Constructing Thesaurus of Korean Nouns (한국어 명사의 시소러스 구축을 위한 시스템 설계 및 구현)

  • Lee, Jong-In;Han, Gwang-Rok;Yang, Seung-Hyeon;Kim, Yeong-Seom
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.2
    • /
    • pp.347-356
    • /
    • 1999
  • We present a method of thesaurus construction in order to produce semantic concept hierarchy of Korean nouns and implement a system for constructing the thesaurus in this paper. Multiple-step construction method is applied to this system which uses bottom-up and top-down method complementarily for solving the non-objectivity of word hierarchy, working speed, structural contradiction and incoherency of existing thesaurus. This system maintains objectivity using the meaning sentence of machine-readable dictionary and solves structural contradiction and incoherency with reference to existing thesaurus. We implement a developmental tool based on client/server system to construct thesaurus including massive entries as soon as possible and multiple client can work simultaneously.

  • PDF

Crafting a Quality Performance Evaluation Model Leveraging Unstructured Data (비정형데이터를 활용한 건축현장 품질성과 평가 모델 개발)

  • Lee, Kiseok;Song, Taegeun;Yoo, Wi Sung
    • Journal of the Korea Institute of Building Construction
    • /
    • v.24 no.1
    • /
    • pp.157-168
    • /
    • 2024
  • The frequent occurrence of structural failures at building construction sites in Korea has underscored the critical role of rigorous oversight in the inspection and management of construction projects. As mandated by prevailing regulations and standards, onsite supervision by designated supervisors encompasses thorough documentation of construction quality, material standards, and the history of any reconstructions, among other factors. These reports, predominantly consisting of unstructured data, constitute approximately 80% of the data amassed at construction sites and serve as a comprehensive repository of quality-related information. This research introduces the SL-QPA model, which employs text mining techniques to preprocess supervision reports and establish a sentiment dictionary, thereby enabling the quantification of quality performance. The study's findings, demonstrating a statistically significant Pearson correlation between the quality performance scores derived from the SL-QPA model and various legally defined indicators, were substantiated through a one-way analysis of variance of the correlation coefficients. The SL-QPA model, as developed in this study, offers a supplementary approach to evaluating the quality performance of building construction projects. It holds the promise of enhancing quality inspection and management practices by harnessing the wealth of unstructured data generated throughout the lifecycle of construction projects.

A Synonym Dictionary Construction for Information Retrieval (정보 검색을 위한 동의어/유의어 사전 구축)

  • Lee, Tae-Woo;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.208-213
    • /
    • 2003
  • 본 논문에서는 많은 정보로부터 의미 있는 정보를 추출하기 위해 사용되는 정보 검색 시스템에서 이용이 가능한 동의어/유의어 사전을 구축하고 구축된 정보의 평가를 수행하였다. 사용한 자원으로는 미리 구축된 한-영 사전과 영-한사전을 이용하였다. 이들의 사용으로 다른 동의어사전과 달리 보다 많은 유의어 정보를 포함하는 이익을 얻었다. 본 논문의 시스템은 사전을 구축하기 위해 기본 자원을 이용하여 동의어/유의어 후보 목록들을 획득하고, 획득된 정보를 바탕으로 후보 목록의 빈도수와 사전의 위치 정보, 마지막으로 입력 명사 정보를 이용하여 동의어/유의어를 확정한다. 작성된 동의어/유의어사전은 한-영사전에 수록된 한국어 명사 64,630개를 대상으로 하였다. 작성된 사전을 문서 필터링 시스템에 추가하여 적용 전보다 성능이 향상됨을 확인하였다. 또한 질의 색인어 확장에 이용하여 보다 정답을 추출하는데 추가적으로 확장된 유의어 정보가 정답을 추출하는데 유용하게 사용됨을 확인하였다.

  • PDF

The Study of Josa Dictionary Construction for Korean-English Machine Translation (한영 기계 번역을 위한 조사 사전 구성에 관한 연구)

  • Choi, Jae-Hyuk;Kim, Kweon-Yang;Park, Sang-Gyu;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.219-224
    • /
    • 1989
  • 본 연구는 한영 기계 번역을 위한 사전 중에서 한국어 조사 사전에 대한 모델을 제시하였다. 특히 정확한 역어 선택을 위한 제약정보를 수집하는데 중점을 두었다. 지금까지의 한국어 조사에 대한 역어 선택 방법은 체언의 속성 정보에 의한 역어 선택과 default 역어의 선택이었다. 그러나 한국어의 한 조사에 대응하는 영어의 전치사의 수가 너무 많음으로 인하여 이러한 기존의 방법을 사용할 경우 고질의 변역은 기대할 수 없다. 따라서 본 논문에서는 정확한 역어의 선택을 위하여 조사의 격 분류와 체언의 속성 정보를 더욱 세분화 시키고, 이를 이용한 용언의 기본 구문 패턴을 재정립하였다. 또한 한 두개의 default 역어로 인한 번역의 부 정확성을 탈피하기 위하여 default 역어 및 체언의 속성 정보에 의한 역어를 용언의 의미적 분류에 의해 더욱 세분화시킴으로써 정확한 역어를 선택하는 방법을 제시하였다.

  • PDF

Automatic Dictionary Construction of Indonesian Field-Associated Terms by Using Korean Associated Knowledge (한국어의 분야 연상 지식의 추출 방법에 관한 연구)

  • Lee, Sang-Gon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.205-210
    • /
    • 2016
  • 인간은 문서전체를 읽지 않고 대표적인 단어를 보는 것만으로 정치나 스포츠 등의 분야를 정확히 인지할 수 있다. 문서 전체는 물론 부분 텍스트(단락)에 출현하는 소수의 단어 정보에서 문서의 분야를 정확히 결정하기 위한 분야연상어의 구축은 중요한 연구과제이다. 미리 분야체계를 정의하고, 각 분야에 해당하는 문서를 인터넷이나 서적을 통해 수집한다. 본 논문은 수집 문서의 분야를 정확히 지시하는 분야연상어를 수집하는 방법을 제안한다. 문서의 분야결정 시점을 고려하여 분야연상어의 수준을 정하였다. 인도네시아어의 분야연상어 사전을 자동으로 구축하기 위해 먼저 한국어로 구축한 분야 연상 지식을 추출하는 방법을 제안한다.

  • PDF

Construction of Korean acronym dictionary by considering ways of making acronym from definition (약어 생성 유형을 고려한 한국어 약어 사전 자동 구축)

  • Yoon, Yeo-Chan;Song, Young-In;Lee, Joo-Young;Lim, Hae-Chang
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2006.06a
    • /
    • pp.81-85
    • /
    • 2006
  • 본 논문에서는 한국어 고유명사 약어 사전을 자동으로 구축하기 위한 방법론을 제안한다. 본 논문은 원어로부터 약어가 생성되는 방식을 네 가지 유형으로 분류 한 후 각 유형에 따라 가능한 약어의 후보들을 생성하여 원어, 약어 후보 쌍을 수집하고, 수집 된 각 쌍에 대하여 확률적모형에 근거, 실제 사용되는 원어, 약어 쌍을 선별하여 사전에 등재함으로써 자동으로 사전을 구축 할 수 있도록 한다.

  • PDF