• Title/Summary/Keyword: 사전이도

Search Result 6,724, Processing Time 0.034 seconds

Analysis of Weights Given to Observations in the Bayesian Reliability Prediction (베이지안 기법을 이용한 신뢰도 예측 시 관측치에 주어지는 가중치 분석에 관한 연구)

  • Yang, Hee Joong
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.22 no.51
    • /
    • pp.53-61
    • /
    • 1999
  • 평균치에 적용되는 credibility formula를 분산에도 적용하여 응용 할 수 있는 extended credibility formula를 개발한다. 간단한 베이지안 신뢰도 예측모형을 구축하고 이 모형에 extended credibility formula를 적용한다. 감마 사전분포 - 포아송 우도의 경우와 베타 사전분포 - 이항분포 우도의 경우에 대해 extended credibility formula를 적용해 관측치에 주어진 가중치에 따라 사후 분산이 어떻게 변화하는지를 분석한다. 사후분산도 사후평균과 마찬가지로 사전값과 관측값의 가중평균으로 표시될 수 있다는 것을 증명한다. 가중치와 불확실성 감소율간의 관계도 연구된다. 이와 같은 가중치에 따른 사전 및 사후분포의 변화 양식에 대한 이해는 올바른 사전분포를 설정하는데 큰 도움이 될 수 있다.

  • PDF

Construction of Sejong Electronic Dictionnary for Contemporary Korean (세종 전자사전 : 전산어휘부로서의 특성과 의의)

  • Hong, Chai-Song;Lee, Seong Heon
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.323-331
    • /
    • 2007
  • 이 글에서는 세종 전자사전이 전산어휘부로서 갖는 특성과 그 개발 의의를 대해서 살피고자 한다. 이를 위해 우선 세종 전자사전 개발 사업을 기간별 내용과 사업의 배경 및 목표, 사업 내용으로 나누어 개관한다. 그런 다음, 세종 전자사전의 특성을 개관하고, 거시구조 및 미시구조의 특성, 그리고 전산어휘부로서의 특성으로 나누어 살핀다. 또한 이러한 특성과 관련하여 세종 전자사전 개발의 의의에 대해서도 아울러 살핀다.

  • PDF

An analysis on the Public Information Dissemination from an Archival Information Service Perspective (기록정보서비스 관점에서 행정정보공표 현황 분석)

  • KIM, Hye-Won;JOUNG, Kyung-Hee
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2013.08a
    • /
    • pp.193-196
    • /
    • 2013
  • 행정정보공표는 시민이 공개요청을 하기 전에 공공기관이 사전에 행정정보를 요청하기 전에 미리 공개하는 제도이다. 이 제도는 국민의 알권리 충족을 위해 2004년 "정보공개법"에 도입되었고 2011년에 동법 시행령을 통하여 좀 더 구체화 되었다. 이에 따라, 공공기관은 "정보공개법"과 "정보공개운영매뉴얼" 등을 기준으로 행정정보를 사전에 공개하고 있다. 본 연구는 중앙행정기관 중 17개부 웹사이트를 대상으로 행정정보를 사전에 공표하고 있는지, 공표된 목록을 웹사이트에서 어떤 형식으로 공개하고 있는지, 사전공표한 행정정보를 쉽게 찾을 수 있는 방법을 제공하는지 등의 3가지 측면에서 분석하였다. 분석 결과, 내부규정 및 지침에 법에서 요구한대로 행정정보공표를 사전에 제공하는 기관이 5개에 불과했으며, 규정 및 지침에 따라 웹사이트에서 제공하지 않았고, 메뉴의 구성도 통일성이 부족하며, 원문정보로의 접근을 위한 링크연결과 검색기능에 대한 문제점을 발견하였다.

  • PDF

Named Entity Recognition based on ELECTRA with Dictionary Features and Dynamic Masking (사전 기반 자질과 동적 마스킹을 이용한 ELECTRA 기반 개체명 인식)

  • Kim, Jungwook;Whang, Taesun;Kim, Bongsu;Lee, Saebyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.509-513
    • /
    • 2021
  • 개체명 인식이란, 문장에서 인명, 지명, 기관명, 날짜, 시간 등의 고유한 의미의 단어를 찾아서 미리 정의된 레이블로 부착하는 것이다. 일부 단어는 문맥에 따라서 인명 혹은 기관 등 다양한 개체명을 가질 수 있다. 이로 인해, 개체명에 대한 중의성을 가지고 있는 단어는 개체명 인식 성능에 영향을 준다. 본 논문에서는 개체명에 대한 중의성을 최소화하기 위해 사전을 구축하여 ELECTRA 기반 모델에 적용하는 학습 방법을 제안한다. 또한, 개체명 인식 데이터의 일반화를 개선시키기 위해 동적 마스킹을 이용한 데이터 증강 기법을 적용하여 실험하였다. 실험 결과, 사전 기반 모델에서 92.81 %로 성능을 보였고 데이터 증강 기법을 적용한 모델은 93.17 %로 높은 성능을 보였다. 사전 기반 모델에서 추가적으로 데이터 증강 기법을 적용한 모델은 92.97 %의 성능을 보였다.

  • PDF

Assignment Semantic Category of a Word using Word Embedding and Synonyms (워드 임베딩과 유의어를 활용한 단어 의미 범주 할당)

  • Park, Da-Sol;Cha, Jeong-Won
    • Journal of KIISE
    • /
    • v.44 no.9
    • /
    • pp.946-953
    • /
    • 2017
  • Semantic Role Decision defines the semantic relationship between the predicate and the arguments in natural language processing (NLP) tasks. The semantic role information and semantic category information should be used to make Semantic Role Decisions. The Sejong Electronic Dictionary contains frame information that is used to determine the semantic roles. In this paper, we propose a method to extend the Sejong electronic dictionary using word embedding and synonyms. The same experiment is performed using existing word-embedding and retrofitting vectors. The system performance of the semantic category assignment is 32.19%, and the system performance of the extended semantic category assignment is 51.14% for words that do not appear in the Sejong electronic dictionary of the word using the word embedding. The system performance of the semantic category assignment is 33.33%, and the system performance of the extended semantic category assignment is 53.88% for words that do not appear in the Sejong electronic dictionary of the vector using retrofitting. We also prove it is helpful to extend the semantic category word of the Sejong electronic dictionary by assigning the semantic categories to new words that do not have assigned semantic categories.

Method for Spatial Sentiment Lexicon Construction using Korean Place Reviews (한국어 장소 리뷰를 이용한 공간 감성어 사전 구축 방법)

  • Lee, Young Min;Kwon, Pil;Yu, Ki Yun;Kim, Ji Young
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.25 no.2
    • /
    • pp.3-12
    • /
    • 2017
  • Leaving positive or negative comments of places where he or she visits on location-based services is being common in daily life. The sentiment analysis of place reviews written by actual visitors can provide valuable information to potential consumers, as well as business owners. To conduct sentiment analysis of a place, a spatial sentiment lexicon that can be used as a criterion is required; yet, lexicon of spatial sentiment words has not been constructed. Therefore, this study suggested a method to construct a spatial sentiment lexicon by analyzing the place review data written by Korean internet users. Among several location categories, theme parks were chosen for this study. For this purpose, natural language processing technique and statistical techniques are used. Spatial sentiment words included the lexicon have information about sentiment polarity and probability score. The spatial sentiment lexicon constructed in this study consists of 3 tables(SSLex_SS, SSLex_single, SSLex_combi) that include 219 spatial sentiment words. Throughout this study, the sentiment analysis has conducted based on the texts written about the theme parks created on Twitter. As the accuracy of the sentiment classification was calculated as 0.714, the validity of the lexicon was verified.

Describing a MachineReadable Electronic Dictionary using LEXml (LEXml을 이용한 기계가독형 전자사전의 표식)

  • Jeong, Hwi-Woong;Yoon, Ae-Sun
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2006.06a
    • /
    • pp.103-109
    • /
    • 2006
  • XML(extensible Markup Language)이 1996년 등장한 이후, 기존의 정보를 XML 기반으로 나타내기 위한 연구가 활발하게 이루어지고 있다. 언어자원(language Resource)과 관련된 분야는 80년대부터 그 연구가 있었으나, XML의 등장 이후, 보다 다양하고 특화된 영역의 정보를 구조화하기 위한 연구결과가 최근 소개되기 시작하였다. 본 연구에서는 이러한 분야 중 전자사전을 표식(markup)하는 XML기반 표준언어인 LEXml(Presentation/Representation of Entries in Dictionaries: LEXml)에 대하여 살펴보고, 기존에 XML로 구축된 전자사전을 LEXml로 변환하여, 그 구조의 확장성과 유효성을 검증할 것이다. 기반자료로써 2000년도에 구축된 MultiDICO의 불어 정보를 이용하였다. 이를 위해 MultiDICO의 XML문서 구조와 LEXml 구조 사이의 각 요소(element)별 대응표를 만들었으며, 이를 바탕으로 XSL(Extensible Style sheet Language)를 작성하였다. 본 연구결과 LEXml이 기존에 구축된 전자사전들을 표식하는데 어려움이 없을 뿐만 아니라, 기계가독성을 높일 수 있는 구조적 유연성이 매우 높은 것을 확인할 수 있었다.

  • PDF

Review On the Unrecognized Risk Identification and Evaluations in the Maritime Transportation Areas (해상운송 분야의 새로운 위기식별과 평가에 관한 고찰)

  • Yim, Jeong-Bin;Yang, Hyeong-Sun;Park, Seong-Bug
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2015.10a
    • /
    • pp.187-189
    • /
    • 2015
  • 해양사고를 야기하는 위기(risk) 또는 해저드(hazard)는 세계 경제 및 물류, 기상환경, 금융, 선종개발, 기술개발 등 다양한 요소에 의해서 수시로 변한다. 변한 위기에 대해서 사전에 대응방안을 수립하지 못한 경우 대규모 해양사고로 연계될 가능성이 크다. 그 이유는 대응방안을 사전에 고려하지 못했거나 준비하지 못한 해양사고는 사전대응책이 마련된 사고와 비교하여 대응하는 방법과 대응속도 등이 다르기 때문이다. 본 연구에서는 현재까지 새로 창출된 다양한 위기를 각종 보고서, 논문 등을 통해서 식별하고 분류하여 현재까지 식별하지 못한 위기를 구분하고, 식별하였더라도 새로운 사고를 유발한 위기를 식별하여 사전에 예방책을 강구하는 것이 목적이다. 연구 대상이 방대하기 때문에 본 연구에서는 일단, 알리안츠 보험회사 자료에서 획득한 위기분석 결과를 토대로 위기를 식별하고, 이에 대한 시나리오를 전개하였다. 이를 통해서 추후 연구방법을 검토하고자 한다.

  • PDF

Emotion Verb Dictionary for Emotional Analysis on Characters in Novel (소설 속 인물의 감정 분석을 위한 감정 용언 사전 제안)

  • Kyu-Hee Kim;Surin Lee;Myung-Jae Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.576-581
    • /
    • 2022
  • 감정 분석은 긍부정의 극성을 판단하는 감성 분석과 달리 텍스트로부터 구체적인 감정 유형을 분류해내는 과제이다. 본 논문에서는 소설 텍스트에 감정 분석을 수행하는 것을 새로운 과제로 설정하고, 이에 활용할 수 있는 감정 용언 사전을 소개한다. 이 사전에는 맥락과 상관없이 동일한 감정을 전달하는 직접 감정 표현과 맥락에 따라 다른 감정으로 해석될 수 있는 간접 감정 표현이 구분되어 있다. 우리는 이로써 한국어 자연어처리 연구자들이 소설의 풍부한 감정 표현 텍스트로부터 정확한 감정을 분류해낼 수 있도록 그 단초를 마련한다.

  • PDF

Development of an MT System on Distributed Environment : about lexicon construction and test environment (분산 환경에서의 번역 시스템의 개발 : 사전 구축과 테스트 환경을 중심으로)

  • 이현아;장병규;강인호;이신목;김길창
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.344-349
    • /
    • 2000
  • 본 논문에서는 영환 기계번역 시스템 ALKOL의 개발 과정에서 사용된 분산 환경을 사전 구축과 테스트 환경을 중심으로 설명한다. 번역 시스템 개발은 시스템 개발자, 사전 개발자, 검사자(tester)의 세 요소를 중심으로 이루어지는 작업으로, 효율적인 개발을 위해서는 개발 요소의 작업이 독립적으로 진행되면서 유기적으로 연결될 수 있는 환경이 마련되어야 한다. ALKOL에서는 이를 위하여 번역 시스템을 번역 서버, 사전 서버, 사전 편집기, 사용자 인터페이스 클라이언트/서버 분산 환경으로 구성하고 검사자를 위한 테스트 환경을 제공하여 효율적인 번역 시스템 개발 환경을 구축한다. 번역 시스템을 분산 환경에서 개발하여 시스템 개발자, 사전 개발자, 검사자가 각자의 작업을 병렬적으로 진행할 수 있고 실시간으로 갱신되는 시스템과 사전 정보를 이용하여 작업을 진행할 수 있어 번역 시스템 개발의 효율성을 높일 수 있다.

  • PDF