• Title/Summary/Keyword: 한글 용어

Search Result 170, Processing Time 0.027 seconds

An Information Retrieval System for IT Terminologies Using a Main Memory DBMS (메인 메모리 DBMS를 이용한 정보기술 전문용어 검색 시스템)

  • 강옥선;경원현;조완섭
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.311-322
    • /
    • 2001
  • 대부분의 일반 정보 검색 시스템은 색인어를 통해 이루어지는데 이런 경우 사용자는 원하는 정보를 얻기 위해 데이터베이스에 저장된 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 필요한 색인어를 정확하게 입력하기는 어렵고 특히 원하는 정보가 전문분야의 것일 때는 더욱 그러하다. 따라서 특정 분야의 용어들을 중심으로 전문용어를 관리할 수 있는 시스템의 개발이 요구되고 있다. 정보기술 분야도 빠르게 성장하고 있는 전문분야의 하나로 사용되는 대부분의 단어가 영어이고 한글 표기 또한 다양하여 많은 사용자들이 원하는 정보를 정확하게 찾지 못하고 있다. 이렇듯 단어간의 형태적인 불일치로 인해 생기는 정보 검색의 문제를 해결하고 검색어의 범위를 확장하기 위해 만든 것이 전문용어 검색 시스템이다. 정보 검색시 사용자가 입력한 검색어뿐만 아니라 동의어나 상위어, 하위어까지 검색하여 질의를 확장함으로써 검색 효율을 높일 수 있다. 또한 객체-관계형 데이터베이스로 설계하여 검색이 용이하고, 새로운 단어의 확장이 용이하도록 그 구조를 설계하였다. 제안한 시스템은 메인 메모리 DBMS 를 이용하여 전자상거래와 같이 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다.

  • PDF

Term Weighting Method by Postposition and Compound Noun Recognition (조사 유형 및 복합명사 인식에 의한 용어 가중치 부여 기법)

  • 강승식;이하규;손소현;홍기채;문병주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.196-198
    • /
    • 2001
  • 문서의 내용을 대표하는 용어를 추출하기 위해 일반적으로 영어에서는 명사구를 색인하는 기법을 사용하지만 주제어 추출의 관점에서 영어의 명사구가 한국어의 복합명사에 해당하기 때문에 한국어에서는 복합명사 색인 기법을 중요시하고 있다. 본 논문에서는 한글 문서에서 추출된 용어의 가중치를 결정하기 위하여 경험적인 방법에 따라 가중치를 계산하는 방법을 제안한다. 구체적인 가중치 계산 방법으로 용어 자체의 특성에 의한 가중치를 부여한 후에, 복합명사의 경계를 인식하여 띄어쓴 복합명사의 가중치를 조절하고, 다시 용어의 조사 유형에 따라 가중치를 재계산하는 방법을 제안한다. 신문기사에 대한 실험결과에 의하면 제안한 방법이 단순 출현빈도에 의한 주제어 추출 기법보다 정확도가 더 높았다.

  • PDF

A study on the Algorithm for automated extraction for chemical term in Korean patents (국내 특허 문헌 내 화학 용어 자동 추출을 위한 알고리즘 연구)

  • Lee, Hayoung;Kim, Hongki;Park, Jinwoo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.273-276
    • /
    • 2019
  • 본 논문에서는 열 및 전기특성 플라스틱 복합수지와 한글에 특화된 인공지능 기술을 개발하기 위한 조성/물성 정보 복합수지 지식베이스를 구축하고자 국내 특허 문헌에서 화학 용어를 추출하고자 한다. 이를 위해 전문용어가 많이 쓰인 특허 문헌의 특수성을 고려하여 UIMA(Unstructured Information Management Architecture) 규칙 기반의 라이브러리를 사용해 한국어 화학 용어 코퍼스를 구축하고 이를 기반으로 딥러닝 알고리즘 중 하나인 Bidirectional LSTM-CRF를 기반으로 특허 문헌에서 화학 용어를 자동으로 추출하는 알고리즘을 연구하고자 한다.

  • PDF

Design and Implementation of Educational Hangul Pascal (교육용 한글 파스칼 설계 및 구현)

  • 김용성;홍성수;심재홍
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.16 no.10
    • /
    • pp.1009-1018
    • /
    • 1991
  • In this paper, we present a design and inplementation of the Hangul pascal programming language corresponding to Turbo pascal. The instructions of Hangul pascal were easily seledted to be understood of elementary middle, high school syudents, and Dos commands and error messages were translated into Hangul. Hangul-pascal were implemented into C-language under IBM PC XT / AT, MS-DOS.

  • PDF

관제교신 및 일지 표준화에 대한 연구

  • Kim, Jae-Il;Kim, Jae-Su;Park, Jeong-Rok;Yun, Cheong-Geum
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2015.07a
    • /
    • pp.307-309
    • /
    • 2015
  • 최근 VTS의 발전과 더불어 관제운영의 중요성이 날로 커지고 있음이 사실이다. 1일 하루의 시간은 정해져 있는 만큼 한정된 시간동안 어떻게 하면 관제 선박과의 효과적인 교신을 할지에 대한 논의가 필요할 것이다. 관제 절차에 따라 관제사의 역할이 중요한 만큼 효율적인 관제가 되기 위해서 SMCP의 사용과 더불어 한글로 된 관제용어의 표준화가 필요하다. 관제사 개인별 차이도 있는 만큼 관제용어의 표준화를 통하여 선박의 원활한 교신 유지와 더불어 관제센터에서 사용하는 관제교신일지의 표준화로 관제운영의 효율화를 모색해 보았다.

  • PDF

Safety in Mass Gathering: Basic Survey for Crowd Crush (군중집회 시의 안전: 군중압박의 기초 조사)

  • Soon-Joo Wang
    • Journal of Korean Society of Disaster and Security
    • /
    • v.16 no.1
    • /
    • pp.49-60
    • /
    • 2023
  • After the 10.29 Itaewon disaster, interests in the crowd crush injury increased, but it is pointed out that the academic and practical basis related to crowd crush is still weak in Korea. Therefore, in this study, terms and concepts related to crowd crush were investigated and proposed, and representative cases of crowd crush events were investigated and summarized. Approaches based on representative cases were investigated, and among them, video analysis, simulation, questionnaire survey and interview methods were derived as an essential approach methods. Through this research, it is expected that standardization of Korean terminology, concept establishment, evaluation, and systematization of approach methods of crowd crush can be accomplished.

A Study on the Description of Relationships and Homographs in Terms of Creator and Work in the Korean Thesaurus (한글 시소러스에서 저자와 저작에 대한 관계 설정과 동형 이의어의 기술)

  • Han, Sang-Kil;Choi, Suk-Doo
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.45 no.4
    • /
    • pp.139-155
    • /
    • 2011
  • The failure of distinguishing homographs in describing relations of individual authors and relations of authorship(i.e. distinction of persons with the same name or persons of the same literary author's name) will cause difficulties of retrieving exact information. It is because relations of automorphism cannot be formed between the two sets mentioned above. Therefore, it is ultimately necessary to set up the criteria or tools to distinguish homographs in order to retrieve more exact information. In the past, some efforts were made to develop authority data in order to solve the homograph problems by individual libraries, documents and portal sites in Korea. It is well understood that developing authority data by an individual institution was very difficult with no criteria or no rules to clarify the homograph problems at the national level. This study is to develop ways of recognizing individual names including subject words and proper nouns. The results of the study will present methods of distinguishing and describing homographs between individual author sets, and authorship sets particularly focused on the areas of arts and popular culture.

Automatic Keyword Extraction System for Korean Documents Information Retrieval (국내(國內) 문헌정보(文獻情報) 검색(檢索)을 위한 키워드 자동추출(自動抽出) 시스템 개발(開發))

  • Yae, Yong-Hee
    • Journal of Information Management
    • /
    • v.23 no.1
    • /
    • pp.39-62
    • /
    • 1992
  • In this paper about 60 auxiliary words and 320 stopwords are selected from analysis of sample data, four types of stop word are classified left, right and - auxiliary word truncation & normal. And a keyword extraction system is suggested which undertakes efficient truncation of auxiliary word from words, conversion of Chinese word to Korean and exclusion of stopword. The selected keyeords in this system show 92.2% of accordance ratio compared with manually selected keywords by expert. And then compound words consist of $4{\sim}6$ character generate twice of additional new words and 58.8% words of those are useful as keyword.

  • PDF

Web Document Classification Based on Hangeul Morpheme and Keyword Analyses (한글 형태소 및 키워드 분석에 기반한 웹 문서 분류)

  • Park, Dan-Ho;Choi, Won-Sik;Kim, Hong-Jo;Lee, Seok-Lyong
    • The KIPS Transactions:PartD
    • /
    • v.19D no.4
    • /
    • pp.263-270
    • /
    • 2012
  • With the current development of high speed Internet and massive database technology, the amount of web documents increases rapidly, and thus, classifying those documents automatically is getting important. In this study, we propose an effective method to extract document features based on Hangeul morpheme and keyword analyses, and to classify non-structured documents automatically by predicting subjects of those documents. To extract document features, first, we select terms using a morpheme analyzer, form the keyword set based on term frequency and subject-discriminating power, and perform the scoring for each keyword using the discriminating power. Then, we generate the classification model by utilizing the commercial software that implements the decision tree, neural network, and SVM(support vector machine). Experimental results show that the proposed feature extraction method has achieved considerable performance, i.e., average precision 0.90 and recall 0.84 in case of the decision tree, in classifying the web documents by subjects.

The Analysis on Research Trends for Computational Thinking in Korea : Based on Terminology of CT (Computational Thinking(CT) 관련 국내 연구 동향 분석 : CT 용어 사용을 중심으로)

  • Han, Jeong-Min;Kim, Seong-Won;Lee, Young-Jun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.07a
    • /
    • pp.223-226
    • /
    • 2017
  • 소프트웨어 교육이 활성화됨에 따라 CT의 중요성이 증가하고 있지만, CT는 다양한 단어로 혼용되고 있다. 이와 같은 현황은 CT 연구에 어려움을 유발하고 있다. 따라서 본 연구에서는 CT 용어 사용의 표준화를 위하여 CT 관련 연구에서 사용하고 있는 CT의 용어를 분석하였다. 이러한 연구를 위하여 선행 연구를 통해 '컴퓨팅 사고(력)', 'computational thinking(CT)', '계산적 사고(력)', '알고리즘적 사고(력)', '컴퓨터적 사고(력)', '컴퓨터 과학적 사고(력)', '정보적 사고(력)', '정보 과학적 사고(력)'이라는 키워드를 추출하였다. 추출한 키워드를 기반으로 학술연구정보서비스에서 CT 관련 논문을 수집한 후 CT 관련 논문 중, 제목에 CT 관련 용어가 포함된 123편의 논문을 최종 연구 대상으로 선정하였다. 이와 같은 논문을 분석한 결과, CT 관련 연구는 2008년부터 지금까지 꾸준히 증가해 왔으며 특히 2014년과 2015년 사이에 큰 폭으로 증가한 것을 알 수 있었다. 또한 CT를 표현하는 여러 용어들이 혼재하는 기간을 거쳐 CT의 한글 용어에 대한 합의가 '컴퓨팅 사고력'으로 귀결되고 있는 것을 확인 할 수 있었다. 이를 출발점으로 연구주제, 연구방법, 연구대상 등을 중심으로 한 CT 관련 연구동향 연구가 추후 이루어져야 함을 제안한다.

  • PDF