• Title/Summary/Keyword: language processing

Search Result 2,711, Processing Time 0.023 seconds

Methodology for Deriving Technical Information Based on Stakeholder Requirements - Focused on 4th Industry Nanosensor Case (이해관계자 요구사항 기반 기술정보 도출 방법론 - 나노 센서 사례)

  • Gi, Wan Wook;Kim, Kwang Soo;Hong, Dae Geun
    • Journal of the Korean Society of Systems Engineering
    • /
    • v.14 no.1
    • /
    • pp.19-27
    • /
    • 2018
  • For the purpose of technology planning and R&D strategy, this research developed a methodology for deriving technical information based on stakeholder requirements using natural language processing technology. The requirements are decomposed into semantic information based on grammar rules, and then the requirement information based technology information can be derived by linking with the three technical information extracted from the patent.

An empirical evaluation of electronic annotation tools for Twitter data

  • Weissenbacher, Davy;O'Connor, Karen;Hiraki, Aiko T.;Kim, Jin-Dong;Gonzalez-Hernandez, Graciela
    • Genomics & Informatics
    • /
    • v.18 no.2
    • /
    • pp.24.1-24.7
    • /
    • 2020
  • Despite a growing number of natural language processing shared-tasks dedicated to the use of Twitter data, there is currently no ad-hoc annotation tool for the purpose. During the 6th edition of Biomedical Linked Annotation Hackathon (BLAH), after a short review of 19 generic annotation tools, we adapted GATE and TextAE for annotating Twitter timelines. Although none of the tools reviewed allow the annotation of all information inherent of Twitter timelines, a few may be suitable provided the willingness by annotators to compromise on some functionality.

open-japanese-mesh: assigning MeSH UIDs to Japanese medical terms via open Japanese-English glossaries

  • Yamada, Ryota;Tatieisi, Yuka
    • Genomics & Informatics
    • /
    • v.18 no.2
    • /
    • pp.22.1-22.3
    • /
    • 2020
  • The Medical Subject Headings (MeSH) thesaurus is a controlled vocabulary for indexing biomedical documents that is used for document retrieval and other natural language processing purposes. However, although the oariginal English MeSH is freely available, its Japanese translation has a restricted license. We attempted to create an open alternative, and for this purpose we made a script for assigning MeSH UIDs to Japanese medical terms using Japanese-English glossaries. From the MeSpEn glossary and MEDUTX dictionary, we generated a 12,457-word Japanese-MeSH dictionary.

A Study on the Generation of Korean using Description Directed Control (표현기술언어를 이용한 한국어 생성에 관한 연구)

  • Kwon, Il-Jae;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.117-120
    • /
    • 1995
  • 자연스러운 문장을 생성하는 것은 자연미 생성에서 중요하다. 자연스러운 문장은 개념과 화자의 의도에 의해서 이루어진다. 따라서, 화자의 의도를 반영할 수 있는 한국어 생성 시스템의 설계가 필요하다. 본 논문에서는 언어 현상을 바탕으로 얻은 사람의 발화 모델에 대하여 살펴보고 설정한 한국어의 기본격에 대한 무표어순을 고찰한 후, 이를 바탕으로 화자의 의도를 반영할 수 있는 생성 시스템을 설계한다. 그리고, 이 시스템에서 몇 가지 사람의 언어 행위가 재현되는 과정을 보인다.

  • PDF

Implementation of the Text Abstraction System using the Statistical Information of Korean Documents (한국어 문서의 통계적 정보를 이용한 문서 요약 시스템 구현)

  • Kang, Sang-Bae;Cho, Hyuk-Kyu;Kwon, Hyuk-Chul;Park, Jae-Deuk;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.28-33
    • /
    • 1997
  • 이 논문에서는 문장 유사도 측정 기법과 말뭉치 정보를 이용한 문서요약 시스템을 구현하였다. 문서 요약은 문서에서 문장 단위로 단어를 추출하여 문장을 단어의 벡터로 표현하고, 문서 내 단어의 출현빈도와 말뭉치 내 단어의 사용빈도를 이용하여 각 문장의 중요도를 계산한다. 그리고 중요도가 높은 상위 몇 위의 문장을 요약문장으로 추출한다. 실험 결과, 문서내 단어빈도의 중요도를 낮추고, 말뭉치내 일반 사용빈도를 단어의 가중치에 추가했을 때 가장 좋은 효율을 보였다. 또 요약하고자 하는 문서와 유사한 말뭉치를 사용 했을 때 높은 효율을 보였다.

  • PDF

A Study on the Specification of Communication Protocols Using Ada (Ada 언어를 이용한 통신 프로토콜의 명세화에 관한 연구)

  • 김길준
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.16 no.8
    • /
    • pp.697-700
    • /
    • 1991
  • In this paper, in first we show a main concept of Ada language and the architectures and functions of transport model for OSI, and than represent the possibility of describing the transport interface using Ada language. It is gived a following result. As we specify communication protocol using the Ada, we can to create of program for processing the communication protocol or for processing protocol itself. It is know to us to represent the effect debugging of softeware.

  • PDF

Refinement of KorLex based on WordNet (워드넷 기반 한국어 명사 어휘의미망의 정제)

  • Hwang, Soon-Hee;Yoon, Ae-Sun
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2005.05a
    • /
    • pp.267-272
    • /
    • 2005
  • 최근 들어 온톨로지(ontology), 시소러스(thesaurus) 등과 함께 주목받고 있는 Princeton 대학의 워드넷(WordNet, 이하 PWN) 은 자연어 처리(NLP)와 관련하여 대안을 제시할 수 있는 어휘의미망(lexico-semantic network)이다. 또한 PWN을 기반으로 상이한 개별어 어휘의미망 구축이 여러 차례 시도되었고, 현재도 진행 중이다. 본 연구는 간접 구축 방식에 의한 어휘의미망 구축 시 요구되는 정제(refinement) 방식들을 검토하고, 이를 한국어 명사 어휘의미망(KL)에 적용하여 정확도 검증 방법의 한 대안으로 제시하였다. 또한 보다 정교한 정제 방법의 모색과 고찰은 향후 과제로 삼고자 한다.

  • PDF

IPA Converter of Korean Standard Pronunciation (한국어 표준 발음 IPA 변환기)

  • Lee, Eun-Jung;Kang, Mi-Young;Yoon, Ae-Sun;Kwon, Hyuk-Chul
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2005.05a
    • /
    • pp.206-211
    • /
    • 2005
  • 한국어의 발음은 형태${\cdot}$음운론적 환경에 따라 다양하게 변화하므로 혼란을 일으키는 경우가 많다. 이에 표준발음법을 바탕으로 올바른 발음을 제시하는 한국어 표준 발음 변환기를 구현한다. 특히 본 논문에서는 세계적으로 널리 쓰이는 IPA를 활용하여 발음열을 생성해, 한국어 발음의 미세한 차이까지 표기하고, 모국어 화자뿐만 아니라 외국인 학습자들도 대상으로 하기에 적합하도록 하였다. 형태소 분석 정보, 어절 간 영향 정보 등을 활용하여 발음열 생성하였고. 발음열 생성 정확도는 98.09%였다.

  • PDF

Design and Implementation of WMLScript Interpreter (WAP 브라우저에서의 WMLScripts 해석기의 설계 및 구현)

  • Yoo, Seung-Bum;Kim, Min-Soo;Chang, Ji-San;Shin, Dong-Kyoo;Shin, Dong-Il
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10b
    • /
    • pp.1553-1556
    • /
    • 2001
  • 무선 이동 통신 인구의 증가와 무선 서비스에 대한 수요는 증가하고 있으며 이에 맞추어 무선휴대 장치의 성능도 빠르게 발전을 하고 있다. WAP 포럼에서 제정한 WML(Wireless Markup Language)을 사용한 무선 컨텐츠의 제작이 활발하게 이루어지고 있는 가운데 보다 더 동적인 WML 무선 컨텐츠의 요구가 증가하고 있다. 그로 인해 개발자가 실제와 같은 상황에서 WML과 WML Script 컨텐츠를 편리하게 테스팅 할 수 있는 환경이 필요하게 되었다. 따라서 본 논문에서는 CP(Content Provider)들이 작성된 WML(Wireless Markup Language) 컨텐츠(Content)를 쉽고 편리하게 브라우징하면서 테스팅 하기 위하여 필수적으로 요청되는 WAP(Wireless Application Protocol) 에뮬레이터 및 무선컨텐츠 제작에 필수적인 WMLScripts 해석기의 설계 및 구현에 대해 기술한다.

  • PDF

Recognition and Evaluation of Efficient Language Analysis Unit for Korean (한국어에서 실용적 언어분석 단위의 인식과 평가)

  • 박인철
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.1
    • /
    • pp.65-76
    • /
    • 2004
  • In this paper, we observe the differences between linguistic and computational aspect in the automatic processing of languages which are dominant representation method for information in the Internet. For efficient information retrieval, information extraction and machine translation from the massive documents, we investigate analysis units for morphology analysis, syntactic analysis and semantic analysis. and propose the syntactic longest analysis unit rather than morphological unit based on linguistics. Also, by evaluating with massive documents, we show that the proposed analysis units can be used for the constraint which can reduce the ambiguity occurring in the language processing.

  • PDF