• 제목/요약/키워드: 한글인명

검색결과 36건 처리시간 0.031초

군중집회 시의 안전: 군중압박의 기초 조사 (Safety in Mass Gathering: Basic Survey for Crowd Crush)

  • 왕순주
    • 한국방재안전학회논문집
    • /
    • 제16권1호
    • /
    • pp.49-60
    • /
    • 2023
  • 2022년 10월 29일 발생한 이태원 참사 이후 군중압박 사고로 인한 인명피해에 대한 관심이 높아졌으나 국내에서 군중압박과 관련된 학술적, 실제적 기반이 미약함이 지적되었다. 이에 본 연구에서는 군중압박과 관련된 용어와 개념을 조사하고 가능한 한글 용어 후보들을 제안하였으며, 국내외에서 발생한 대표적인 군중압박 사고 사례를 조사하여 정리하였다. 일부 대표적 사례를 기반으로 한 선진국의 접근법들을 조사하였고, 그 중 대표적으로 영상분석, 시뮬레이션 및 설문과 인터뷰 방법을 요약 도출하였다. 이를 통하여 군중압박 사고의 한글 용어 표준화와 개념 정립, 평가 및 접근 방법의 체계화가 이루어지기를 기대하고 있다.

광물명에 대한 제언 1: 금속광물 (Suggestion for Mineral Species Name 1: Metallic Mineral)

  • 조현구;구효진
    • 한국광물학회지
    • /
    • 제32권2호
    • /
    • pp.145-150
    • /
    • 2019
  • 최근 남북한 사이에 화해의 분위기가 무르익어가고 있으므로, 미래에 발생할 한반도 통일을 대비하는 관점에서 남북한 사이의 광물명을 통일하여 사용하는 것이 절실히 요구되고 있다. 외래어 표기법에 다른 언어에서 빌려온 어휘를 한글로 표기하는 규정이 있음에도 불구하고 광물명의 경우 이를 준수하지 않고 같은 외래어 광물명에 대하여 다양한 용어를 사용하고 있으므로 외래어 표기법에 맞도록 통일해야 한다. 금속광물과 비금속광물 모두에 ${\bigcirc}{\bigcirc}{\bigcirc}$석을 사용하고, 외래어 표기법 용례 찾기에 포함된 약 70개의 광물명은 용례 찾기에 나와 있는 대로 표기하고, 인명이나 지명에서 유래한 광물명은 인명이나 지명 + 석으로 표기할 것을 제안한다.

Bi-directional LSTM-CNN-CRF를 이용한 한국어 개체명 인식 시스템 (Korean Entity Recognition System using Bi-directional LSTM-CNN-CRF)

  • 이동엽;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.327-329
    • /
    • 2017
  • 개체명 인식(Named Entity Recognition) 시스템은 문서에서 인명(PS), 지명(LC), 단체명(OG)과 같은 개체명을 가지는 단어나 어구를 해당 개체명으로 인식하는 시스템이다. 개체명 인식 시스템을 개발하기 위해 딥러닝 기반의 워드 임베딩(word embedding) 자질과 문장의 형태적 특징 및 기구축 사전(lexicon) 기반의 자질 구성 방법을 제안하고, bi-directional LSTM, CNN, CRF과 같은 모델을 이용하여 구성된 자질을 학습하는 방법을 제안한다. 실험 데이터는 2017 국어 정보시스템 경진대회에서 제공한 2016klpNER 데이터를 이용하였다. 실험은 전체 4258 문장 중 학습 데이터 3406 문장, 검증 데이터 426 문장, 테스트 데이터 426 문장으로 데이터를 나누어 실험을 진행하였다. 실험 결과 본 연구에서 제안하는 모델은 BIO 태깅 방식의 개체 청크 단위 성능 평가 결과 98.9%의 테스트 정확도(test accuracy)와 89.4%의 f1-score를 나타냈다.

  • PDF

KACTEIL-NER: 딥러닝과 앙상블 기법을 이용한 개체명 인식기 (KACTEIL-NER: Named Entity Recognizer Using Deep Learning and Ensemble Technique)

  • 박건우;박성식;장영진;최기현;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.324-326
    • /
    • 2017
  • 개체명 인식은 입력 문장에서 인명, 지명, 기관명, 날짜, 시간 등과 같은 고유한 의미를 갖는 단어 열을 찾아 범주를 부착하는 기술이다. 기존의 연구에서는 단어 단위나 음절 단위를 입력으로 사용하였다. 하지만 단어 단위의 경우 미등록어 처리가 어려우며 음절 단위의 경우 단어 고유의 의미가 희석되는 문제가 발생한다. 이러한 문제들을 해결하기 위해 본 논문에서는 형태소 단위 개체명 인식기와 음절 단위 개체명 인식기를 앙상블하여 보정된 결과를 예측하는 개체명 인식기를 제안한다. 제안된 모델은 각각의 단일 입력 모델보다 향상된 F1-점수(0.8049)를 보였다.

  • PDF

Bidirectional LSTM CRFs를 이용한 한국어 개체명 인식 (Named-entity Recognition Using Bidirectional LSTM CRFs)

  • 송치윤;양성민;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.321-323
    • /
    • 2017
  • 개체명 인식은 문서 내에서 고유한 의미를 갖는 인명, 기관명, 지명, 시간, 날짜 등을 추출하여 그 종류를 결정하는것을 의미한다. Bidirectional LSTM CRFs 모델은 연속성을 갖는 데이터에 가장 적합한 RNN기반의 심층 학습모델로서 개체명 인식 연구에 가장 우수한 성능을 보여준다. 본 논문에서는 한국어 개체명 인식을 위하여 Bidirectional LSTM CRFs 모델을 사용하고, 입력 자질로 단어뿐만 아니라 품사 임베딩 모델과, 개체명 사전을 활용하여 입력 자질을 구성한다. 또한 입력 자질에 대한 벡터의 크기를 최적화 하여 기본 모델보다 성능이 향상되었음을 증명하였다.

  • PDF

음절 기반의 CNN를 이용한 개체명 인식 (Named Entity Recognition using CNN for Korean syllabic character.)

  • 박혜웅;송영숙
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.330-332
    • /
    • 2017
  • 개체명 인식(Named Entity Recognition, 이하 NER)은 인명(PS), 기관명(OG), 장소(LC), 날짜(DT), 시간(TI) 등에 해당하는 개체명에 일정한 태깅 값을 주어 그 정보를 가시화하는 작업이다. 한국어 개체명 인식은 아직 그 자질이 충분히 밝혀져 있지 않아 자연어 처리 분야의 발전을 더디게 하는 한 요소로 작용하고 있다. 한국어가 음절 기반으로 단어를 형성하고 비교적 어순이 자유롭다는 특성이 있기에, 이런 특징을 잘 포착할 수 있는 "음절 기반의 Convolutional Neural Network(CNN)"의 아키텍쳐를 제안하여 66.80%의 성능을 보였다. 이 방법을 사용하면 형태소 분석등 개체명 이전 단계에서 발생하는 오류에 의해 개체명 인식(NER)의 성능이 떨어지는 문제를 해결할 수 있고, 조사나 어미 등을 제거하기 위한 후처리를 생략할 수 있다.

  • PDF

중국어 음성합성을 위한 지진 벡터 기반 실시간 미등록어 처리 (Real-time Unknown Word Identification Using Support Vector Machine For Chinese Text-to-Speech)

  • 하주홍;정옥;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.267-272
    • /
    • 2003
  • 음성 합성 시스템 구축에 있어서 입력 텍스트를 정확한 발음 표기로 변환하는 것은 매우 중요하다. 중국어에는 하나의 한자가 의미나 사용에 따라 다르게 발음되는 다음자(polyphony)들이 존재한다. 다음자의 처리는 상당히 복잡한 문제이기 때문에 본 논문에서는 그 중 가장 발음에 영향을 미치는 요소인 인명과 지명에 대한 미등록어 처리를 수행했다. 무엇보다 실시간 음성 합성 시스템을 위해서는 처리 속도의 향상이 요구된다. 따라서 본 연구에서는 미등록어 후보 구간 선정을 선행하고, 선정된 후보에 대해 추정하는 두 단계로 진행하였다. 후보 구간 선정은 단일 한자 단어(monosyllable word)의 확률과 간단한 패턴들을 이용한다. 최종 선정된 후보의 미등록어 추정은 SVM(Support Vector Machine)을 기반으로 실시하였다.

  • PDF

KDC 4판(1996)상의 외국인명, 지명 및 외래어의 한글표기 문제 (Standardizing Korean transliteration of foreign proper names and loan words in headings and notes in the 4th edition of KDC)

  • 유경숙
    • 한국도서관정보학회지
    • /
    • 제30권4호
    • /
    • pp.27-57
    • /
    • 1999
  • Standardization is a prerequisite of quality control in any field. Library field is not an exception. The bibliographic control structures of AACR2R, MARC, DDC, LCC, LCSH, ISBD are highly standardized and dependent on rigorous authority work, so that libraries and bibliographic utilities using these tools could provide effective quality services. In order to emphasize the importance of standardization in the field of bibliographic control structures, this study focuses on inconsistencies in transliterated foreign personal and geographic names in headings, used as the caption of a given class as well as in notes describing what is found in a class or clarifying the notation hierarchy in the 4th edition of KDC. This study also examines Korean transliteration of loan words in the schedule as well as the transliterated entries of the Relative Index.

  • PDF

특허 개체명 인식에 대한 기계학습 사례 (Named Entity Recognition for Patent Data by Machine Learning)

  • 이태석;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-186
    • /
    • 2014
  • 특허 분석에서 관심 있는 기술명, 서비스명, 제품명을 인식하도록 기계학습 기법을 사용해 개체명 인식기의 성능을 평가해 보았다. 개체인식을 위한 엔진은 스탠포드 대학의 NER과 CRF++을 사용하였다. 그 결과 F1값인 0.5612로 나타났다. 이것은 인명, 지역명, 조직명 개체를 인식하는 다른 연구에서 나타난 0.7857보다 0.2245 떨어지는 결과이다. 특허 개체명 인식에 대한 자질값 선정과 사전처리에 대한 더 많은 연구가 필요하다.

  • PDF

전화번호화일 관리시스팀 개발 (Development of File System for Telephone Subscriber)

  • 김의경;강종수;김영곤;이종원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.51-61
    • /
    • 1992
  • 전자전화번호부 서비스는 HiTEL단말기 및 기존의 PC를 소유한 가입자의 전화번호 관련문의에 대해 신속, 정확한 정보를 제공하는 비디오텍스 응용시스팀으로서 통신처리시스팀, 서비스검색시스팀, 화일관리시스팀으로 나뉠 수 있다. 전화번호화일은 가입자에 따라 인명부, 업종상호부로 나뉘어 CISAM 방식의 화일로 구현하였으며, 상호인 경우 1:N 필드관계를 지원하여 하나의 전화번호에 대해 다수 업종의 지원이 가능하다. 전화가입자의 일일 변동자료의 처리및 화일의 갱신에 대해 소개하고자 한다.

  • PDF