• Title/Summary/Keyword: 단체명

검색결과 546건 처리시간 0.027초

Bi-directional LSTM-CNN-CRF를 이용한 한국어 개체명 인식 시스템 (Korean Entity Recognition System using Bi-directional LSTM-CNN-CRF)

  • 이동엽;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.327-329
    • /
    • 2017
  • 개체명 인식(Named Entity Recognition) 시스템은 문서에서 인명(PS), 지명(LC), 단체명(OG)과 같은 개체명을 가지는 단어나 어구를 해당 개체명으로 인식하는 시스템이다. 개체명 인식 시스템을 개발하기 위해 딥러닝 기반의 워드 임베딩(word embedding) 자질과 문장의 형태적 특징 및 기구축 사전(lexicon) 기반의 자질 구성 방법을 제안하고, bi-directional LSTM, CNN, CRF과 같은 모델을 이용하여 구성된 자질을 학습하는 방법을 제안한다. 실험 데이터는 2017 국어 정보시스템 경진대회에서 제공한 2016klpNER 데이터를 이용하였다. 실험은 전체 4258 문장 중 학습 데이터 3406 문장, 검증 데이터 426 문장, 테스트 데이터 426 문장으로 데이터를 나누어 실험을 진행하였다. 실험 결과 본 연구에서 제안하는 모델은 BIO 태깅 방식의 개체 청크 단위 성능 평가 결과 98.9%의 테스트 정확도(test accuracy)와 89.4%의 f1-score를 나타냈다.

  • PDF

Bi-directional LSTM-CNN-CRF를 이용한 한국어 개체명 인식 시스템 (Korean Entity Recognition System using Bi-directional LSTM-CNN-CRF)

  • 이동엽;임희석
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.327-329
    • /
    • 2017
  • 개체명 인식(Named Entity Recognition) 시스템은 문서에서 인명(PS), 지명(LC), 단체명(OG)과 같은 개체명을 가지는 단어나 어구를 해당 개체명으로 인식하는 시스템이다. 개체명 인식 시스템을 개발하기 위해 딥러닝 기반의 워드 임베딩(word embedding) 자질과 문장의 형태적 특징 및 기구축 사전(lexicon) 기반의 자질 구성 방법을 제안하고, bi-directional LSTM, CNN, CRF과 같은 모델을 이용하여 구성된 자질을 학습하는 방법을 제안한다. 실험 데이터는 2017 국어 정보시스템 경진대회에서 제공한 2016klpNER 데이터를 이용하였다. 실험은 전체 4258 문장 중 학습 데이터 3406 문장, 검증 데이터 426 문장, 테스트 데이터 426 문장으로 데이터를 나누어 실험을 진행하였다. 실험 결과 본 연구에서 제안하는 모델은 BIO 태깅 방식의 개체 청크 단위 성능 평가 결과 98.9%의 테스트 정확도(test accuracy)와 89.4%의 f1-score를 나타냈다.

  • PDF

국내 에이즈 민간단체

  • 대한에이즈예방협회
    • 레드리본
    • /
    • 통권68호
    • /
    • pp.24-25
    • /
    • 2006
  • 국내 첫 에이즈 감염인의 발견 2년 뒤인 1987년 국립보건원에 에이즈센터를 설립하면서 본격적으로 예방사업이 시작되었다. 같은 해에 후천성면역결핍증 예방법이 제정되었고, 모든 헌혈액에 대한 에이즈 검사와 특정집단에 대한 의무검사도 시작하게 되었다. 그뒤 1989년에는 각 지역 보건소에서 에이즈 무료의 명검사를 실시하게 되었다. 정부의 에이즈 예방과 확산금지에 대한 노력이 역부족이라는 판단 하에 대한에이즈예방협회와 한국에이즈퇴치연맹이 설립되면서 민간 차원에는 에이즈 예방 사업이 본격화되었다. 그 후 구세군과 대학적십자사에서도 에이즈 예방사업에 뛰어들었으며, 다양한 감염인 단체들이 생겼다 사라지곤 했다. 90년대 초부터 에이즈 사업에 뛰어든 역사와 내실을 자랑하는 단체들과 이제 막 형성된 신생단체까지 국내에서는 다양한 단체들이 에이즈 사업에 뛰어들고 있다.

  • PDF

회원단체순례 - 한국기술사회

  • 성락정
    • 과학과기술
    • /
    • 제30권7호통권338호
    • /
    • pp.88-89
    • /
    • 1997
  • 1963년 제정된 기술사법에 따라 64년 농업, 기계, 광업 등 13개 부문, 64개 전문분야에서 67명의 기술사가 배출되었고 이 기술사들이 모여 65년 2월 한국기술사회를 창립했다. 77년 사단법인으로 등록된 기술사회는 현재 22개분야 96개 종목에 정회원 9천여명의 큰 단체로 성장했다.

  • PDF

IT의 세계

  • 한국과학기술단체총연합회
    • 과학과기술
    • /
    • 제34권8호통권387호
    • /
    • pp.36-39
    • /
    • 2001
  • 초고속 인터넷 대중화 시대, 국내 가입자 6백만명 넘어/새로운 국면에 접어든 위성통신 이리듐/개발자 지원으로 시장 확대를 노린다/가상 CD-ROM 드라이브로 간편하게/손쉽게 구축하는 인터넷 쇼핑몰

  • PDF

한국어 지명 인식 처리를 위한 사전기반의 규칙 적용을 위한 세분화된 시스템 연구 (A Study on Recognition of Korean Place Names System on the Internet by Using the Rules of Dictionary Use)

  • 장혜숙;정규철;이진관;박기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.301-304
    • /
    • 2005
  • 문서의 내용을 대표하는 용어를 추출하는데 있어서 반드시 선행되어야 할 작업이 개체명 인식이다. 개체명의 범주로는 인명, 지명, 단체명, 시간, 날짜등이 있다. 높은 신뢰도의 개체명 인식은 정보추출 시스템구축을 한 차원 높일 수 있을 것이다. 일반적인 개체명 인식이나 인명의 개체명 인식에 대한 연구는 활발하게 진행되어 왔다.. 그러나 세분화된 지명 인식의 연구는 다루어지지 않았다. 본 논문에서는 한국어 지명 인식 처리를 위한 사전기반의 세분화된 규칙 적용 시스템 연구방법을 제안하고자 한다.

  • PDF