통합 검색 | Korea Science

한국어 문서에서 개체명 인식에 관한 연구 (Study on Named Entity Recognition in Korean Text)

이경희;이주호;최명석;김길창
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
- /
- pp.292-299
- /
- 2000
본 논문에서는 개체명 사전과 결합 단어 사전, 그리고 용언의 하위범주화 사전을 이용하는 규칙 기반의 한국어 개체명 인식 방법을 제안한다. 각 규칙은 네 단계로 나누어 적용되는데, 첫번째 단계에서는 어절 내의 단어 정보를, 두번째 단계에서는 제한된 주변 문맥 정보를, 그리고 세번째 단계에서는 용언의 하위범주화 정보와 개체명과의 관계를 이응하고, 마지막으로 네번째 단계에서는 개체명 간의 관계 정보를 고려한다. 본 논문에서 제안한 규칙 기반 개체명 인식기의 성능을 평가하기 위해 실험한 결과 90.4%의 정화률과 83.4%의 재현율을 얻었다.
PDF

대규모 인터뷰 작업이 생성하는 집단적 관계성의 의미 - 미디어전시예술 <70mK>를 중심으로 (The Meaning of Collective Relationships Becoming by Large-scale Interview Project - Focused on the media exhibition art <70mk> -)

오세현
- 트랜스-
- /
- 제7권
- /
- pp.19-48
- /
- 2019
본 연구는 대규모 인터뷰 작업을 통해 한민족이 가진 집단적 의식의 지형도를 담아내고자 하는 미디어전시작업 <70mK>의 의미를 고찰하기 위해 기술되었다. <70mK>는 개별 존재자들의 인터뷰 영상들을 마치 모자이크와 같은 배치와 형태로 편집, 구성된 영상전시물을 만들고 전시회를 개최하고 있다. 분할된 프레임 속의 개체들은 저마다의 생각과 개성을 드러내는 차이의 연속성을 보여준다. 이것은 개체들의 내재성이 동시다발적이고 총체적인 이미지로 구현된 공시적이고 의식적인 집단적 타자의 형상이다. 인터뷰 영상들은 실제 존재자로서의 자신의 형태를 드러내고 자신이 가진 특유의 내재성을 구술적인 정보로서 발산한다. <70mK>는 특정 집단이라는 동일선의 연장에서 이런 생명적 개체들의 형태와 정보를 미학적으로 구조화하여 새로운 개체화를 이루어낸다. 프레임 속의 존재자들, 각 개체들은 서로가 대화를 나누거나 소통하는 것이 아니라 카메라를 향한 전면 응시, 즉 작품을 관람하는 사람들을 향해 그들이 가진 전개체적 실재로서의 관계성과 개성을 전달한다. 그것은 각 개체들이 보여주는 이질성과 차이의 반복적 배치와 구성인 동시에 그 이면에 집단적 동일성을 내포한 연쇄 작용이다. <70mK>는 개성을 드러내는 인터뷰이들의 직접적인 이미지와 소리를 구조화하여 전시영상작품이라는 새로운 정보전달 방식의 형태를 이루어낸다. 이러한 점은 정신적이고 집단적인 개체화의 의미와 관개체적인 관계성의 의미와 과정을 은유하게 하고 지각하게 한다. 이것은 개체화라는 생성의 과정과 관계의 의미를 현대 기술과 함께 사유한 질베르 시몽동의 개체화론으로 설명하기 적합한 사례이다. <70mK>가 구축한 전시공간은 특정 집단의 개체들 사이를 관통하여 연결되는 정신적이고 집단적인 의미와 그 관계성을 미학적인 방법론으로 함의하고 있다. 시몽동은 개체화라는 과정에 대한 사유와 생성의 의미를 고찰하며 현대의 기술이 가진 가능성과 잠재력을 긍정한 철학자이다. <70mK>는 현대의 기술 매커니즘과 네트워크적 행위들이 매개되어 구조화되고 생성된 윤리적 실재성으로서의 새로운 개체이다. 그것은 기술이 협업 된 개체화 과정에 인터뷰가 어떻게 '변환' 작용으로 기능하는지에 대한 미학적이고 실천적인 방법론을 보여주는 사례이다. <70mK>가 보여주는 직접적인 이미지와 소리는 생명적 개체의 정보들이 운반, 증폭, 축적되며 발산하는 정보의 체계이자 정신적이고 집단적인 풍경으로서의 새로운 개체이다. 그것은 복수의 개체화를 통해 새롭게 생성된 전시예술작품에 내포된 개체초월적인 의미작용과 과정에 대한 하나의 표상이기도 하다. 개체화된 준안정적 상태로서의 미디어전시예술은 작품을 관람하는 이들이 동일한 전개체적 실재를 인지하고 정념적 감정을 느끼는 새로운 관계 맺기를 이끌어낸다. <70mK>의 전시공간은 의미작용의 표상을 넘어 관개체적 집단의 실질적인 가능성을 예비하는 무대가 된다.
PDF

개체명 기반 질문-답변 검사를 통한 요약문 사실관계 확인 (Factual consistency checker through a question-answer test based on the named entity)

정지수;류휘정;장두성;정이우;정상근
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
- /
- pp.112-117
- /
- 2021
기계 학습을 활용하여 요약문을 생성했을 경우, 해당 요약문의 정확도를 측정할 수 있는 도구는 필수적이다. 원문에 대한 요약문의 사실관계 일관성의 파악을 위해 개체명 유사도, 기계 독해를 이용한 질문-답변 생성을 활용한 방법이 시도되었으나, 충분한 데이터 확보가 필요하거나 정확도가 부족하였다. 본 논문은 딥러닝 모델을 기반한 개체명 인식기와 질문-답변쌍 정확도 측정기를 활용하여 생성, 필터링한 질문-답변 쌍에 대해 일치도를 점수화하는 방법을 제안하였다. 이러한 기계적 사실관계 확인 점수와 사람의 평가 점수의 분포를 비교하여 방법의 타당성을 입증하였다.
PDF

한국목록규칙 4판 개정판의 구성 방안 연구 (Suggestions for the Composition of KCR4 Revision)

도태현
- 한국도서관정보학회지
- /
- 제46권4호
- /
- pp.207-226
- /
- 2015
연구는 FRBR과 FRAD 모형, ICP, RDA, NCR 개정안의 분석 결과를 토대로 KCR4 개정판의 구성 방안을 다음과 같이 제시하였다. 1) 개체는 저작, 표현형, 구현형, 개별자료, 개인, 가족, 단체, 개념, 대상, 사건, 장소로 구분한다. 2) 규칙 전체는 '속성'과 '관계'로 대별하며 '속성'은 다시 속성 기술과 접근점 구축으로 구분한다. 3) 속성 기술은 1집단 개체는 저작, 표현형, 구현형, 개별자료의 순으로, 2집단 개체는 개인, 가족, 단체의 순으로 배열한다. 4) 접근점 구축은 저작과 표현형의 접근점 구축, 개인, 가족, 단체의 접근점 구축 순으로 배열한다. 5) '관계'는 저작, 표현형, 구현형, 개별자료 간의 기타 관계와 개인, 가족, 단체 간의 관계에 대한 규칙을 둔다.
https://doi.org/10.16981/kliss.46.201512.207 인용 PDF KSCI

지역별 구상나무 생육현황 비교 (Comparison of Growth Condition of Abies koreana Wilson by Districts)

추갑철
- 한국환경생태학회지
- /
- 제14권1호
- /
- pp.80-87
- /
- 2000
구상나무림 보전관리의 기초자료를 마련하고자 지리산 한라산 및 덕유산의 아고산지대에 95개의 조사구를 설치하여 한국특산종 구상나무의 생육현황과 구상나무 서식지의 입지인지를 조사하였다 구상나무는 흉고직경 10-30cm의 범위에 드는 나무들이 주로 고사목으로 나타났으며 고사목의 비율은 전체적으로 총개체수의 11.51%였다 고사목의 비율또한 덕유산에서 18.18%로 가장높게나타났고 한라산 지역이 8.11%로 가장 낮게 나타났다 조사구당 구상나무 개체수 치수의 개체수 구상나무의 수고와 흉고직경 생육현황표에 의한 점수 구상나무의 상대밀도 등은 지역간에 통계적 유의차가 인정되었다 생육중인 구상나무의 활력은 한라산 지리산, 덕유산으로 순으로 좋았다 조사구당 구상나무 치수의 개체수는 한라산에서 6.00개체로 가장 많았으며 덕유산에서는 치수가 없는 것으로 나타났다 구상나무의 상대밀도도 한라산, 지리산, 덕유산 순으로 높게 나타났다. 조사구당 구상나무 개체수는 해발고와 정의 상관, 방위, 낙엽퇴의 두께, 조사구당 교목의 개체수 및 종수, 활엽수 상대밀도와는 부의 상관이 인정되었다. 구상나무 상대밀도는 해발고와는 고도의 정의 상관관계 방위 조사 구당교목의 개체수 및 종수 수관울폐도, 활엽수 상대밀도와는 부의 상관관계가 인정되었다 지리산, 한라산 및 덕유산에 자생하는 구상나무는 해발고가 높으며 볕이 잘들고 낙엽퇴가 얕으며 종구성이 단순하고 활엽수가 적은 지역에 보다 많이 분포한다.
PDF

Rotifer Brachionus rotundiformis의 개체군 성장과 소화효소 활성의 관계 (Relationship between Population Growth and Digestive Enzyme Activity of Rotifer Brachionus rotundiformis)

권오남;박흠기
- 한국양식학회지
- /
- 제21권1호
- /
- pp.47-53
- /
- 2008
본 연구의 목적은 rotifer Brachionus rotundiformis의 영양강화와 자어의 소화기능을 높이기 위해 소화효소 활성이 높은 rotifer의 선택방법을 제시하는 것이다. 소화효소 활성을 측정하는 개체군은 성장과정에 있는 개체군들 중 임의로 표본 수집하여 소화효소활성을 측정하여 결정하였다. 선택된 개체군에서 개체밀도와 성장률의 관계가 RD=5865 SGR-350.08(P<0.001)로 나타났다. 포란률은 성장률과 개체밀도와의 관계가 각각 F=-36.147 SGR+61.652(P<0.05)와 F=-0.0085 RD+66.38(P<0.001)로 나타났다. 성장률과 소화효소 활성의 rotifer 개체당 활성은 Amyl=-1.6482 SGR+3.2498(P<0.05), TAP=-0.8115 SGR+1.1361(P<0.001) 및 TGL+0.0055 SGR+0.0079(P=0.239)로 나타나 TG-lipase 활성에서는 성장률과 관계없는 것으로 나타났다. 또한 포란률과 rotifer 개체당 소화효소 활성의 관계는 Amyl=0.0296 F+1.0981(P<0.001). TAP=0.0252 F+0.0975(P<0.001) 및 TGL=-6E-06 F+0.0113(P=0.915)으로 나타나 TG-lipase 활성이 포란률과 관계없는 것으로 나타났다. 반면 TG-lipase의 단백질 비활성과 포란률, 성장률 및 개체밀도와의 관계는 각각 TGL=-0.0024 F0.2332(P=0.132), TGL=0.1267 SGR+0.005(P<0.01) 및 TGL=0.0002 F-0.0594(P<0.001)로 나타나 TG-lipase 단백질 비활성은 포란률과의 관계를 제외하고 각각 상관된 변화를 보였다. 따라서 rotifer의 영양강화효과와 자어에게 외부기인 소화효소 전달을 위한 높은 소화효소 활성을 보이는 rotifer 개체군이 개체밀도가 높은 개체군보다는 포란률이 높은 경우에 나타났기 때문에 포란률이 높은 개체군을 선택하여 영양강화하고 자어에 공급하는 것이 보다 자어에 유익할 것으로 판단된다.
PDF KSCI

확률적 교차 연산을 이용한 보편적 관계 추출 (General Relation Extraction Using Probabilistic Crossover)

이제승;김재훈
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제12권8호
- /
- pp.371-380
- /
- 2023
관계 추출은 텍스트로부터 개체(named entity) 사이의 관계를 추출하는 과정이다. 전통적으로 관계 추출 방법은 주어와 목적어가 미리 정해진 상태에서 관계만 추출한다. 그러나 종단형 관계 추출에서는 개체 쌍마다 주어와 목적어의 위치를 고려하여 가능한 모든 관계를 추출해야 하므로 이 방법은 시간과 자원을 비효율적으로 사용한다. 본 논문에서는 이러한 문제를 완화하기 위해 문장에서 주어와 목적어의 위치에 따른 방향을 설정하고, 정해진 방향에 따라 관계를 추출하는 방법을 제안한다. 제안하는 방법은 기존의 관계 추출 데이터를 활용하여 문장에서 주어가 목적어를 가리키는 방향을 나타내는 방향 표지를 새롭게 생성하고, 개체 위치 토큰과 개체 유형 정보를 문장에 추가하는 작업을 통해 사전학습 언어모델 (KLUE-RoBERTa-base, RoBERTa-base)을 이용하여 방향을 예측한다. 그리고 확률적 교차 연산을 통해 주어와 목적어 개체의 표상을 생성한다. 이후 이러한 개체의 표상을 활용하여 관계를 추출한다. 실험 결과를 통해, 제안 모델이 하나로 통합된 라벨을 예측하는 것보다 3 ~ 4%p 정도 더 우수한 성능을 보여주었다. 또한, 제안 모델을 이용해 한국어 데이터와 영어 데이터를 학습할 때, 데이터 수와 언어적 차이로 인해 한국어보다 영어에서 1.7%p 정도 더 높은 성능을 보여주었고, 최상의 성능을 내는 매개변수의 값이 다르게 나타나는 부분도 관찰할 수 있었다. 제안 모델은 방향에 따른 경우의 수를 제외함으로써 종단형 관계 추출에서 자원의 낭비를 줄일 수 있다.
https://doi.org/10.3745/KTSDE.2023.12.8.371 인용 PDF

계층적 레이블 임베딩을 이용한 세부 분류 개체명 인식 (Fine-grained Named Entity Recognition using Hierarchical Label Embedding)

김홍진;김학수
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
- /
- pp.251-256
- /
- 2021
개체명 인식은 정보 추출의 하위 작업으로, 문서에서 개체명에 해당하는 단어를 찾아 알맞은 개체명을 분류하는 자연어처리 기술이다. 질의 응답, 관계 추출 등과 같은 자연어처리 작업에 대한 관심이 높아짐에 따라 세부 분류 개체명 인식에 대한 수요가 증가했다. 그러나 기존 개체명 인식 성능에 비해 세부 분류 개체명 인식의 성능이 낮다. 이러한 성능 차이의 원인은 세부 분류 개체명 데이터가 불균형하기 때문이다. 본 논문에서는 이러한 데이터 불균형 문제를 해결하기 위해 대분류 개체명 정보를 활용하여 세부 분류 개체명 인식을 수행하는 방법과 대분류 개체명 인식의 오류 전파를 완화하기 위한 2단계 학습 방법을 제안한다. 또한 레이블 주의집중 네트워크 기반의 구조에서 레이블의 공통 요소를 공유하여 세부 분류 개체명 인식에 효과적인 레이블 임베딩 구성 방법을 제안한다.
PDF

Bidirectional LSTM-CRF 앙상블을 이용한 공간 개체 추출 (Spatial Entities Extraction using Bidirectional LSTM-CRF Ensemble)

민태홍;이재성
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
- /
- pp.133-136
- /
- 2017
공간 정보 추출은 대량의 텍스트 문서에서 자연어로 표현된 공간 관련 개체 및 관계를 추출하는 것으로 질의응답 시스템, 챗봇 시스템, 네비게이션 시스템 등에서 활용될 수 있다. 본 연구는 한국어에 나타나 있는 공간 개체들을 효과적으로 추출하기 위한 앙상블 기법이 적용된 Bidirectional LSTM-CRF 모델을 소개한다. 한국어 공간 정보 말뭉치를 이용하여 실험한 결과, 기존 모델보다 매크로 평균이 향상되어 전반적인 공간 관계 추출에 유용할 것으로 기대한다.
PDF

Bidirectional LSTM-CRF 앙상블을 이용한 공간 개체 추출 (Spatial Entities Extraction using Bidirectional LSTM-CRF Ensemble)

민태홍;이재성
- 한국어정보학회:학술대회논문집
- /
- 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
- /
- pp.133-136
- /
- 2017
공간 정보 추출은 대량의 텍스트 문서에서 자연어로 표현된 공간 관련 개체 및 관계를 추출하는 것으로 질의응답 시스템, 챗봇 시스템, 네비게이션 시스템 등에서 활용될 수 있다. 본 연구는 한국어에 나타나 있는 공간 개체들을 효과적으로 추출하기 위한 앙상블 기법이 적용된 Bidirectional LSTM-CRF 모델을 소개한다. 한국어 공간 정보 말뭉치를 이용하여 실험한 결과, 기존 모델보다 매크로 평균이 향상되어 전반적인 공간 관계 추출에 유용할 것으로 기대한다.
PDF

검색결과 1,446건 처리시간 0.031초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)