• 제목/요약/키워드: 단위논

검색결과 5,471건 처리시간 0.034초

단어 임베딩을 이용한 단위성 의존명사 분별 (Disambiguation of Counting Unit Noun using Word Embedding)

  • 이주상;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.246-248
    • /
    • 2016
  • 단위성 의존명사는 수나 분량 따위를 나타내는 의존명사로 혼자 사용할 수 없으며 수사나 수관형사와 함께 사용하는 의존명사이다. 단위성 의존명사가 2가지 이상인 동형이의어의 경우 기존의 인접 어절을 이용한 동형이의어 분별 모델에서는 동형이의어 분별에 어려움이 있다. 본 논문에서는 단위성 의존명사 분별을 위해 단어 임베딩을 사용했으며 총 115,767개의 단어를 벡터로 표현하였으며 분별할 의존명사 주변에 등장한 명사들과의 유사도를 계산하여 단위성 의존명사를 분별하였다. 단어 임베딩을 이용한 단위성 의존명사 분별이 효과가 있음을 보았다.

  • PDF

품사 분포와 Bidirectional LSTM CRFs를 이용한 음절 단위 형태소 분석기 (Syllable-based Korean POS Tagging using POS Distribution and Bidirectional LSTM CRFs)

  • 김혜민;윤정민;안재현;배경만;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2016
  • 형태소 분석기는 많은 자연어 처리 영역에서 필수적인 언어 도구로 활용되기 때문에 형태소에 대한 품사를 결정하는 것은 매우 중요하다. 최근 음절 기반으로 형태소의 품사를 태깅하는 방법에 대한 연구들이 많이 진행되고 있다. 음절 단위 형태소 분석은 음절 단위로 분리된 형태소에 대해서 기계학습을 이용하여 분리된 음절 단위로 품사를 태깅하는 단계를 가진다. 본 논문에서는 기존의 CRF를 이용한 음절 단위 품사 태깅 방법을 개선하기 위해 bi-LSTM-CRFs를 이용한 방법을 제안한다. 또한, bi-LSTM-CRFs의 입력을 음절의 품사 분포 벡터를 이용해 확장함으로써 음절 단위 품사 태깅의 성능을 향상 시켰다.

  • PDF

문맥종속 반음소단위에 의한 자동 음운 레이블링 시스템의 구현 및 성능평가 (Implementation of Automatic Phoneme Labelling System Using Context-dependent Demi-phone Unit and Performance Evaluation)

  • 박순철;김태환;김봉완;이용주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.65-70
    • /
    • 1999
  • 음소 단위로 레이블링된 데이터베이스는 음성연구에 있어 매우 중요하다. 그러나 수작업에 의한 음소분할 및 레이블링 작업은 많은 시간과 노력이 필요하기 때문에 자동 음소분할 및 레이블링 시스템에 대한 많은 연구가 진행되고 있다. 저자들은 자동레이블링 시스템에서 레이블링 분할의 단위로monophone과 triphone의 장점을 포함하는 문맥 종속 반음소 단위 모델을 이용한 자동 음소분할 및 레이블링 시스템을 제안한바 있다[1]. 본 논문에서는 문맥종속 반음소 단위 자동음소분할 및 레이블링 시스템의 성능을 개선하기 위하여, 반음소의 단위를 개선하였다. 기존에 제안된 반음소 단위는 음소의 중점을 기준으로 left/right의 반음소 단위로 양분하였다. 본 논문에서는 음소의 길이가 120ms 이상일 경우 음소의 천이구간의 특성을 잘 나타낼 수 있도록, 음소의 앞뒤구간 각각 60ms를 전반음소와 후반음소로 나누고, 나머지 안정구간을 별도의 모델로 구성하였다. 본 논문에서 제안한 반음소 단위의 성능을 평가하기 위하여 PBW 452단어를 발성한 남자 30명분의 데이터를 이용하여 레이블링 시스템을 훈련하고, 훈련에 사용하지 않은 남자 4명분의 데이터를 이용하여 테스트 하였다. 실험결과, 기존의 반음소 단위에 비하여 10ms에서 $69.09\%$$1.65\%$, 20ms에서 $85.32\%$$1.02\%$의 성능향상을 가져왔다.

  • PDF

주변 문장 유사도를 이용한 문서 재사용 측정 모델 (A Text Reuse Measuring Model Using Circumference Sentence Similarity)

  • 최성원;김상범;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-183
    • /
    • 2005
  • 기존의 문서 재사용 탐지 모델은 문서 혹은 문장 단위로 그 내부의 단어 혹은 n-gram을 비교를 통해 문장의 재사용을 판별하였다. 그렇지만 문서 단위의 재사용 검사는 다른 문서의 일부분을 재사용하는 경우에 대해서는 문서 내에 문서 재사용이 이루어지지 않은 부분에 의해서 그 재사용 측정값이 낮아지게 되어 오류가 발생할 수 있는 가능성이 높아진다. 반면에 문장 단위의 문서 재사용 검사는 비교문서 내의 문장들에 대한 비교를 수행하게 되므로, 문서의 일부분에 대해 재사용물 수행한 경우에도 그 재사용된 부분 내의 문장들에 대한 비교를 수행하는 것이므로 문서 단위의 재사용에 비해 그런 경우에 더 견고하게 작동된다. 그렇지만, 문장 단위의 비교는 문서에 비해 짧은 문장을 단위로 하기 때문에 그 신뢰도에 문제가 발생하게 된다. 본 논문에서는 이런 문장단위 비교의 단점을 보완하기 위해 문장 단위의 문서 재사용 검사를 수행 후, 문장의 주변 문장의 재사용 검사 결과를 이용하여 문장 단위 재사용 검사에서 일어나는 오류를 감소시키고자 하였다.

  • PDF

LSTM을 이용한 한국어 이미지 캡션 생성 (Generate Korean image captions using LSTM)

  • 박성재;차정원
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.82-84
    • /
    • 2017
  • 본 논문에서는 한국어 이미지 캡션을 학습하기 위한 데이터를 작성하고 딥러닝을 통해 예측하는 모델을 제안한다. 한국어 데이터 생성을 위해 MS COCO 영어 캡션을 번역하여 한국어로 변환하고 수정하였다. 이미지 캡션 생성을 위한 모델은 CNN을 이용하여 이미지를 512차원의 자질로 인코딩한다. 인코딩된 자질을 LSTM의 입력으로 사용하여 캡션을 생성하였다. 생성된 한국어 MS COCO 데이터에 대해 어절 단위, 형태소 단위, 의미형태소 단위 실험을 진행하였고 그 중 가장 높은 성능을 보인 형태소 단위 모델을 영어 모델과 비교하여 영어 모델과 비슷한 성능을 얻음을 증명하였다.

  • PDF

의사 형태소 단위의 음성언어 형태소 해석 (Morphological Analysis of Spoken Korean Based on Pseudo-Morphemes)

  • 이경님;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.396-404
    • /
    • 1998
  • 본 논문에서는 언어학적 단위인 형태소의 특성을 유지하면서 음성인식 과정에 적합한 분리 기준의 새로운 디코딩 단위인 의사형태소(Pseudo-Morpheme)를 정의 하였다. 이러한 필요성을 확인하기 위해 새로이 정의된 40개의 품사 태그를 갖는 의사 형태소를 표제어 단위로 삼아 발음사전 생성과 형태소 해석에 초점을 두고 한국어 연속음성 인식 시스템을 구성하였다.

  • PDF

소표본 통계단위에서의 집세 변동률 추정

  • 박원란
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.63-68
    • /
    • 2003
  • 도시가구의 지출 중 집세가 차지하는 비율이 높으며 그 변동에 따라 도시가구의 생활에 미치는 영향도 커서 중요한 통계자료로 인식되고 있다. 집세 계약기간이 통상 2년 단위이기 때문에 집세변동의 발생빈도가 적어서 이러한 소표본 군의 통계단위로 일반적인 집세지수를 작성하는데는 많은 어려움이 따른다. 그렇다고 해서 소표본 군의 표본을 확대하는 것도 어렵기 때문에 이러한 산술적인 표본확대가 어려운 소표본 군의 문제점을 해결하기 위해 소지역 추정법을 도입하였다. 이러한 소표본 통계단위에서의 집세 변동률 추정방법을 경기도 지역의 6개 도시에서의 집세변동을 추정하는데 적용하였으며 검토해 보았다.

  • PDF

워크플로우 시스템에서 HTML 문서를 이용한 데이터 접근성의 조정 (Data accessibility control for Workflow System using HTML document)

  • 김홍숙;한동수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.273-275
    • /
    • 1998
  • 기존의 워크플로우 시스템의 단위 업무간의 흐름 조정이 제어의 흐름에 중점을 두고 연구되었으나 실제 단위 업무간에 흐름 조정 시에 데이터도 같이 흘러가므로 이에 대한 연구가 필요하다. 본 논문에서는 워크플로우 시스템에서 단위 업무간의 흐름 조정 시에 제어의 흐름에 따라 데이터에 대한 접근성을 HTML문서를 이용하여 표현하는 방법을 제안한다. 단위 업무간의 흐름 조정의 형태에 따른 데이터의 접근성에 대한 요구사항을 고찰하고 이를 제안된 데이터 접근성 표현 방법을 사용하여 구현하는 방법에 대하여 제시한다.

  • PDF

용융탄산염 단위 연료전지의 질소 조성과 가스의 순환 및 작동압력이 단위 전지의 성능에 미치는 영향 (Effects of the composition of Nitrogen Gas, Recycling of Gas, and the Working Pressure on the Unit Cell Performance of MCFC)

  • 김태진;정귀영;주재백;남석우;오인환;임태훈;홍성안
    • 한국에너지공학회:학술대회논문집
    • /
    • 한국에너지공학회 1995년도 추계학술발표회 초록집
    • /
    • pp.105-109
    • /
    • 1995
  • 본 연구에서는 수치모사로 부터 단위 전지 양극가스내 질소 조성과 각 가스의 순환에 따른 단위전지내의 온도분포 및 성능변화를 구하였다. 양극가스내 질소의 영향은 냉각효과로 나타났고 순환비가 증가할수록 전지내의 온도와 전지의 성능은 감소하였다. 작동압력이 증가할수록 전지의 성능은 증가하였고, 기전력변화 대 압력의 상용대수변화의 직선의 기울기는 문헌상의 실험치와 유사하게 나타났다.

  • PDF

질소영양지수와 지상부 건물중을 이용한 벼의 단위면적당 영화수 추정 (Estimation of Spikelet Number of Rice with Shoot Dry Weight and Nitrogen Nutrition Index)

  • 이변우;최일선
    • 한국농림기상학회:학술대회논문집
    • /
    • 한국농림기상학회 2001년도 춘계 학술발표논문집
    • /
    • pp.97-100
    • /
    • 2001
  • 벼의 수량은 일차적으로 결정되는 단위면적당 영화수와 출수기 전후의 광합성량과 동화산물의 이삭으로의 전류에 의해 결정되는 등숙율에 의해 최종 결정된다. 또한, 단위면적당 영화수의 증가는 수량증대에 중요한 역할을 하며(Ying et al., 1998; Kropff, et al., 1994a), 단위면적 당 영화수는 벼 수량변이의 약 80% 이상을 설명할 수 있다고 하였다(Yoshida and Parao, 1976).(중략)

  • PDF