• 제목/요약/키워드: 한글자모

검색결과 99건 처리시간 0.022초

제한된 언어 자원 환경에서의 다국어 개체명 인식 (Multilingual Named Entity Recognition with Limited Language Resources)

  • 천민아;김창현;박호민;노경목;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-146
    • /
    • 2017
  • 심층학습 모델 중 LSTM-CRF는 개체명 인식, 품사 태깅과 같은 sequence labeling에서 우수한 성능을 보이고 있다. 한국어 개체명 인식에 대해서도 LSTM-CRF 모델을 기본 골격으로 단어, 형태소, 자모음, 품사, 기구축 사전 정보 등 다양한 정보와 외부 자원을 활용하여 성능을 높이는 연구가 진행되고 있다. 그러나 이런 방법은 언어 자원과 성능이 좋은 자연어 처리 모듈(형태소 세그먼트, 품사 태거 등)이 없으면 사용할 수 없다. 본 논문에서는 LSTM-CRF와 최소한의 언어 자원을 사용하여 다국어에 대한 개체명 인식에 대한 성능을 평가한다. LSTM-CRF의 입력은 문자 기반의 n-gram 표상으로, 성능 평가에는 unigram 표상과 bigram 표상을 사용했다. 한국어, 일본어, 중국어에 대해 개체명 인식 성능 평가를 한 결과 한국어의 경우 bigram을 사용했을 때 78.54%의 성능을, 일본어와 중국어는 unigram을 사용했을 때 각 63.2%, 26.65%의 성능을 보였다.

  • PDF

SRLev-BIH: 한국어 일반 상식 추론 및 생성 능력 평가 지표 (SRLev-BIH: An Evaluation Metric for Korean Generative Commonsense Reasoning)

  • 서재형;장윤나;이재욱;문현석;어수경;박찬준;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.176-181
    • /
    • 2022
  • 일반 상식 추론 능력은 가장 사람다운 능력 중 하나로써, 인공지능 모델이 쉽게 모사하기 어려운 영역이다. 딥러닝 기반의 언어 모델은 여전히 일반 상식에 기반한 추론을 필요로 하는 분야에서 부족한 성능을 보인다. 특히, 한국어에서는 일반 상식 추론과 관련한 연구가 상당히 부족한 상황이다. 이러한 문제 완화를 위해 최근 생성 기반의 일반 상식 추론을 위한 한국어 데이터셋인 Korean CommonGen [1]이 발표되었다. 그러나, 해당 데이터셋의 평가 지표는 어휘 단계의 유사성과 중첩에 의존하는 한계를 지니며, 생성한 문장이 일반 상식에 부합한 문장인지 측정하기 어렵다. 따라서 본 논문은 한국어 일반 상식 추론 및 생성 능력에 대한 평가 지표를 개선하기 위해 문장 성분의 의미역과 자모의 형태 변화를 바탕으로 생성 결과를 평가하는 SRLev, 사람의 평가 결과를 학습한 BIH, 그리고 두 평가 지표의 장점을 결합한 SRLev-BIH를 제안한다.

  • PDF

탈네모글꼴에 관한 역사적 연구와 전망 - 세벌식 한글 글꼴을 중심으로 - (A historical study on the flexibility square-format typeface and the prospects - Focused on the three-pairs fonts of hangeul -)

  • 유정미
    • 디자인학연구
    • /
    • 제19권2호
    • /
    • pp.241-250
    • /
    • 2006
  • 한국의 고유 문자인 한글은 학자들의 연구를 바탕으로 제자원리에 따라 창제되었다. 세계 대부분의 문자들이 자연 발생적으로 생겨난 것에 비해 한글은 문자를 만들던 당시 언어에 대한 정밀한 분석을 토대로 하여 만들어져 세계의 문자 중에서 가장 과학적이고 합리적이다. 하지만 한글 글꼴 디자인은 창제이념의 과학성과 합리성을 올바르게 계승하지 못하고 있다. 그 이유는 당시 사용되던 한자의 영향으로 네모 틀 형식을 그대로 사용했기 때문이다. 네모글꼴 한 벌을 디자인하려면 무려 11,172자를 만들어야 한다. 이는 자모 28자의 조합으로 모든 소리를 시각화 할 수 있도록 만들어진 한글의 장점을 제대로 살리지 못하고 있는 것이다. 네모글꼴의 문제점에 대한 인식은 1900년대 서구로부터 도입된 타자기의 등장으로 시작되었다. 타자기는 한글의 모아쓰기 원리를 활용하여 닿자와 홀자를 키보드에 배열하므로 활자를 쉽게 조합해서 쓸 수 있다. 이렇게 인식하게 된 개념이 탈네모글꼴이다. 그중 특히 세벌식 글꼴은 닿자와 홀자 그리고 받침자를 합하여 총 67자를 기본 자수로 제작할 수 있다. 세벌식 글꼴 개념은 기존의 네모글꼴이 지니고 있는 문제점을 보완해 줄 수 있는 대안 일뿐 아니라 한글 창제 이념의 본래적 의미를 계승하는 길이기도 하다. 이에 한글의 기계화로 비롯된 세벌식 글꼴 디자인의 역사를 살펴보므로 미래 한글 글꼴 디자인이 나아가야 할 길을 제시하려고 한다. 탈네모글꼴 디자인은 디지털 기술 발달로 인해 발전을 거듭하므로 정보화 시대가 요구하는 기능적이고 합리적인 특성에 부합되고 있다. 훈민정음이 한자의 영향에서 벗어나 문자적인 독자성을 획득하려고 했던 것처럼 탈네모글꼴 디자인이 우리 글꼴 디자인의 정체성을 회복할 수 있는 길이라는 것을 밝히려 한다. 적용될 수 있는 개념이다.조를 벗어나면서도 활기찬 가로의 이미지를 갖게 되는 것은 가로공간의 구조적요소 이외에 가로공간 활성화인자에 의해 많은 영향을 받고 있다는 것을 알 수 있었다. 즉, 이런 구조를 가진 한국의 상업지역의 가로인 경우 연도건물, 보도, 수경시설 등의 인자 순으로, 일본의 업무지역의 가로인 경우 수경시설, 연도건물, 보도인자 순으로 가로활성화에 영향을 주고 있다는 것을 알 수 있었다.과 대동소이했다. 물리적인 특성값(고유저항, 자기유도, 초투자율, 손실계수, 큐리온도 등)으로 미루어보아 각종 microwave 통신기기 core 및 고 투자율 deflection yoke core 등으로 사용이 가능하다.의 쐐기를 사용할 때 MU값이 크다. 결론: 수집된 광자선 빔 데이터를 분석하여 빔데이터의 정확성과 치료계획용 시스템의 계산 정확성을 대략적으로 점검 할 수 있는 기준 값을 제시하였다.동결이 요구되며 본 연구에서 이용된 OPS 동결 방법이 폭넓게 활용될 것으로 사료된다.며 이 때가 최상의 교배 적기로 사료되며, 혈장 progesterone농도가 4.0 ng/ml 이상으로 증가한 날(Bay 0)을 기준으로 하였을 때부터 CI는 혈장 estradiol-$17{\beta}$ peak 후 1일째인 최고치를 나타내었고, CI peak 후 1일째인 Day 0에 혈장 progesterone 농도가 최초로 4.0 ng/ml 이상으로 증가하여 CI가 90% 이상으로 지속된 시기가 최상의 교배 적기임이 확인되었다. 따라서 혈장 progesterone농도 측정으로 정확한 배란 시기 및 교배 적기를 판정할 수 있으나, 시설비가 저렴하고 검사 방법이 간단한 질 세포 검사가 Shih-tzu 견에서 발정 주기, 교배 적기 및 배란

  • PDF

상지 협응 움직임을 기반으로 한 과제중심적 접근 훈련이 발달성 협응 장애아동의 글씨쓰기 능력에 미치는 효과 (The Effects of Upper Limb Coordinated Movement Based Task Oriented Approach on Improving Handwriting Performance in Children With Developmental Coordination Disorder)

  • 김미지
    • 재활치료과학
    • /
    • 제5권1호
    • /
    • pp.77-87
    • /
    • 2016
  • 목적 : 상지 협응 움직임을 기반으로 한 과제중심적 접근 훈련이 발달성 협응 장애아동의 한글 글씨쓰기 능력에 미치는 영향을 알아보며 각 접근이 한글 글씨 쓰기 수행의 질과 글씨쓰기 준비기술에 미치는 영향을 비교하고자 한다. 연구방법 : 본 연구는 5~10세의 발달성 협응장애 아동 40명을 대상으로 무작위 추출을 통해 두 집단으로 나뉘어 사전-사후 검사로 진행하였다. 두 집단은 과제중심접근 중재군과 과정중심접근 중재군으로 5주 동안 40분씩 주 2회 중재를 받았다. 글씨쓰기 수행은 한글 자모 쓰기 검사로 측정하고, 글씨쓰기 준비요소인 상지 운동 기능, 시 지각 기능과 시 운동기능은 각각 운동 유창성 평가(Bruininks-Oseretsky Test of Motor Proficiency-2: BOT-2)중 미세운동조절의 하위검사 일부, 한국판 시 지각 발달 검사(Korean-Developmental Test of Visual Perception-2: K-DTVP-2), 개정된 시 운동기술 평가(Test of Visual Motor Skills-Revised: TVMS-R)로 평가하였다. 고찰 : 본 연구는 과제중심접근법을 적용하여 발달성 협응 장애아동의 글씨쓰기 수행도를 향상시킨다는 임상적 근거를 제공하는데 의의가 있다. 또한 과정중심접근법과 과제중심접근법이 글씨쓰기 준비기술의 향상에 어떠한 영향을 끼치는 지에 대한 결과를 확인하여 보다 효과적인 글씨쓰기 중재방법을 제시하는 초석이 될 수 있을 것이라 생각한다.

휴먼인터페이스를 위한 한글음절의 입모양합성 (Lip Shape Synthesis of the Korean Syllable for Human Interface)

  • 이용동;최창석;최갑석
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.614-623
    • /
    • 1994
  • 얼굴을 마주보며 인간끼리 대화하는 것처럼 인간과 자연스럽게 대화할 수 있는 휴먼인터페이스를 실현하기 위해서는 임성의 합성과 얼굴영상의 합성이 필요하다. 본 논문은 얼굴영상의 합성을 대상으로 한다. 얼굴영상의 합성에서는 표정변화와 입모양의 변화를 3차원적으로 실현하기 위하여 얼굴의 3차원 형상모델을 이용한다. 얼굴의 3차원 모델을 얼굴 근육의 움직임에 따라 변형하므로서 다양한 얼굴표정과 음절에 어울리는 입모양을 합성한다. 우리말에서 자모의 결합으로 조합가능한 음절은 14,364자에 이른다. 이 음절에 대한 입모양의 대부분은 모음에 따라 형성되고, 일부가 자음에 따라 달라진다. 그러므로, 음절에 어울리는 입모양의 변형규칙을 정하기 위해, 이들을 모두 조사하여 모든 음절을 대표할 수 있는 입모양패턴을 모음과 자음에 따란 분류한다. 그 결과, 자음에 영향을 받는 2개의 패턴과 모음에 의한 8개의 패턴, 총 10개의 패턴으로 입모양을 분류할 수 있었다. 나아가서, 분류된 입모양패턴의 합성규칙을 얼굴근육의 움직임을 고려하여 정한다. 이와같이 분류된 10개의 입모양패턴으로 모든 음절에 대한 입모양을 합성할 수 있고, 얼굴근육의 움직임을 이용하므로써 다양한 표정을 지으면서 말하는 자연스런 얼굴영상을 합성할 수 있었다.

  • PDF

LSB와 LDR을 기반한 효과적인 혼합 스테가노그래피 (An Effective Mixed Steganography Based on LSB and LDR)

  • 지선수
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.561-566
    • /
    • 2019
  • 인터넷 공간에서 송신자와 수신자 사이의 신뢰성을 보장하는 안전한 비밀 통신을 위해 무결성과 보안성이 유지되어야 한다. 또한 암호 기법은 외부 공격으로부터 견고성을 유지하기 위한 중요한 요소이다. 이를 위해 암호화 기술과 스테가노그래피 방법이 사용된다. 스테가노그래피는 디지털 미디어에 통계적으로 유의미한 변화를 주지 않으면서 비밀 정보를 숨기는 방법이다. 초성, 중성, 종성으로 이루어지는 한글 자모를 변형한 후 커버 이미지의 RGB 화소 값에 각각 삽입하는 방법을 제안한다. 보안성을 향상시키기 위해 대체되어 변형된 정보를 최하위 영역에 숨기는 새로운 혼합 방법을 사용하였다. 이때 LSB와 LDR 기법을 혼합하여 적용하였다. 제안된 방법의 이미지 품질을 위해 PSNR을 계산하였다. 제안된 방법의 PSNR은 43.225dB이며, 최저수준을 만족하였음을 확인하였다.

한국어 획 기반 그래피컬 패스워드 기법에 관한 연구 (A Study on the Korean-Stroke based Graphical Password Approach)

  • 고태형;손태식;홍만표
    • 정보보호학회논문지
    • /
    • 제22권2호
    • /
    • pp.189-200
    • /
    • 2012
  • 테블릿 PC, 스마트폰, 넷북 등 다양한 형태를 가진 스마트 기기의 증가에 따라 그러한 스마트 기기를 기반으로 하는 모바일 환경에서의 정보보호가 큰 이슈로 떠오르고 있다. 이때 안전하게 패스워드를 입력하는 것은 매우 중요한 요소이며, 다양한 형태의 모바일 기기에서는 기기 자체의 하드웨어 제약 사항에 따라 키보드와 마우스 등의 보조 입력장치를 구비하기 힘든 어려움을 가진다. 또한 입력 정보들이 주로 터치스크린을 통해서 이뤄지기 때문에 정확도가 떨어질 수 있는 문제점도 가지게 된다. 앞서 언급한 문제들 때문에 현재 거의 보편적으로 사용되는 4자리 패스워드 기반의 인증 기법이 향후에는 점차 문자 기반에서 그래피컬 패스워드로 변화 할 것으로 예상되며, 이러한 그래피컬 패스워드는 문자기반의 패스워드에 비해서 사용하기 쉽고, 엿보기 공격에 강한 특성을 가지는 것으로 알려져 있다. 그러므로 본 논문에서는 엿보기 공격을 방어하기 위해서 한글의 자모를 분해하여 도출된 5개의 획 기반으로 이루어진 새로운 그래피컬 패스워드 기법을 제안하고 검증하였다.

CNN기반의 청각장애인을 위한 수화번역 프로그램 (CNN-based Sign Language Translation Program for the Deaf)

  • 홍경찬;김형수;한영환
    • 융합신호처리학회논문지
    • /
    • 제22권4호
    • /
    • pp.206-212
    • /
    • 2021
  • 사회가 점점 발전하면서 의사소통 방법이 다양한 형태로 발전하고 있다. 그러나 발전한 의사소통은 비장애인을 위한 방법이며, 청각장애인에게는 아무런 영향을 미치지 않는다. 따라서 본 논문에서는 청각장애인의 의사소통을 돕기 위한 CNN 기반의 수화번역 프로그램을 설계 및 구현한다. 수화번역 프로그램은 웹캠을 통해 입력된 수화 영상 데이터를 기반으로 의미에 맞게 번역한다. 수화번역 프로그램은 직접 제작한 24,000개의 한글 자모음 데이터를 사용하였으며, 효과적인 분류모델의 학습을 위해 U-Net을 통한 Segmentation을 진행한다. 전처리가 적용된 데이터는 19,200개의 Training Data와 4,800개의 Test Data를 통하여 AlexNet을 기반으로 학습을 진행한다. 구현한 수화번역 프로그램은 'ㅋ'이 97%의 정확도와 99%의 F1-Score로 모든 수화데이터 중에서 가장 우수한 성능을 나타내었으며, 모음 데이터에서는 'ㅣ'가 94%의 정확도와 95.5%의 F1-Score로 모음 데이터 중에서 가장 높은 성능을 보였다.

가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환 시스템 (Knowledge based Text to Facial Sequence Image System for Interaction of Lecturer and Learner in Cyber Universities)

  • 김형근;박철하
    • 정보처리학회논문지B
    • /
    • 제15B권3호
    • /
    • pp.179-188
    • /
    • 2008
  • 본 논문에서는 가상대학에서 교수자와 학습자간 상호작용을 위한 지식기반형 문자-얼굴동영상 변환(TTFSI : Text to Facial Sequence Image) 시스템에 관해 연구하였다. TTFSI 시스템의 구현을 위해, 한글의 문법적 특징을 기반으로 가상강의에 사용된 자막정보에 립싱크된 얼굴 동영상 합성하기 위하여 자막정보를 음소코드로 변환하는 방법, 음소코드별 입모양의 변형규칙 작성법, 입모양 변형규칙에 의한 얼굴 동영상 합성법을 제안한다. 제안된 방법에서는 한글의 구조분석을 통해 기본 자모의 발음을 나타내는 10개의 대표 입모양과 조음결합에서 나타나는 78개의 혼합 입모양으로 모든 음절의 입모양을 표현하였다. 특히 PC환경에서의 실시간 영상을 합성하기 위해서 매 프레임마다 입모양을 합성하지 않고, DB에서 88개의 해당 입모양을 불러오는 방법을 사용하였다. 제안된 방법의 유용성을 확인하기 위하여 텍스트 정보에 따른 다양한 얼굴 동영상을 합성하였으며, PC환경에서 구현 가능한 TTFSI 시스템을 구축하였다.