• 제목/요약/키워드: 말하기

검색결과 11,158건 처리시간 0.035초

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

휴리스틱을 이용한 개체명 인식 학습 말뭉치 품질 향상 (Improving Quality of Training Corpus for Named Entity Recognition Using Heuristic Rules)

  • 이성희;송영길;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.202-205
    • /
    • 2015
  • 개체명 인식은 문서에서 개체명을 추출하고 추출된 개체명의 범주를 결정하는 작업이다. 기존의 지도 학습 기법을 이용한 개체명 인식을 위해서는 개체명 범주가 수동으로 부착된 대용량의 학습 말뭉치가 필요하며, 대용량의 말뭉치 구축은 인력과 시간이 많이 들어가는 일이다. 본 논문에서는 학습 말뭉치 구축비용을 최소화하고 초기 학습 말뭉치의 노이즈를 제거하여 말뭉치의 품질을 향상시키는 방법을 제안한다. 제안 방법은 반자동 개체명 사전 구축 방법으로 구축한 개체명 사전과 원거리 감독법을 사용하여 초기 개체명 범주 부착 말뭉치를 구축한다. 그리고 휴리스틱을 이용하여 초기 말뭉치의 노이즈를 제거하여 학습 말뭉치의 품질을 향상시키고 개체명 인식의 성능을 향상시킨다. 실험 결과 휴리스틱 적용을 통해 개체명 인식의 F1-점수를 67.36%에서 73.17%로 향상시켰다.

  • PDF

치아 회분말과 연석고를 이용한 초기 골치유시 알긴산의 효과 (Effect of Alginate on Early Bone Healing after Implantation of Particulate Dentin and Plaster of Paris Mixture)

  • 조경안;김수관;임성철;김생곤
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제27권3호
    • /
    • pp.218-225
    • /
    • 2005
  • 본 연구의 목적은 치아 회분말과 연석고 및 알긴산을 혼합하여 이식한 후 초기 골 형성을 알아보는 데 있다. 백서 30마리의 두개골에 8mm 직경의 골결손부를 형성한 후 인간의 치아 회분말과 연석고 및 알긴산을 혼합하여 이식한 후 대조군, 치아 회분말과 연석고 처치군, 그리고 치아 회분말과 연석고 및 알긴산 혼합 처치군에서 각각의 골 결손부 치유과정을 조직병리학적, 조직형태계측학적으로 비교 관찰하였다. 통계학적으로 주간 변화(4주, 8주)는 유의하지 않았고, 각 그룹 간에 있어도 치아 회분말과 연석고 처치군과 치아 회분말과 연석고 및 알긴산 혼합 처치군 간 모두(4주, 8주) 유의한 차이가 없었다. 그러나 이들 치아 회분말과 연석고 처치군과 치아 회분말과 연석고 및 알긴산 혼합 처치군은 대조군에 비해서는 유의하게 우수한 신생골 형성을 보였다. 비록 통계학적으로는 치아 회분말과 연석고 처치군과 치아 회분말과 연석고 및 알긴산 혼합 처치군이 유의한 차이를 보이지 않았지만 치아 회분말과 연석고 및 알긴산 혼합 처치군에서 보다 더 우수한 신생골 형성 경향을 보였다. 뿐만 아니라, 신생골의 내용면에서도 치아 회분말과 연석고 및 알긴산 혼합 처치군에서 좀더 많은 신생 직조골의 융합이나 골 소주형성이 관찰되어 신생골의 형성 및 성숙에 알긴산이 역할을 담당하는 것으로 사료되었다. 결론적으로 골결손부 치료 방법으로 치아 회분말과 연석고 처치군 또는 치아 회분말과 연석고 및 알긴산 혼합 처치로 결손부에 이식하는 것은 신생골 형성의 양적, 질적 개선에 통계학적으로 유의하며, 알긴산을 이식재와 함께 처리한 경우에 신생골 형성의 양적, 질적 개선에 도움을 줄 수 있을 것으로 사료된다.$1^{\circ}C$ 냉수로 세척하고 PETE tray로 포장하여 $4^{\circ}C$로 저장한 경우 깻잎 고유의 초록색과 향을 유지하고 있어 저온냉수 세척과 tray 포장이 세척 청경채의 선도 유지에 효과가 있는 것으로 나타났다.1%,\;pendimethalin\;1.3{\sim}2.9%$ 및 $3.8{\sim}10.8%,\;ethoprophos\;0.6{\sim}2.7%$$0.1{\sim}0.3%$이었다. 인공강우실험 후 공약의 토심별 분포를 살펴 본 결과 alachlor와 ethopropho는 토심 $10{\sim}15cm$까지 이동하였고, ethalfluralin과 pendimethalin는 대부분 토심 5 cm 이내에 잔류하였다. 경사도 30%의 경우가 10%에 비하여 각 농약의 유실량이 $0.2{\sim}1.9$ 배 증가하였는데 유출수에 의한 농약의 유실량 차이는 유출수 중 농도 차이로 판단되며, 유실토양에 의한 농약 유실량 차이는 토양 유실량과 관계되는 것으로 생각되었다. 농약의 강우에 의한 유실은 복잡하게 작용하는 많은 환경적 요인에 의하여 영향을 받지만 정교하게 구성된 환경 시나리오에 의하여 예측 가능할 것으로 판단되었다.고 도라지는 물에 우려 푹 삶았고, 감자, 송이 등은 잘게 썰어 쌀과 함께 밥을 조리하였다. 4. 약선 음식조리방법 약선음식의 재료는 평상시 식생활에 사용되고 있던 식품들의 기능성분과 약이성을 이용하여 만성적인 질병과 급성적인 복통 설사 등에 재료의 전처리를 통해 죽으로 많이 이용하였다. 특히 곡류 등은

2003년부터 2008년까지 한국에 수입된 말에서 전염성 질병의 실태조사 (A Survey of Epidemic Diseases in Horses Imported into South Korea between 2003 and 2008)

  • 이상규;한재익;윤선종;강현구
    • 한국임상수의학회지
    • /
    • 제27권3호
    • /
    • pp.268-272
    • /
    • 2010
  • 한국은 가축의 수입이 많아 외래성 질병에 항상 노출되어 있다. 이에 본 연구의 목적은 2003년부터 2008년까지 외국에서 한국으로 수입된 말의 전염성 질환의 발생실태를 조사하기 위하여 실시하였다. 2003년부터 2008년까지 수입된 6,650두의 말을 대상으로 가축전염병예방법에 등재되어 있는 주요 전염병 7개 항목(말전염성빈혈, 말파이로플라스마병, 말전염성동맥염, 비저, 구역, 전염성자궁염, 수포성구내염)을 검사하였다. 말전염성빈혈은 수입된 말 6,189두 중 3두에서 양성을 나타내었으며, 말파이로플라스마병은 6,005두 중 37두, 말전염성동맥염은 6,043두 중 28두, 구역은 2,071두 중 4두, 비저는 1,950두 중 4두가 양성을 나타내었다. 말전염성자궁염과 수포성구내염은 모든 말에서 검출되지 않았다. 전체적으로 수입된 말 6,650두 중 76두가 전염성 질환에 대해 양성을 나타내었다. 특히 탄자니아에서 수입 된 말의 66.6%가 비저에 양성을 나타내었다는 것은 주목할만한 결과이며, 이것은 1996년 이래 최초로 검출되었다.

XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지 (Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation)

  • 최민석;김창현;박호민;천민아;윤호;남궁영;김재균;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.221-228
    • /
    • 2020
  • 품사부착말뭉치는 품사정보를 부착한 말뭉치를 말하며 자연언어처리 분야에서 다양한 학습말뭉치로 사용된다. 학습말뭉치는 일반적으로 오류가 없다고 가정하지만, 실상은 다양한 오류를 포함하고 있으며, 이러한 오류들은 학습된 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제를 다소 완화시키기 위해서 본 논문에서는 XGBoost와 교차 검증을 이용하여 이미 구축된 품사부착말뭉치로부터 오류를 탐지하는 방법을 제안한다. 제안된 방법은 먼저 오류가 포함된 품사부착말뭉치와 XGBoost를 사용해서 품사부착기를 학습하고, 교차검증을 이용해서 품사오류를 검출한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로 일반적인 분류기로서 오류를 검출할 수 없다. 따라서 본 논문에서는 매개변수를 조절하면서 학습된 품사부착기의 출력을 비교함으로써 오류를 검출한다. 매개변수를 조절하기 위해서 본 논문에서는 작은 규모의 오류부착말뭉치를 이용한다. 이 말뭉치는 오류 검출 대상의 전체 말뭉치로부터 임의로 추출된 것을 전문가에 의해서 오류가 부착된 것이다. 본 논문에서는 성능 평가의 척도로 정보검색에서 널리 사용되는 정밀도와 재현율을 사용하였다. 또한 모집단의 모든 오류 후보를 수작업으로 확인할 수 없으므로 표본 집단과 모집단의 오류 분포를 비교하여 본 논문의 타당성을 보였다. 앞으로 의존구조부착 말뭉치와 의미역 부착말뭉치에서 적용할 계획이다.

연령세대에 따른 말 산출의 시간적 특성: 말속도와 쉼을 중심으로 (The effects of speakers' age on temporal features of speech among healthy young, middle-aged, and older adults)

  • 김예지;이송민;최민경;정상민;성지은;이영미
    • 말소리와 음성과학
    • /
    • 제14권1호
    • /
    • pp.37-47
    • /
    • 2022
  • 본 연구의 목적은 정상 성인 화자의 연령세대에 따른 말 산출의 시간적 특성 간에 유의한 차이가 있는지를 분석하고, 말 산출 변수들 중에서 청년 화자와 노년 화자를 유의하게 분류할 수 있는 변수가 무엇인지 살펴보고자 하였다. 이를 위해 청년, 장년, 노년의 말속도(전체 말속도, 조음속도)와 발화당 쉼 빈도, 쉼 지속시간, 쉼의 실현 위치를 살펴보았다. 국립국어원에서 배포하는 오픈 코퍼스인 서울말 낭독 발화 말뭉치에서 청년층, 장년층, 노년층 각 10명씩 총 30명 화자의 발화를 선별해 말 산출의 시간적 특성을 분석하였다. 그 결과, 전체 말속도, 조음속도, 전체 쉼 빈도, 어절 간 쉼 빈도, 전체 쉼 지속시간, 어절 간 쉼 지속시간에 집단 간 유의한 차이가 발생했다. 사후 검정 결과, 장년층이 청년층보다, 노년층이 청년층보다 느린 말속도, 잦은 쉼 빈도, 긴 쉼 지속시간을 보였다. 반면 정상 성인에게서는 부적절한 쉼인 어절 내 쉼 빈도, 어절 내 쉼 지속시간에는 집단 간 유의한 차이가 없었다. 이중 청년층과 노년층을 유의하게 구별하는 변수는 전체 말속도로 나타났다. 노년층이 한 번 쉼을 가질 때 청·장년층과 비슷한 길이지만, 훨씬 더 빈번하게 가진다는 것을 보여주었다. 이러한 결과는 연령세대에 따라 말 산출의 시간적 특성에 변화가 나타난다는 것을 시사한다.

페로니켈슬래그 미분말을 사용한 모르타르의 응결시간 및 압축강도특성에 관한 실험적 연구 (An Experimental Study on the Setting Time and Compressive strength of Mortar using Ferronickel Slag Powder)

  • 김영욱;김도빈;최세진
    • 한국건축시공학회지
    • /
    • 제18권6호
    • /
    • pp.551-558
    • /
    • 2018
  • 본 연구에서는 페로니켈슬래그 미분말의 시멘트 대체재로서의 가능성을 평가하기 위하여 페로니켈슬래그 미분말 사용 모르타르의 압축강도 및 건조수축특성을 비교 분석하였다. 연구결과 페로니켈슬래그 미분말을 사용한 배합의 경우 동일한 양의 고로슬래그 미분말 및 플라이애시를 사용한 배합에 비해 미소수화열량이 낮게 나타났으며 모르타르 플로우는 상대적으로 다소 높은 것으로 나타났다. 또한 페로니켈슬래그 미분말을 사용한 모르타르의 압축강도의 경우 초기 강도발현은 고로슬래그 미분말 및 플라이애시와 유사하게 나타났으나 재령 28일에서는 상대적으로 낮은 압축강도를 발현하였다. 건조수축의 경우 페로니켈슬래그 미분말을 사용한 배합에서 고로슬래그 미분말을 사용한 배합에 비해 낮은 건조수축값을 나타내었으며 플라이애시를 혼입한 배합의 건조수축과 유사하게 나타났다.

중국어 회화문에 대한 의사소통 분석단위에 기초한 접근 (An Approach to Chinese Conversations in the Textbook based on Social Units of Communication)

  • 박찬욱
    • 비교문화연구
    • /
    • 제49권
    • /
    • pp.127-150
    • /
    • 2017
  • 본고는 Hymes(1972)가 제시한 의사소통의 사회적 분석단위 중 네 가지 - 말 공동체(speech community), 말 상황(speech situation), 말 사례(speech event), 말 행위(speech act) - 개념에 기대어 중국어 교재 상의 회화문을 고찰하고 그 결과를 교실 활동에서 활용할 수 있도록 숙고하는 데 목적이 있다. 이에 본고는 매 회화 단락을, 특정한 상황 맥락 하에서 여러 말 행위들로 구성된 말 사례의 정합으로 간주한다. 그리고 매 문장을, 발화로써 말 힘을 가질 수 있는 언어적 행위로 가정한다. 회화문을 Hymes(1972)의 단위에 기대어 분석하기에 앞서 본고는 분석 단위의 개별적 특징을 먼저 살펴본다. 그런 뒤, 그것의 단위 개념을 토대로, 교재 회화문을 형태 및 통사 단위의 결합이 아닌 행위의 결합이란 관점에서 분석한다. 나아가 복잡한 통사 단위들의 결합으로 여겨질 수 있는 회화 단락이 다소 한정된 소수의 분석단위들 간 결합일 수 있음을 보인다. 그리고 그 결과가 교실 활동에서 어떻게 사용될 수 있는지 제언을 덧붙인다.

중환자실 간호사의 생애말 간호수행에 미치는 영향요인 (Factors Affecting Performance of End-of-Life Care among ICU Nurses)

  • 김미정;장희경
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.135-146
    • /
    • 2021
  • 본 연구는 중환자실 간호사의 도덕적 고뇌, 윤리적 환경, 생애말 간호 어려움 및 긍정심리자본이 생애말 간호수행에 미치는 영향을 파악하기 위한 서술적 상관관계 연구이다. 대상자는 G도의 J시와 C시에 위치한 G대학병원 중환자실에서 근무하는 간호사 144명으로, 2020년 10월부터 11월까지 설문조사를 통해 자료수집하였다. 자료분석은 SPSS/WIN 21.0 프로그램을 이용하여 통계 분석하였다. 본 연구결과 대상자의 생애말 간호수행은 결혼상태, 생애말 간호 교육경험에 따라 유의한 차이가 있는 것으로 나타났다. 중환자실 간호사의 생애말 간호수행에 유의한 영향을 미치는 변인은 긍정심리자본, 생애말 간호 어려움으로 설명력은 24.8%였다. 이러한 결과를 바탕으로 중환자실 간호사의 생애말 간호수행을 향상시키기 위해서는 생애말 간호 어려움을 감소시키고, 긍정심리자본을 향상시킬 수 있는 교육과 중재 프로그램 개발이 요구된다.

한국어 튜터링 챗봇을 위한 말뭉치 구축 (Building a Corpus for Korean Tutoring Chatbot)

  • 김한샘;최경호;한지윤;정해영;곽용진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.288-293
    • /
    • 2017
  • 교수-학습 발화는 발화 턴 간에 규칙화된 인과관계가 강하고 자연 발화에서의 출현율이 낮다. 일반적으로 어휘부, 표현 제시부, 대화부로 구성되며 커리큘럼과 화제에 따라 구축된 언어자원이 필요하다. 기존의 말뭉치는 이러한 교수-학습 발화의 특징을 반영하지 않았기 때문에 한국어 교육용 튜터링 챗봇을 개발하는 데에 활용도가 떨어진다. 이에 따라 이 논문에서는 자연스러운 언어 사용 수집, 도구 기반의 수집, 주제별 수집 및 분류, 점진적 구축 절차의 원칙에 따라 교수-학습의 실제 상황을 반영하는 준구어 말뭉치를 구축한다. 교실에서 발생하는 언어학습 상황을 시나리오로 구성하여 대화 흐름을 제어하고 채팅용 메신저와 유사한 형태의 도구를 통해 말뭉치를 구축한다. 이 연구는 한국어 튜터링 챗봇을 개발하기 위해 말뭉치 구축용 챗봇과 한국어 학습자, 한국어 교수자가 시나리오를 기반으로 발화문을 생성한 준구어 말뭉치를 최초로 구축한다는 데에 의의가 있다.

  • PDF