• 제목/요약/키워드: 말도

검색결과 11,189건 처리시간 0.038초

한국어 튜터링 챗봇을 위한 말뭉치 구축 (Building a Corpus for Korean Tutoring Chatbot)

  • 김한샘;최경호;한지윤;정해영;곽용진
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.288-293
    • /
    • 2017
  • 교수-학습 발화는 발화 턴 간에 규칙화된 인과관계가 강하고 자연 발화에서의 출현율이 낮다. 일반적으로 어휘부, 표현 제시부, 대화부로 구성되며 커리큘럼과 화제에 따라 구축된 언어자원이 필요하다. 기존의 말뭉치는 이러한 교수-학습 발화의 특징을 반영하지 않았기 때문에 한국어 교육용 튜터링 챗봇을 개발하는 데에 활용도가 떨어진다. 이에 따라 이 논문에서는 자연스러운 언어 사용 수집, 도구 기반의 수집, 주제별 수집 및 분류, 점진적 구축 절차의 원칙에 따라 교수-학습의 실제 상황을 반영하는 준구어 말뭉치를 구축한다. 교실에서 발생하는 언어학습 상황을 시나리오로 구성하여 대화 흐름을 제어하고 채팅용 메신저와 유사한 형태의 도구를 통해 말뭉치를 구축한다. 이 연구는 한국어 튜터링 챗봇을 개발하기 위해 말뭉치 구축용 챗봇과 한국어 학습자, 한국어 교수자가 시나리오를 기반으로 발화문을 생성한 준구어 말뭉치를 최초로 구축한다는 데에 의의가 있다.

  • PDF

한국어 악센트구초 고성조와 음절 길이 (Relationship between accetual-phrase-initial high tone and its syllable duration in Korean)

  • 이숙향
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.184-187
    • /
    • 1998
  • 한국어의 계층적 운율구조와 음향적 길이간의 관계를 규명하고자 한다. 운율구조 계층간 비교에서 첫째, 운율단위말 음절간, 모음 길이 및 음절 길이 비교분석이 수행되었으며 둘째, 특히 본 연구의 중점적 연구대상으로서 악센트구초 고성조가 실현되는 음절과 다른 성조 이벤트가 실현되는 음절간 모음 및 음절 길이 비교 분석이 수행되었다. 일반적으로 상위 계층의 운율단위말 음절의 모음 및 음절 길이가 하위 계층에서보다 길었으나, 악센트구말 음절의 음절 길이는 어절말 음절 길이보다 짧게 나타나 계층성에서 운율 단위말 음절의 모음 또는 음절 길이는 어절말 음절 길이보다 짧게 나타나 계층성에서 운율 단위말 음절의 모음 또는 음절길이는 운율구조와 일대일 대응관계를 갖고 있지 않은 것으로 나타났다. 그리고 악센트구초 음절은 모음 길이 비교 분석에서는 가장 짧은 것으로 나타났으나 음절 길이 비교 분석에서는 피험자에 따라 악센트구말 길이와 같거나 또는 더 길게, 그리고 심지어는 어절말 길이보다 길게 나타남으로써, 첫째, 악센트 구초 고성조 음절의 초성자음으로 강자음이 많이 나타남을 간접적으로 추론할 수 있었으며, 둘째, F0 값만 상승하는 것이 아니라 길이 또한 길게 나타나 운율적으로 강한 자리임을 보여주었다.

  • PDF

말뭉치 오류를 고려한 HMM 한국어 품사 태깅 시스템 (A Korean POS Tagging System with Handling Corpus Errors)

  • 설용수;김동주;김규상;김한우
    • 한국컴퓨터정보학회지
    • /
    • 제15권1호
    • /
    • pp.117-124
    • /
    • 2007
  • 통계 기반 접근 방법을 이용한 품사태깅에서 태깅 정확도는 훈련 데이터의 양에 좌우될 뿐 아니라, 말뭉치가 충분할지라도 수작업으로 구축한 말뭉치의 경우 항상 오류의 가능성을 내포하고 있으며 언어의 특성상 통계적으로 신뢰할만한 데이터의 수집에도 어려움이 따른다. 훈련 데이터로 사용되는 말뭉치는 많은 사람들이 수작업으로 구축하므로 작업자 중 일부가 언어에 대한 지식이 부족하다거나 주관적인 판단에 의한 태깅 실수를 포함할 수도 있기 때문에 단순한 저빈도와 관련된 잡음 외의 오류들이 포함될 수 있는데 이러한 오류들은 재추정이나 평탄화 기법으로 해결될 수 있는 문제가 아니다. 본 논문에서는 HMM(Hidden Markov Model)을 이용한 한국어 품사 태깅에서 재추정 후 여전히 존재하는 말뭉치의 잡음에 인한 태깅 오류 해결을 위해 비터비 알고리즘적용 단계에서 데이터 부족과 말뭉치의 오류로 인해 문제가 되는 부분을 찾아내고 규칙을 통해 수정을 하여 태깅 결과를 개선하는 방안을 제안한다. 실험결과는 오류가 존재하는 말뭉치를 사용하여 구현된 HMM과 비터비 알고리즘을 적용한 태깅 정확도에 비해 오류를 수정하는 과정을 거친 후 정확도가 향상됨을 보여준다.

  • PDF

의존명사를 포함하는 보조용언의 구묶음 (Chunking of Auxiliary Verbs including Dependant Nouns)

  • 김태웅;조희영;서형원;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.279-284
    • /
    • 2006
  • 한국어 부분 구문분석의 단위인 말덩이(chunk)는 하나의 의미적 중심어를 가지며, 그 구문구조가 선형인 구를 말하며, 말덩이를 분석하는 과정을 구묶음(chunking)이라고 한다. 한국어 말덩이에는 여러 종류가 있으며 보조용언도 말덩이의 한 종류이다. 이 논문은 (한국해양대학교, 2005)의 연구를 바탕으로 오류를 자주 발생시킨 의존명사를 포함하는 보조용언에 대한 명확한 기준을 제시하여 구축된 말뭉치의 신뢰성을 더욱 높이고자 한다. 이 논문에서는 모든 의존명사를 포함하는 보조용언을 다루기에는 더 많은 연구가 필요하므로 "것", "바", "때문", "데" 등의 의존명사를 포함하는 보조용언을 구성하는 말덩이를 중심으로 명확한 기준을 언어학적인 방법으로 제시하고 말뭉치 구축 오류를 방지할 수 있는 해결방안을 모색한다.

  • PDF

XGBoost와 교차 검증을 이용한 구문분석 말뭉치에서의 오류 탐지 (Detecting Errors in Dependency Treebank through XGBoost and Cross Validation)

  • 최민석;김창현;천민아;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-107
    • /
    • 2020
  • 의존구조 말뭉치는 자연언어처리 분야에서 문장의 의존관계를 파악하는데 널리 사용된다. 이러한 말뭉치는 일반적으로 오류가 없다고 가정하지만, 현실적으로는 다양한 오류를 포함하고 있다. 이러한 오류들은 성능 저하의 요인이 된다. 이러한 문제를 완화하려고 본 논문에서는 XGBoost와 교차검증을 이용하여 이미 구축된 구문분석 말뭉치로부터 오류를 탐지하는 방법을 제안한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로, 일반적인 분류기로서 오류를 검출할 수 없다. 본 논문에서는 분류기의 결과를 분석하여 오류를 검출하는 방법을 제안한다. 성능을 분석하려고 표본집단과 모집단의 오류 분포의 차이를 분석하였고 표본집단과 모집단의 오류 분포의 차이가 거의 없는 것으로 보아 제안된 방법이 타당함을 알 수 있었다. 앞으로 의미역 부착 말뭉치에 적용할 계획이다.

  • PDF

말에 있어서 Microsporum canis 감염증과 사람에의 전염 (JNirrofporNm c$\alpha$air Infection in a Horse and its Transmission to Man)

  • 팔마헨드라;이창우
    • 한국임상수의학회지
    • /
    • 제15권1호
    • /
    • pp.196-198
    • /
    • 1998
  • 젊은 말과 그 관리인에게 발생한 Microsporum canis 감염에 의한 백선에 대해 보 고하였다. 말과 사람에 있어서의 진단은 피부 병변의 KOH 표본에서 피부사상균을 직접 증명 하고,감염된 인설의 순수 배양물로부터 Microsporum canis를 분리한 것에 근거를 두었다. 말과 사람에 서 분리하고, PHOL 염색액으로 염색한 Microsporum canis는 현미경으로 자세히 관찰했을 때 형태학 적인 차이를 나타내지 않았다. 말에 있어서 옥도정기와 사람에 있어서 miconazole에 의한 국 소 요법은 효과적이었다. 병력은 관리인이 말로부터 감염된 것을 제시하였다.

  • PDF

심층신경망을 활용한 제어가능 말뭉치 시각화 기법 (Constrained Corpus visualization using neural network)

  • 정지수;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.389-393
    • /
    • 2020
  • 말뭉치를 구성하고 있는 문장들 사이의 관계가 반영된 시각화는 말뭉치 전체의 구조나 유사의미 문장군의 분포 등을 파악하는데 매우 유용하게 활용될 수 있다. 본 연구에서는, 유사한 의미를 가지는 문장들은 서로 가까이에 분포하도록 시각화되어야 한다는 제어조건을 사용자가 제공했을 때, 해당 조건이 만족되도록 2차원 공간에 말뭉치의 각 문장을 시각화하는 기법을 소개한다.

  • PDF

가이아 별을 지키는 아름다운 사람들-에코솔루션 황종식 대표

  • 벤처기업협회
    • 벤처다이제스트
    • /
    • 통권67호
    • /
    • pp.10-11
    • /
    • 2005
  • 여느 기업인을 만나더라도 한결같이 강조하는 것이 있다. 바로‘기술과 인재의 중요성’이다. ‘위기가 기회’라는 말도 자주 한다. 이런 말들은 기업인들이 경영을 통해 체득한 기업생존의 필수요소들이다. 친환경기업‘에코솔루션’의 황종식 대표 역시‘기술과 인재, 위기’를 말한다. 하지만 말의 무게는 사뭇 다르다. IMF 위기 속에서도 꿋꿋이 기업을 싹틔워 매출 200여 억원의 기업을 일궈낸 황대표의 기술과 인재관을 들어보자.

  • PDF

논단-남북의 말과 글자(1)-허웅 한글학회회장

  • 대한인쇄문화협회
    • 프린팅코리아
    • /
    • 통권4호
    • /
    • pp.70-73
    • /
    • 2002
  • 남북한이 말마저 달라지게 되면 이방인에 가까운 장벽을 만들게 될 것인데, 이것은 민족의 앞날을 위해 매우 근심스러운 일이다. 서로 말을 주고받는 기회가 잦으면 잦을수록 그들의 말은 그만큼 동질적인 것이 되고, 그렇지 않으면 그만큼 이질적인 것이 된다. 여기 각 언어의 차이, 방언의 차이가 생겨나는 이유가 있다. 남북한이 서로 끊긴 지 어언 반세기가 지났다.

  • PDF

학술자료 II: 말의 호흡-순환기계 및 질병

  • 양재혁
    • 대한수의사회지
    • /
    • 제46권11호
    • /
    • pp.1038-1046
    • /
    • 2010
  • 말과 자동차는 서로 닮은 게 몇 가지 있는데, 순환기계 및 호흡기계는 말의 엔진을 구성하고 말이 소화 시키는 사료는 자동차의 연료와 같으며, 연료는 근육에 힘을 내는 영양적 에너지로 바뀐다. 호흡기계는 대사를 촉진하기 위해 산소를 제공하고 심장혈관계 또는 순환기계는 산소와 영양소를 조직에 운반할 뿐만 아니라 엔진이 작동하면서 생긴 노폐물도 제거한다.

  • PDF