• 제목/요약/키워드: Korean sentence generation

검색결과 81건 처리시간 0.029초

청각장애인의 읽기 능력 향상을 위한 2Bi 접근 모형을 활용한 모바일 학습 시스템의 설계 및 구현 (Design and Implementation of a Mobile Learning System for Improving Reading Ability of Hearing-impaired Persons)

  • 정미아;전우천
    • 정보교육학회논문지
    • /
    • 제14권1호
    • /
    • pp.1-12
    • /
    • 2010
  • 청각장애인은 청각 손실로 인해 나이가 많아질수록 언어의 이해력과 표현력이 점점 지체된다. 따라서 그들의 유일한 의사소통의 통로인 읽기 능력의 향상을 위해 최근 관심을 받고 있는 2Bi(Bilingual-Bicultural Approach) 접근 모형을 활용하고, 컨텐츠의 구성은 책을 읽고 이해하는 방법 중 질문 생성 전략을 활용하여 모바일 학습 시스템을 설계 및 구현 하였다. 본 시스템의 특징은 다음과 같다. 첫째, 상호 유기적으로 관련된 두 교육과정의 반복과 차이를 통해 올바른 문자 언어 사용법을 익힌다. 둘째, 글을 읽고 질문을 만들어 답을 해 보는 활동을 통해 문장 이해력을 높이도록 학습 내용을 구성 하였다. 셋째, 학습자의 수준에 따라 언제 어디서나 짧은 시간에 개별 선택 학습이 가능하도록 하였다.

  • PDF

개체명 인식 코퍼스 생성을 위한 지식베이스 활용 기법 (Automatic Training Corpus Generation Method of Named Entity Recognition Using Knowledge-Bases)

  • 박영민;김예진;강상우;서정연
    • 인지과학
    • /
    • 제27권1호
    • /
    • pp.27-41
    • /
    • 2016
  • 개체명 인식은 미리 정의된 개체 범주로 텍스트의 요소를 분류하는 과정을 의미하며 최근 주목 받고 있는 음성 비서 서비스 등 다양한 응용 분야에 널리 활용되고 있다. 본 논문에서는 지식베이스를 사용하여 개체명 인식 코퍼스를 자동으로 생성하는 방법을 제안한다. 지식베이스의 종류에 따라 두 가지 방법을 적용하며 그 중 첫 번째 방법은 위키피디아를 기반으로 위키피디아 본문의 문장에 개체명 표지를 부착하여 학습 코퍼스를 생성하는 방법이다. 두 번째 방법은 인터넷으로부터 다양한 형태의 문장을 수집하고 다양한 개체들 간의 관계를 데이터베이스에 보유 중인 프리베이스를 이용하여 개체명 표지를 부착하는 방법으로 학습 코퍼스를 생성한다. 자동 생성된 학습 코퍼스의 질과 본 논문에서 제안하는 학습 코퍼스 자동 생성 기법을 평가하기 위해 두 가지로 실험했다. 첫 번째, 다른 형태의 지식베이스인 위키피디아와 프리베이스(Freebase)를 기반으로 생성된 학습 코퍼스의 표지 부착 성능을 수동으로 측정하여 코퍼스의 질을 평가하였다. 두 번째, 각 코퍼스로 학습된 개체명 인식 모델의 성능을 통해 제안하는 학습 코퍼스 자동 생성 기법의 실용성을 평가하였다. 실험을 통해 본 방법이 타당함을 증명하였으며 특히 실제 응용에서 많이 사용되는 웹 데이터 환경에서 의미 있는 성능 향상을 보여주었다.

  • PDF

상태레벨 공유를 이용한 MLLR 적응화의 회귀클래스 생성에 관한 연구 (A Study on Regression Class Generation of MLLR Adaptation Using State Level Sharing)

  • 오세진;성우창;김광동;노덕규;송민규;정현열
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.727-739
    • /
    • 2003
  • 본 논문에서는 HM-Net (Hidden Markov Network)을 다양한 태스크에의 적용과 화자의 특성을 효과적으로 나타내기 위해 HM-Net 음성인식 시스템에 MLLR (Maximum Likelihood Linear Regression) 적응방법을 도입하였으며, HM-Net 학습 알고리즘을 개량하여 회귀클래스 생성방법을 제안한다. 제안방법은 PDT-SSS (Phonetic Decision Tree-based Successive State Splitting)알고리즘의 문맥방향 상태분할에 의한 상태레벨 공유를 이용한 방법이다. 즉, 문맥방향의 각 상태에 적응화자 음성데이터에 포함된 문맥정보를 분할하여 적응화될 음소환경을 결정하는 것이다. 따라서 제안방법은 새로운 화자로부터 문맥정보와 적응화 데이터의 발성 양에 의존하여 결정된 많은 적응 파라미터들을 (평균, 분산) 자유롭게 제어할 수 있게 된다. 제안방법의 유효성을 확인하기 위해 국어공학센터 (KLE) 452 데이터와 항공편 예약관련 (YNU200) 연속음성을 대상으로 인식실험을 수행한 결과, 음소인식, 단어인식, 연속음성인식에 대해서, 평균 34∼37%, 평균 9%, 평균 20%의 성능 향상을 각각 보였다. 또한 적응화 데이터의 양에 따른 인식성능 비교에서 제안방법을 적용한 인식 시스템이 적응 데이터의 양이 적은 경우에도 향상된 인식률을 보여 MLLR 적응방법의 특성을 만족하였다. 따라서 MLLR 적응방법을 도입한 HM-Net 음성인식 시스템에 제안한 회귀클래스 생성방법이 유효함을 확인할 수 있었다.

한국어 목적격조사의 몽골어 격 어미 번역 (Translation of Korean Object Case Markers to Mongolian's Suffixes)

  • ;신준철;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권2호
    • /
    • pp.79-88
    • /
    • 2019
  • 최근 기계 번역에 관한 연구들이 활발하게 이루어지고 있고 한국어와 몽골어 간의 상호 기계 번역 시스템도 개발되고 있다. 한국어와 몽골어는 계통적으로 같은 어족에 속하며 '주어+목적어+서술어'라는 비교적 자유로운 어순을 가지는 언어이고 어미와 조사가 발달한 것이 그 특징이다. 따라서 기계 번역 시 양언어의 조사나 어미의 의미를 잘 번역하는 것이 중요하다. 그러나 한국어 목적격 조사를 몽골어로 번역할 때 한국어 목적격 조사가 몽골어의 여러 격 어미로 번역이 될 수 있는데, 기존의 연구들은 한 가지 격 어미로만 번역해 정확한 의미를 전달하지 못하는 문제점이 있다. 본 논문에서는 이러한 문제점을 개선하기 위하여 한국어 형태소 분석과 동시에 품사 및 동형이의어 태깅 시스템인 유태거(UTagger)를 기반으로 하여 한국어 목적격 조사의 몽골어 격 어미 결정 방법을 제안한다. 제안하는 방법에서는 한국어 목적격 조사에 대응하는 몽골어 격 어미들을 살펴보고 데이터 테이블을 설계하여 적절한 격 어미를 결정한다. 제안한 방법의 성능을 검증하기 위하여 한국어기초사전에서 데이터를 추출하고 유태거와 비교 실험하였다. 실험 결과 목적격 조사를 바로 대격 어미로 번역한 유태거의 정확률은 46.9%인데 반해 본 논문에서 제안한 방법은 88.38%로 제안한 방법이 41.48%p 더 우수한 결과를 보였다.

태블릿 PC 기반 한국형 하이테크 AAC 소프트웨어의 사용성 평가 (A Usability Testing on the Tablet PC-based Korean High-tech AAC Software)

  • 이희연;홍기형
    • 한국HCI학회논문지
    • /
    • 제7권2호
    • /
    • pp.35-42
    • /
    • 2012
  • 본 연구의 목적은 의사소통장애인을 위한 태블릿 PC기반 한국형 하이테크 보완대체의사소통(AAC) 소프트웨어의 사용성을 평가하는 것이다. 우리나라의 언어 및 문화적 상황과 의사소통장애인의 요구에 적합한 AAC 기기를 개발하기 위해서, 본 연구에서는 과제분석을 통해 선정된 시나리오 평가를 통해 한국형 하이테크 AAC 소프트웨어의 기능들(중도 지적장애인을 위한 의사소통판, 존대, 시제, 부정, 주부와 술부 연동, 자동문장생성)의 필요성과 용이성을 평가하였고, 반구조화된 질문들과 개방형 질문들을 통하여 전반적인 기능 및 사용자 인터페이스(UI)에 대한 잠재적인 사용자의 선호도, 만족도를 평가하고 추가 요구사항을 조사하였다. 본 사용성 평가에는 특수교사 9명, 언어치료사 6명, 의사소통장애를 가진 아동의 학부모 6명으로 구성된 총 21명의 잠재적인 AAC사용자가 참여하였다. 태블릿 PC기반의 한국형 하이테크 AAC의 사용성 평가 결과, 대부분으 응답들이 5점 척도에서 4이상의 긍정적인 반응을 나타냈으나, 시제와 부정 기능의 필요성과 실행 용이성은 상대적으로 낮게 나타났는데 이는 시제/부정 기능과 존대 기능간의 비일관적인 작동방식과 관련된 것으로 보인다. 각 기능들의 UI 측면에서는 시각적인 피드백 강화, 기능키들의 작동방식의 일관화, 자연스러운 어휘 연동, 상징 내 텍스트의 띄어쓰기 등과 같은 요구가 나타났다. 본 연구의 사용성 평가 결과 및 잠재적 사용자의 피드백은 기존 AAC의 기능 및 UI의 개선과 보완을 위한 지침이 될 것이다.

  • PDF

KoEPT 기반 한국어 수학 문장제 문제 데이터 분류 난도 분석 (Analyzing Korean Math Word Problem Data Classification Difficulty Level Using the KoEPT Model)

  • 임상규;기경서;김부근;권가진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권8호
    • /
    • pp.315-324
    • /
    • 2022
  • 이 논문에서는 자연어로 구성된 수학 문장제 문제 자동 풀이하기 위한 Transformer 기반의 생성 모델인 KoEPT를 제안한다. 수학 문장제 문제는 일상 상황을 수학적 형식으로 표현한 자연어 문제이다. 문장제 문제 풀이 기술은 함축된 논리를 인공지능이 파악해야 한다는 요구사항을 지녀 최근 인공지능의 언어 이해 능력을 증진하기 위해 국내외에서 다양하게 연구되고 있다. 한국어의 경우 문제를 유형으로 분류하여 풀이하는 기법들이 주로 시도되었으나, 이러한 기법은 다양한 수식을 포괄하여 분류 난도가 높은 데이터셋에 적용하기 어렵다는 한계가 있다. 본 논문은 이에 대해 '식' 토큰과 포인터 네트워크를 사용하는 KoEPT 모델을 사용했다. 이 모델의 성능을 측정하기 위해 현존하는 한국어 수학 문장제 문제 데이터셋인 IL, CC, ALG514의 분류 난도를 측정한 후 5겹 교차 검증 기법을 사용하여 KoEPT의 성능을 평가하였다. 평가에 사용된 한국어 데이터셋들에 대하여, KoEPT는 CC에서는 기존 최고 성능과 대등한 99.1%, IL과 ALG514에서 각각 89.3%, 80.5%로 새로운 최고 성능을 얻었다. 뿐만 아니라 평가 결과 KoEPT는 분류 난도가 높은 데이터셋에 대해 상대적으로 개선된 성능을 보였다. KoEPT가 분류 난도의 영향을 덜 받으며 좋은 성능을 얻게 된 이유를 '식' 토큰과 포인터 네트워크 때문이라는 것을 ablation study를 통해서 밝혔다.

KOMUChat : 인공지능 학습을 위한 온라인 커뮤니티 대화 데이터셋 연구 (KOMUChat: Korean Online Community Dialogue Dataset for AI Learning)

  • 유용상;정민화;이승민;송민
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.219-240
    • /
    • 2023
  • 사용자가 만족감을 느끼며 상호작용할 수 있는 대화형 인공지능을 개발하기 위한 노력이 이어지고 있다. 대화형 인공지능 개발을 위해서는 사람들의 실제 대화를 반영한 학습 데이터를 구축하는 것이 필요하지만, 기존 데이터셋은 질문-답변 형식이 아니거나 존대어를 사용하여 사용자가 친근감을 느끼기 어려운 문체로 구성되어 있다. 이에 본 논문은 온라인 커뮤니티에서 수집한 30,767개의 질문-답변 문장 쌍으로 구성된 대화 데이터셋(KOMUChat)을 구축하여 제안한다. 본 데이터셋은 각각 남성, 여성이 주로 이용하는 연애상담 게시판의 게시물 제목과 첫 번째 댓글을 질문-답변으로 수집하였다. 또한, 자동 및 수동 정제 과정을 통해 혐오 데이터 등을 제거하여 양질의 데이터셋을 구축하였다. KOMUChat의 타당성을 검증하기 위해 언어 모델에 본 데이터셋과 벤치마크 데이터셋을 각각 학습시켜 비교분석하였다. 그 결과 답변의 적절성, 사용자의 만족감, 대화형 인공지능의 목적 달성 여부에서 KOMUChat이 벤치마크 데이터셋의 평가 점수를 상회했다. 본 연구는 지금까지 제시된 오픈소스 싱글턴 대화형 텍스트 데이터셋 중 가장 대규모의 데이터이며 커뮤니티 별 텍스트 특성을 반영하여 보다 친근감있는 한국어 데이터셋을 구축하였다는 의의를 가진다.

부호화 전략 유형과 동시과제 처리 적절성이 미래계획기억 수행에 미치는 효과 (The Effect of Encoding strategy and Transfer Appropriate Processing on Prospective Memory Performance)

  • 박영신
    • 인지과학
    • /
    • 제27권1호
    • /
    • pp.101-127
    • /
    • 2016
  • 본 연구는 미래계획기억(PM) 수행에서 기억전략과 동시과제 처리적절성의 효과를 탐색하기 위해 수행되었다. 먼저 실험 1에서 목표단어 파지를 위한 기억전략 유형이 부호화 단계에서 조작되었다. 먼저 메타 전략을 통해 목표단어를 기억해야했던 참가자들은 PM 과제 수행에 대한 수행 난이도에 대한 주관적 평정과 자신의 수행 예측 정도를 판단해야 했으며, 인지 전략을 통해 목표단어를 기억해야 했던 참가자들은 목표단어에 대한 문장 산출과 주관적 호감도 평정을 해야 했다. 또한 모든 참가자들은 목표단어와의 처리적절성이 높은 동시과제와 낮은 동시과제 두 종류 모두를 수행하면서 PM 과제를 수행해야 했다. 실험 2는 실험 1의 반복검증을 위해 수행되었으며, 처리적절성에 대한 동시과제의 종류를 제외하고 실험 1과 모든 것이 동일하였다. 실험 결과, 두 실험 모두에서 메타 전략 조건의 참가자들이 인지 전략 조건의 참가자들보다 PM 수행 정확률이 더 높았다. 또한 처리적절성이 높은 과제에서 PM 수행 정확률이 더 높았다. 두 조건들 간에 상호작용도 나타났다. 메타 인지 조건에서는 처리적절성이 높은 동시과제를 수행하는 동안 PM 정확율이 좋았던 반면, 인지 전략 조건에서는 처리적절성에 따라 PM 정확율에 차이가 없었다. 동시과제에서는 조건들 간에 아무런 수행의 손실이나 이득이 나타나지 않았다. 본 연구의 결과를 통해 미래계획기억 수행에서 메타 인지처리과정에 의한 수행의 향상은 인지 자원의 영향에 따라 달라질 수 있다고 볼 수 있다.

  • PDF

염증-치주 질환과 암에 관한 최근 연구 동향 (Link between Periodontal Disease and Cancer: A Recent Research Trend)

  • 이신화;최영현
    • 생명과학회지
    • /
    • 제23권4호
    • /
    • pp.602-608
    • /
    • 2013
  • 만성적인 염증이 다단계 발암과정에서 다면적인 역할을 하고 있음은 이미 잘 알려진 사실이다. 치주 질환의 원인은 구강 박테리아에서 분비되는 내독소들과 염증 유발인자들의 생성 등이 관여하는 다양한 요인들을 포함하며, 이는 잘못된 구강 위생 관리가 신체의 여러 가지 전신병적 원인과 연관되어 있음을 의미한다. 비위생적인 구강 상태와 연관된 만성 염증, 흡연, 알콜 섭취의 증가 등은 암의 발병 위험 요소로 작용함은 명확한 사실이다. 최근에는 구강 위생과 치아 손실이 위장관암, 폐암 및 췌장암 뿐만 아니라 혈구암 발병 증가와 직접적인 연관성이 있음이 밝혀졌다. 또한 흡연은 악성 질환 발병의 위험 요소로서 구강 위생의 강력한 위해요인임은 명백하며, 역학적 조사결과들에 의하면 구강 박테리아에 의한 치주 질환은 만성 염증을 통하여 흡연과 알콜 연관 발암원을 활성시킴으로서 다양한 암의 발병 위험 요소를 증가시킬 수 있는 것으로 나타났다. 따라서 암 뿐만 아니라 다른 다양한 질환의 예방을 위한 적절한 구강 관리는 필수적이다. 본 논문에서는 암예방을 위한 악성질환의 위해 요소로서 염증과 치주질환 및 구강 위생과의 연관성을 논하였다.

신라 시조 혁거세왕 신화에 대한 분석심리학적 연구 (A Study of Myth of King Heokgeose, the Founder of Shilla Dynasty from a Perspective of Analytical Psychology)

  • 한상익
    • 심성연구
    • /
    • 제28권1호
    • /
    • pp.50-87
    • /
    • 2013
  • C. G. Jung은 일찍이 신화(神話)나 민담(民譚, Märchen)에서 인간 무의식의 보편적, 원초적 조건이 발견된다고 하였다. 우리의 일상에서 이러한 인간심성의 보편성을 흔히 체험할 수 있는 것은 꿈이다. 그러므로 꿈에 나오는 인간 심성에 있는 보편적인 원형상들을 이해하기 위해서 신화소(神話素)들이 등장하는 신화나 민담들에 대한 분석심리학적 해석을 시도해 보는 것은 실제 임상에서 마주치게 되는 이런 '큰 꿈'들을 충실히 이해하기 위해 매우 중요한 과정이다. 저자는 신화에 대한 분석심리학적 해석에 관심을 가지면서 그 대상에 대한 탐색을 하면서 신화소에 나타나는 '원형'의 보편성을 우리 민족 전래의 신화 속에서 찾아보기 위해 삼국유사를 살펴보던 중 기이편(紀異篇)에 나오는 신라(新羅)의 건국신화인 혁거세왕(赫居世王) 신화에 주목을 하게 되었다. 신라는 일찍 건국이 되긴 하였지만 한반도 남부 끝자락에 위치한 제일 작은 나라로서 고구려, 백제에 비해 정치, 군사적으로나 문화적으로 가장 늦게 발전한 나라였음에도 결국 삼국을 통일하고 우리나라 역사상 가장 긴 거의 1000년(BC57~AD935)의 역사를 이어온 나라라는 점에서 건국과 관련된 남다른 바탕이 있었는지 그들의 건국신화에 있는 원형상(原型像)들을 살펴보고자 하였다. 한반도의 남쪽 작은 나라였던 신라의 건국시조의 탄생신화가 탄생전의 상태에서부터 탄생, 배필의 탄생, 성장, 결혼, 즉위, 다스림, 죽음, 죽음 이후, 계승까지 거의 완전한 줄거리를 갖고 있다는 것은 매우 주목되는 점이다. 이 신화에 나오는 1, 3, 5, 6, 7, 13, 61 등 다양한 숫자 상징, 동, 서, 남, 북과 중심을 포함한 모든 방위, 호랑이, 백마, 닭, 용, 봉(鳳) 뱀 등 많은 동물상징, 중심적인 상징인 알을 비롯한 바위, 박(瓢), 전광(電光), 샘물, 내(川), 나무, 숲, 산, 쇠 등 자연의 상징과 선도성모 같은 신상(神像) 등 점차 이야기가 전개되면서 등장하는 온갖 상징들은 이 짧은 신화 속에 온 인류가 경험해온 의식의 탄생, 부성과 모성의 합일을 통한 성장과 발전, 소멸, 재생의 이야기가 펼쳐지고 그런 과정이 다음 세대로 영원히 계승되는 웅대한 이야기가 재현되고 있음을 볼 수 있다. 신화의 한 단어, 한 문장 또는 별로 의미를 찾을 수 없어 보이던 내용들이 점차 그 뜻을 드러내고 있었고, 무의식과 의식의 상호 작용이 그 모습을 달리 하며 계속 반복되며, 중층적으로 표현되고 있음을 확인할 수 있었다.