• 제목/요약/키워드: 통 문장

검색결과 20건 처리시간 0.028초

통 문장 암기와 짝 활동을 통한 한국어말하기 향상 융합전략 (A Convergence Strategy of Improving Korean Speaking Skills through Memorizing Whole Sentence and Pair Works)

  • 류자미;오성록
    • 한국융합학회논문지
    • /
    • 제7권2호
    • /
    • pp.77-84
    • /
    • 2016
  • 이 논문에서는 외국학생들이 한국어를 배울 때 통 문장암기방법과 짝 활동이 말하기능력향상에 효과가 있는지를 알아보고자 했다. 먼저 통 문장암기방법에 대한 효과를 다루고 있는 논문의 선행연구를 살펴보았고, 이 연구에서 활용한 학습자의 활동은 주로 외국학생끼리 짝 활동이므로 이에 대한 방법을 설명하였다. 이 활동은 수업시간에 학습자의 한국어 사용빈도를 높이고자 시도했고, 동시에 학습자간에 지속적인 학습을 서로 돕도록 의도했다. 이 융합교수접근법에 힘입어 수업시간에 학습자들의 한국어 활용빈도가 크게 향상되었다. 이는 각 짝을 중국학생과 베트남학생으로 구성하였기 때문에 학습자들은 한국어를 사용할 수밖에 없었기 때문이었다. 이 활동을 통해 학습자들은 서로 격려하고 도움을 줌으로써 외국어학습을 지속적으로 하게하는 동기부여나 힘을 얻을 수 있었다고 설문과 인터뷰에서 밝혔다. 특히 설문조사에서 학생들은 이 융합교수법에 대해 참여 학습자 거의 모두가 만족했음을 보여주었다.

광고성 메일을 자동으로 구별해내는 Text Mining 기법 연구 (Detecting spam mails using Text Mining Techniques)

  • 이종호
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.35-39
    • /
    • 2002
  • 광고성 메일이 개인 당 하루 평균 10통 내외로 오며, 그 제목만으로는 광고메일을 효율적으로 제거하기 어려운 현실이다. 이러한 어려움은 주로 광고 제목을 교묘히 인사말이나 답신처럼 변경하는 데에서 오는 것이며, 이처럼 제목으로 광고를 삭제할 수 없도록 은폐하는 노력은 계속될 추세이다. 그래서 제목을 통한 변화에 적응하면서, 제목뿐만 아니라 내용에 대한 의미 파악을 자동으로 수행하여 스팸 메일을 차단하는 방법이 필요하다. 본 연구에서는 정상 메일과 스팸 메일의 범주화(classification) 방식으로 접근하였다. 이러한 범주화 방식에 대한 기준을 자동으로 알기 위해서는 사람처럼 문장 해독을 통한 의미파악이 필요하지만, 기계가 문장 해독을 통해서 의미파악을 하는 비용이 막대하므로, 의미파악을 단어수준 등에서 효율적으로 대신하는 text mining과 web contents mining 기법들에 대한 적용 및 비교 연구를 수행하였다. 약 500 통에 달하는 광고메일을 표본으로 하였으며, 정상적인 편지군(500 통)에 대해서 동일한 기법을 적용시켜 false alarm도 측정하였다. 비교 연구 결과에 의하면, 메일 패턴의 가변성이 너무 커서 wrapper generation 방법으로는 해결하기 힘들었고, association rule analysis와 link analysis 기법이 보다 우수한 것으로 평가되었다.

  • PDF

Denoising Transformer기반 한국어 맞춤법 교정기 (Korean Spell Correction based on Denoising Transformer)

  • 박찬준;정솔;양기수;이수미;조재춘;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.368-372
    • /
    • 2019
  • 맞춤법 교정이란 주어진 문장에서 나타나는 철자 및 맞춤법 오류들을 올바르게 교정하는 것을 뜻하며 맞춤법 교정 시스템이란 컴퓨터가 이를 자동으로 수행하는 것을 의미한다. 본 논문에서는 맞춤법 교정을 기계번역의 관점으로 바라보고 문제를 해결하였다. 소스문장에 맞춤법 오류문장, 타겟 문장에 올바른 문장을 넣어 학습시키는 방법을 제안한다. 본 논문에서는 단일 말뭉치로 한국어 맞춤법 병렬 말뭉치를 구성하는 방법을 제안하며 G2P(Grapheme to Phoneme)를 이용한 오류 데이터 생성, 자모 단위 철자 오류데이터 생성, 통번역 데이터 기반 오류 데이터 생성 크게 3가지 방법론을 이용하여 맞춤법 오류데이터를 생성하는 방법론을 제안한다. 실험결과 GLEU 점수 65.98의 성능을 보였으며 44.68, 39.55의 성능을 보인 상용화 시스템보다 우수한 성능을 보였다.

  • PDF

키워드 추출용 구묶음 데이터 구축 및 개선 방법 연구 (Study on Making Chunking Dataset for Keyword Extraction and its Improvement Methods)

  • 이민호;최맹식;김정아;이충희;김보희;오효정;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.512-517
    • /
    • 2020
  • 구묶음은 문장을 겹치지 않는 문장 구성 성분으로 나누는 과정으로, 구묶음 방법에 따라 구문분석, 관계 추출 등 다양한 하위 태스크에 사용할 수 있다. 본 논문에서는 문장의 키워드를 추출하기 위한 구묶음 방식을 제안하고, 키워드 단위 구묶음 데이터를 구축하기 위한 가이드라인을 제작하였다. 해당 가이드라인을 적용하여 구축한 데이터와 BERT 기반의 모델을 이용하여 학습 및 평가를 통해 구축된 데이터의 품질을 측정하여 78점의 F1점수를 얻었다. 이후 패턴 통일, 형태소 표시 여부 등 다양한 개선 방법의 적용 및 재실험을 통해 가이드라인의 개선 방향을 제시한다.

  • PDF

실시간 동시통번역의 정책기반 성능 비교 연구 (Policy-based performance comparison study of Real-time Simultaneous Translation)

  • 이정섭;문현석;박찬준;서재형;어수경;이승준;구선민;임희석
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.43-54
    • /
    • 2022
  • 동시통번역은 문장의 일부만으로 번역을 시작하는 온라인 디코딩으로 지연 대비 번역 성능을 평가 지표로 사용한다. 동시통번역 연구의 공통의 목적은 지연 대비 번역 성능을 높이는 것으로, 지연과 번역 성능 사이의 적절한 절충점을 찾는 것이다. 본 논문은 이러한 동시통번역의 현재 연구 흐름을 반영하여 한국어에서 고정 정책 기반 동시통번역의 비교 실험을 진행하였다. 또한, 한국어에서 동시통번역은 토큰화 과정에서 많은 분절이 발생하여 다른 언어 대비 불필요한 지연이 발생하게 되고, 이를 해결하기 위한 n-gram 토큰화 방안 등의 후속 연구의 필요성에 대해 제시하였다.

문법화의 관점에서 본 한$\cdot$독 관사, 비인칭구문, 재귀동사 구문 (Artikel, Impersonalien und die $Reflexivit\"{a}t$ aus der Grammatikalisierungsperspektive: Ein Vergleich des Deutschen und des Koreanischen)

  • 송경안
    • 한국독어학회지:독어학
    • /
    • 제5집
    • /
    • pp.23-51
    • /
    • 2002
  • 이 글은 문법화의 관점에서 관사, 비인칭구문, 재귀동사 구문을 독일어와 우리말을 중심으로 비교하였다. 우리말의 경우 관사의 범주가 아직 문법 화하지는 않았지만 수사 '하나/한'은 서양 언어에 못지 않게 다양한 문법적 기능으로 발전하였다. 독일어의 정관사나 대명사에 해당되는 요소는 우리말에서 자주 생략된다. 비인칭구문도 유럽언어의 특징인데 독일어의 경우 이는 지시대명사에서 문법 화한 것이다. 우리말의 경우 비인칭구문은 문법 화하지 않았으며 이를 위해 우리말은 주어생략 통 다른 문법적 기재들을 사용한다. 독일어에는 또 재귀구문이 잘 발달되어 있는데 우리말은 재귀구문이 그렇게 다양하게 문법 화되지 않았다 한편 우리말의 재귀사는 다양한 지시적 기능을 발전시켰다. 즉 이들은 순수하게 재귀적으로 쓰이는 경우 이외에 문장 내적 혹은 문장 외적 지시사로 사용되고 있으며 부분적으로 독일어의 man과 같은 부정대명사의 기능도 가지고 있다.

  • PDF

UniWeb 2.0 - 웹을 이용한 클라이언트-서버 데이타베이스 응용 개발 환경 (UniWeb 2.0 - A Web-based Client-Server Database Application Development Environment)

  • 김평철
    • 정보기술과데이타베이스저널
    • /
    • 제3권2호
    • /
    • pp.119-132
    • /
    • 1996
  • 웹을 이용한 클라이언트-서버 데이타베이스 시스템은 웹의 서비스 능력과 데이타베이스 시스템의 데이타 관리 기능을 상호 보완적으로 통합함으로써 인터넷과 같은 대규모 환경에서 데이타베이스 업무 환경을 구축하는 데 매우 적합한 것으로 알려져 있다. 데이타베이스 통로는 이러한 통합의 가장 핵심적 구성 요소이다. 본 논문에서는 먼저 클라이언트-서버 데이타베이스 응용을 위한 데이타베이스 통로의 고려사항으로서, 고성능 실행구조, 응용 프로그램 개발 환경, 그리고 상태 및 트랜잭션 관리에 대해 기술하고, 이어서 UniSQL/X용 데이타베이스 통로인 UniWeb 2.0의 설계와 구현에 대하여 소개한다. UniWeb 2.0은 CGI 응용 서버 방식을 채택하여 다양한 플랫폼을 지원하고, 고성능 그리고 확장성을 제공한다. 또한 프로그래머가 HTML 문서에 SQL/X문장이 포함된 Tcl 스크립트를 끼워 넣을 수 있도록 하여 응용 프로그램 개발 생산성을 향상시키고 있다. UniWeb 2.0은 여러 웹 페이지에 걸친 상태 와 트랜잭션을 지원하고 있다.

  • PDF

단위 테스트 자동화를 위한 자바 프로그램 테스트 코드 구축 (Building Test Codes for Unit Test Automation of Java Programs)

  • 윤회진
    • 소프트웨어공학소사이어티 논문지
    • /
    • 제23권4호
    • /
    • pp.141-149
    • /
    • 2010
  • 애자일 개발의 XP와 Scrum을 중심으로 단위 테스트 자동화의 중요성이 커지고 있다. 그러나 테스트 결과, 즉 통과 또는 실패를 자동으로 결정하기 위해서는 테스트 실행 결과와 예상 결과를 비교하는 과정이 필요하다. 이 부분의 구현이 자동화의 성패를 좌우한다. 본 연구는 단위 테스트 자동화를 위한 테스트 코드 작성을 소개하고, 테스트 코드 구현에서 고려해야할 사항을 언급한다. 첫째, void 형태의 메소드의 경우 테스트 데이터 실행 결과를 명시적으로 구하기 어려운 문제를 본 연구에서는 Mock 프레임워크를 사용하여 해결하였다. 둘째, void 형태의 메소드의 경우, criteria로 인해 구성된 테스트 경로상의 모든 문장들이 제대로 수행되었는지 하나씩 살펴보아야 하는지, 아니면 최종 문장에 대해서만 보아야 하는지의 문제이다. 본 연구에서는 Mock 프레임워크의 verify 기능을 활용하여 매 순간 제대로 실행되어져야 하는 메소드 호출을 중심으로 명확한 매개변수들을 사용하여 호출이 일어났는 지를 확인하고, 그 결과들이 모두 예상 결과와 맞을 때, 해당 테스트 케이스에 대한 테스트를 통과한 것으로 결정하였다.

  • PDF

갈수관리 활용을 위한 월강수량 가뭄빈도분석 (Drought Frequency Analysis using Monthly Rainfall for Low Flow Management)

  • 문장원;김정엽;조효섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.415-415
    • /
    • 2018
  • 갈수관리를 효과적으로 수행하기 위해서는 하천유량을 예측할 수 있는 방안을 마련하는 것이 중요하다. 하천유량 예측을 위해서는 강수량에 대한 예측 값을 활용하는 방안이 가장 적합하다고 할 수 있으나 강수량 예측에 대한 불확실성은 하천유량 예측의 정확도 확보에 있어 한계로 작용하고 있다. 강수량 예측에 대한 불확실성 극복을 위해서는 다양한 강수 시나리오를 설정하여 활용하는 방안을 검토할 수 있으며, 유량 예측을 하고자 하는 유역에 대해 과거 발생했던 강수량이 반복된다는 가정 하에 유량 예측을 제한적으로 수행하고 있는 상황이다. 이와 함께 강수 시나리오의 다양성 확보 차원에서 하천유량을 예측하고자 하는 유역에 대해 가뭄빈도 강수량을 사전에 산정한 후 유량 예측 과정에 활용하는 방안도 고려해볼 수 있는 방안이다. 이에 본 연구에서는 2016년 수립된 수자원장기종합계획(국토교통부, 2016)에서 제시된 중 권역별 일 강수량 자료를 이용하여 중권역별로 월 강수량을 산정한 후 월별 가뭄빈도분석을 수행하였다. 1966~2015년까지의 기간에 대한 월 강수량 자료를 이용하여 월별로 가뭄빈도분석을 수행하였으며, 빈도분석 방법으로는 확률가중모멘트법을 이용하여 적정 분포형 결정 및 갈수빈도별 강수량을 산정하여 제시하였다. 이때 빈도 강수량의 재현기간은 총 7가지 빈도(2년, 5년, 10년, 20년, 50년, 80년, 100년)를 고려하였다. 산정된 빈도 강수량을 이용하여 월 유출모형에 적용함으로써 월 유출 전망 자료 생산이 가능하며, 금강수계의 용담댐유역에 시범 적용하여 그 결과를 검토하였다. 검토 결과, 중권역별로 산정된 월별 가뭄빈도 강수량을 활용한 하천유량 예측 방법은 갈수예보에 있어 유용한 정보를 제공할 수 있을 것으로 판단된다.

  • PDF

유사도 기반 이미지 캡션을 이용한 시각질의응답 연구 (Using similarity based image caption to aid visual question answering)

  • 강준서;임창원
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.191-204
    • /
    • 2021
  • 시각질의응답과 이미지 캡셔닝은 이미지의 특징과 문장의 언어적인 특징을 이해하는 것을 요구하는 작업이다. 따라서 두 가지 작업 모두 이미지와 텍스트를 연결해 줄 수 있는 공동 어텐션이 핵심이라고 할 수 있다. 본 논문에서는 MSCOCO 데이터 셋에 대하여 사전 훈련된 transformer 모델을 이용 하여 캡션을 생성한 후 이를 활용해 시각질의응답의 성능을 높이는 모델을 제안하고자 한다. 이때 질 문과 관계없는 캡션은 오히려 시각질의응답에서 답을 맞히는데 방해가 될 수 있기 때문에 질문과의 유사도를 기반으로 질문과 유사한 일부의 캡션을 활용하도록 하였다. 또한 캡션에서 불용어는 답을 맞히는데 영향을 주지 못하거나 방해가 될 수 있기 때문에 제거한 후에 실험을 진행하였다. 기존 시 각질의응답에서 이미지와 텍스트간의 공동 어텐션을 활용하여 좋은 성능을 보였던 deep modular co-attention network (MCAN)과 유사도 기반의 선별된 캡션을 사용하여 VQA-v2 데이터에 대하여 실험을 진행하였다. 그 결과 기존의 MCAN모델과 비교하여 유사도 기반으로 선별된 캡션을 활용했을 때 성능 향상을 확인하였다.