• Title/Summary/Keyword: 통 문장

Search Result 19, Processing Time 0.024 seconds

A Convergence Strategy of Improving Korean Speaking Skills through Memorizing Whole Sentence and Pair Works (통 문장 암기와 짝 활동을 통한 한국어말하기 향상 융합전략)

  • Ryu, Ja-Mi;Oh, Seong-Rok
    • Journal of the Korea Convergence Society
    • /
    • v.7 no.2
    • /
    • pp.77-84
    • /
    • 2016
  • This paper is aimed at finding whether foreign students' Korean speaking skills can be increased or not through memorizing whole Korean sentences and pair works. First, the advance studies on the effects of this teaching method were surveyed. Second, the activity of this study was mainly pair works with foreign students, so how to do this activity was described. This activity was intended to help each other with keeping study and correcting errors while drilling in class. Thanks to this convergence teaching approach the students' frequency of target language, the Korean language was dramatically increased, and their motivation and energy were brought from this activity. They have to do communications with each other because each pair was made of one Chinese and one Vietnamese. They have no choice but to use Korean in communication. Finally, the questionnaire and interviews also showed that almost all of the students were satisfied with this convergence teaching approach.

Detecting spam mails using Text Mining Techniques (광고성 메일을 자동으로 구별해내는 Text Mining 기법 연구)

  • 이종호
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.35-39
    • /
    • 2002
  • 광고성 메일이 개인 당 하루 평균 10통 내외로 오며, 그 제목만으로는 광고메일을 효율적으로 제거하기 어려운 현실이다. 이러한 어려움은 주로 광고 제목을 교묘히 인사말이나 답신처럼 변경하는 데에서 오는 것이며, 이처럼 제목으로 광고를 삭제할 수 없도록 은폐하는 노력은 계속될 추세이다. 그래서 제목을 통한 변화에 적응하면서, 제목뿐만 아니라 내용에 대한 의미 파악을 자동으로 수행하여 스팸 메일을 차단하는 방법이 필요하다. 본 연구에서는 정상 메일과 스팸 메일의 범주화(classification) 방식으로 접근하였다. 이러한 범주화 방식에 대한 기준을 자동으로 알기 위해서는 사람처럼 문장 해독을 통한 의미파악이 필요하지만, 기계가 문장 해독을 통해서 의미파악을 하는 비용이 막대하므로, 의미파악을 단어수준 등에서 효율적으로 대신하는 text mining과 web contents mining 기법들에 대한 적용 및 비교 연구를 수행하였다. 약 500 통에 달하는 광고메일을 표본으로 하였으며, 정상적인 편지군(500 통)에 대해서 동일한 기법을 적용시켜 false alarm도 측정하였다. 비교 연구 결과에 의하면, 메일 패턴의 가변성이 너무 커서 wrapper generation 방법으로는 해결하기 힘들었고, association rule analysis와 link analysis 기법이 보다 우수한 것으로 평가되었다.

  • PDF

Korean Spell Correction based on Denoising Transformer (Denoising Transformer기반 한국어 맞춤법 교정기)

  • Park, Chanjun;Jeong, Sol;Yang, Kisu;Lee, Sumi;Joe, Jaechoon;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.368-372
    • /
    • 2019
  • 맞춤법 교정이란 주어진 문장에서 나타나는 철자 및 맞춤법 오류들을 올바르게 교정하는 것을 뜻하며 맞춤법 교정 시스템이란 컴퓨터가 이를 자동으로 수행하는 것을 의미한다. 본 논문에서는 맞춤법 교정을 기계번역의 관점으로 바라보고 문제를 해결하였다. 소스문장에 맞춤법 오류문장, 타겟 문장에 올바른 문장을 넣어 학습시키는 방법을 제안한다. 본 논문에서는 단일 말뭉치로 한국어 맞춤법 병렬 말뭉치를 구성하는 방법을 제안하며 G2P(Grapheme to Phoneme)를 이용한 오류 데이터 생성, 자모 단위 철자 오류데이터 생성, 통번역 데이터 기반 오류 데이터 생성 크게 3가지 방법론을 이용하여 맞춤법 오류데이터를 생성하는 방법론을 제안한다. 실험결과 GLEU 점수 65.98의 성능을 보였으며 44.68, 39.55의 성능을 보인 상용화 시스템보다 우수한 성능을 보였다.

  • PDF

Study on Making Chunking Dataset for Keyword Extraction and its Improvement Methods (키워드 추출용 구묶음 데이터 구축 및 개선 방법 연구)

  • Lee, Minho;Choi, Maengsik;Kim, Jeongah;Lee, Chunghee;Kim, Bohui;Oh, Hyo-Jung;Lee, Yeonsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.512-517
    • /
    • 2020
  • 구묶음은 문장을 겹치지 않는 문장 구성 성분으로 나누는 과정으로, 구묶음 방법에 따라 구문분석, 관계 추출 등 다양한 하위 태스크에 사용할 수 있다. 본 논문에서는 문장의 키워드를 추출하기 위한 구묶음 방식을 제안하고, 키워드 단위 구묶음 데이터를 구축하기 위한 가이드라인을 제작하였다. 해당 가이드라인을 적용하여 구축한 데이터와 BERT 기반의 모델을 이용하여 학습 및 평가를 통해 구축된 데이터의 품질을 측정하여 78점의 F1점수를 얻었다. 이후 패턴 통일, 형태소 표시 여부 등 다양한 개선 방법의 적용 및 재실험을 통해 가이드라인의 개선 방향을 제시한다.

  • PDF

Policy-based performance comparison study of Real-time Simultaneous Translation (실시간 동시통번역의 정책기반 성능 비교 연구)

  • Lee, Jungseob;Moon, Hyeonseok;Park, Chanjun;Seo, Jaehyung;Eo, Sugyeong;Lee, Seungjun;Koo, Seonmin;Lim, Heuiseok
    • Journal of the Korea Convergence Society
    • /
    • v.13 no.3
    • /
    • pp.43-54
    • /
    • 2022
  • Simultaneous translation is online decoding to translates with only subsentence. The goal of simultaneous translation research is to improve translation performance against delay. For this reason, most studies find trade-off performance between delays. We studied the experiments of the fixed policy-based simultaneous translation in Korean. Our experiments suggest that Korean tokenization causes many fragments, resulting in delay compared to other languages. We suggest follow-up studies such as n-gram tokenization to solve the problems.

Artikel, Impersonalien und die $Reflexivit\"{a}t$ aus der Grammatikalisierungsperspektive: Ein Vergleich des Deutschen und des Koreanischen (문법화의 관점에서 본 한$\cdot$독 관사, 비인칭구문, 재귀동사 구문)

  • Song Kyung-An
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.5
    • /
    • pp.23-51
    • /
    • 2002
  • 이 글은 문법화의 관점에서 관사, 비인칭구문, 재귀동사 구문을 독일어와 우리말을 중심으로 비교하였다. 우리말의 경우 관사의 범주가 아직 문법 화하지는 않았지만 수사 '하나/한'은 서양 언어에 못지 않게 다양한 문법적 기능으로 발전하였다. 독일어의 정관사나 대명사에 해당되는 요소는 우리말에서 자주 생략된다. 비인칭구문도 유럽언어의 특징인데 독일어의 경우 이는 지시대명사에서 문법 화한 것이다. 우리말의 경우 비인칭구문은 문법 화하지 않았으며 이를 위해 우리말은 주어생략 통 다른 문법적 기재들을 사용한다. 독일어에는 또 재귀구문이 잘 발달되어 있는데 우리말은 재귀구문이 그렇게 다양하게 문법 화되지 않았다 한편 우리말의 재귀사는 다양한 지시적 기능을 발전시켰다. 즉 이들은 순수하게 재귀적으로 쓰이는 경우 이외에 문장 내적 혹은 문장 외적 지시사로 사용되고 있으며 부분적으로 독일어의 man과 같은 부정대명사의 기능도 가지고 있다.

  • PDF

UniWeb 2.0 - A Web-based Client-Server Database Application Development Environment (UniWeb 2.0 - 웹을 이용한 클라이언트-서버 데이타베이스 응용 개발 환경)

  • 김평철
    • The Journal of Information Technology and Database
    • /
    • v.3 no.2
    • /
    • pp.119-132
    • /
    • 1996
  • 웹을 이용한 클라이언트-서버 데이타베이스 시스템은 웹의 서비스 능력과 데이타베이스 시스템의 데이타 관리 기능을 상호 보완적으로 통합함으로써 인터넷과 같은 대규모 환경에서 데이타베이스 업무 환경을 구축하는 데 매우 적합한 것으로 알려져 있다. 데이타베이스 통로는 이러한 통합의 가장 핵심적 구성 요소이다. 본 논문에서는 먼저 클라이언트-서버 데이타베이스 응용을 위한 데이타베이스 통로의 고려사항으로서, 고성능 실행구조, 응용 프로그램 개발 환경, 그리고 상태 및 트랜잭션 관리에 대해 기술하고, 이어서 UniSQL/X용 데이타베이스 통로인 UniWeb 2.0의 설계와 구현에 대하여 소개한다. UniWeb 2.0은 CGI 응용 서버 방식을 채택하여 다양한 플랫폼을 지원하고, 고성능 그리고 확장성을 제공한다. 또한 프로그래머가 HTML 문서에 SQL/X문장이 포함된 Tcl 스크립트를 끼워 넣을 수 있도록 하여 응용 프로그램 개발 생산성을 향상시키고 있다. UniWeb 2.0은 여러 웹 페이지에 걸친 상태 와 트랜잭션을 지원하고 있다.

  • PDF

Building Test Codes for Unit Test Automation of Java Programs (단위 테스트 자동화를 위한 자바 프로그램 테스트 코드 구축)

  • Yoon, Hoijin
    • Journal of Software Engineering Society
    • /
    • v.23 no.4
    • /
    • pp.141-149
    • /
    • 2010
  • Agile development is mentioned a lot by developers these days. XP or Scrum is one of the popular development processes, and it says that unit test automation would drive an agile development successful. The success of unit test automation depends on how well to compare an execution result to its own expected result. that is why this paper focuses on the comparison part. This paper introduces how to build test codes for unit testing, and then concludes with mentioning two considerations of unit testing automation. First, test codes for void-typed methods need Mock Framework to monitor their behavior. Second, the comparison of execution results and expected results is hard to implement in case of testing void-typed methods. We check every sentences of a test path to decide if the testing is fail or pass.

  • PDF

Drought Frequency Analysis using Monthly Rainfall for Low Flow Management (갈수관리 활용을 위한 월강수량 가뭄빈도분석)

  • Moon, Jang-Won;Kim, Jeong-Yup;Cho, Hyo-Seob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.415-415
    • /
    • 2018
  • 갈수관리를 효과적으로 수행하기 위해서는 하천유량을 예측할 수 있는 방안을 마련하는 것이 중요하다. 하천유량 예측을 위해서는 강수량에 대한 예측 값을 활용하는 방안이 가장 적합하다고 할 수 있으나 강수량 예측에 대한 불확실성은 하천유량 예측의 정확도 확보에 있어 한계로 작용하고 있다. 강수량 예측에 대한 불확실성 극복을 위해서는 다양한 강수 시나리오를 설정하여 활용하는 방안을 검토할 수 있으며, 유량 예측을 하고자 하는 유역에 대해 과거 발생했던 강수량이 반복된다는 가정 하에 유량 예측을 제한적으로 수행하고 있는 상황이다. 이와 함께 강수 시나리오의 다양성 확보 차원에서 하천유량을 예측하고자 하는 유역에 대해 가뭄빈도 강수량을 사전에 산정한 후 유량 예측 과정에 활용하는 방안도 고려해볼 수 있는 방안이다. 이에 본 연구에서는 2016년 수립된 수자원장기종합계획(국토교통부, 2016)에서 제시된 중 권역별 일 강수량 자료를 이용하여 중권역별로 월 강수량을 산정한 후 월별 가뭄빈도분석을 수행하였다. 1966~2015년까지의 기간에 대한 월 강수량 자료를 이용하여 월별로 가뭄빈도분석을 수행하였으며, 빈도분석 방법으로는 확률가중모멘트법을 이용하여 적정 분포형 결정 및 갈수빈도별 강수량을 산정하여 제시하였다. 이때 빈도 강수량의 재현기간은 총 7가지 빈도(2년, 5년, 10년, 20년, 50년, 80년, 100년)를 고려하였다. 산정된 빈도 강수량을 이용하여 월 유출모형에 적용함으로써 월 유출 전망 자료 생산이 가능하며, 금강수계의 용담댐유역에 시범 적용하여 그 결과를 검토하였다. 검토 결과, 중권역별로 산정된 월별 가뭄빈도 강수량을 활용한 하천유량 예측 방법은 갈수예보에 있어 유용한 정보를 제공할 수 있을 것으로 판단된다.

  • PDF

Using similarity based image caption to aid visual question answering (유사도 기반 이미지 캡션을 이용한 시각질의응답 연구)

  • Kang, Joonseo;Lim, Changwon
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.191-204
    • /
    • 2021
  • Visual Question Answering (VQA) and image captioning are tasks that require understanding of the features of images and linguistic features of text. Therefore, co-attention may be the key to both tasks, which can connect image and text. In this paper, we propose a model to achieve high performance for VQA by image caption generated using a pretrained standard transformer model based on MSCOCO dataset. Captions unrelated to the question can rather interfere with answering, so some captions similar to the question were selected to use based on a similarity to the question. In addition, stopwords in the caption could not affect or interfere with answering, so the experiment was conducted after removing stopwords. Experiments were conducted on VQA-v2 data to compare the proposed model with the deep modular co-attention network (MCAN) model, which showed good performance by using co-attention between images and text. As a result, the proposed model outperformed the MCAN model.