• 제목/요약/키워드: word length

검색결과 230건 처리시간 0.027초

종단 간 심층 신경망을 이용한 한국어 문장 자동 띄어쓰기 (Automatic Word Spacing of the Korean Sentences by Using End-to-End Deep Neural Network)

  • 이현영;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권11호
    • /
    • pp.441-448
    • /
    • 2019
  • 기존의 자동 띄어쓰기 연구는 n-gram 기반의 통계적인 기법을 이용하거나 형태소 분석기를 이용하여 어절 경계면에 공백을 삽입하는 방법으로 띄어쓰기 오류를 수정한다. 본 논문에서는 심층 신경망을 이용한 종단 간(end-to-end) 한국어 문장 자동 띄어쓰기 시스템을 제안한다. 자동 띄어쓰기 문제를 어절 단위가 아닌 음절 단위 태그 분류 문제로 정의하고 음절 unigram 임베딩과 양방향 LSTM Encoder로 문장 음절간의 양방향 의존 관계 정보를 고정된 길이의 문맥 자질 벡터로 연속적인 벡터 공간에 표현한다. 그리고 새로이 표현한 문맥 자질 벡터를 자동 띄어쓰기 태그(B 또는 I)로 분류한 후 B 태그 앞에 공백을 삽입하는 방법으로 한국어 문장의 자동 띄어쓰기를 수행하였다. 자동 띄어쓰기 태그 분류를 위해 전방향 신경망, 신경망 언어 모델, 그리고 선형 체인 CRF의 세 가지 방법의 분류 망에 따라 세 가지 심층 신경망 모델을 구성하고 종단 간 한국어 자동 띄어쓰기 시스템의 성능을 비교하였다. 세 가지 심층 신경망 모델에서 분류 망으로 선형체인 CRF를 이용한 심층 신경망 모델이 더 우수함을 보였다. 학습 및 테스트 말뭉치로는 최근에 구축된 대용량 한국어 원시 말뭉치로 KCC150을 사용하였다.

수학 문장제의 문장 구조와 해석상의 오류 분석 -초등학교 2학년을 중심으로- (An Analysis on Sentence Structures and Interpretation Errors in Word Problems in Mathematics -Focussing on the 2nd grade elementary students-)

  • 이병옥;안병곤
    • 한국초등수학교육학회지
    • /
    • 제12권2호
    • /
    • pp.185-204
    • /
    • 2008
  • 본 연구에서는 초등학교 2학년 수학 교과서에 제시된 문장제의 문장 구조와 해석상의 오류를 분석하고, 문장 구조가 해석상의 오류에 어떻게 관여하는지를 알아보았다. 이를 위해 초등학교 2학년 수학 교과서에 제시된 문장제 168문항의 문장 구조와 초등학교 2학년 160명의 학생을 대상으로 수학 문장제 해결과정에서의 오류경향을 분석한 결과, 문장제의 문장 구조는 쉽고 단순한 낱말이나 어휘를 반복적으로 사용하고 있으며, 과일이나 책, 사람 수 등의 특정한 실생활 소재를 반복적으로 많이 사용되고 있었다. 문장제의 오류 경향은 문장 해석상의 오류가 전체 오류의 51.56%로 계산상의 오류 39.20%보다 높았다. 이는 역연산(逆演算) 유형, 문장의 길이, 문제에 사용된 숫자의 개수 등이 해석상의 오류에 관여하는 것으로 분석되었다. 따라서 문장제의 문장을 구성할 때 교사의 관점에서 벗어나 학생들의 입장을 고려하는 것이 매우 중요하며, 학생들에게 기초적인 문장 해석 지도가 필요하다는 것을 알 수 있었다.

  • PDF

월경주기의 길이와 규칙성에 영향을 주는 요인에 관한 연구 (A Preliminary Survey of Factors Affect Menstrual Cycle Length and Regularity)

  • 김윤상;임은미
    • 대한한방부인과학회지
    • /
    • 제24권3호
    • /
    • pp.73-84
    • /
    • 2011
  • Objectives: This study examined the recent update of factors affect length and regularity of menstrual cycle and symptoms need for diagnosis in oriental medicine. Methods: For factors, we searched the key word "menstrual cycle length and factor" in ScienceDirect(http://www.sciencedirect.com) and we mainly searched symptoms in the journal of oriental obstetrics & gynecology and text. Results: The result are shown in the Table 1-3. Conclusion: In fact as the fluctuation of menstrual cycle length and regularity is very high in healthy women, we must observe the factor affect menstrual cycle with attention even though rule out disease, operation and HRT etc. these researches show potential to compound oriental medicine care and factor of menstrual cycle change.

A NEW UPPER BOUND FOR SINGLE ERROR-CORRECTING CODES

  • Kim, Jun-Kyo
    • 대한수학회보
    • /
    • 제38권4호
    • /
    • pp.797-801
    • /
    • 2001
  • The purpose of this paper is to give an upper bound for A[n,4], the maximum number of codewords in a binary code of word length n with minimum distance 4 between codewords. We have improved upper bound for A[12k+11,4]. In this correspondence we prove $A[23,4]\leq173716$.

  • PDF

어린이 글 읽기에서 나타나는 안구 운동의 특징 (The characteristics of eye-movement during children read Korean texts)

  • 고성룡;윤소정;민철홍;최경순;고선희;황민아
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.481-503
    • /
    • 2010
  • 이 연구는 초등학교 3학년 아동들이 나이에 알맞은 동화와 설명글을 읽을 때 보이는 안구 운동의 전반 특징과 낱말/어절 수준에 따른 특징을 우리글에서 처음으로 알아보았다. 아동들은 동화를 읽을 때 어절을 대략 213ms 동안 보다가 글 방향으로 3.6자 눈을 움직였고, 설명문을 읽을 때는 214ms 동안 보다가 글 방향으로 3.3자 정도 눈을 움직였다. 동화와 설명글 모두에서 앞으로 가서 다시 읽는 눈 움직임은 전체의 약 31%정도를 차지했다. 이런 전반 양상과 더불어, 어절 수준에서 어절 길이, 낱말빈도, 착지점 효과를 살펴보았는데, 아이들은 동화와 설명 글 모두에서 긴 어절을 짧은 어절보다 오래 주시하였고, 성인 독자와 마찬가지로 눈을 어절 가운데 근처에 착지하려는 경향성을 보였다. 또한 반복되지 않은 어절들을 분석했을 때 설명글에서 빈도가 낮은 어절들은 길이에 따른 주시시간이 차이를 크게 보였고 빈도가 높은 어절들은 길이에 따른 차이를 거의 보이지 않았다.

  • PDF

관계기간과 몰입의 역할에 관한 연구 : 이동통신산업을 중심으로 (The Effect of the Length of Relationship and Commitment in the Context of Mobile Telecommunication Industry)

  • 방정혜;설진영;김민선;이은형
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제21권1호
    • /
    • pp.47-68
    • /
    • 2012
  • The purpose of this study is to investigate two components of commitment(affective commitment and calculative commitment) and relational equity on loyalty. In addition, The authors analyzed the moderating effect of length of relationship on the effects of commitments and relational equity on switching intention. Major findings can be summarized as follows. It was found that affective commitment made a negative impact on switching intentions and a positive impact on w-o-m. Calculative commitment had no effect on switching intention and w-o-m while it made a negative effect on w-o-m in handset side only. Relational equity appears to bolster a negative effect on switching intention and a positive effect on w-o-m. Also length of relationship seems to moderate the effect of relational equity on switching intention.

FIR ADM 디지털 필터의 성능 해석 및 설계 (Performance Analysis and Design of Fir ADM Digital Filters)

  • 선우종성;은종관
    • 대한전자공학회논문지
    • /
    • 제19권4호
    • /
    • pp.38-48
    • /
    • 1982
  • 본 논문에서는 적응 델타 변조기 (ADM)를 A/D 변환기로 사용하는 FIR ADM 디지탈 필터의 성능과 구현 방법을 연구하였다. 이 필터는 지금까지 사용되는 PCM 필터와는 달리 승산이 필요 없을 뿐만 아니라 또한 저전력 소모, 크기 및 가격면 등에서 여러 가지 장점이 있다. 필터의 성능 해석을 위하여 필터의 mean-squared error의 식과 원하는 성능을 갖기 위한 필터의 word Length의 식을 유도하였고 이를 computer simulation에 의해서 입증하였다. 또한 디지탈 필터의 성능을 최적화 하기 위해서 parameter값들을 simulation에 의해서 최적화 하였다. 마지막으로 단일 및 다수의 신호를 동시에 처리할 수 있는 FIR ADM 디지탈 필터의 설계에 관해서 고찰하였다.

  • PDF

중국유학생의 거주기간에 따른 한국음식 확산 (Adoption Process of Chinese Students to Korean Food Based on Residence periods)

  • 한경수;민지은
    • 한국식생활문화학회지
    • /
    • 제34권4호
    • /
    • pp.411-423
    • /
    • 2019
  • This study conducted qualitative research through in-depth interviews on the diffusion process of Korean food in accordance with the length of residence of Chinese students in Korea. As the analysis method, the qualitative analysis method such as NVivo12.0 was used, and the analysis was performed through word frequency, word cloud, and coding matrix. The images of taste of Korean food were revealed as 'Spicy', 'Sweet', and 'Light taste' by both short-term Chinese residents and long-term Chinese residents. The long-term Chinese residents showed their dissatisfaction with the institutional food, and they also pointed out the importance of the matter of cooking for quick adaptation to life in Korea. The long-term Chinese residents also thought of Korean food as 'High-fiber food', and this was influenced by the 'Less-oil' cooking method of Korean food, which is different from the cooking method of Chinese food. The length of residence was used as a main variable of this study, and it was one of the factors having positive effects on the diffusion of Korean food and acculturation. It would be difficult to generalize the results because this study used the convenience sampling method and snowball sampling.

순환 신경망에서 LSTM 블록을 사용한 영어와 한국어의 시편 생성기 비교 (Psalm Text Generator Comparison Between English and Korean Using LSTM Blocks in a Recurrent Neural Network)

  • 에런 스노버거;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.269-271
    • /
    • 2022
  • 최근 몇 년 동안 LSTM 블록이 있는 RNN 네트워크는 순차적 데이터를 처리하는 기계 학습 작업에 광범위하게 사용되어왔다. 이러한 네트워크는 주어진 시퀀스에서 가능성이 다음으로 가장 높은 단어를 기존 신경망보다 더 정확하게 예측할 수 있기 때문에 순차적 언어 처리 작업에서 특히 우수한 것으로 입증되었다. 이 연구는 영어와 한국어로 된 150개의 성경 시편에 대한 세 가지 다른 번역에 대해 RNN/LSTM 신경망을 훈련하였다. 그런 다음 결과 모델에 입력 단어와 길이 번호를 제공하여 훈련 중에 인식한 패턴을 기반으로 원하는 길이의 새 시편을 자동으로 생성하였다. 영어 텍스트와 한국어 텍스트에 대한 네트워크 훈련 결과를 상호 비교하고 개선할 점을 기술한다.

  • PDF

대용량 전자사전 구축을 위한 국어 대사전의 통계 정보 (Statistical Information of Korean Dictionary to Construct an Enormous Electronic Dictionary)

  • 김철수;김양범
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.60-68
    • /
    • 2007
  • 언어 정보 처리 응용 분야는 정보검색, 형태소분석, 철자검색, 음성인식, 문자 인식 등 다양하다. 이러한 정보처리 과정은 전자 사전이 필수적이다. 본 논문에서는 국어대사전에 대한 기본적인 통계 정보들을 살펴보고, 전자사전 구축에 대하여 알아보았다. 대상 정보는 고어 및 불완전음절을 포함하는 단어를 제외한 표제어들에 대하여, 대사전의 표제어수, 전자사전의 엔트리수, 사용된 전체음절수, 서로 다른 음절수, 엔트리들의 평균 길이, 품사별 분포, 전자사전을 트라이로 구축할 때 사용되는 노드 수 등 이다. 전자사전의 전체 엔트리 수는 361,980개, 사용된 음절수는 1,289,659개로 엔트리들의 평균 길이는 3.56이었으며 서로 다른 음절수는 2,463개였다. 이러한 통계 정보들은 전자사전 구축 및 한국어 정보처리에 도움이 될 것이다.