• 제목/요약/키워드: 글자 빈도수

검색결과 38건 처리시간 0.024초

한글 부호의 최적화 전송을 위한 한국어 낱자 분석 (An Analysis on the Korean Language for Optimum Transmission of Hangul Code)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.33-38
    • /
    • 2015
  • 본 논문은 한글부호의 전송을 최적화하는데 요구되는 한글낱자를 연구하였다. 한글낱자는 한국어를 구성하고 있는 한글을 토대로 하여 분석하였다. 한글낱자의 분석은 세가지 유형을 대상으로 하여 수행하였다. 첫번째 대상은 한글맞춤법 통일안의 24개 낱자이었다. 두번째 대상은 표준 두벌식 글자판의 낱자 28개이었다. 세 번째 대상은 한글맞춤법 통일안에 겹낱자를 포함한 총 54개 낱자이었다. 이 세가지 분석대상별로 각 낱자에 대한 사용빈도를 분석하였다. 국립국어원의 한국어자료에 수록된 총 한국어 단어는 총58,437개인데, 단어들은 총 1,540자의 글자로 구성되어 있다. 이 한글들을 분석한 결과, 사용빈도수를 보면, 첫 번째 대상의 경우, 닿소리는 "ㅇ"이 가장 많고 "ㅋ"이 가장 적었으며 홑소리는 "ㅏ"가 가장 많고 "ㅑ"가 가장 적었다. 두 번째 대상의 경우, 닿소리는 첫 번째 대상과 같고 홑소리는 "ㅏ"가 가장 많고 "ㅒ"가 가장 적었다. 세 번째 대상의 경우, 닿소리는 "ㄱ"이 가장 많고 "ㄽ"이 가장 적었으며 홑소리는 "ㅏ"가 가장 많고 "ㅞ"가 가장 적었다.

한국농수산대학 졸업생 영농정착 성공 사례집의 Text Mining - 주요단어의 빈도 분석 및 word cloud - (Text Mining of Successful Casebook of Agricultural Settlement in Graduates of Korea National College of Agriculture and Fisheries - Frequency Analysis and Word Cloud of Key Words -)

  • 주진수;김종숙;박석영;송천영
    • 현장농수산연구지
    • /
    • 제20권2호
    • /
    • pp.57-72
    • /
    • 2018
  • 본 연구는 한농대에서 발간하는 청년 농어업인들의 우수한 영어·영농 정착사례에서 의미 있는 정보를 추출하고자 프로그램 R의 Text mining으로 주요단어를 추출하고 시각화를 위하여 word cloud를 작성하였다. 먼저 전체 표본에 대한 text mining 결과에서는 '대표', '이사', '생각', '자신', '시작', '마음', '노력' 등이 상위 50개 핵심 단어 가운데 빈도수가 높게 나타난 단어들이다. 이는 젊은 농부들이 회사의 경영주가 되기 위해서거나 또는 경영주로서 그들 스스로 생각하고 판단하고 추진하는 능력을 갖추고 있음을 표현이며 자기의 꿈을 버리지 않고 스스로 꿈꾸는 일을 헤쳐 나가는 모습의 표현이라 할 수 있다. '아버지', '부친' 및 '부모님' 등의 단어 빈도수가 높은 것은 부모협농과 승계농의 비율이 높은 경영형태의 영향이라 할 수 있으며, '한국농수산대학', '대학', '졸업', '공부' 등의 단어는 이들의 높은 교육의식을 나타낸 결과이며, '유기농'과 '친환경' 의 단어는 우수사례자들의 친환경 농업에 대한 관심도를 나타낸 결과라 할 수 있다. 또한 '판매', '체험' 등의 6차산업 관련어는 농어업·농어촌을 활성화시키기 위한 이들의 노력을 나타내는 결과라 할 수 있다. 한편 '인터넷', '블로그', '온라인', '홈페이지', 'SNS', 'ICT', '융복합' 및 '스마트' 등의 단어들은 비록 상위 50위 안에는 없었으나 이들 단어들이 빠지지 않고 추출된 결과는 영어·영농의 과학화·첨단화에 청년농부들의 관심이 높아지고 있음을 알 수 있었다. 다음으로 품목별 샘플에 대하여 빈도수가 상위 50위 이내인 주요단어를 그룹화 한 결과로서 축산, 채소 및 수산은 '시설', 식량작물은 '장비', '기계' 등의 빈도수가 높게 나타냈다. '친환경'은 채소작물과 식량작물에서 나타났으며, '유기농'은 채소, 식량작물, 과수에서 나타났다. 식량작물에서는 '우렁이'가 추출되었으며, 우수농수산물을 의미하는 '인증'은 수산에서만 나타났다. '6차산업' 관련단어로 '생산'은 모든 계열, '가공', '유통'은 과수, '체험'은 채소, 식량작물 및 과수에서 나타났다. 그리고 텍스트 마이닝으로 추출한 단어를 시각화하기 위하여 전체 샘플과 각 품목별로 word cloud를 작성하여 구조화되지 않은 비정형 텍스트인 우수사례들이 내포하고 있는 의미를 글자의 크기로 알 수 있도록 나타냈다.

영화 <데드풀>에 나타난 풍자유머 번역양상 (The Trend of English-Korean Translational Strategy in Satire - Focusing on the movie, )

  • 오정민;김순영
    • 한국융합학회논문지
    • /
    • 제9권6호
    • /
    • pp.217-224
    • /
    • 2018
  • 본 연구의 목적은 2016년 개봉된 영화 <데드풀>의 유머 중 풍자유머의 번역특성을 분석, 고찰하는 것이다. 풍자유머는 말하고자 하는 무엇을 다른 것에 빗대어 재치 있는 웃음을 유발하는 문학적 기교이므로 이를 번역한다는 것은 번역가에게 큰 난관이 아닐 수 없다. 이에 본고는 영화 속 유머번역을 확인, 검토하고 각각의 유머범주에서 풍자유머를 분리하여 분석방법에서 제시한 4가지 기본전략을 바탕으로 풍자유머의 빈도수와 그에 따른 양상을 배경으로 현대 풍자유머의 번역트렌드를 고찰해 보았다. 연구 결과 대부분의 풍자유머는 대부분 글자그대로 (Literal Translation) 번역되었으며, 이와 다른 전략을 사용했다하더라도 출발텍스트(ST)를 보존하고자 하는 경향이 두드러진 것으로 나타났다. 본 연구의 결과는 향후 사회, 문화, 정치 등의 융합적 관점에서 효과적인 풍자번역 전략을 도출해내는데 있어 기본 자료가 될 것으로 기대된다.

회선부호의 스크램블링을 고려한 새로운 한국표준 한글글자마디부호에 관한 연구 (Considering the scrambling code of the line Study on the New Korea joint protection Standard Hangul character)

  • 박요셉;홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.1345-1354
    • /
    • 2015
  • 본 논문은 정보통신용 표준 부호인(정보 교환용 부호계 $KS{\times}1001$ : 2004)에 정의되어 있는 한글낱자 부호집합에 대하여, Date link 계층에서 AMI/HDB-3 스크램블링 측면에서 효율적인 데이터 전송을 위한 새로운 부호집합 체계를 제시하였다. 기존 부호집합 체계와 상호비교를 위하여 ($4{\times}4$) 비트 원천부호화 규칙과 한글 빈도통계 (국립국어원)를 적용한 결과 약44 %의 데이터 전송 효율이 개선시킬 수 있음을 나타났다.

ART2 기반 자가 생성 지도 학습 알고리즘을 이용한 컨테이너 인식 시스템 (Container Image Recognition using ART2-based Self-Organizing Supervised Learning Algorithm)

  • 정병희;김재용;조재현;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.393-398
    • /
    • 2005
  • 본 논문에서는 ART2 기반 자가 생성 지도 학습 알고리즘을 이용한 운송 컨테이너 식별자 인식 시스템을 제안한다. 일반적으로 운송 컨테이너의 식별자들은 글자의 색이 검정색 또는 흰색으로 이루어져 있는 특징이 있다. 이러한 특성을 고려하여 원 컨테이너 영상에 대해 검은색과 흰색을 제외한 모든 부분을 잡음으로 처리하기 위해 퍼지를 이용한 잡은 판단 방법을 적용하여 식별자 영역과 잡음을 구별한다. 식별자 영역을 제외한 잡음 영역을 전체 영상의 평균 픽셀값으로 대체시킨다. 그리고 Sobel 마스크를 이용하여 에지를 검출하고, 추출된 에지를 이용하여 수직 블록과 수평 블록을 검출하여 컨테이너의 식별자 영역을 추출하고 이진화한다. 이진화된 식별자 영역에 대해 검정색의 빈도수를 이용하여 흰바탕과 민바탕을 구분하고 8방향 윤곽선 추적 알고리즘을 적용하여 개별 식별자를 추출한다. 개별 식별자 인식을 위해 ART2 기반 자가 생성 지도 학습 알고리즘은 입력층과 은닉층 사이에 ART2를 적용하여 은닉층의 노드를 생성하고, 은닉층과 출력층 사이에 일반화된 델타 학습 방법과 Delta-bar-Delta 알고리즘을 적용하여 학습 성능을 개선한다. 실제 컨테이너 영상을 대상으로 실험한 결과, 기존의 식별자 추출 방법보다 제안된 식별자 추출 방법이 개선되었다. 그리고 기존의 식별자 인식 알고리즘보다 제안된 ART2 기반 자가 생성 지도 학습 알고리즘이 식별자의 학습 및 인식에 있어서 우수한 성능이 있음을 확인하였다.

  • PDF

한글에 대한 필적분석과 성격유형과의 관계성에 대한 연구 (A study on the graphology in Korean based on relationship with personality types)

  • 한상덕;한승희;정양권
    • 한국전자통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.703-711
    • /
    • 2013
  • 외국의 경우에는 개인의 필적을 통해 그 사람의 성격 등 개인정보를 파악하려는 노력이 수십 년간 지속되어 왔으나, 국내에는 한글을 대상으로 하는 필적학 연구가 거의 전무한 형편이다. 물론 필적감정 분야에 있어 개인의 필적 특성을 근거로 본인 여부를 확인하고 있지만 필적감정 전문가의 개인 능력과 판단에 주로 의존하고 있다. 이에 외국에서 필상학, 필체학, 필적학이라고 칭하는 필적학(Graphology)에 대한 학문적 접근이 한글에도 필요한 시점이다. 따라서 본 연구에서는 총 339명의 성인남녀를 대상으로 5요인 기법에 의한 성격진단 실험과 글자크기, 기울기 등 개인의 고유 필기습관이 나타난 시필(試筆)을 확보하여 빈도분석, 차이검정, 교차분석, 요인분석, 상관분석, 회귀분석 등을 실시하였다. 이때 성격진단을 위해 활용한 5요인 기법의 설문문항에 대한 요인분석 결과는 신뢰도가 매우 높았으며 이를 개인의 성격으로 채택하였다. 교차분석에서는 성별과 글자크기, 고향과 여백, 직업과 습관 등 일부 항목간에 차이를 확인할 수 있었으며, 소요시간과 5요인 성격 그리고 장당 줄수와의 관계를 알아보기 위하여 실시한 상관분석의 경우에는 5요인 성격간에 높은 상관관계가 나타났다. 선형회귀분석의 경우에도 적합도가 매우 높게 나타났으며, 이외에도 글씨정보와 5요인 성격을 비교분석하여 다양한 상관관계를 확인할 수 있었다. 물론 영어에 대한 필적학 이론도 해석하는 주체마다 다르고 한글은 구조적인 측면에서 영어와는 확연하게 다르기에 양 언어간의 필적학 이론을 맞비교하는 것은 어렵고 불가능한 일이다. 하지만 한글에 대한 필적학 이론 마련이 전무한 상태에서 기초적인 이론 정립을 위해 다양한 실험과 분석을 시도하는 것은 현 단계에서 매우 중요한 의미를 가진다.

제한된 한글 입력환경을 위한 음소기반 근사 문자열 검색 시스템 (A Phoneme-based Approximate String Searching System for Restricted Korean Character Input Environments)

  • 윤태진;조환규;정우근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권10호
    • /
    • pp.788-801
    • /
    • 2010
  • 모바일 기기가 발전함에 따라 입력 수단에 대한 연구는 중요한 이슈이다 키패드, 쿼티키패드, 터치, 음성인식 등 다양한 입력장치가 사용되고 있으나 아직 데스크톱 입력장치에 비해 편의성이 떨어져서 입력 시의 오타나 탈자 등의 오류가 포함되는 경우가 많다. 이러한 입력 오류는 문자 메시지 등 사람과의 의사소통에는 문제를 일으키지 않으나 사전, 주소록 등의 데이터베이스 검색에는 치명적인 오류로서 원하는 검색 결과를 얻지 못하게 된다. 특히 한글의 경우 자음과 모음의 조합을 통해 글자를 생성하는 특성상 1만자가 넘는 글자의 조합이 가능하여 영문에 비하여 오류의 빈도가 높다. 기존의 검색 시스템은 Suffix Tree등을 이용하여 입력 오류를 처리하지만 다양한 오류에 대응하기에는 한계가 있다. 본 논문에서는 오자, 탈자 등의 입력 오류를 허용하면서 빠른 검색이 가능한 근사 한글 단어 검색 시스템을 제안하고자 한다. 이 시스템은 기존의 알파벳에 적용된 근사 문자열 검색(Approximate String Searching)을 한글에 효과적으로 적용할 수 있는 여러 가지 알고리즘과 기법이 포함되어 있다. 그리고 제안된 시스템을 이용한 변형 욕설 필터링 시스템의 개발에 대해 이야기하고자 한다. 이 시스템은 유저의 각종 변형 욕설 입력에 대해 90% 이상의 필터링 성능을 보였다.

한글 단어 재인에 영향을 미치는 변인: 음절 형태를 중심으로 (Variables affecting Korean word recognition: focusing on syllable shape)

  • 민수영;이창환
    • 인지과학
    • /
    • 제29권4호
    • /
    • pp.193-220
    • /
    • 2018
  • 시각 단어 재인에 영향을 미치는 변인으로는 단어 빈도, 단어 길이, 이웃단어, 단어 형태 등이 밝혀진 바 있다. 단어 형태 변인은 한글이 영어와는 글자 체계가 다르기 때문에 형태 정보가 단어 처리에 다른 방식으로 영향을 미칠 수 있다. 본 연구는 게스탈트의 연속성 원리를 한글에 적용하여 한글 단어의 처리 단위를 알아보고, 음절 형태가 한글 단어 재인에 영향을 미치는지 검증하고자 하였다. 실험 1에서는 3음절 단어를 사용하여 음절 유형(평소 읽기방향이 연속성 원리에 부합하는 '가로집자'형(예: "가"), 부합하지 않는 '세로집자'형(예: "고")과 글자 제시 방향(가로, 세로)을 조작하였다. 어휘 판단 시간의 분석 결과, 제시 방향에 상관없이 '가로집자'형의 처리 속도가 '세로집자'형보다 빨랐다. 실험 2에서는 차폐 점화를 사용하여 음절유형('가로집자'와 '세로집자'형) 및 점화 자극과 목표 자극의 시각적 관계(동일, 유사, 상이)를 조작하였다. 점화자극과 목표자극의 음절집자 형태에 따라서 수행에 차이가 있었으며 이는 음절 형태가 단어 재인에 미친다는 것을 시사한다.

한글 문자 인식에서의 오인식 문자 교정을 위한 단어 학습과 오류 형태에 관한 연구 (A Study on Word Learning and Error Type for Character Correction in Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1273-1280
    • /
    • 1996
  • 본 논문에서는 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들 을 언어적 지식을 이용하여 교정하는 문자 인식 후처리에 관하여 논한다. 문자 인식의 오인식 교정시스템의 경우 후보 단어가 많을 때 많은 후보 단어중에서 가장 적당한 단어를 후보 단어로 올려주기 위해서는 여러 가지 정보가 필요하다. 본 논문에서는 이러한 정보로 이용할 수 있는 것으로 단어들의 특성과, 문자 인식에 발생하는 오인식 형태, 단어 학습에 관하여 논한다. 이를 위한 실험으로 15 만여의 단어가 수록된 국어 사전을 이비력하고 초중고 국어교과서에 나타난 단어 들의 사용빈도를 조사하여 국어 사전에 등록된 단어 중에서 10.7%정도가 실제 초중고 국어교과서에 사용되고 있다는 것을 알 수 있었다. 또한 실제 문자 인식 시스템들을 가지고 여러 문서를 입력하고 인식하여 오인식이 자주 일어나는 글자들 의 형태를 분류하여 보았다. 그리고 한국어 처리 관련 서적이나 논문을 처리하고자 한국어에 관련된 책의 찾아보기에 나타난 단어 를 학습시켜 후보 단어들의 다른 인하여 정확한 단어를 예측하기 힘들던 문제를 해결 하고자 하였다.

  • PDF

자가 생성 지도 학습 알고리즘을 이용한 컨테이너 식별자 인식

  • 김재용;박충식;김광백
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 공동추계학술대회
    • /
    • pp.500-506
    • /
    • 2005
  • 본 논문에서는 자가 생성 지도 학습 알고리즘을 이용한 운송 컨테이너 식별자 인식 시스템을 제안한다. 일반적으로 운송 컨테이너의 식별자들은 글자의 색이 검정색 또는 흰색으로 이루어져 있는 특정이 있다. 이러한 특성을 고려하여 원 컨테이너 영상에 대해 검은색과 흰색을 제외하고는 모든 부분을 잡음으로 처리하기 위해 퍼지 추론 방법을 이용하여 식별자 영역과 바탕영역을 구별한다. 식별자 영역으로 구분 된 영역은 그대로 두고, 바탕 영역으로 구분된 영역 은 전체 영상의 평균 픽셀 값으로 대체시킨다. 그리고 Sobel 마스크를 이용하여 에지를 검출하고, 추출된 에지를 이용하여 수직 블록과 수평 블록을 검출 하여 컨테이너의 식별자 영역을 추출하고 이진화한다. 이진화 된 식별자 영역에 대해 검정색의 빈도수를 이용하여 흰바탕과 민바탕을 구분하고 4 방향 윤곽선 추적 알고리즘을 적용하여 개별 식별자를 추출 한다. 개별 식별자 인식을 위해 자가 생성 지도 학습 알고리즘을 제안하여 개별 식별자 인식에 적용한다. 제안된 자가 생성 지도 학습 알고리즘은 입력층과 은닉층 사이의 구조를 ART-l을 개선하여 적용하고 은닉층과 출력층 사이에는 일반화된 델타 학습 방법과 Delta-bar-Delta 알고리즘을 적용하여 학습 및 인식 성능을 개선한다. 실제 80 개의 컨테이너 영상을 대상으로 실험한 결과, 제안된 식별자 추출 방법이 이전의 개별 추출 방법보다 추출률이 개선되었고 FCM 기반 자가 생성 지도 학습 알고리즘보다 제안된 자가 생성 지도 학습 알고리즘이 컨테이너 식별자의 학습 및 인식에 있어서 개선된 것을 확인하였다.색 문제를 해결하고자 하는 것이 연구의 목적이다. 정보추출은 사용자의 관심사에 적합한 문서들로부터 어떤 구체적인 사실이나 관계를 정확히 추출하는 작업을 가리킨다.앞으로 e-메일, 매신저, 전자결재, 지식관리시스템, 인터넷 방송 시스템의 기반 구조 역할을 할 수 있다. 현재 오픈웨어에 적용하기 위한 P2P 기반의 지능형 BPM(Business Process Management)에 관한 연구와 X인터넷 기술을 이용한 RIA (Rich Internet Application) 기반 웹인터페이스 연구를 진행하고 있다.태도와 유아의 창의성간에는 상관이 없는 것으로 나타났고, 일반 유아의 아버지 양육태도와 유아의 창의성간의 상관에서는 아버지 양육태도의 성취-비성취 요인에서와 창의성제목의 추상성요인에서 상관이 있는 것으로 나타났다. 따라서 창의성이 높은 아동의 아버지의 양육태도는 일반 유아의 아버지와 보다 더 애정적이며 자율성이 높지만 창의성이 높은 아동의 집단내에서 창의성에 특별한 영향을 더 미치는 아버지의 양육방식은 발견되지 않았다. 반면 일반 유아의 경우 아버지의 성취지향성이 낮을 때 자녀의 창의성을 향상시킬 수 있는 것으로 나타났다. 이상에서 자녀의 창의성을 향상시키는 중요한 양육차원은 애정성이나 비성취지향성으로 나타나고 있어 정서적인 측면의 지원인 것으로 밝혀졌다.징에서 나타나는 AD-SR맥락의 반성적 탐구가 자주 나타났다. 반성적 탐구 척도 두 그룹을 비교 했을 때 CON 상호작용의 특징이 낮게 나타나는 N그룹이 양적으로 그리고 내용적으로 더 의미 있는 반성적 탐구를 했다용을 지원하는 홈페이지를 만들어 자료

  • PDF