• 제목/요약/키워드: 문장비중

검색결과 30건 처리시간 0.03초

비정상 문자 조합으로 구성된 스팸 메일의 탐지 방법 (An Approach to Detect Spam E-mail with Abnormal Character Composition)

  • 이호섭;조재익;정만현;문종섭
    • 정보보호학회논문지
    • /
    • 제18권6A호
    • /
    • pp.129-137
    • /
    • 2008
  • 인터넷의 활용도가 높아짐에 따라, 스팸메일이 전체 메일에서 차지하는 비중이 점점 커지게 되었다. 전체 인터넷 자원에서 필요에 의해 사용되는 메일의 기능보다, 주로 광고나 악성코드 등의 전파를 위한 목적으로 사용되는 메일의 비중이 점점 커지고 있으며, 이를 방지하기 위한 컴퓨터 및 네트워크, 인적자원의 소모가 매우 심각해지고 있다. 이를 해결하기 위해 스팸 메일 필터링에 대한 연구가 활발히 진행되어 왔으며, 현재는 문맥상의 의미는 없지만 가독상에서 의미를 해석할 수 있는 문장에 대한 연구가 활발히 이루어지고 있다. 이러한 방식의 메일은 기존의 어휘를 분석하거나 문서 분류 기법 등을 이용한 스팸 메일을 필터링 방법을 통해 분류하기 어렵다. 본 연구는 이와 같은 어려움을 해결하기 위해 메일의 제목에 대한 N-GRAM 색인화를 통해 베이지안 및 SVM 을 이용하여 스팸 메일을 필터링 하는 방법을 제안한다.

음절 복원 규칙과 형태소 분석을 이용한 음성인식 후처리 (Post-Processing of Voice Recognition Using Phonologic Rules and Morphologic analysis)

  • 서상현;김재홍;김해진;김미진;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-499
    • /
    • 1997
  • 컴퓨터의 사용이 보편화됨에 따라 컴퓨터와 사용자 사이의 쉽고 자연스러운 의사 소통을 위한 자연어 인터페이스에 대한 연구가 활발히 진행되고 있다. 이 중에서 특히, 음성인식 분야는 음성명령, 받아쓰기 시스템 등 일반적인 컴퓨터 사용자의 요구를 충족시켜 줄 수 있는 분야로 주목을 받고 있다. 그러나 음성인식은 인식 자체만으로는 인식률에 한계가 있으며, 인식 결과를 향상시키기 위해서는 후처리 단계가 필요하다. 본 논문에서는 음성 인식의 성능을 향상시키기 위해 음성 인식의 결과로 들어온 연속된 한국어 음성을 올바른 음절로 복원시켜 주는 시스템을 구현하였다. 이 시스템에서는 어절단위의 연속된 한국어 음성을 입력으로 받아 한국어 발음 규칙을 역으로 적용하여 원래의 음절로 복원시키고, 형태소 분석기를 이용하여 복원된 음절이 올바른지를 확인하고 수정한다. 초등학교 교과서에 나오는 문장을 대상으로 본 시스템의 성능을 실험한 결과, 90.42%의 복원율을 나타내었다. 현재 정확하게 복원이 되지 않는 것 중에는 동음이의어가 차지하는 비중이 크며, 이 문제는 구문분석이나 의미분석을 이용하여 어느 정도 개선할 수 있을 것으로 보인다.

  • PDF

난이도 자동제어가 구현된 객관식 문항 생성 시스템 (A Sentence Generation System for Multiple Choice Test with Automatic Control of Difficulty Degree)

  • 김용범;김유섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1404-1407
    • /
    • 2007
  • 본 논문에서는 객관식 문항을 난이도에 따라 자동으로 생성하는 방법을 고안하여, 학습자 수준에 적합하도록 다양하고 동적인 형태로 문항 제시를 할 수 있는 시스템을 제안하였다. 이를 위해서는 주어진 문장에서 형태소 분석을 통해 키워드를 추출하고, 각 키워드에 대하여 워드넷의 계층적 특성에 따라 의미가 유사한 후보 단어를 제시한다. 의미 유사 후보 단어를 제시할 때, 워드넷에서의 어휘간 유사도 측정 방법을 사용함으로써 생성된 문항의 난이도를 사용자가 원하는 수준으로 조정할 수 있도록 하였다. 단어의 의미 유사도는 동의어를 의미하는 수준 0에서 거의 유사도를 찾을 수 없는 수준 9 까지 다양하게 제시할 수 있으며, 이를 조절함으로써 문항의 전체 난이도를 조절할 수 있다. 후보 어휘들의 의미 유사도 측정을 위해서, 본 논문에서는 두 가지 방법을 사용하여 구현하였다. 첫째는 단순히 두 어휘의 워드넷 상에서의 거리만을 고려한 것이고 둘째는 두 어휘가 워드넷에서 차지하는 비중까지 추가적으로 고려한 것이다. 이러한 방법을 통하여 실제 출제자가 기존에 출제된 문제를 토대로 보다 다양한 내용과 난이도를 가진 문제 또는 문항을 보다 쉽게 출제하게 함으로써 출제에 소요되는 비용을 줄일 수 있었다.

  • PDF

한글 문서에서 형태적 중의 오류의 교정 (A method for morphological correction of ambiguous error)

  • 김민주;정준호;이현주;최재혁;김항준;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-48
    • /
    • 1998
  • 교정 시스템에 나타나는 오류 유형들 중에는 전체적인 교정률에 차지하는 비중은 적지만 출현할 때마다 틀릴 가능성이 아주 높은 오류들이 있다. 기존의 교정 시스템에서는 이러한 오류들에 대한 처리가 미흡한데, 철자 오류와 띄어쓰기 오류 중 형태가 비슷하거나 같은 형태가 다른 기능을 함으로써 발생하는 오류들이다. 이러한 오류는 일반 문서 작성자뿐만 아니라 한글 맞춤법에 대해 어느 정도 지식을 가진 사람의 경우에도 구분이 모호하다. 복합 명사와 미등록어를 제외한 오류 중 약 30%가 여기에 속한다. 따라서 본 논문에서는 이러한 오류 유형들을 분류하고, 이 중에서 빈번하게 출현하는 오류에 대한 교정을 시도하고, 오류 유형들이 문장 내에서 어떤 분포를 가지는지 알아본다. 약 617만 어절의 말뭉치를 이용하여 해당 형태와 다른 성분들과의 관련성을 조사하여 교정 방법을 제시하고, 형태소 분석을 하여 교정을 행한다. 코퍼스 655만 어절 대상으로 실험한 결과 84.6%의 교정률을 보였다. 본 논문에서 제시한 교정 방법은 기존의 교정 시스템에 추가되어 교정 시스템의 전체 교정률을 향상시킬 수 있다. 또한 이와 비슷한 유형의 다른 어휘 교정에 대한 기초 자료로 사용될 수 있을 것이다.

  • PDF

Bloom의 신교육목표분류에 따른 2022 개정 과학과 교육과정 초등학교 3~4학년군 성취기준 분석 및 2015 개정 교육과정과의 비교 (Analysis of the 2022 Revised Science Curriculum Grades 3-4 Achievement Standards Based on Bloom's New Taxonomy of Educational Objectives and Comparison to the 2015 Revised Curriculum)

  • 김우중;김동석;신영준;권난주;오필석
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제43권3호
    • /
    • pp.353-364
    • /
    • 2024
  • 본 연구의 목적은 2022 개정 과학과 교육과정의 초등학교 3~4학년 성취기준을 분석하여 2022 개정 교육과정의 3~4학년군 과학교육이 목표하는 바를 확인하고 차후 3~4학년군 과학 교과서 개발 및 현장 교사들의 교수학습방향에 대한 시사점을 제시하려는 것이다. 이를 위해 2022 개정 교육과정 과학 교과 3~4학년군 성취기준 57개를 블룸의 목표분류체계에 따라 지식차원과 인지과정으로 분석하고자 했다. 성취기준이 복문이거나 2개 이상의 지식차원 또는 인지과정 차원을 복합하여 서술한 경우에는 전문가집단의 자문을 통해 문장을 분리하여 성취기준을 57개의 문장으로 만들어 분석하였다. 이후 기존에 연구된 2015 개정 교육과정의 초등 과학과 성취기준과의 비교를 통해 개념 및 서술어의 분류 빈도를 분석하였다. 주요 연구 결과는 다음과 같다. 첫째, 지식차원에서는 '사실적 지식'이 50개 (86%)로 나머지 '개념적 지식'(10%), '절차적 지식'(4%)에 비해 압도적인 비중을 차지하는 것으로 나타났으며 '메타인지 지식'은 한 개도 없는 것으로 분석되었다. 둘째, 인지과정 차원에서는 '이해하기'가 34개로 60% 가장 높게 나타났다. 이어서 '적용하기'가 11개로 19%, '창안하기'가 15%, '평가하기'가 6%로 나타났으며 분석하기와 기억하기는 아예 없었다. 셋째, 서술어를 중심으로 분석한 결과 '설명할 수 있다'가 9개로 가장 많았으며 비교가 여섯, 실천과 분류가 다섯으로 그 다음을 차지하였다. 넷째, 2015 개정 교육과정과 비교하여 개념적 지식이 축소되고 사실적 지식이 압도적인 비중으로 증가하였다. 다섯째, 인지과정 차원에서는 이해하기가 크게 늘어난 데 반해 나머지 인지과정 차원은 축소되었다. 이러한 연구 결과를 바탕으로 얻은 결론 및 시사점은 다음과 같다. 2022 개정교육과정 초등학교 3~4학년군 과학교과의 지향점은 사실적 지식에 편중되어 있으며 인지과정 차원에서는 이해하기가 압도적인 비중을 차지하였다. 이에 많은 개념과 적용이 줄어들었다. 2015 개정 교육과정의 연구 결과와의 서술어 비교 연구 결과를 토대로 2022 개정 교육과정 초등학교 3~4학년군의 과학 교과서 개발에 주는 시사점을 논의하였으며, 이를 통해 현장의 교육과정에 어떠한 시사점이 있는지를 논의할 수 있었다.

공자의 『시경』 재구성과 시론(詩論) - 『논어』를 중심으로 (Confucius's Theory of Poetics in Analects)

  • 임헌규
    • 철학연구
    • /
    • 제137권
    • /
    • pp.439-462
    • /
    • 2016
  • 주지하듯이 공자(孔子)는 인문주의 이념을 정립하고, 이를 실현하기 위하여 천하를 주유하였고, 그리고 만년에 고향으로 돌아와 육경(六經)을 산정(刪定)하면서 제자들을 훈육하였다고 전해진다. 그런데 "논어"에 의거하여 살펴본다면, 공자는 주로 "시(詩)" "서(書)"의 문장으로 교양을 쌓고, 례(禮)에서 자립하고, 락(樂)에서 도덕적 완성을 기하도록 제자들을 이끌었다. 그런데 그 가운데에서도 그는 특히 "시(詩)"에 가장 많은 비중을 두면서 논찬(論纂)과 교육에 힘을 기울였다. 이 글은 공자가 가장 많은 비중을 두고 제자들을 가르친 책은 "시(詩)"라는 점에 주의하면서, "시경"이란 어떤 책이며, 공자가 "시(詩)"의 형성에 어떤 공헌을 했으며, 공자의 시론(詩論)은 어떠하였는지를 해명하고자 하였다. 이러한 해명을 위해서 2장에서는 기존의 연구들을 바탕으로 중국 고전에 입각한 시(詩)에 대한 정의(定義), "시경(詩經)"의 성격 구성 형성 및 공자의 시산정설(詩刪定說)에 대한 비정(批正)을 시도하였다. 여기서 필자는 우선 사마천의 공자(孔子) 시산정설(詩刪定說)이 왜 근거가 박약한지를 살펴보고, 공자는 3,000여 편의 시(詩)를 손수 산정하여 300여 편으로 정리한 것이 아니라, 단지 시(詩)에 곡을 붙이면서(악정(樂正)) 다양한 판본들을 참고하면서 '손상되어 어질러지고 빠지거나 순서가 뒤바뀐 것'을 교정하는 역할을 하였다고 주장하였다. 3장에서는 "논어"에 나타난 시(詩)에 대한 공자의 언명을 분석하면서, 공자의 시론(詩論)을 설명하였다. 여기서는 우선 공자가 말한 학시칠법(學詩七法)(흥(興) 관(觀) 군(?) 원(怨) 이지사부(邇之事父)-원지사군(遠之事君) 다식어조수초목지명(多識於鳥獸草木之名):17:9)을 상세히 논구하였다. 그런 다음 공자가 말한 시교(詩敎)의 종지(宗旨)인 "시 삼백 편을 한마디 말로 포괄하면, 생각에 사특함이 없는 것이다."는 말에 대한 면밀한 분석과 해석을 시도하였다.

초·중학교 과학과 교육과정의 내용 진술에 사용된 서술어 비교: 제7차 교육과정 이후를 중심으로 (Comparison of Verbs in the Contents of the National Curriculum for Elementary and Middle School Science: Focused on the 7th, 2007, and 2009 Revision)

  • 조광희
    • 과학교육연구지
    • /
    • 제39권2호
    • /
    • pp.239-254
    • /
    • 2015
  • 이 연구에서는 제7차, 2007 개정, 2009 개정 교육과정의 초등학교 및 중학교 과학과 내용 진술에 사용된 서술어를 분석하고 교육과정에 따른 특징을 알아보고자 하였다. 성취기준 및 탐구 활동 진술에 사용된 문장의 마지막 서술어 1383개를 대상으로 종류 및 빈도 등을 조사한 결과, 초등학교에서는 평균적으로 '안다'(15.0 %)가, 중학교에서는 '이해한다'(24.2 %)가 가장 많이 사용되었다. 교육과정별로 살펴보면, 제7차 교육과정에서는 '이해한다'의 비중이 가장 높았지만 초등학교에서 관찰, 조사와 같은 탐구 활동을 뜻하는 동사가 상대적으로 자주 등장하였다. 2007 개정 과학과 교육과정을 살펴보면 초 중학교를 합쳐 '설명한다'가 최빈 동사로 나타났다. 2009 개정 교육과정에서는 '안다'와 '이해한다'가 각각 1, 2 순위를 차지하였다. 세 교육과정을 비교하면, '이해한다'와 '관찰한다'는 비교적 고르게 사용된 반면에 '안다'는 교육과정이 개정되면서 빈도가 점점 증가하는 경향이 나타났다. 아울러 이러한 결과들이 지니는 의미와 시사점을 논의하고, 차기 교육과정 개정과 관련하여 후속 연구의 필요성을 제안하였다.

  • PDF

남북한 수학 교과서 영역별 분석 및 표준 수학 교육과정안 개발 연구 (II): 남북한 초등학교 수학교과서의 구성과 전개방법 비교 (A Comparative Study of South and North Korea on Mathematics Textbook and the Development of Unified Mathematics Curriculum for South and North Korea (II) - Focusing on the Elementary School Textbooks of South and Those of North Korea -)

  • 임재훈;이경화;박경미
    • 대한수학교육학회지:학교수학
    • /
    • 제5권1호
    • /
    • pp.43-58
    • /
    • 2003
  • 본 연구에서는 남북한 초등학교 수학교과서의 외형과 단원체제, 각 영역별 내용 요소의 비중과 도입시기, 문장제의 소재 등 다소 양적인 비교에 초점을 둔 선행연구에 기초하여, 남북한 초등학교 수학교과서를 내용 구성과 전개 과정에서의 구체적인 특징에 주목한 질적인 관점에서 비교.분석하였다. 먼저 내용 구성에 관한 비교 결과는 다음과 같다. 첫째, 초등학교 학생들의 정의적.인지적 특성을 고려하여 학습 내용을 분산.교차하여 배치하는 남한과 달리 북한에서는 관련된 요소를 집중 배치하는 방식으로 구성되어 있다. 둘째 생활 소재를 통하여 문제상황을 제시하고 점진적이고 구체적인 활동으로 학습 내용을 제시하는 남한과 달리, 인민학교 교과서에서는 여러 형태의 문제를 통하여 학습을 유도하고 있다. 또한 내용 전개의 주요 전략으로 남한은 '안내'를. 북한은'설명'을 따르는 것으로 파악된다. 단계화된 탐구형 질문으로 안내하면서 학습을 유도하는 남한과 달리 북한에서는 의미 있는 설명을 통하여 학습 내용을 다루는 것으로 확인되었다.

  • PDF

몫으로서의 분수에 관한 초등학교 수학과 교과용도서 분석 (An Analysis of the Fraction as Quotient in Elementary Mathematics Instructional Materials)

  • 방정숙;이지영
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제24권2호
    • /
    • pp.165-180
    • /
    • 2014
  • 본 연구는 제7차부터 2009 개정 교육과정에 제시된 몫으로서의 분수 관련 내용을 바탕으로 수학과 교과용 도서를 분석하였다. 분석 결과, 몫으로서의 분수와 관련하여 현재 수학과 교과용 도서에 몇 가지 재고의 여지가 있는 부분이 드러났다. 첫째, 제7차 수학과 교육과정에 비해 2007 수학과 교육과정에서 몫으로서의 분수를 다루는 비중이 크게 줄었다. 둘째, 3, 4학년에서 배우는 자연수의 나눗셈 상황과 5학년에서 배우는 몫으로서의 분수 상황이 자연스럽게 연결되어 있지 않고 분리되어 있다. 셋째, 교과서에 제시된 문장제, 모델 및 분할전략, 형식화과정들이 어느 한 부분에 집중되어 있거나 지나치게 약화되어 있다. 이에 대한 논의를 바탕으로 초등학교 수학교과서의 몫으로서의 분수 관련 내용 구성 및 지도 방향에 시사점을 제공하고자 한다.

  • PDF

하수종말처리시설 방류수의 하천유량 기여도 분석 (Contribution Degree Analysis of Discharge from Sewage Treatment Plants at Streamflow in River)

  • 문장원;최시중;강성규;이동률
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1370-1374
    • /
    • 2010
  • 하수종말처리시설은 가정 등에서 배출되는 생활하수를 처리하여 오염물질을 제거한 후 다시 하천으로 물을 되돌려 보내는 시설로 하천수의 수질 측면에서 매우 중요한 역할을 수행하고 있다. 그러나 하천수의 수질 측면뿐만 아니라 수량적인 측면에서도 하수종말처리시설은 하천유량 관리에 있어 중요한 고려사항이라 할 수 있다. 하수종말처리시설을 통해 하천으로 방류되는 물은 비교적 일정한 수준을 유지하고 있으며, 이는 평저수기 및 갈수기 하천유량 관리 측면에서 매우 중요한 의미를 갖는다. 효율적인 하천유량 관리를 위해서는 하천을 중심으로 이루어지는 물 순환 구조에 대해 명확하게 파악할 수 있어야 하며, 하천에서 빠져나가는 물의 양과 하천으로 들어오는 물의 양을 파악함으로써 적절한 하천유량 관리가 이루어질 수 있다. 본 연구에서는 하수종말처리시설에서 하천으로 방류되는 물의 양이 하천유량에서 차지하는 비중을 파악하기 위한 분석을 수행하였다. 이를 위해 하수종말처리시설의 처리수 방류위치를 확인한 후 이를 기준으로 인접한 상 하류 하천구간에 유량자료가 생산되고 있는 수위관측시설을 검토하여 분석을 위한 대상 지점을 선정하였다. 선정된 지점을 중심으로 홍수기(6~9월)를 제외한 기간에 대해 하천유량과 하수종말처리시설의 방류수량을 검토하여 하수처리수의 기여도를 분석하였다. 하천유량과의 비교와 함께 분석 대상 지점에 고시되어 있는 하천유지유량과 비교한 후 그 결과를 제시하였다. 본 연구의 결과를 통해 하수처리수가 하천에 흐르는 유량에 기여하는 정도를 파악할 수 있으며, 이는 하천유량이 상대적으로 적은 평저수기 및 갈수기 하천유량 관리를 위한 기반 정보로 활용할 수 있을 것이다.

  • PDF