• Title/Summary/Keyword: 어휘사용빈도

검색결과 104건 처리시간 0.023초

수학 교수학적 어휘의 변화: 텍스트 마이닝 기법을 이용한 교실수업 어휘 연구의 확장 (Changes in mathematics pedagogical lexicons: Extension research of the International Classroom Lexicon using a text mining approach)

  • 이기마;김희정
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제61권4호
    • /
    • pp.559-579
    • /
    • 2022
  • 어휘와 언어에 대한 연구는 이를 사용하는 개인들이 포함된 공동체의 관심과 가치, 실천 관행에 대한 이해도를 높일 수 있다. 이러한 맥락에서 10개국이 참여한 국제 교실수업 어휘 프로젝트(The International Classroom Lexicon Project)는 자국의 수학 교실 수업과 관련하여, 교사가 바라보고 명명하는 구어적 입장에서 수학 교실수업 어휘 연구를 진행하여 어휘를 확인하고 정리하였다. 본 연구는 이 국제 교실수업 어휘 프로젝트 연구의 확장으로, 전국수학교사모임에서 발행하는 수학교사 전문 잡지인 「수학과 교육」에 사용된 교수학적 어휘를 텍스트 마이닝 기법을 이용하여 조사하고, 통시적 관점에서 최근 10년간 시간의 흐름에 따라 이러한 교수학적 어휘가 양적으로 어떻게 변화하였는지를 관찰하였다. 연구 결과, 선행연구에서 발견되지 않은 새로운 교수학적 어휘를 발견할 수 있었다. 또한, 이러한 교수학적 어휘 중 시간의 흐름에 따라 출현 빈도가 유의하게 증가하는 어휘와 단기간에 갑자기 출현(급증)하는 어휘를 발견할 수 있었으며, 이를 통해 수학교사를 위한, 그리고 수학교사에 의한 전문 잡지를 중심으로 이루어진 문어적 공동체 수학교사의 관심의 변화를 살펴볼 수 있었고, 나아가 이러한 관심의 변화를 사회문화적·사건적·시대적 맥락에 비추어 봄으로써 이들의 가치와 시대적 정신의 변화를 조심스럽게 해석할 수 있었다. 이러한 점에서 본 연구는 지난 10년간 시대의 변화에 따른 한국의 수학교사 공동체에서의 수학교육에 대한 관심과 가치, 시대적 정신을 이해하는 첫 걸음으로서 가치를 지니고 있다. 또한, 텍스트 마이닝 기법이 이러한 시대변화에 따른 관심과 가치, 시대적 정신의 변화에 대한 연구를 수행할 수 있는 방법론적인 기여를 제공한다.

한국어 학습자를 위한 드라마 <도깨비> 속 관용표현 교육 방안 연구 (A Study Regarding Education Method on Idiomatic Expressions Appearing in the Korean Drama for Learners of Korean Language)

  • 송대헌
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권5호
    • /
    • pp.181-191
    • /
    • 2020
  • 이 연구는 일상생활에서 쉽게 접할 수 있는 드라마를 한국어 교육에 활용하여 한국어 관용표현의 효율적 교수·학습 방향을 제시하는 것을 목적으로 한다. 한국어 학습자들의 흥미와 교육적 효과를 높이기 위해서 한국에서 인기리에 방영된 드라마 <도깨비>를 교육 자료로 활용하였다. 관용표현은 한국의 역사와 문화, 사회적 배경을 통해 형성되어 사용하고 있기 때문에 한국의 문화와 정서가 담겨있는 드라마는 관용표현의 교수·학습에 적합한 자료라고 할 수 있다. 한국어 교육용 관용표현을 선정하기 위해 드라마 <도깨비>를 분석하여 실제 발화된 어휘를 바탕으로 드라마 내에서 277개의 유의미한 어휘를 추출하였다. 그중 중복 표현된 어휘를 제외하고 기준으로 124개의 관용표현을 분류하였다. 이렇게 분류한 관용표현은 사용 빈도 2회 이상의 어휘를 기본으로 하여 학습자 수준에 맞는 교육용 관용표현 선정을 위해 어휘의 난이도를 고려하여 최종 한국어 교육용 관용표현 46개를 선정하였다. 마지막으로 드라마 <도깨비>에서 선정한 자료를 교육적으로 활용할 때 교수·학습의 유의사항과 초급, 중급, 고급 등급별 관용표현의 교육 방향을 제시하였다.

소셜 데이터에서 재난 사건 추출을 위한 사용자 행동 및 시간 분석을 반영한 토픽 모델

  • 촐몽 바야르;이경순
    • 정보와 통신
    • /
    • 제34권6호
    • /
    • pp.43-50
    • /
    • 2017
  • 본고에서는 소셜 빅데이터에서 공공안전에 위협되고 사회적으로 이슈가 되는 재난사건을 추출하기 위한 방법으로 소셜 네트워크상에서 사용자 행동 분석과 시간분석을 반영한 토픽 모델링 기법을 알아본다. 소셜 사용자의 글 수, 리트윗 반응, 활동주기, 팔로워 수, 팔로잉 수 등 사용자의 행동 분석을 통하여 활동적이고 신뢰성 있는 사용자를 분류함으로써 트윗에서 스팸성과 광고성을 제외하고 이슈에 대해 신뢰성 높은 사용자가 쓴 트윗을 중요하게 반영한다. 또한, 트위터 데이터에서 새로운 이슈가 발생한 것을 탐지하기 위해 시간별 핵심어휘 빈도의 분포 변화를 측정하고, 이슈 트윗에 대해 감성 표현 분석을 통해 핵심이슈에 대해 사건 어휘를 추출한다. 소셜 빅데이터의 특성상 같은 날짜에 여러 이슈에 대한 트윗이 많이 생성될 수 있기 때문에, 트윗들을 토픽별로 그룹핑하는 것이 필요하므로, 최근 많이 사용되고 있는 LDA 토픽모델링 기법에 시간 특성과 사용자 특성을 분석한 시간상에서의 중요한 사건 어휘를 반영하고, 해당이슈에 대한 신뢰성 있는 사용자가 쓴 트윗을 중요시 반영하도록 토픽모델링 기법을 개선한 소셜 사건 탐지 방법에 대해 알아본다.

브렉시트 캠페인 기간 동안 영어 미디어에 나타난 이민자들 (Migrant Representation in the English-language Media during the Brexit Campaign)

  • 이재승
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.325-348
    • /
    • 2016
  • 본 논문은 브렉시트 캠페인 기간 동안 영어권 국가, 영국, 미국, 캐나다, 그리고 호주의 미디어에서 이민자들이 어떻게 표현되는지 살펴본다. 코퍼스 지원 담화연구의 틀을 사용한 본 연구는 브렉시트 국민투표 캠페인이 시작된 날부터 국민투표가 실시되기 전 날까지(2016년 4월 15일-6월 22일) 검색기간으로 설정하고, 검색어 'Brexit'가 포함된 모든 기사를 수집하여 브렉시트 캠페인 코퍼스를 구축하였다. 수집된 코퍼스 자료를 통해서 이민자를 나타내는 어휘들, IMMIGRANT, MIGRANT, 그리고 REFUGEE의 빈도를 관찰하고, 이 어휘들과 함께 나타나는 연어를 분석하였다. 또한 세 어휘의 연어들을 사회적 행위자 범주에 따라 분류 및 분석하였다. 분석 결과, IMMIGRANT의 연어는 법적 상태 및 출신지역 어휘들과 연관성이 있고, MIGRANT는 경제적인 용어들과 주로 연어 관계에 있으며, REFUGEE는 큰 수를 나타내는 어휘와 관련성이 있는 것으로 나타났다. 그리고 이민자들은 기능범주, 유형범주, 그리고 평가범주를 통해서 묘사되며, 특히 영국과 미국의 미디어에서 이민자들이 부정적으로 그려지고 있는 것으로 관찰되었다. 본 연구를 통하여 특정 현상 및 특정 집단의 사람들을 가리킬 때 특정 어휘가 사용되며, 코퍼스 지원 언어분석이 해당 사회의 사회 문화 정치적 상황을 파악하는데 도움이 된다는 것을 확인할 수 있었다.

통사적 중의성이 어절 처리에 미치는 영향 (The effect of syntactic category ambiguity on eojeol processing)

  • 이호영;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-257
    • /
    • 2009
  • 본 논문은 한국어의 통사적 중의성이 언어정보처리에 어떠한 영향을 미치는지 알아보기 위하여 어휘판단과제(lexical decision task)를 실시하였다. 명사의 의미와 동사의 의미로 중의적인 어절을 사용하여 각각의 빈도가 영향을 미치는지를 살펴보고자 하였다. 개별 품사 정보가 모두 영향을 미친다면 각각의 빈도가 영향을 미치게 되고 누적빈도 효과가 발생하여 개별 품사의 빈도와 동일한 비교조건에서의 반응시간보다 빠를 것이다. 실험 결과, 중의어절에서의 반응시간이 가장 빠르게 발생하였고 이를 통해 하나의 중의어절이 의미하는 개별적인 품사 의미가 모두 언어정보처리에 영향을 미친다는 것을 의미한다.

  • PDF

질의응답 커뮤니티에서 문서 간 이독성 비교 (Comparison of Readability between Documents in the Community Question-Answering)

  • 문길성
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.25-34
    • /
    • 2020
  • 커뮤니티 질의응답 서비스는 다양한 목적으로 활용되고 있다. 질의응답 문서에서 정보의 품질은 질문의 명확성과 답변 내용의 적절성으로 결정되며 문서의 읽기 쉬운 정도를 나타내는 이독성(readability)은 문서가 가지고 있는 정보의 품질을 평가하기 위한 주요 요소이다. 본 연구의 목적은 국내의 CQA 사이트에서 제공되는 문서의 품질을 측정하는 것이다. 이를 위하여 네이버 지식iN의 '국민 신문고' 커뮤니티의 문서에서 사용된 어휘 수준별 사용 빈도를 비교하고, 작성 기관별 문서의 이독성 지수를 측정하였다. 이독성 지수의 측정은 어휘 수준과 문장 길이를 바탕으로 계산되는 Dale-Chall 공식을 사용하였다. 분석 결과, 답변에서 사용된 어휘는 질문에서 사용된 어휘보다 더 어려운 수준이고 문장 길이도 더 길어서 이독성이 더 낮은 것으로 나타났다. 또한, 질의응답간 이독성의 차이는 작성 기관별로도 차이가 있음을 파악할 수 있었다. 본 연구의 결과는 상담업무에 반영할 수 있는 유용한 정보를 도출하여 온라인상의 민원상담 개선에 활용할 수 있으며, 이독성 지수에 기반하여 문서 수준의 정량적 분석을 시도함으로써 텍스트 마이닝의 주제를 확장할 수 있을 것으로 기대한다.

영미 아동 모험 소설에 관한 코퍼스 분석 연구: 『보물섬』을 중심으로 (A Corpus Analysis of British-American Children's Adventure Novels: Treasure Island)

  • 최은샘;정채관
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.333-342
    • /
    • 2021
  • 본 연구에서는 대표적인 영미 아동 모험 소설 『보물섬』의 언어적 특징을 파악하기 위해 『보물섬』을 코퍼스화 하여 어휘, 리마, 키워드, n-그램을 분석하였다. 이 연구를 통해 고빈도 어휘가 텍스트의 핵심어라는 일반적인 주장과 달리 『보물섬』의 고빈도 어휘는 『보물섬』과 직접 관련이 없는 기능어, 고유명사 등이 최상위층에 포진하고 있다는 것을 발견하였고, 통계적인 방법으로 추출한 『보물섬』 키워드 역시 『보물섬』의 내용을 가늠하기에 충분하지 않음을 발견하였다. 따라서 1차 정량적인 키워드 분석 후 진행된 2차 정성적인 키워드 분석을 통해 추출한 30개의 핵심 키워드를 통해 『보물섬』 내용을 신속하고 구체적으로 파악하는 단초를 마련하였고, 이를 바탕으로 그동안 직관적으로만 회자 되던 『보물섬』에 나타난 남성성을 계량적으로 분석할 수 있었다. 또한, n-그램 분석을 통해 『보물섬』의 작가가 다른 작가에 비해 선호하고 자주 사용하는 연속어휘구를 발견하였고, 이를 토대로 문학 작품의 계량적 연구가 가능한 코퍼스 문체론 연구의 가능성을 탐색하였다. 본 연구를 통해 밝혀낸 연구결과가 영미 아동문학 콘텐츠의 확산과 코퍼스 문체론 연구에 도움이 되기를 희망한다.

XMDR 기반 온톨로지 구축 방법에 대한 실험 및 평가 (Experiment and Evaluation of the XMDR-based Ontology Building Method)

  • 이석훈;정동원;김장원;백두권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.185-188
    • /
    • 2010
  • 온톨로지 간 이질성 문제를 해결하고 상호운용성을 향상시키기 위한 연구가 진행되어 왔으며, 최근 XMDR에 기반한 온톨로지 구축 방법이 제안되었으나 기존 연구와의 비교 평가가 부족하여 장점을 정확하게 보이지 못하였다. 따라서 이 논문에서는 XMDR 기반 온톨로지 구축 방법의 장점을 보다 명확하게 보이기 위해 정량적인 평가를 수행한다. 이를 위해 실제 온톨로지를 구축하고, 구축된 온톨로지는 온톨로지 참조 기반 온톨로지 구축 방법, 사전 참조 기반 온톨로지 구축 방법, 기존 방법론을 이용한 온톨로지 구축 방법을 평가 대상으로 하여 5가지 평가 지표로 분석된다. 평가 지표로는 구축된 온톨로지의 어휘 및 구조의 일관성 비교를 위하여 어휘 및 구조의 빈도수 평균과 엔트로피를 사용하고 구축 비용의 평가를 위하여 각 온톨로지의 구축 시간을 사용한다. 이러한 실험 및 평가의 결과로써, 온톨로지 참조 기반의 온톨로지 구축 방법은 다른 온톨로지 구축 방법들에 비해 온톨로지 어휘 및 구조가 일관적이고 효율적임을 보인다.

아동영문어휘책에 제시된 그림과 문자의 사용에 대한 분석 (Analysis on the Use of Picture and Letter Used in the Books of English Vocabulary for Children)

  • 이미영
    • 한국콘텐츠학회논문지
    • /
    • 제14권1호
    • /
    • pp.150-157
    • /
    • 2014
  • 본 논문은 현재 출간된 아동영문어휘책의 현황분석을 통해 그림과 문자의 관계적 속성을 이해하고 사용자인 아동을 고려해 시각적 심상을 얼마나 잘 활용하고 있는가를 파악하고자 하였다. 이에 아동영문어휘책에 사용된 그림의 유형과 그림의 활용도, 그림과 문자의 결합 형태, 그림과 문자와의 의미일치도 정도를 살펴보았다. 분석결과 그림의 활용도는 일러스트, 만화, 일러스트와 만화의 혼용 순으로 전반적으로 높은 것으로 나타났다. 그림과 문자의 결합 형태에서는 그림+어휘형, 일러스트가 없는 문자형, 그림문자형 순으로 나타났다. 특히나 그림과 문자의 의미일치도가 높을수록 학습에 효과적인데 반해 의미일치도는 전반적으로 낮게 나타났다. 의미일치도가 높게 나타난 5개의 그룹 중 그림문자형이 가장 높은 결합형태 빈도를 보이고 있었다. 따라서 현재 출간된 아동영문어휘책에 나타난 그림과 문자의 제시형태는 비슷한 형태로 출판사별로 출간되고 있음을 알 수 있었고 아동의 다양한 수준을 바탕으로 한 효과적인 디자인연구가 필요하다고 보아진다.

문서의 의미론적 분석에 기반한 키워드 추출에 관한 연구 (A Study on Keywords Extraction based on Semantic Analysis of Document)

  • 송민규;배일주;이수홍;박지형
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.586-591
    • /
    • 2007
  • 지식 관리 시스템, 정보 검색 시스템, 그리고 전자 도서관 시스템 등의 문서를 다루는 시스템에서는 문서의 구조화 및 문서의 저장이 필요하다. 문서에 담겨있는 정보를 추출하기 위해 가장 우선시되어야 하는 것은 키워드의 선별이다. 기존 연구에서 가장 널리 사용된 알고리즘은 단어의 사용 빈도를 체크하는 TF(Term Frequency)와 IDF(Inverted Document Frequency)를 활용하는 TF-IDF 방법이다. 그러나 TF-IDF 방법은 문서의 의미를 반영하지 못하는 한계가 존재한다. 이를 보완하기 위하여 본 연구에서는 세 가지 방법을 활용한다. 첫 번째는 문헌 속에서의 단어의 위치 및 서론, 결론 등의 특정 부분에 사용된 단어의 활용도를 체크하는 문헌구조적 기법이고, 두 번째는 강조 표현, 비교 표현 등의 특정 사용 문구를 통제 어휘로 지정하여 활용하는 방법이다. 마지막으로 어휘의 사전적 의미를 분석하여 이를 메타데이터로 활용하는 방법인 언어학적 기법이 해당된다. 이를 통하여 키워드 추출 과정에서 문서의 의미 분석도 수행하여 키워드 추출의 효율을 높일 수 있다.

  • PDF