• 제목/요약/키워드: 어휘학습

검색결과 361건 처리시간 0.023초

중학교 과학 교과서 물리 단원에 수록된 과학 전문 용어 조사 (Investigation of Scientific Terms in Physics Units of Middle School Science Textbooks)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제31권8호
    • /
    • pp.1175-1185
    • /
    • 2011
  • 본 연구는 과학 교육용 과학 전문 용어 목록을 만들기 위한 기초 연구로써 중학교 과학 교과서 물리 단원에 수록된 과학 전문 용어를 조사하였다. 그 결과 7학년 249개, 8학년 170개, 9학년 137개, 총 556개의 과학 전문 용어를 얻을 수 있었다. 그리고, 초등학교와 중학교에서 다루는 어휘수의 차이가 매우 심함을 알 수 있었고, 교육인적자원부의 편수자료와 물리학용어집, 표준국어대사전 간에 불일치가 상당히 많았다. 본 연구의 결과에 수정, 보완 작업을 거쳐서 수준별로 평정된 과학 전문 용어 목록이 완성되면 도서 및 사전 편찬, 각종 검사 제작, 교사 교육, 학습능력 향상 등에 다양하게 활용될 수 있을 것이다.

Conditional Random Fields를 이용한 영역 행위 분류 모델 (A Domain Action Classification Model Using Conditional Random Fields)

  • 김학수
    • 인지과학
    • /
    • 제18권1호
    • /
    • pp.1-14
    • /
    • 2007
  • 목적 지향 대화에서 사용자의 의도는 화행과 개념열의 쌍으로 구성된 영역 행위로 표현될 수 있다. 그러므로 지능적인 대화 시스템을 구성하기 위해서는 영역 행위를 정확히 파악하는 것이 매우 중요하다. 본 논문에서는 CRFs (Conditional Random Fields)를 이용하여 화행과 개념열을 동시에 결정하는 통계 모델을 제안한다. 편향 학습 문제를 피하기 위하여 제안한 모델은 어휘와 품사 같은 낮은 수준의 언어 자질을 입력 자질로 사용하며, 카이 제곱 통계량을 이용하여 불필요한 자질들을 제거한다. 일정 관리 영역에서 실험을 수행한 결과, 제안한 모델은 화행 분류 정착률에서 93.0%, 개념열 분류 정확률에서 90.2%의 좋은 성능을 보였다.

  • PDF

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

온라인게임 채팅에서의 비속어 차단시스템 (A Swearword Filter System for Online Game Chatting)

  • 이성욱
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1531-1536
    • /
    • 2011
  • 온라인 게임의 활성화로 온라인 게임의 폐해도 증가하고 있는데 온라인 게임의 대표적인 폐해 중 하나인 언어 폭력 문제가 심각한 사회문제를 야기하고 있다. 본 논문은 온라인 게임의 채팅에 나타나는 비속어를 자동으로 차단하는 시스템을 제안한다. 우리는 온라인 게임의 채팅창에 나타나는 문장을 수집하였고 비속어 포함 문장과 정상 문장으로 수동으로 분류하였다. 음절 n-gram과 어휘-품사 쌍을 자질로 사용하며 카이제곱 통계량을 이용하여 자질을 선택한다. 선택된 자질들을 이진가중치로 표현하여 지지벡터기계(SVM)를 학습한 후, SVM 분류기로 각 문장의 차단 여부를 결정하였다. 실험 결과, 수집된 데이터에 대해 약 90.4%의 F1 정확률을 얻었다.

정의형 질의응답시스템을 위한 정의형 정답 문장 추출 (A Extraction of Definitional Answer Sentence for a Definitional Question-Answering System)

  • 고병일;강유환;신승은;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.470-475
    • /
    • 2004
  • 본 논문에서는 정의형 정답 문장을 요구하는 질의에 대하여 올바른 정답 문장을 추출하는 방법에 대해 기술한다. 말뭉치로부터 정의형 정답문장 패턴을 정의하고, 패턴별 제약 규칙 및 패턴 순위화 같은 방법들을 이용하여 정확한 정의형 정답 문장이 추출되도록 하였다. 정답 패턴은 정의형 정답 문장의 구문 구조 및 각 패턴 또는 정답 패턴 별 실마리 어휘 등으로 구성된다. 현재 학습되지 않은 일반 문서에 대해 약 83%의 정의형 정답 문장 추출 정확도를 보이고 있다.

  • PDF

이동동사의 인지 도식에 관한 비교 연구 (Comparative Study on Cognitive Scheme of Movement Verbs)

  • 오현금;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.59-64
    • /
    • 2002
  • 인지심리학 및 인지언어학 분야에서 시도한 어휘 표상, 특히 움직임과 관련된 동사의 인지도식에 관한 연구들을 비교해보고자 한다. 인간의 언어학적인 지식을 도식적으로 표상 하고자 하는 노력은 언어의 통사적인 외형에만 치중하는 연구에서는 언어의 의미구조를 파악하기 힘들다고 판단하고 의미적인 범주화를 중요시하게 되었다. 본 연구에서는 시각적 이미지 도식을 중점적으로 살펴보기로 한다. 이미지 도식은 공간적 위치 관계, 이동, 형상 등에 관한 지각과 결부되어 있다. 이미지로 나타낸 표상은 근본적으로 세상의 인식과 세상에 대한 행동방법을 사용하게 하는 유추적이고 은유적인 원칙에 기초하고 있다. 이러한 점에 있어서, 언술을 발화한 화자는 어느 정도 주관적인 행동의 능력과 그가 인식한 개념화에서부터 문자화시킨 표상을 구성한다. 인지 원칙에 입각한 의미 표상에 중점을 둔 도식으로는, Langacker, Lakoff, Talmy의 도식이 있다. 프랑스에서 톰 R. Thom과 같은 수학자들은 질적인 현상에 관심을 가져 형역학(morphodynamique)이론을 확립하였는데, 이 이론은 요즘의 인지 연구에 수학적 기초를 제공하였다. R. Thom, J. Petitot-Cocorda의 도식 및 구조 의미론의 창시자라고 불리는 B.Pottier의 도식이 여기에 속한다 J.-P. Descles가 제시한 인지연산문법(Grammaire Applicative et Cognitive)은 다른 인지문법과는 달리 정보 자동처리과정에서 사용할 수 있는 연산자와 피연산자의 관계에 기초한 수학적 연산작용을 발전시켰다. 동사의 의미는 의미-인지 도식으로 설명되는데, 이것은 서로 다른 연산자와 피연산자로 구성된 형식화된 표현이다. 인간의 인지 기능은 언어로 표현되며, 언어는 인간의 의사소통, 사고 행위 및 인지학습의 핵심적 기능을 담당한다. 인간의 언어정보처리 메카니즘은 매우 복잡한 과정이기 때문에 언어정보처리와 관련된 언어심리학, 인지언어학, 형식언어학, 신경해부학 및 인공지능학 등의 관련된 분야의 학제적 연구가 필요하다.

  • PDF

유아의 한국어 어휘학습용 어플리케이션 분석: 태블릿 PC 어플리케이션을 중심으로 (Analysis of Applications for Preschoolers' Korean Vocabulary Learning: Focusing on Tablet PC Applications)

  • 성미영
    • Human Ecology Research
    • /
    • 제53권2호
    • /
    • pp.219-228
    • /
    • 2015
  • This study evaluated the content of Korean vocabulary learning applications with a focus on tablet PC applications. We analyzed 51 Korean vocabulary learning applications. The instruments in this study were developed based on Yoo et al. (2012)' Vocabulary Learning Game Application Evaluation Criteria and Hyun et al. (2013)' Educational Application Evaluation Criteria. Data were analyzed using a t-test and one-way analysis of variance. The main results are as follows. First, each criteria's score was fairly good; the ease of use had the highest scores and the amusement had the lowest scores. Second, there was a significant difference in the interaction by vocabulary teaching approach. Applications based on a whole language-teaching method had higher scores than applications based on a phonics instructional teaching method inducing more operation and with immediate feedback. Third, there was significant difference in the sum of score and each criteria of developmental appropriateness, educational values, amusement, function and interaction by type of learning. Applications of combining type had higher scores in every criteria except for ease of use than applications of description type. These findings provide a preliminary evidence that the systematic Korean vocabulary learning application facilitates preschoolers' vocabulary learning.

통계 언어모델 기반 객관식 빈칸 채우기 문제 생성 (Automatic Generation of Multiple-Choice Questions Based on Statistical Language Model)

  • 박영기
    • 정보교육학회논문지
    • /
    • 제20권2호
    • /
    • pp.197-206
    • /
    • 2016
  • 빈칸 채우기 문제는 학생들이 학습 내용을 제대로 이해했는지 확인하기 위해 널리 사용되어 왔다. 이런 유형의 문제를 컴퓨터 알고리즘에 의해 자동으로 생성하는 많은 방법들이 제안되어 왔지만, 대부분 어떤 부분을 빈칸으로 만들면 좋을지에 대해 집중했기 때문에 적절한 보기를 자동으로 생성하는 연구는 미흡했다. 본 논문에서는 빈칸이 주어졌다고 가정하고, 이에 어울리는 보기를 자동 생성하는 알고리즘을 제안한다. 본 알고리즘은 통계 언어 모델에 기반하여 보기를 생성하기 때문에, 사람이 생성하는 경우보다 출제자에 편향되지 않은 보기를 제공할 수 있다. 또, 확률값에 기반하여 난이도를 자동으로 조절하는 것이 가능하기 때문에, 직접 사람이 문제를 만드는 것에 비해 상당한 비용 절감 효과가 있다. TEPS 문법, 어휘 시험에 대해 적용하여 실험한 결과, 사람과 유사한 결과를 생성함을 확인하였다. 향후 스마트 교육 분야에서 높은 활용도를 보일 것으로 기대한다.

지지벡터기계를 이용한 스팸 블로그(Splog) 판별 시스템 (A Splog Detection System Using Support Vector Systems)

  • 이성욱
    • 한국정보통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.163-168
    • /
    • 2011
  • 블로그는 인터넷 공간에서 가장 손쉽게 정보 출간, 토론 참여, 커뮤니티 형성하는 수단이다. 그러나 최근에 광고를 유치하거나 페이지 순위를 올리기 위한 목적의 다양한 스팸 블로그가 범람하고 있다. 본 연구의 목적은 웹 환경에서 이러한 스팸 블로그(Splog)를 자동으로 판별하는 시스템을 개발하는 것이다. 먼저 블로그의 HTML을 제거한 후 품사를 부착하였다. 어휘/품사 쌍을 자질로 사용하였으며 카이제곱 통계량을 이용하여 유용한 자질을 선택하였다. 선택된 자질의 가중치를 벡터로 표현한 후, 지지벡터기계(Support Vector Machines)를 학습하여 자동으로 스팸 블로그를 판별하는 시스템을 제안하였으며, SPLOG 데이터 집합으로 실험한 결과 F1척도로 90.5%의 정확률을 얻었다.

텍스트에서 IS-A 관계의 자동 추출 및 순위화 (Automatic Acquisition of Ranked IS-A Relation from Unstructured Text)

  • 류법모;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.150-157
    • /
    • 2007
  • 본 논문에서는 의존 구조 매칭과 약한 지도식 학습 방법을 적용하여 텍스트에서 IS-A 관계를 자동으로 추출하고 순위화하는 방법을 제안한다. 텍스트에서 잠재적인 IS-A 관계를 표현하는 [관계 표현, 하위어, 상위어]의 삼진관계 리스트를 추출하고, 관계 표현과 IS-A 관계 인스턴스, IS-A 관계 후보, 사이의 상호 관련성을 이용하여 각각의 점수를 반복적으로 정제한다. 제안한 방법의 대표적인 특징은 다음과 같다. 1) 의존 구조에 기반한 패턴 매칭 방법을 적용하여 정규 표현에 기반한 방법보다 다양한 형태의 삼진관계를 추출할 수 있고, 2) 도메인 코퍼스에서 통계적으로 추출한 어휘 사이의 관련성 정보를 이용하여 도메인에 적합한 IS-A 관계 인스턴스의 순위를 높일 수 있으며, 3) 관계 표현과 관계 인스턴스의 점수를 상호 관련성에 기반한 방법으로 반복적으로 점수화하여 IS-A 관계 인스턴스 사이의 변별력을 높일 수 있다. 실험에서 순위화된 관계 인스턴스는 전문가의 판단과 66%이상 일치함을 보였고, 의존 구조를 이용한 유연한 패턴 매칭 방법은 정규표현을 이용한 방법보다 43.6%의 추가적인 삼진관계를 추출하였다.

  • PDF