• 제목/요약/키워드: word problems

검색결과 417건 처리시간 0.027초

세종 전자사전과 한국어 어휘의미망을 이용한 용언의 어의 중의성 해소 (Word Sense Disambiguation of Predicate using Sejong Electronic Dictionary and KorLex)

  • 강상욱;김민호;권혁철;전성규;오주현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권7호
    • /
    • pp.500-505
    • /
    • 2015
  • 21세기 세종계획을 통하여 개발된 세종 전자사전은 한국어 어휘의 내재정보에 대한 체계적인 분석 정보를 담고 있다. 이는 일반적으로 사용하는 텍스트 사전이 가지는 전산적 표상 문제를 해결하는데 많은 도움을 주고 있다. 자연언어처리 분야에서 끊이지 않는 문제인 어의 중의성 해소(Word Sense Disambiguation) 문제 또한 세종 전자사전의 상세 정보를 이용하여 해결할 수 있지만, 실제 제시된 문형과 논항의 선택제약 명사로는 어의 중의성 해소 문제를 해결하는 데 한계를 보인다. 본 연구에서는 세종 전자사전의 용언 하위범주화 정보를 이용한 어의 중의성 해소의 한계점을 보이고, 한국어 어휘의미망(Korean Lexico-semantic network)을 이용하여 논항의 선택제약 정보를 일반화한다.

The SAFE Management System Model Based on Context Automatic Awareness

  • Han, Kook-Hee;Liu, Yiwen;Kwon, Young-Jik;Kang, Byeong-Do
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2007년도 춘계학술대회
    • /
    • pp.87-96
    • /
    • 2007
  • Ubiquitous is a Latin-derived word meaning "to exist at any time and place" like water or air. In computing, the word "ubiquitous" indicates an environment in which users have access to networks without any limitation regarding computer networks or places. Important issues in building Ubiquitous Korea (U-Korea) are the social problems appearing with a rapid increase in the old age population. Nowadays, with the rise of the nuclear family, the increase in the number of elderly people living alone, and the change in the status of women, both wives and husbands are employed outside the home, and the relatives who would be responsible for supporting the elderly sometimes are on long or short business trips, and it happens that old people can't be looked after. Therefore the government developed a wireless paging system for the sick, disabled, old and weak so that when an emergency happens, by just simply dialing 119, an emergency aid center could take prompt action. However, the present wireless paging systems composing the under-layer of the emergency aid information system have some problems, such as, a lack of reliability, problems among terminals, mobile transmitters and receiving terminals, the users' refusal to admit the need for the system and poor operational skills, administrators' perfunctory management and checks, etc. On account of these problems, the system efficiency has degraded and therefore a system upgrade is necessary. In this paper, we attempt to evaluate the newly implemented SAFE119 system, a new wireless paging system seeking to correct the problems of the current system.

  • PDF

곱셈과 나눗셈 문장제 유형에 따른 문제해결능력 (An Analysis on Problem Solving Ability of 3rd Grade Types of Multiplication and Division Word Problem)

  • 임자선;김성준
    • 한국초등수학교육학회지
    • /
    • 제19권4호
    • /
    • pp.501-525
    • /
    • 2015
  • 본 논문은 2009 개정 교육과정 초등학교 3학년 수학 교과서와 익힘책에 제시된 곱셈과 나눗셈 문장제를 유형별로 분석하고, 초등학교 4학년 학생을 대상으로 문장제 유형에 따른 문제해결능력을 살펴봄으로써 곱셈과 나눗셈 문장제의 효율적인 지도 방안을 생각해보기 위한 것이다. 이를 위해 먼저 초등학교 3학년 수학 교과서와 익힘책에 제시된 자연수의 곱셈 문장제를 동수누가, 비율, 비교, 정렬, 조합의 5가지 의미 유형으로, 나눗셈은 등분제와 포함제의 2가지 유형으로 구분하여 살펴보았다. 이와 함께 곱셈과 나눗셈 문장제에서 미지수의 위치에 따라 처음량, 변화량, 결과량을 묻는 문장제의 구문 유형에 대해서도 살펴보았다. 그런 다음 4학년 학생을 대상으로 문장제 문제해결능력 검사 도구를 개발하였는데, 앞서 분석한 곱셈과 나눗셈의 문장제 유형을 의미와 구문으로 나누어 2차례의 검사를 실시하여 정답률과 학생들의 오답 반응 등을 분석하였다. 분석 결과 곱셈은 동수누가에서의 정답률이 높게 나온 반면 나눗셈의 경우 포함제와 등분제에서 차이를 보이지 않았는데, 이는 교과서의 문제 유형 분포와 상관관계를 보임을 알 수 있다. 이러한 논의를 바탕으로 곱셈과 나눗셈 문장제의 효과적인 지도와 학생들의 문장제 문제해결능력을 향상시키기 위해 다양한 유형의 문장제를 제시할 필요가 있음을 제안하고 있다.

워드 임베딩과 품사 태깅을 이용한 클래스 언어모델 연구 (Class Language Model based on Word Embedding and POS Tagging)

  • 정의석;박전규
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.315-319
    • /
    • 2016
  • 음성인식 성능 개선을 위한 언어모델의 기술적 진보는 최근 심층 신경망을 기반으로 한 접근방법으로 한 단계 더 진보한 모양새다. 그러나 연구되고 있는 심층 신경망 기반 언어모델은 대부분 음성인식 이후 리스코링 단계에서 적용할 수 있는 한계를 지닌다. 또한 대규모 어휘에 대한 심층 신경망 접근방법은 아직 시간이 필요하다고 본다. 따라서 본 논문은 심층 신경망 언어 모델의 단순화된 형태인 워드 임베딩 기술을 음성인식 후처리가 아닌 기반 N-gram모델에 바로 적용할 수 있는 접근 방법을 찾는다. 클래스 언어모델이 한 접근 방법이 될 수 있는데, 본 연구에서는 워드 임베딩을 우선 구축하고, 해당 어휘별 벡터 정보를 클러스터링하여 클래스 언어모델을 구축 방법을 제시한다. 이를 기존 어휘기반 N-gram 모델에 통합한 후, 언어모델의 성능 개선 여부를 확인한다. 클래스 언어모델의 타당성 검증을 위해 다양한 클래스 개수의 언어모델 실험과 RNN LM과의 비교 결과를 검토한 후, 모든 언어모델의 성능 개선을 보장하는 품사 부착 언어모델 생성 방법을 제안한다.

산술과 대수 영역의 문장제 문제해결 전략에 대한 초등 예비교사의 내용지식 연구 (The Study on Elementary Preservice Teachers' Content Knowledge in Arithmetic and Algebra Word Problems Solving Strategy)

  • 이종학
    • 한국콘텐츠학회논문지
    • /
    • 제14권12호
    • /
    • pp.1083-1099
    • /
    • 2014
  • 본 연구의 목적은 통계적 방법을 활용해 산술과 대수 영역에서 초등 예비교사들의 문장제 문제해결 능력과 그들이 선호하는 전략, 그리고 평가 능력을 알아보는 것이다. 연구의 결과, 첫째, 초등 예비교사들은 대수의 문장제 문제해결에서 뿐만 아니라 산술 문항에서도 논리적이고 절차적인 대수적 문제해결 행태를 보였지만, 산술문항에서 선호하는 문제해결 전략은 식세우기 전략과 표만들기 전략이었다. 둘째, 수학교육과 영어교육을 심화 전공하는 초등 예비교사들의 평가 점수는 유의수준 ${\alpha}=0.05$에서 유의미한 차이가 나타났지만, 1학년과 4학년 초등 예비교사 집단의 평가 점수는 유의수준 ${\alpha}=0.05$에서 유의미한 차이가 나타나지 않았다. 이 결과는 초등 예비교사들의 문장제 문제해결, 적합한 전략의 선택, 평가에서 단계별 향상을 위한 산술과 대수 영역의 정교하고 구조화된 예비교사교육이 필요함을 시사한다.

세종 전자사전과 준지도식 학습 방법을 이용한 용언의 어의 중의성 해소 (Word Sense Disambiguation of Predicate using Semi-supervised Learning and Sejong Electronic Dictionary)

  • 강상욱;김민호;권혁철;오주현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.107-112
    • /
    • 2016
  • 국립국어원의 주관으로 10년에 걸쳐 구축된 21세기 세종 계획의 결과물들은 한국어를 대상으로 한 대부분의 자연언어 처리 시스템 및 연구에 널리 이용되고 있다. 21세기 세종 계획의 결과물 중, 세종 전자사전은 한국어 어휘의 내재정보에 대한 체계적인 분석 정보를 담고 있어 세종 전자사전 내의 상세 정보를 이용하여 어의 중의성 해소(Word Sense Disambiguation) 규칙을 구축하는 데 이용할 수 있다. 하지만 한국어의 특성상 다양한 문형과 논항이 출현할 수 있으므로 문형과 논항에 대한 모든 정보를 담을 수 없는 단점이 존재한다. 본 연구에서는 세종 전자사전의 용언 하위범주화 정보와 한국어 어휘의미망(Korean Lexico-semantic Network)을 이용하여 구축한 어의 중의성 해소 규칙을 준지도 학습 방법을 이용하여 논항의 선택제약 정보를 확장 및 일반화한다.

텍스트 데이터 워드클라우드 분석을 위한 데이터 정제기법에 관한 연구 (A Study on Data Cleansing Techniques for Word Cloud Analysis of Text Data)

  • 이원조
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.745-750
    • /
    • 2021
  • 비정형 텍스트 데이터의 빅데이터 시각화 분석에서 원시 데이터는 대부분 대용량이고 비정형으로 정제하지 않고 분석기법을 적용할 수 없는 상태이다. 따라서 수집된 원시 데이터는 1차 휴리스틱 정제과정을 통해서 불필요한 데이터들을 제거하고 2차 머시인 정제과정을 통해서 불용어를 제거한다. 그리고 어휘의 빈도수를 계산하여 워드클라우드 기법으로 시각화하고 핵심 이슈들을 추출하여 정보화하고 그 결과를 분석한다. 본 연구에서는 파이썬 워드클라우드에서 외부 불용어 Set(DB)를 사용한 새로운 불용어 정제기법을 제안하고 실무 사례분석을 통하여 이 기법의 문제점과 효용성을 도출한다. 그리고 이 검증 결과를 통해 제안된 정제기법을 적용한 워드클라우드 분석의 실무적용에 대한 효용성을 제시한다.

불용어 시소러스를 이용한 비정형 텍스트 데이터 후처리 방법론에 관한 연구 (A Study on Unstructured text data Post-processing Methodology using Stopword Thesaurus)

  • 이원조
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.935-940
    • /
    • 2023
  • 인공지능과 빅데이터 분석을 위해 웹 스크래핑으로 수집된 대부분의 텍스트 데이터들은 일반적으로 대용량이고 비정형이기 때문에 빅데이터 분석을 위해서는 정제과정이 요구된다. 그 과정은 휴리스틱 전처리 정제단계와 후처리 머시인 정제단계를 통해서 분석이 가능한 정형 데이터가 된다. 따라서 본 연구에서는 후처리 머시인 정제과정에서 한국어 딕셔너리와 불용어 딕셔너리를 이용하여 워드크라우드 분석을 위한 빈도분석을 위해 어휘들을 추출하게 되는데 이 과정에서 제거되지 않은 불용어를 효율적으로 제거하기 위한 "사용자 정의 불용어 시소러스" 적용에 대한 방법론을 제안하고 R의 워드클라우드 기법으로 기존의 "불용어 딕셔너리" 방법의 문제점을 보완하기 위해 제안된 "사용자 정의 불용어 시소러스" 기법을 이용한 사례분석을 통해서 제안된 정제방법의 장단점을 비교 검증하여 제시하고 제안된 방법론의 실무적용에 대한 효용성을 제안한다.

고등학교 순열과 조합 단원의 불안요인 연구 (The Study of Factors of Anxiety of Permutation and Combination in High School)

  • 김미정;김용구;정인철
    • 한국학교수학회논문집
    • /
    • 제12권2호
    • /
    • pp.261-279
    • /
    • 2009
  • 순열과 조합은 수학 I 교과서의 여러 단원 중에서 가장 가르치기 어렵다고 느끼는 단원중의 하나이다. 이에, 본고에서는 순열과 조합 단원의 불안요인과 평가문항에 대하여 살펴보고, 불안요인을 감소시키는 방안을 찾고자 하였다. 이 연구는 2006년 11월부터 2008년 2월까지 약 1년여에 걸쳐서 Y고등학교 학생 2명을 대상으로 진행되었으며, 평가문항의 분석과정에 동료교사 2명이 참여하였다. 그 결과, 비형식적 평가문항이 불안의 주요 요인이며 협동학습과 문제 읽기 및 쓰기가 수학불안을 감소시키는 데 도움이 된다는 것을 알 수 있었다. 또한 이러한 수학불안 요인을 고려한 적절한 교수 학습법이 요구된다고 결론지었다.

  • PDF

맵리듀스를 이용한 통계적 접근의 감성 분류 (Statistical Approach to Sentiment Classification using MapReduce)

  • 강문수;백승희;최영식
    • 감성과학
    • /
    • 제15권4호
    • /
    • pp.425-440
    • /
    • 2012
  • 인터넷의 규모가 커지면서 주관적인 데이터가 증가하였다. 이에 주관적인 데이터를 자동으로 분류할 필요가 생겼다. 감성 분류는 데이터를 여러 감성 종류에 따라 나누는 것을 말한다. 감성 분류 연구는 크게 자연어 처리와 감성어 사전 구축을 중심으로 이루어져 왔다. 이전의 감성 분류 연구는 자연어 처리 과정에서 형태소 분석이 제대로 이루어지지 않는 문제와 감성어 사전구축 시 등록할 단어를 선별하고 단어의 감성 정도를 정하는 데에 명확한 기준을 정하기 힘든 문제가 있다. 이러한 어려움을 해결하기 위하여 감성 분류에 대용량 데이터와 통계적 접근의 조합을 제안한다. 본 논문에서 제안하는 방법은 단어의 의미를 찾는 대신 수많은 데이터에서 등장하는 표현들의 통계치를 이용하여 감성 판단을 하는 것이다. 이러한 접근은 자연어 처리 알고리즘에 의존하던 이전 연구와 달리 데이터에 집중한다. 대용량 데이터 처리를 위해 하둡과 맵리듀스를 이용한다.

  • PDF