• 제목/요약/키워드: 단어학습

검색결과 814건 처리시간 0.029초

단어 패턴 빈도를 이용한 한국어 영화평 자동 분류기법 (Automatic Classification of Korean Movie Reviews Using a Word Pattern Frequency)

  • 장재영;김정민;이신영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.51-53
    • /
    • 2012
  • 데이터 마이닝의 문서분류 기술에서 발전된 오피니언 마이닝은 이제 국외뿐만 아니라 국내의 학계 및 기업에서 중요한 관심분야로 자리잡아가고 있다. 오피니언 마이닝의 핵심은 문서에서 감정 단어를 추출하여 긍정/부정 여부를 얼마나 정확하게 자동적으로 판별하느냐를 평가하는 것이다. 국내에서도 이에 관련된 많은 연구가 이루어 졌으나 아직 실용적으로 적용할 만큼의 정확한 분류 정확도 보이지 않고 있다. 그 이유는 한국어의 경우 비문법적 표현, 감정단어의 다양성 등으로 인해 문서의 극성을 판별하기가 쉽지 않기 때문이다. 본 논문에서는 문법적 요소를 최대한 배제하고 단어 패턴의 빈도만을 고려한 영화평 분류기법을 제안한다. 제안된 방법에서는 문서를 단어들의 리스트로 추상화하여 패턴들의 빈도로 학습한 후 적절한 스코어 함수를 적용하여 문서의 극성을 판별한다. 또한 실험을 통해 제안된 기법의 정확도를 평가한다.

외국어 능력 향상을 위한 사용자 안구운동 분석 기반의 지능형 학습도구 개발 (Development of Intelligent Learning Tool based on Human eyeball Movement Analysis for Improving Foreign Language Competence)

  • 신지혜;장영민;김상욱;;배정옥;최성묵;이민호
    • 전자공학회논문지
    • /
    • 제50권11호
    • /
    • pp.153-161
    • /
    • 2013
  • 최근 효율적인 외국어 학습 및 테스트를 위한 교육 콘텐츠 개발에 대한 연구가 많이 되고 있다. 이러한 추세에 기반 하여, 온라인 학습 도구와 방송매체 등의 IT 기술을 이용한 e-learning 교육용 콘텐츠 개발이 급격하게 증가하고 있는 추세이다. 하지만 기존의 IT 기술을 이용한 교육용 콘텐츠들은 단방향의 학습 정보만을 제공하기에, 외국어 글을 이해하는 데는 사용자의 학습 편의를 제공하기 어렵다. 사용자 편의가 제공되려면 사용자의 학습 진단에 대한 부가적인 off-line 분석이 요구된다. 이에 본 논문에서는 사용자의 외국어 능력 향상을 위하여, 실시간(on-line)으로 학습 콘텐츠를 제공하여 외국어 능력을 진단하고, 향상시키기 위한 사용자 안구운동 분석 기반의 지능형 학습 도구를 제안한다. 이에 본 논문에서는 사용자 학습상태를 분석하기 위하여 인지심리학/신경생리학 기반의 사용자 학습상태와 관련된 안구 운동 특징 정보를 추출하고 판별 분석한다. 본 논문에서 제안하는 지능형 학습 도구는 앞서 언급한 사용자 안구운동 특징 정보를 기저로 하여 사용자가 외국어 읽기를 수행할 때, 사용자가 응시하고 있는 단어에 대하여, '안다/모른다'를 분석하여, 모르는 단어일 경우 실시간(on-line)으로 웹에서 단어를 검색하고, 정리하여 사용자에게 제공함으로써, 외국어로 된 글을 읽고 이해하는데 도움을 주는 자가 학습 서비스를 제공한다. 제안하는 시스템은 학습자들에게 자기 주도적 학습 도구를 제공하고, 자동화된 학습 콘텐츠로 외국어로 된 글의 이해에 대한 성취와 만족도를 높일 수 있다.

헬름홀츠머신 학습 기반의 의미 커널을 이용한 문서 유사도 측정 (Estimation of Document Similarity using Semantic Kernel Derived from Helmholtz Machines)

  • 장정호;김유섭;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.440-442
    • /
    • 2003
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어수준 이상의 개념 수준에서의 운서 비교를 가능하게 한다. 본 논문에서는 은닉변수모델을 이용하여 문서 집합으로부터 단어들 간의 의미관계를 자동적으로 추출하고 이를 통해 문서간 유사도 측정을 효과적으로 하기 위한 방안을 제시한다. 은닉변수 모델로는 다중요인모델의 학습이 용이한 헬름홀츠 머신을 활용하묘 이의 학습 결과에 기반하여, 문서간 비교를 한 의미 커널(semantic kernel)을 구축한다. 2개의 문서 집합 HEDLINE과 CACM 데이터에 대한 검색 실험에서, 제안된 기법을 적응함으로써 기본 VSM(Vector Space Model) 에 비해 20% 이상의 평균 정확도 향상을 이를 수 있었다.

  • PDF

동사사전를 이용한 의미 기반 정보 검색 시스템의 설계 (Design of An Information Retrieval System using Verb Dictionary)

  • 이용훈;이상범
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.177-180
    • /
    • 2009
  • 본 논문에서는 문장에서 동사를 파악하여 명사간의 의미를 부여하는 자동학습 온톨로지 기반 정보 검색 시스템을 제안한다. 정보의 양이 무한히 증가하고 있으며 웹의 발전에 따라 적합한 정보를 찾아내야 하는 효율적인 정보 검색 시스템의 필요성이 증대되고 있다. 단순히 키워드의 가중치에 따른 검색의 순위화는 사용자의 의미를 이해하지 못한 검색 결과로서 사용자로 하여금 결과를 다시 한번 직접 검색해야 하는 불편함을 제공하고 있다. 이러한 문제점을 해결하기 위해서 문장에서 동사를 파악하여 명사 간의 의미를 부여하고 문서 내에서 단어 간의 의미를 파악하여 검색의 질을 개선하는 방법을 논의한다. 또한, 문서에서 단어의 관계를 스스로 학습 가능하여 구축되는 자동학습 온톨로지 기반의 정보 검색 시스템을 제안한다.

  • PDF

온톨로지 기반의 효과적인 영어 학습 웹 어플리케이션 (An Web Application for Effective English Leaning based on Ontology)

  • 매튜 오클리;기창진;송은지
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.841-842
    • /
    • 2013
  • 우리나라에는 영어 학습을 위한 수많은 도구들이 있다. 특히, 최근 스마트폰의 출현으로 영어 학습을 위한 어플리케이션 개발이 활발하다. 그러나 대부분 영어단어를 단순히 암기하는 방법에 관한 것으로 텍스트 분석에 대한 어플리케이션은 부재하다. 본 논문에서는 사용자가 텍스트를 입력하면 단어가 갖고 있는 희소성에 따라 온톨로지 기반으로 분석되어져서 등급을 매기는 어플리케이션 시스템을 제안한다. 결과물은 파일 시스템과 데이터베이스에 저장되어 사용자는 텍스트의 희소성에 따라 선택한 텍스트를 읽음으로서 사용자의 눈높이에 맞게 신속하고 효율적인 어휘획득 능력을 갖게 된다.

  • PDF

WIPI 기반의 모바일 영단어 학습 시스템의 설계 및 구현 (Design and Implementation of a Mobile English Words Learning System based on WIPI)

  • 강의영;고진희;김한일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.1005-1008
    • /
    • 2005
  • 현재 휴대폰을 통한 무선 인터넷 사용자가 급격한 증가폭을 보이고 있다. 또한 WIPI 탑재 의무화에 따른 WIPI 플랫폼을 탑재한 휴대폰이 본격적으로 출시되고 있다. 이에 본 논문에서는 제한된 공간을 벗어나 정보를 이용할 수 있는 모바일 기기를 활용하고, 영어 학습자들의 어휘력 증진에 도움이 되는 영단어 학습 시스템을 WIPI 기반의 플랫폼에서 설계하고 구현한 결과를 보인다.

  • PDF

에러패턴 학습과 후처리 모듈을 이용한 연속 음성 인식의 성능향상 (Improving Performance of Continuous Speech Recognition Using Error Pattern Training and Post Processing Module)

  • 김용현;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.441-443
    • /
    • 2000
  • 연속 음성 인식을 하는 경우에 많은 에러가 발생한다. 특히 기능어의 경우나 서술어의 경우에는 동시 조음 현상에 의한 음운 변화에 의해 빈번한 에러가 발생한다. 이러한 빈번한 에러를 수정하기 위한 방법에는 언어 모델의 개선과 음향 모델의 개선등을 통한 인식률 향상과 여러 단계의 인식과정을 두어 서로 다른 언어 모델을 적용하는 등의 방법이 있지만 모두 시간과 비용이 많이 들고 각각의 상황에 의존적인 단점이 있다. 따라서 본 논문에서 제안하는 방법은 이것을 수정하기 위해 음성 인식기로부터 인식되어 나온 결과 문장을 정답과 비교, 학습함으로써 빈번하게 에러 패턴을 통계적 방법에 의해 학습하고 후처리 모듈을 이용하여 인식시에 발생하는 에러를 적은 비용과 시간으로 수정할 수 있도록 하는 것이다. 실험은 3000 단어급의 한국어 낭독체 연속 음성을 대상으로 하여 형태소와 의사형태소를 각각 인식단위로 하고, 언어모델로 World bigram과 Tagged word bigram을 각각 적용 실험을 하였다. 형태소, 의사 형태소일 경우 모두 언어 모델을 tagged word bigram을 사용하였을 경우 N best 후보 문장 중 적당한 단어 후보의 분포로 각각 1 best 문장에 비해 12%, 18%정도의 에러 수정하여 문장 인식률 향상에 상당한 기여를 하였다.

단어의 불순도를 고려한 특징 선택 방법 연구 (An Enhanced Feature Select ion Method using the Impurity of Words)

  • 강진범;양재영;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.679-681
    • /
    • 2005
  • 효과적인 문서 분류를 위해 학습 하고자 하는 클래스와 관련된 많은 특징들이 필요하다. 하지만 학습하고자 하는 개념과 관련이 없거나 중복된 정보가 수집된 정보 속에 존재한다. 학습 과정에서 정확한 지식 습득을 하기 위해 특징 선택 방법을 사용하였다. 본 논문에서는 클래스에 대한 단어의 불순도를 이용한 특징 선택 방법을 제안한다. 기존의 특징 선택 방법과 비교 분석하여 기존 특징 선택 방법의 문제점을 파악하고 개선된 기법을 보인다.

  • PDF

기계학습과 언어처리에 기반한 문자메시지 분류 (Text Message Classification based on Machine Learning)

  • 선주오;지명근;최범휘;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.492-495
    • /
    • 2019
  • 휴대전화 메시지로는 결제, 인증번호, 택배, 광고 등의 다양한 문자들이 수신된다. 이 문자들은 서로 섞여 있어 이용자가 찾고자 하는 문자를 찾는 데 어려움이 있다. 본 논문에서는 기계학습과 단어 임베딩을 통해 메시지들을 카테고리로 분류하는 방법을 제안하고, 이를 구현한 안드로이드 앱을 소개한다. 앱에서는 택배, 카드, 인증, 공공기관, 통신사, 대화, 기타의 7개의 분류로 메시지를 분류하며, 자동 분류에서는 수동 태깅한 5802건의 문자메시지를 사용한다. 앱에서는 저장된 문자메시지간 유사도에 기반한 오프라인에 서의 자동 분류를 지원하여 개인정보 노출에 대한 거부감이 있는 사용자의 요구를 반영한다.

  • PDF

형제어 대체를 이용한 개체명 말뭉치 확장 (Named Entity Tagged Corpus Augmentation Using Co-hyponym Replacement)

  • 김재균;김창현;천민아;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-183
    • /
    • 2020
  • 말뭉치는 기계학습 및 심층학습을 위한 필수 자원이다. 한국어 개체명의 경우 학습에 사용할 잘 정제된 개체명 부착 말뭉치가 충분하지 않다. 말뭉치 정제 작업은 시간적, 경제적으로 많은 비용이 소모된다. 따라서 본 논문에서는 적은 양의 말뭉치를 이용하여 말뭉치를 자동적으로 확장하는 방법을 제안한다. 특별히 소규모 말뭉치에 속하는 문장의 단어에 대한 형제어들을 선정하여 형제어의 확률추출을 기반으로 대체함으로써 새로운 문장을 생성함으로써 말뭉치 확장하는 방법이다. 본 논문에서는 확장된 말뭉치를 이용해서 대부분의 시스템에서 성능이 향상됨을 확인할 수 있었다. 앞으로 단어의 삭제 및 삽입 등 다양한 방법으로 좀 더 다양한 문장을 생성할 수 있을 것으로 생각합니다.

  • PDF