• 제목/요약/키워드: 실제어

검색결과 458건 처리시간 0.035초

세종 전자사전과 한국어 어휘의미망을 이용한 용언의 어의 중의성 해소 (Word Sense Disambiguation of Predicate using Sejong Electronic Dictionary and KorLex)

  • 강상욱;김민호;권혁철;전성규;오주현
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권7호
    • /
    • pp.500-505
    • /
    • 2015
  • 21세기 세종계획을 통하여 개발된 세종 전자사전은 한국어 어휘의 내재정보에 대한 체계적인 분석 정보를 담고 있다. 이는 일반적으로 사용하는 텍스트 사전이 가지는 전산적 표상 문제를 해결하는데 많은 도움을 주고 있다. 자연언어처리 분야에서 끊이지 않는 문제인 어의 중의성 해소(Word Sense Disambiguation) 문제 또한 세종 전자사전의 상세 정보를 이용하여 해결할 수 있지만, 실제 제시된 문형과 논항의 선택제약 명사로는 어의 중의성 해소 문제를 해결하는 데 한계를 보인다. 본 연구에서는 세종 전자사전의 용언 하위범주화 정보를 이용한 어의 중의성 해소의 한계점을 보이고, 한국어 어휘의미망(Korean Lexico-semantic network)을 이용하여 논항의 선택제약 정보를 일반화한다.

코어넷을 활용한 비지도 한국어 어의 중의성 해소 (Unsupervised Korean Word Sense Disambiguation using CoreNet)

  • 한기종;남상하;김지성;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.153-158
    • /
    • 2017
  • 본 논문은 한국어 어휘 의미망인 코어넷(CoreNet)을 활용한 비지도학습 방식의 한국어 어의 중의성 해소(Word Sense Dsiambiguation)에 대한 연구이다. 어의 중의성 해소의 실질적인 응용을 위해서는 합리적인 수준으로 의미 후보를 나눌 필요성이 있다. 이를 위해 동형이의어와 코어넷의 개념체계를 활용하여 의미 후보를 나누어서 진행하였으며 이렇게 나눈 것이 실제 활용에서 의미가 있음을 실험을 통해 보였다. 접근 방식으로는 문맥 속에서 서로 영향을 미치는 어휘의 의미들을 동시에 고려하여 중의성 해소를 할 수 있도록 마코프랜덤필드와 의존구조 분석을 바탕으로 한 지식 기반 모델을 사용하였다. 이 과정에서도 코어넷의 개념체계를 활용하였다. 이 방식을 통해 임의의 모든 어휘에 대해 중의성 해소를 하도록 직접 구축한 데이터 셋에 대하여 80.9%의 정확도를 보였다.

  • PDF

코어넷을 활용한 비지도 한국어 어의 중의성 해소 (Unsupervised Korean Word Sense Disambiguation using CoreNet)

  • 한기종;남상하;김지성;함영균;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.153-158
    • /
    • 2017
  • 본 논문은 한국어 어휘 의미망인 코어넷(CoreNet)을 활용한 비지도학습 방식의 한국어 어의 중의성 해소(Word Sense Dsiambiguation)에 대한 연구이다. 어의 중의성 해소의 실질적인 응용을 위해서는 합리적인 수준으로 의미 후보를 나눌 필요성이 있다. 이를 위해 동형이의어와 코어넷의 개념체계를 활용하여 의미 후보를 나누어서 진행하였으며 이렇게 나눈 것이 실제 활용에서 의미가 있음을 실험을 통해 보였다. 접근 방식으로는 문맥 속에서 서로 영향을 미치는 어휘의 의미들을 동시에 고려하여 중의성 해소를 할 수 있도록 마코프랜덤필드와 의존구조 분석을 바탕으로 한 지식 기반 모델을 사용하였다. 이 과정에서도 코어넷의 개념체계를 활용하였다. 이 방식을 통해 임의의 모든 어휘에 대해 중의성 해소를 하도록 직접 구축한 데이터 셋에 대하여 80.9%의 정확도를 보였다.

  • PDF

로그데이터를 이용한 디스크립터의 외형적 특성 분석 (Analysis of the Candidate Terms and Structure Using the Log-data)

  • 남영준;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.61-66
    • /
    • 2004
  • 본 연구에서는 시소러스를 구축하기 위해 필요한 디스크립터 수집원으로써 이용자 로그데이터를 분석하여 후보 디스크립터의 외형적 특성을 분석하였다. 분석대상인 이용자 로그데이터는 국내 검색엔진가운데 야후와 라이코스를 대상으로 하였다. 분석결과, 이용자들은 대부분 검색어로써 명사와 복합명사를 사용하였으며, 조사 '의'이외에는 다른 품사로 이루어진 검색어는 거의 존재하지 않음을 알 수 있었다. 또한 검색어로써 이용자들은 고유명사(외국어 포함)를 많이 사용함으로써, 국내외 지침에서 권고하는 고유명사의 최소한 사용지침과 실제 이용자 사이의 이용행태와의 차이를 알 수 있었다. 따라서 국내외 시소러스 개발지침을 수용하면서, 이용자 중심의 시소러스를 개발하기 위해서는 전거어나 유사어 사전을 대등관계와 연동하여 개발하는 것을 고려해야 한다.

  • PDF

일한 기계번역 시스템 COBALT-J/K의 성능 평가 (Evaluation of COBALT-J/K, Japanese to Korean Machine Translation System)

  • 정중락;김정인;문경희;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.338-345
    • /
    • 1996
  • 일본어 특허 문서를 번역하기 위해 개발이 시작된 COBALT-J/K(COllocation - BAsed Language Translator from Japanese to Korea)는 현재 그 번역 대상을 모든 일본어 문서로 확장해 곧, 상용 시스템으로 전환을 바라보고 있다. 이런 시점에서 일반 문서를 대상으로 하는 범용 기계 번역 시스템의 관점에서 시스템을 평가하여 문제점을 찾고, COBALT-J/K가 우선적으로 해결하고자 한 문제들이 올바르게 해결되었는지를 살피고자 한다. 이를 위한 평가 방법으로 문형별로 분류된 다수의 일본어 문장에 대하여 실제 번역을 하여 한국어 번역문과 일본어 원문을 비교하는 방식으로 분석하였으며, 현재 시판되고 있는 J-Seoul에 대해서도 같은 방법으로 실험한 결과를 얻은 후, 이 결과는 평가의 보조 자료로 삼았다.

  • PDF

K-MOOC(한국형 온라인 공개강좌) 관련 연구 경향 및 핵심어 분석 (An Analysis of Research Trends and Major Keywords related to K-MOOC)

  • 권충훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.369-370
    • /
    • 2021
  • 본 연구는 2015년부터 서비스를 진행하고 있는 한국형 온라인 공개강좌 K-MOOC 관련 연구물들의 연구 경향과 그 연구물들의 주요 핵심어들을 실증적으로 분석하여 그 결과를 제시하였다. K-MOOC는 4차 산업혁명 시대의 평생교육 교육지원 서비스로서, 또한 코로나19 상황에서의 대면수업 대체 보완 교수학습 활동 콘텐츠로 주목받고 있다. 본 연구에서는 K-MOOC 관련 등재지(등재후보지 포함) 게재논문 96건을 연도별 발표 경향과 그 연구물들의 핵심어들의 빈도 등을 분석하여 워드클라우드로 제시하였다. 본 연구자는 본 연구결과에 기초하여, K-MOOC 수강생들의 학습성과 향상 방안과 정규 교육과정과의 실제적인 연계 방안 등에 대한 후속 연구를 진행할 계획이다.

  • PDF

검색엔진에서 일간질의 어분포의 정상성에 관한 연구 (On Regularity of Daily Distribution of Queries in Search Engine)

  • 박상규;이찬규;윤경현;김성희;이준호
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.255-265
    • /
    • 2007
  • 하루에도 수백만 건 이상의 방대한 질의어가 입력되는 검색엔진을 통해 인터넷 검색 패턴을 분석하는데 활용될 수 있는 질의어 분포의 정상성을, Pareto 분포와 Zipf 모형을 이용해 검토하였다. 실제2주일간의 일간 검색어 분포를 Pareto 모형으로 적합 시킨 결과, 그 기울기가 1.33에서 1.34 정도로 일관되게 측정되고 있어 Pareto 분포를 이용해 일간질의어 분포의 정상성을 평가할수 있음을 제시하였다. 이런 연구결과는 사회적 관심사와 그 변동 흐름을 해석하는데 보다 객관적이며, 효율적인 자료를 제공해 줄 수 있을 것이다.

다문화 배경 학생을 위한 학습 도구어 선정 및 학습 어플리케이션 개발 (Academic Vocabulary Selection and the Development of Learning Application for Students with Multi-cultural Backgrounds)

  • 민경아;유동희
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.23-36
    • /
    • 2020
  • 본 연구는 중학교 입학 전 다문화 배경 학생을 위한 학습 도구어 교육의 필요성을 밝히고 중학교 교과 학습에 필요한 학습 도구어를 선정하여 선정된 어휘 목록을 활용한 자기 주도적 학습 방안을 모색하는 것에 그 목적이 있다. 이를 위하여 본 연구에서는 실제적인 학습 도구어 목록을 마련할 필요가 있다고 판단하여 중학교 1학년 국어, 수학, 사회, 과학 교과서의 지문에 있는 학습 관련 어휘들을 조사하였고, 그 결과를 바탕으로 주요 학습 도구어를 선정하였다. 또한 선정된 학습 도구어를 활용하여 자기 주도적인 학습이 가능한 프로토타입 형태의 학습 도구어 학습 어플리케이션을 개발하였다. 본 연구에서 개발한 학습 어플리케이션을 활용하여 학습 도구어를 학습할 경우 다문화 배경 학생의 중학교 교과 학습 적응에 도움이 될 것으로 기대된다.

한국어 서술어와 논항들 사이의 의미역 (Korean Semantic Role of subcategorization)

  • 김윤정;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.143-148
    • /
    • 2014
  • 본 논문은 한국어 문장의 서술어와 공기관계에 있는 논항들의 의미관계를 결정하는 데에 목적이 있다. 본 논문에서는 의미역을 결정하기 위해 기존에 구축된 세종구구조말뭉치를 모단위로 하여 표준국어대사전의 문형을 적용하였다. 또한 의미역을 결정하기 위해 기존 언어학 이론에서의 의미역을 정리하여 광범위한 의미역 판별기준을 세우고 이를 실제 말뭉치에 적용함으로써 자연언어적 처리가 가능하도록 정리하였다.

  • PDF

일본어화자의 한국어 학습에 나타나는 발음상의 제문제 -- phonemic unit와 prosody, 특히 pitch에 대하여 --

  • 노마 히데키
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.268-273
    • /
    • 1996
  • 본고는 일본어화자의 한국어 학습에 나타나는 발음상의 제문제를 논한다. 문제점은 초급, 중급의 단계별로 고찰할 필요가 있고 또한 학습자의 이론적인 인식상의 문제와 학습자의 실제 발음 실천상의 문제를 구별해서 검토할 필요가 있다. 본고에서는 모음, 자음, 음운변화 및 표기상에 나타나지 않는 발음의 문제 등, 음운단위에 관한 요소, 그리고 높낮이(pitch)와 억양(intonation) 등, 운율적인 요소를 다루었다. 서울말의 높낮이에 대한 기술도 시도하였다.

  • PDF