• 제목/요약/키워드: 한자사전

검색결과 28건 처리시간 0.215초

전문용어 한글-한자 자동 변환 (Hangul-Hanja Transfer for Terminology)

  • 황금하;배선미;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.886-888
    • /
    • 2004
  • 기존의 한글-안자 변환에서는 문맥정보와 통계정보를 고려하지 않는 사전기반의 단어단위 변환 방법을 사용한 반면, 본 논문에서는 언어모델 밀 변환모델을 이용한 문장단위의 한자 자동변환 방법을 제안하고. 사전 미등록어와 복합어의 한글-한자 변환을 위하여 단어분할을 변환의 숨김 과정으로 처리하는 통합모델을 사용하였다. 실험 결과, 전문용어의 한글-한자 변환에서 제한된 한자 데이터를 이용하여 기존의 사전기반 변환보다 나은 결과를 얻을 수 있었다.

  • PDF

수학에 쓰이는 한자말에 대한 소고 (A note for Sino-Korean terminology of mathematics)

  • 허민
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제30권2호
    • /
    • pp.121-138
    • /
    • 2016
  • 초 중등학교 수학 용어의 대부분은 한자말이거나 한자말이 섞여 있다. 한자말 용어의 각 한자를 한자사전을 통해 확인하고, 한자의 뜻으로 한자말 용어를 이해할 수 있는지를 비판적으로 검토한다. 이를 통해 한자말이거나 한자말이 섞여 있는 수학 용어들을 한자의 뜻이 그것이 들어있는 용어의 개념을 이해하는 데 도움이 되는 경우와 도움이 안되는 경우 및 한자의 뜻이 오히려 잘못된 개념을 얻게 하는 경우로 나누어 파악한다.

정보 시스템의 유니코드 기반 한자 검색 지원 (Support on Ideograph Characters Search of Unicode Based Information System)

  • 윤소영
    • 정보관리학회지
    • /
    • 제24권4호
    • /
    • pp.375-391
    • /
    • 2007
  • 현재 유니코드 CJK 한자코드는 부수 기준 배열방식을 따르고 있어 한자의 한글음가를 기준으로 하는 우리의 문자생활 방식과 차이가 있으며, 우리나라 고유한자나 동형이음어, 이두문자, 그리고 이체자 관계 등을 모두 수록하고 있지 않아 정보시스템에 그대로 적용하기에는 무리가 있다. 따라서 유니코드 기반 정보시스템의 정확한 한자표현 및 한자검색을 위해서는 한자를 포함하는 자료에 대한 정확한 이해를 바탕으로 여러 가지 지원방안을 마련해야 한다. 이러한 측면에서 역사분야 정보검색시스템에서는 한글음가 및 한국에서만 사용되는 동형이음어 처리를 위한 한자-한글음가 사전, 본래 한자의 음가와 다르게 읽히는 한자를 위한 특수용어사전, 이형자와이체자를 위한 이체자사전, 그리고 유니코드 CJK 통합한자에 등록되어 있지 않은 한자를 위한 신출 한자목록을 지원하고 있다.

의미처리 기반의 한글-한자 변환 시스템 (korean-Hanja Translation System based on Semantic Processing)

  • 김홍순;신준철;옥철영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.398-401
    • /
    • 2011
  • 워드프로세서에서의 한자를 가진 한글 어휘의 한자 변환 작업은 사용자에 의해 음절/단어 단위의 변환으로 많은 시간이 소요되어 효율이 떨어진다. 본 논문에서는 한글 문장의 의미처리를 통해 문맥에 맞는 한자를 자동 변환하는 시스템을 제안한다. 문맥에 맞는 한글-한자 변환을 위해서는 우선 정확한 형태소 분석 및 동형이의어 분별이 선행되어야 한다. 이를 위해 본 논문에서는 은닉마르코프모델 기반의 형태소 및 동형이의어 동시 태깅 시스템을 구현하였다. 제안한 시스템은 형태의미 세종 말뭉치 1,100만여 어절을 이용하여 unigram과 bigram을 추출 하였고, unigram을 이용하여 어절의 생성확률 사전을 구축하고 bigram을 이용하여 전이확률 학습사전을 구축하였다. 그리고 품사 및 동형이의어 태깅 후 명사를 표준국어대사전에 등재된 한자로 변환하는 시스템을 구현하였다. 구현된 시스템의 성능 확인을 위해 전체 세종 말뭉치를 문장단위로 비학습 말뭉치를 구성하여 실험하였고, 실험결과 한자를 가진 동형이의어에 대한 한자 변환에서 90.35%의 정확률을 보였다.

국어대사전의 표제어에 나타나는 한자 정보 (Hanja Information in the Entries of Korean Unabridged Dictionary)

  • 김철수
    • 한국콘텐츠학회논문지
    • /
    • 제10권4호
    • /
    • pp.438-446
    • /
    • 2010
  • 한글과 한자가 혼합되어 나타나는 분야의 언어정보처리를 수행하기 위해서는 한글 및 한자 정보를 동시에 지원할 수 있는 전자 사전이 요구된다. 본 논문에서는 국어대사전의 표제어에 나타나는 한자 통계 정보에 대하여 고찰하였다. 대상 정보는 KSC-5601 코드에 기초하여 엔트리에 한자가 포함된 엔트리 수, 엔트리에 나타나는 한자의 음과 훈의 출현빈도 수, 품사별 한자 출현빈도수, 엔트리당 평균 출현 한자 수 등이다. 440,594개의 표제어 중 303,951개에서 한 글자 이상의 한자가 나타나 68.99%의 표제어에서 한자가 출현 하였다. 440,594개의 표제어에서 858,595글자의 한자를 포함하고 있어 표제어 당 평균 1.95개의 한자가 출현하였다. 표제어의 평균 음절길이 3.56이고 1.95개의 한자가 출현하므로 표제어를 구성하는 글자 중 54.78%가 한자임을 알 수 있다. 4,888개의 한자 코드 중 한번 이상 출현한 한자는 4,660개이며, 228개의 한자는 한 번도 출현하지 않았다. 4,000번 이상 출현하는 한자는 5개였다. 엔트리에 출현하는 858,595개의 한자에 대응하는 한글 음은 471개였다.

바른 한글음 생성을 위한 한자.한글 변환기 설계 및 구현 (Design and Implementation of a hanja-Hangul Convertor for Generating Correct Hangul)

  • 강형일;강승헌;장수민;유재수
    • 한국정보처리학회논문지
    • /
    • 제5권3호
    • /
    • pp.583-591
    • /
    • 1998
  • 본 논문은 한자·한글 혼합 문서들을 정확한 우리말 문서로 자동 변환하는 한자·한글 변환기를 설계하고 구현한다. 구현된 한자·한글 변환기는 정보 검색 시스템에서 한자·한글 혼합 문서 검색시 사용자들이 한자에 해당하는 한글음을 파악하는데 걸리는 시간을 절약하고 쉽게 판독할 수 있도록 한다. 이를 위해 KS C 5601 표준코드를 기준으로 바르지 못한 한글음 생성의 원인을 조사하고 두 개 이상의 한글음을 갖는 한자들과 이형표기가 가능한 한자를 올바른 한글음으로 변환할 수 있는 한글단어 매핑사전을 구축한다.

  • PDF

한자용어로부터 한글색인어의 생성 (A Generation of Hangul Index Term from Hanja Term)

  • 최석두
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.51-58
    • /
    • 1996
  • 한자(漢子)로 기술된 용어를 한글로 자동변환하여 색인어로 사용하는 경우에 한글의 음운체계나 해당 시스템의 색인정책에 맞지 않는 일이 생기게 된다. 이런 문제가 생기는 원인은 해당 한자에 대응하는 정확한 한글을 입력하지 않고 변환하였을 경우, 해당 한자의 음이 없거나 한자와의 음운체계가 달라 생기는 경우 및 별도의 색인정책이 있는 경우 등을 생각할 수 있다. 본고에서는 KS C 5601 표준코드(이하 표준코드라 한다)를 기준으로 한자(漢子)의 다음자(多音子)를 조사하였다. 다음자(多音子)가 포함되어 있는 사전용어와 다음자(多音子)파일을 이용하여 매핑파일을 구축함과 동시에 매핑파일을 보완함으로써 한자(漢子)로 기술된 용어의 바른 한글음을 자동생성하여 색인어로 사용할 수 있는 방안에 대하여 논한다.

  • PDF

Shale을 왜 '혈암'이라 하는가?

  • 이창진;류춘렬
    • 한국지구과학회:학술대회논문집
    • /
    • 한국지구과학회 2010년도 춘계학술발표회 논문집
    • /
    • pp.24-24
    • /
    • 2010
  • 중등 지구과학교과서와 대학 교재에서 학습하는 광물과 암석 이름은 대부분 영어, 한자, 일본어에서 도입한 용어이다. 이 용어에 대한 어원과 말뜻에 대한 분석이나 연구가 되지 않은 상태에서 바로 사용해왔기 때문에 지질학 초보자들이 학습하기에 아주 어렵다. 광물과 암석이름의 어원과 말뜻을 잘 알지 못하고 단순히 외우거나 학술적인 이름이나 의미만을 생각하고 사용하고 있으며, 한 광물이나 암석에 대하여 여러 가지 이름을 사용하기도 한다. 심지어 전혀 엉뚱한 암석 이름이 대중 사이에서 사용되고 있지만 이를 통제하지도 못하고 그 명칭이 틀렸다는 것도 모르고 있다. 예를 들면 영어로 Shale을 중등 교과서와 대학 교재에서 영어 발음을 따라 한국어로 셰일이라고 표기하지만 중국과 일본에서는 혈암(頁岩)으로 표기한다. 우리나라의 대중 매체의 인터넷 사전과 대중들이 사용하는 용어는 중국어 혈암(頁岩)을 공공연하게 '혈암'으로 표기하고 있다. '혈(頁)'을 한자 사전에서 찾아보면 '머리 혈'과 '책 면 엽'으로 정리되어 있다. 그러면 셰일의 암석학적 특징으로 볼 때 혈암이라고 해야 하나? 엽암이라고 해야 하나? 과학과의 다른 분야에서는 어려운 한자를 쉬운 한글로 표준화하는 연구와 실행을 꾸준히 진행해오고 있다. 생물의 경우 생물의 어려운 학명을 이미 쉬운 한글로 표준화했으며, 그 학명이 학생과 대중들에게 널리 알려져 있다. 지구과학의 교과서 문장에 나오는 단어와 전문용어가 한자를 한글로 표기한 경우가 많은데 이 단어들을 하루 속히 한글로 표준화하여 전문가들이 먼저 사용하는 동시에 학생과 대중들에게 알려 주어야 한다. 이렇게 되면 지구과학의 내용보다 용어가 어렵다는 인식을 바꾸어 줄 것이고 지구과학을 전공하고자 하는 학생들에게 희망과 용기를 줄 것이다. 그 일환으로 광물과 암석 이름의 어원을 조사해 보고 한글 표준화의 가능성을 타진해 보고자 한다.

  • PDF

중국어 규칙변환 웹 교육시스템 설계 및 구현에 관한 연구 (A Study on Construction and Implementation of Web education System with Chinese conversion rule set)

  • 이지현;이은령
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권4호
    • /
    • pp.227-234
    • /
    • 2016
  • 한자가 유입된 당시 한자의 원음도 함께 들어와서 현재 많은 한자들이 중국과 같은 한자에 같은 발음으로 사용하고 있으나 한국과 중국은 한자에 대한 발음이 서로 독립적으로 보존 및 변천되어 오늘날은 그 발음을 표기하는 방식이 서로 다르다. 본 연구는 중국 한자의 발음인 한어병음과 한국 한자발음을 구성하는 초성, 중성, 종성의 변화를 시스템으로 분석하여 중국어 발음과 대응되는 변환규칙을 생성함으로써 쉽게 중국어 발음을 학습할 수 있는 중국어규칙변환 교육시스템으로 설계 및 구현하였다. 본 연구는 중국어규칙변환 교육시스템을 웹으로 구현하였고, 앱등의 다양한 어플리케이션을 통하여 중국어를 학습하는데 도움이 되도록 하였다.

오프라인 인쇄체 문장부호, 일본 문자, 영문자, 한자 인식에서의 오인식 문자 교 정에 관한 연구 (A study on the Character Correction of the Wrongly Recognized Sentence Marks, Japanese, English, and Chinese Character in the Off-line printed Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.184-194
    • /
    • 1997
  • 최근 상용 오프라인 문자 인식시스템들이 계속 발표되고 있다. 본 눈문에서는 적 은 메모리와 빠른 시간내에 검색이 가능한 자기조직화 구조를 가진 단어 사전을 구축 하고 검색하는 알고리즘을 제시하며 오프라인 문자 인식 시스템을 이용하여 오인식 교정의 측면에서 문장부호, 영문자, 한자를 인식한 후에 나온 오인식된 문자들을 수 집하여 오인식 형태를 제분류하였다. 영문자에 대해서는 영문자의 오인식 형태와 오 인식의 예들을 조사하고 오인식이 자주 일어나는 글자에 대해 오인식 혼동 테이블을 작성하였으며 25,145개의 영어 단어가 입력된 자기조직화된 영어 단어 사전을 가지고 교정을 행하여 0.5%의 인식률 향상을 가져왔다. 한자에 대해서도 영문자와 마찬가지 로 오인식 행태를 조사하고 혼동 테이블을 작성하였으며 34,593개의 단어가 입력된 자기조직화된 한자 단어 사전을 이용하여 교정을 행하여 인식률을 6.1% 향상시켰다.

  • PDF