• 제목/요약/키워드: 한글과 영어

검색결과 361건 처리시간 0.026초

통계적 기법에 의한 한-영 문자열의 자동 전환 (Statistical Approach to the Automatic Korean-English String Conversion)

  • 안영훈;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.205-208
    • /
    • 2001
  • 한글 혹은 영어 문자열을 입력할 때 입력 모드를 수동으로 전환하지 않더라도 입력된 문자열이 한글인지, 영어인지를 자동으로 판단하여 해당 문자열로 변환하는 방법을 제안한다. 한글 문자열일 확률을 계산하기 위해 음절 구성 요건과 음절 빈도 정보를 이용하고, 영어 문자열일 확률을 계산하기 위해 영어 bigram 및 trigram 정보를 이용한다. 또한, 한글과 영어가 혼합된 문자열은 한글일 확률과 영어일 확률이 교차되는 경계 위치를 인식함으로써 혼합 문자열을 생성한다.

  • PDF

한글 DBpedia 온톨로지 스키마 구축 (Building a Schema of the Korean DBpedia Ontology)

  • 강민서;김재성;김선동;이재길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-142
    • /
    • 2014
  • 시맨틱웹의 구현 도구로써 온톨로지가 있다. 온톨로지는 지식개념의 의미적 연결을 하는데 사용된다. 영어 위키피디아를 토대로 한 영어 DBpedia 온톨로지는 스키마(owl파일 형태)와 인스턴스 모두 잘 구축이 되어있다. 그리고 영어 DBpedia의 각 Class에 한글은 레이블의 형태로 달려있다. 하지만 한글 레이블을 가지고 있지 않은 영어 DBpedia의 Class들이 절반이 넘기 때문에 한글 Class들만으로 된 스키마 구축은 의미가 있다. 한글 Class들로 만들어진 스키마가 있다면 두 한글 온톨로지 사이의 클래스 매칭 알고리즘을 위한 실험이나 한글 온톨로지 자동 증강 알고리즘의 연구 등에 유용하게 쓰일 수 있을 것이다. 본 논문에서 구축한 한글 DBpedia 온톨로지 스키마는 영문 DBpedia 온톨로지의 계층구조와 한글 클래스와 영문 클래스 사이의 매핑정보를 바탕으로 구축되었다. 그리고 기존에 제공되는 한글 DBpedia 온톨로지 클래스의 영어매핑 정보가 있는 한글 프로퍼티와 영어매핑 정보가 없는 한글 프로퍼티를 모두 한글 클래스의 프로퍼티로 입력해주었다.

  • PDF

음운인식의 언어 간 전이와 한글 및 영어의 읽기 쓰기와의 관계 (Cross-language Transfer of Phonological Awareness and Its Relations with Reading and Writing in Korean and English)

  • 김상미;조증열;김지연
    • 인지과학
    • /
    • 제26권2호
    • /
    • pp.125-146
    • /
    • 2015
  • 본 연구는 초등학교 5학년 학생들을 대상으로 한국어 음운인식이 영어 음운인식에 기여하는지의 여부와, 한국어와 영어의 음운인식이 한글과 영어 읽기 및 쓰기와 관련이 되는지를 살펴보았다. 그 결과, 어휘력과 연령을 통제한 후에 한국어 음운인식은 영어 음운인식의 변량을 유의하게 설명하였다. 구체적으로 한국어 음절과 음소인식은 영어 음절인식을 예측하였고, 한국어 음소인식은 영어 음소인식을 예측하였다. 연령과 어휘력을 통제한 후에 영어 음소인식은 영어와 한글의 읽기와 받아쓰기의 변량을 유의하게 설명하였다. 또한 한국어 음절인식이 한글읽기를 설명하였으며, 영어 음절인식은 한글 받아쓰기를 설명하였다. 본 연구의 결과는 음운인식은 상위언어적 기술(metalinguistic skill)로 한국어에서 영어로 언어 간 전이되는 것을 시사한다. 또한 음소인식이 영어의 읽기와 쓰기에 중요하지만, 음소와 음절인식이 한글의 읽기와 쓰기에 중요한 것을 시사한다.

웹 검색을 이용한 한글대역어에 대한 영어약어의 중의성 해소 (Web-based disambiguation of English Abbreviation for Korean Term)

  • 구희관;정한민;강인수;성원경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.611-614
    • /
    • 2006
  • 특정 신문은 해당 도메인의 언어자원을 구축하는데 필요한 자원이며, 한글과 영어의 괄호를 통해 표현되는 대역어구는 다국어 정보로 언어자원 구축에 이용된다. 그러나, 실제로 신문에서 사용되는 한영대역어의 구성은 한글대역어와 영어약어로 구성된 비율이 80%이상을 보인다. 신문을 대상으로 대역어사전 등을 구축하기 위해서는, 영어양어의 완전한 형태인 영어비약어 정보가 필요하다. 본 논문은 영어비약어 정보를 획득하기 웹검색을 통해 영어비약어를 획득하고, 영어약어를 이용해 영어약어와 영어비약어의 관계를 이용하는 방법을 제안한다.

  • PDF

정보검색을 위한 외래어 자동표기 모델 (Automatic Foreign Word Transliteration Model for Information Retrieval)

  • 이재성;최기선
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

객체 지향을 지원하는 한글 프로그래밍 언어 "새싹" 구현 (Implementation of a Hangul Programming Language "Sprout" Supporting Object-Oriented Programming)

  • 강도훈;오정한;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.35-38
    • /
    • 2015
  • 컴퓨터 보급률의 증가로 소프트웨어에 관한 관심이 높아지게 되었고, 이는 초중등학생에게 프로그래밍을 가르치는 계기가 되었다. 하지만 대부분의 프로그래밍 언어는 영어로 구성되어 있어 영어 능력이 부족한 초중등학생이 사용하기에 부담되는 것이 사실이다. 그래서 비영어권 국가에서는 모국어로 된 프로그래밍 언어를 개발해왔다. 한국에서는 몇몇 한글 프로그래밍 언어가 개발되었지만, 현재까지 사용되고 있는 언어가 거의 없다. 또한, 객체 지향을 지원하는 한글 프로그래밍 언어가 거의 없다. 우리는 프로그래밍을 처음 배우는 초보자들이 영어를 모르더라도 객체 지향 개념을 쉽게 사용할 수 있도록 도와주는 한글 프로그래밍 언어 새싹을 개발하였다. 새싹을 통해 객체 지향 개념을 쉽게 습득함으로써 나중에 영어로 된 프로그래밍 언어를 배워야 할 때에서 더 쉽게 배울 수 있을 것이다.

전화기 버튼을 이용한 한글입력방식에 대한 고찰

  • 이남식;김호성;신찬수
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1997년도 추계학술대회논문집
    • /
    • pp.326-332
    • /
    • 1997
  • 본 연구에서는 각종 통신기기의 입력방식으 사용되고 있는 전화기 버튼을 이용한 여러 가지 한 글입력방식의 사용성 평가를 통해 어떠한 입력방식이 더 사용하기 편리한가를 살펴보는데 있다. 기존의 많은 사람들이 전화기 버튼을 이용한 한글입력방식을 개발하기 위해 노력하였고, 그 결과 현재 여러 가 지의 특허가 나와 있다. 하지만 한글의 자모가 영어 알파벳보다 많다는 것과 복잡한 구성체계를 갖고 있다는 한글의 특징으로 인해 영어권과 같이 실생활에서 쉽게 쓰이지 못하고 있고, 또한 한글입력방식에 대한 체계적인 연구가 미흡 실정이다. 이에 본 연구에서는 여러 가지 한글입력방식에 대한 사용성 평 가를 통해 좀더 실생활에 적용력이 높은 창의적인 입력방식을 제안하고자 한다.

  • PDF

한영 혼용문서 인식을 위한 다중 폰트 이미지로부터 한글과 영어의 구별 (Distinction of Korean and English Characters from Multi-font Images for the Recognition of Mixed Document Composed of Korean and English)

  • 전일수
    • 한국산업정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.52-58
    • /
    • 1999
  • 본 논문에서는 한\ulcorner영 혼용문서인식을 위해 다중 크기, 다중 활자체에 적용 가능한 한글과 영어를 구별하는 알고리즘을 제안한다. 제안된 방법에서는 글자의 종횡비, 연결요소의 수, 좌상단의 획이미지 존재 여부, 그리고 바(bar)를 입력 이미지에 대해 좌상우하의 순서로 진행해 가면서 바를 검출하고, 이들을 이용하여 한글과 영어를 구별한다. 제안된 방법을 문서 작성 시 널리 사용되는 ?글의 명조체, 신명조체, 고딕체, 궁서체에 대해 실험하여 그 성능의 우수성을 입증하였다.

  • PDF

세선화된 결과를 이용한 한글과 영어의 구별 (Distinction of Korean and English Characters Using the Result of Thinning)

  • 전일수;원남식;이두한
    • 한국정보처리학회논문지
    • /
    • 제4권6호
    • /
    • pp.1652-1663
    • /
    • 1997
  • 본 논문에서는 세선화된 결과로부터 다중 활자체에 적용 가능한 한글과 영어를 구별하는 알고리즘을 제안한다. 제안된 알고리즘에서는 각 글자의 연결요소의 개수를 가지고 한글과 영어를 구별하였으며, 연결요소의 개수만으로는 구별이 되지 않을 경우에는 한굴에 존재하는 모음을 이용하여 이들을 구별하였다. 가장 널리 사용되는 세가지의 활자체에 대해 21,150 자를 실험한 결과 99.82%의 구별율을 얻었다.

  • PDF

텍스트 인식률 개선을 위한 한글 및 영어 텍스트 이미지 초해상화 (Korean and English Text Image Super-Resolution for Improving Text Recognition Accuracy)

  • 권준형;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.72-75
    • /
    • 2022
  • 야외 환경을 카메라로 촬영한 일반 영상에서 텍스트 이미지를 검출하고 인식하는 기술은 로봇 비전, 시각 보조 등의 기반이 되는 기술로 활용될 수 있어 매우 중요한 기술이다. 하지만 저해상도의 텍스트 이미지의 경우 텍스트 이미지에 포함된 노이즈나블러 등이 더 두드러지기 때문에 텍스트 내용을 인식하는 것이 어렵다. 이에 본 논문은 일반 영상에서의 저해상도 한글 및 영어 텍스트에 대한 이미지 초해상화를 통해 텍스트 인식 정확도를 개선하였다. 트랜스포머에 기반한 모델로 한글 및 영어 텍스트에 대한 이미지 초해상화를 수행하였으며, 영어 및 한글 데이터셋에 대해 제안한 초해상화 방법을 적용했을 때 그렇지 않을 때보다 텍스트 인식 성능이 개선되는 것을 확인하였다.

  • PDF