• 제목/요약/키워드: Korean sentence symbols

검색결과 13건 처리시간 0.009초

문장 검색을 위한 색인시스템 구축 : 초 .중등 학생의 한국어 및 영어 문장을 중심으로 (A Construction of Indexing System for Sentence Retrieval)

  • 이태영
    • 정보관리학회지
    • /
    • 제20권1호
    • /
    • pp.145-163
    • /
    • 2003
  • 한국어 및 영어의 글쓰기를 도와주는 문장 및 문단 제공시스템을 구축하기 위하여 색인작성과 탐색시에 필요한 색인언어를 연구하였다. 색인언어로 명사어와 술어 및 부사어를 선정하였고 여러 가지 보조 색인기호들도 추가하였다. 접근점으로 주제명과 키워드를 사용하였고 키워드 검색은 1절, 2절, 3 절, 문맥첨가 탐색을 포함하였다. 검색의 만족도는 긍정적이었으며 데이터베이스의 양과 질을 충실히 보완한다면 문장이나 문단을 제공하여 주는 시스템은 효과적일 수 있다.

음성 합성 시스템의 품질 향상을 위한 한국어 문장 기호 전처리 시스템 (Korean Sentence Symbol Preprocess System for the Improvement of Speech Synthesis Quality)

  • 이호준
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.149-156
    • /
    • 2015
  • 본 논문에서는 한국어 문장 기호의 처리를 통해 자연스러운 음성 합성 결과를 생성하는 방법에 대해서 논의한다. 이를 위해 한국어 위키피디아 문서를 분석하여 문장 기호의 사용을 8가지 형태로 분류하고, 11개의 정규표현식 규칙으로 문장 기호를 처리하는 방안을 제시한다. 그 결과 63,000 문장에 대해 56%의 정확도와 71.45%의 재현율을 달성하였으며, 문장 기호 처리 결과를 SSML 기반의 음성 합성 표현으로 변환하여 음성 합성 결과의 품질을 향상시키는 방법을 제안한다.

한국어의 리듬 단위에 관한 연구 - 문법 구조와 관련하여 (A Study on Rhythmic Units in Korean -with Respect to Syntactic Structure-)

  • Kim, Sun-Mi
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.224-228
    • /
    • 1996
  • This paper is intended as a study on how an utterance is divided into rhythmic units in Standard Korean with respect to its syntactic structure. With respect to the data in this study I used 150 sentences which contained similar number of words and various syntactic structures. Those sentences were read by 7 speakers of Seoul dialect in a conversation style. Each sentence was read twice in a normal speed and twice in a fast speed. As a total, 4200 sentences were recorded. Then listening to them, the author marked the sentences with two kinds of boundaries i.e. strong and weak. To explore the relationship between rhythmic units and syntactic structure I devised a framework of grammatical symbols. Each symbol is designed to have both syntactic and morphological information at the same time. So I assigned those grammatical symbols to the sentences. Having sentences marked with grammatical symbols on the one hand, and with the rhythmic boundaries on the other hand, 1 could show the relationship between rhythmic units and syntactic structure; which syntactic structures are likely to be pronounced as one rhythmic unit, and which are on the rhythmic boundaries.

  • PDF

등호 해석의 두 시간적 차원인 읽기.쓰기의 불일치와 그 해소 (Discrepancy between Reading and Writing Equality Number Sentences in Korean Language)

  • 임재훈
    • 한국초등수학교육학회지
    • /
    • 제17권2호
    • /
    • pp.207-223
    • /
    • 2013
  • 이 논문은 5+2=7과 같은 등호가 들어 있는 식의 읽기와 쓰기라는 두 행위 사이의 불일치 및 그 해소 과정에서 생길 수 있는 문제점에 관하여 논한 것이다. 기호 이해의 시간적 차원과 등호 개념의 이중성을 바탕으로, 초등 수학 교과서에 제시된 등식 읽기와 쓰기 방법을 분석하였다. 교사는 수업에서 기호 읽기와 기호 쓰기를 통해 무시간적인 차원의 기호를 시간 속에 펼쳐 놓는 시간화 작업을 수행한다. 이 때 읽기 순서와 쓰기 순서 사이에 불일치가 있을 수 있으며, 이를 교사가 어떻게 해소하는가는 학생들의 기호 이해에 영향을 줄 수 있다. 등식 읽기를 쓰기 관습에 종속시켜 이 불일치를 해소하면, 관계적 관점을 나타내고 있는 교과서의 등식 읽기를 조작적 관점의 읽기로 변환하는 현상이 일어나게 된다. 등호의 관계적 의미 이해를 중시하는 입장에서 보면, 쓰기를 교과서에 제시된 읽기 방식에 종속시키는 방향으로 불일치를 해소하는 것이 적절하다. 또한, 등호의 읽기 쓰기를 부등호의 읽기 쓰기와 통합적으로 다룰 필요가 있다.

  • PDF

Recognition of the Printed English Sentence by Using Japanese Puzzle

  • Sohn, Young-Sun
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제8권3호
    • /
    • pp.225-230
    • /
    • 2008
  • In this paper we embody a system that recognizes printed alphabet, numeral figures and symbols written on the keyboard for the recognition of English sentences. The image of the printed sentences is inputted and binarized, and the characters are separated by using histogram method that is the same as the existing character recognition method. During the abstraction of the individual characters, we classify one group that has not numerical information by the projection of the vertical center of the character. In case of another group that has the longer width than the height, we assort them by normalizing the width. The other group normalizes the height of the images. With the reverse application of the basic principle of the Japanese Puzzle to a normalized character image, the proposed system classifies and recognizes the printed numeral figures, symbols and characters, consequently we meet with good result.

철근콘크리트 설계에 이용되는 문헌자료의 자동축적에 관한 연구 (A Study on the Automatic Accumulation of Literal Data for Reinforced Concrete Design)

  • 이민호;이정재;김한중
    • 한국농공학회:학술대회논문집
    • /
    • 한국농공학회 1998년도 학술발표회 발표논문집
    • /
    • pp.150-154
    • /
    • 1998
  • Database schema is designed to accumulate the literal information automatically such as reinforced concrete design specifications. Sentence of design knowledge with literal data, numerical data, and symbols have analyzed manually. Finally, the proposed method has been shown that by proper design of the database schema of knowledge information as a function of design rule.

  • PDF

효율적인 한국어 파싱을 위한 최장일치 기반의 형태소 분석기 기능 확장 (Functional Expansion of Morphological Analyzer Based on Longest Phrase Matching For Efficient Korean Parsing)

  • 이현영;이종석;강병도;양승원
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권3호
    • /
    • pp.203-210
    • /
    • 2016
  • 한국어는 문장 구성소의 생략과 수식 범위가 자유롭기 때문에 파싱보다는 형태소 분석 단계에서 처리하면 좋은 경우가 있다. 본 논문에서는 파싱의 부담을 덜어 줄 수 있는 형태소 분석기의 기능 확장 방안을 제안한다. 이 방법은 미지어의 추정, 복합 명사 및 복합동사의 처리, 숫자 및 심볼의 처리에 의해 여러 형태소 열이 하나의 구문 범주를 가질 때 이것을 최장일치 방법으로 결합하고 의미 자질을 부여하여 하나의 구문 단위로 처리하는 것이다. 제안한 형태소 분석 방법은 불필요한 형태론적 모호성이 제거되고 형태소 분석 결과가 줄어들어 태거 및 파서의 정확률이 향상되었다. 또한, 실험을 통해 파싱트리는 평균 73.4%, 파싱 시간은 평균 52.9%로 줄었음을 보인다.

한국어 제목 개체명 인식 및 사전 구축: 도서, 영화, 음악, TV프로그램 (Named Entity Recognition and Dictionary Construction for Korean Title: Books, Movies, Music and TV Programs)

  • 박용민;이재성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권7호
    • /
    • pp.285-292
    • /
    • 2014
  • 개체명 인식은 정보검색 시스템, 질의응답 시스템, 기계번역 시스템 등의 성능을 향상시키기 위하여 사용된다. 개체명 인식은 일반적으로 PLOs(인명, 지명, 기관명)을 대상으로 하며, 주로 미등록어와 고유명사로 이루어져 있기 때문에 고유명사나 미등록어는 중요한 개체명 후보로 쓰일 수 있다. 하지만 도서명, 영화명, 음악명, TV프로그램명과 같은 제목 개체명은 PLO와는 달리 단어부터 문장까지 매우 다양한 형태를 지니고 있어서 개체명 인식이 쉽지 않다. 본 논문에서는 뉴스 기사문을 이용하여 제목 개체명을 빠르게 인식하고 자동으로 사전을 구축하는 방법을 제안한다. 먼저 특수기호로 묶인 어절을 추출하고, 주변 문맥 단어 및 단어 거리를 이용하여 SVM으로 제목 후보들을 추출하였다. 이렇게 추출된 제목 후보들은 상호 정보량을 가중치로 SVM을 이용해 제목 유형을 분류하였다.

문장부호를 사용한 효과적인 중국어 최장명사구 식별기법 (An Effective Approach Using Sentence Symbols to Identify Maximal-Length Noun Phrase in Chinese)

  • 백설매;이금희;김미훈;정유진;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.454-456
    • /
    • 2005
  • 일반적으로 중국어의 명사구는 최단명사구, 기본명사구 최장명사구로 분류된다. 최장명사구에 대한 정확한 식별은 문장의 전체적인 구조를 파악하고 문장의 정확한 지배용언을 찾아내는데 중요한 역할을 한다. 본 논문에서는 특성에 따라 5개의 클래스로 세분화된 문장부호를 학습자질로 사용하여 최장명사구 자동식별을 진행한다. 제안된 기법은 평균길이가 4인 최장명사구의 식별실험에서 기본모델(baseline)보다 $4.5\%$ 향상된 평균 $85.1\%$의 우수한 F-measure 성능을 보인다.

  • PDF

양상 논리에 대한 구성주의적 해석 (Constructivist interpretation on the modal logic)

  • 은은숙
    • 철학연구
    • /
    • 제116권
    • /
    • pp.257-280
    • /
    • 2010
  • 본 연구의 목적은 우선 일차적으로 양상논리학체계를 국어의 통사론적 구조 하에서 재구성하는 것이고, 둘째로 이를 구성주의 인식론의 관점에서 해석하는 것이다. 말하자면, 본 연구는 논리학에 대한 인식론적 해석, 즉 일종의 메타-논리학적 연구이다. 본 연구는 논리(규칙) 및 논리학적 체계는 선험적으로 우리 정신에 주어진 원리가 아니라, 인식 주관이 외적 대상들을 조작하는 행동들 중에서 반복적으로 작용하는 메커니즘들을 형식적으로 구조화하는 데서 성립한다는 것을 정당화하고자 한다. 말하자면, 논리규칙의 후험적 구성주의 논제를 정당화하고자 한다. 따라서 본 연구는 일체의 논리적 구조들을 심리학적 구조들에로 환원을 시도하는 일종의 환원주의이다. 필자가 강조하는 논리적 구성의 두 계기는 체계의 닫힘과 새로운 모순의 발견이다. 따라서 여기서는 명제계산체계 내에 있는 모순을 지적하고 이를 극복하기 위해서 양상논리가 출현하게 되었다는 것과 그럼에도 불구하고 이 체계 역시 새로운 모순을 만난다는 것을 증명하고자 한다. 결국 논리의 구성주의의 논제는 상위의 체계는 하위의 체계에 없던 새로운 제한적 속성이 등장한다는 것을 해명하는 것이 될 것이다.