• 제목/요약/키워드: 내용 문장

검색결과 400건 처리시간 0.024초

영어 웹문서 기계번역을 위한 태그 관리기 (Tag Manager for Machine Translation of English Web Page)

  • 안동언;서진원;이영우;정성종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.164-168
    • /
    • 1998
  • 영어 웹문서를 한국어로 기계번역을 하기 위해서는 웹문서에 있는 HTML 태그들을 처리하여야 한다. 본 논문에서는 웹문서의 태그들을 처리해 주는 태그 관리기를 제안한다. 태그 관리기는 영한기계번역의 대상이 되는 영어 웹문서에서 태그를 분리하고, 번역이 완료된 후에는 분리된 태그들을 올바른 위치에 복원시키는 기능을 갖는다. 태그 관리기는 태그들의 위치정보에 따른 태그들의 분류와 이를 분리하고 복원하는 기능을 가지고 태그의 내용에 따른 문장 분리기능도 가진다.

  • PDF

의미변화을 고려한 문서 요약 알고리즘 연구 (A Study of Text Summarization Algorithm Using a Meaning Distortion)

  • 이진관;장혜숙;이종찬;박상준;박기홍
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.295-298
    • /
    • 2011
  • 스마트폰과 같은 소형 이동단말기의 보급이 확산됨에 따라서 이동단말을 통한 웹 접속이 크게 증가하고 있다. 따라서 작은 화면에 웹문서의 내용을 표현하기 위해 문서요약이 필요하다. 형태소 치환에 의한 문서요약 방법은, 문장해석에서 의미변화와 단축처리에서 일부 단락에 치우치는 문제가 발생한다. 본 논문에서는, 의미변화의 문제는 의미변화율이 낮은 순서에 따라 요약 규칙을 분류하고 이 순위에 따른 요약 알고리즘을 제안하였다. 치우치는 문제는 요약처리가 문서전체에 똑같이 적용되는 새로운 기준을 정의해 요약 알고리즘에 도입하였다. 제안방법의 유효성은 20명의 피실험자로 실험한 결과에 의해 입증되었다.

  • PDF

MPEG-4 컨텐츠 저작의 형식 정의와 시스템 개발 (A Formalization and System Development for MPEG-4 Contents Authoring)

  • 김상욱;김희선;차경애
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.755-758
    • /
    • 2000
  • 시각 언어는 인간-컴퓨터 사이의 인터랙션 수단이다. 올바른 인터랙션을 위하여 저작된 컨텐츠와 재생되는 씬의 시맨틱이 인간과 컴퓨터는 물론 인간과 인간 사이에서 일관성과 신뢰성을 가져야 한다. 본 논문에서는 인터랙션의 일관성과 신뢰성을 위한 시각 언어의 시각문장 집합을 정의하고 형식화한다. 이러한 형식화는 시각 언어의 시각적 저작 내용의 모호성을 제거하여 공동 참여자의 신뢰성을 높인다. 또한 형식 정의에 대하여 저작 컨텐츠와 재생 씬의 동일성을 그래프로 증명한다. 이러한 형식 정의를 MPEG-4 컨텐츠 저작 도구에 적응한다. 즉. 각 객체 사이의 시간관계 정의에 따라 저작하며, 사용자 인터랙션에 따른 씬의 속성의 변화를 효율적으로 지원한다. 저작된 컨텐츠는 씬의 속성 정보에 따라 객체 사이의 동기화를 유지하면서 재생한다.

  • PDF

관계형 DB에서 Local Order 방식을 이용한 XQuery 변환기 설계 및 구현 (XQuery transformer Using Local Order in Relational DB)

  • 이명숙;홍동권;손유익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.137-140
    • /
    • 2005
  • 관계형 데이터베이스(RDBMS)의 내용을 XML로 표현하게 되면 지금까지 축적되어온 방대한 비즈니스 데이터들을 지속적으로 이용할 수 있게 된다. 다양한 형태로 저장된 XML 문서에서 원하는 데이터를 추출하고 변환하는 작업을 위해 W3C에서는 XPath를 핵심으로 하는 XQuery를 새로운 질의어 표준으로 발표하였다. RDBMS에 XQuery 질의어로는 구조가 다르기 때문에 질의어를 사용할 수가 없다. 따라서 본 논문에서는 XQuery 질의어로 RDBMS에서 검색이 가능하도록 XQuery 질의어를 SQL문장으로 변환시켜 검색할 수 있는 변환기를 설계하였다. 이 변환기는 복잡한 Numbering 기법을 사용하지 않고 child-parent relationship만 사용하므로 효율적인 데이터의 업데이트를 처리할 수 있다.

  • PDF

정보거래 자동 중개 시스템을 위한 한국어 문형 표준안 (Controlled Korean Phrase-Stucture Standard Spec.for the Automatic Information Trading Mediator System)

  • 정의석;김기태;임수종;차건회;박재득;윤보현;강현규
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.138-145
    • /
    • 2000
  • 본 논문은 정보거래 자동 중개 시스템을 위한 한국어 문형 표준안에 대하여 기술한다. 정보거래 자동 중개 시스템은 인터넷상에서 지식정보자산의 공급자와 수요자를 자동으로 연결해주는 시스템으로서 텍스트로 기술되는 수요자의 의도와 공급자의 지식정보 내용을 정확히 연결할 수 있는 신뢰성을 보장한 고품질의 정보검색 기술이 필수적이다. 그러나 자연어의 복잡성과 불규칙성은 정확한 언어처리 기술이 필수적인 고품질의 정보검색을 보장할 수 없다. 따라서 본 논문은 한국어 문장 표현 방식을 표준화하여 언어처리 기술 적용의 한계를 극복해보자는 데 그 목적이 있다. 또한 일반 사용자의 언어 표현을 문형 표준안으로 유도하는 방법에 대하여 기술한다. 문형 표준안의 구성은 표준 문형, 표준 문형 유도 방법, 어휘부로 구성되어 있다.

  • PDF

담화표지의 음성언어적 특성과 음성합성 시스템에서의 활용 (Characteristics of Spoken Discourse Markers and their Application to Speech Synthesis Systems)

  • 이호준;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.254-260
    • /
    • 2007
  • 음성은 컴퓨터로 대변되는 기계와 사람 그리고 기계를 매개로 한 사람과 사람의 상호작용에서 가장 쉽고 직관적인 인터페이스로 널리 활용되고 있다. 인간에게 음성정보를 제공하는 음성합성 분야에서는 합성결과의 자연스러움과 인식성이 시스템의 주요 평가요소로 활용되고 있는데 이러한 자연스러움과 인식성은 합성결과의 정확성뿐만 아니라 발화환경이나 발화자의 발화특징 혹은 감정상태 등에 의해 많은 영향을 받게 된다. 담화표지는 문장의 명제 내용에는 직접 관여하지 않으면서 화자의 발화 의도나 심리적 태도를 전달하는 구성 요소를 말하는데 본 논문에서는 담화표지가 포함된 대화 음성 데이터를 수집하여 담화표지의 음성언어적인 특징을 분석하고 분석된 결과를 음성합성 시스템에 활용하는 표현방식에 대해 논의한다.

  • PDF

세종전자사전을 활용한 한국어 구문분석 (Korean Parsing using Sejong Dictionary)

  • 성열원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.261-268
    • /
    • 2007
  • 본 논문에서는 세종전자사전의 정보를 활용하여 논항 결합의 정확도를 향상시키는 한국어 구문분석 모델을 제안한다. 구문분석 과정에서 노드간의 결합 가능성을 계산할 때, 세종전자사전 동사사전의 격틀 정보, 논항 제약 정보와 명사사전의 의미부류 정보를 활용하여 가산점을 부여하여 사전의 내용과 일치하는 결합이 선호되도록 하였다. 이 과정에서 구조적 오류를 해결할 수 있었고, 결합에 참여하는 동사와 명사의 의미 중의성도 해소할 수 있었다. 평균 13어절 길이의 실험용 문장 50개를 대상으로 실험한 결과, 35% 정도의 오류 감소 효과를 볼 수 있었다. 또한 구문분석 결과 정보를, 전자 사전에 기술된 정보의 완결성을 시험하고 보완하는 데에도 활용하였다.

  • PDF

고등학교 환경과학 교과서의 질문과 문장 내용 분석 (Analysis of Question and Sentence in High Environmental Science Textbook)

  • 이봉헌;문성배;문정대
    • 한국환경과학회지
    • /
    • 제6권3호
    • /
    • pp.213-218
    • /
    • 1997
  • The question style In high school enoronmental science textbook was examined in terms of the placement, frequency, and type of question, and then analyzed the kind of scientific Inquiry process elicited by the question In the topic of textbook using the Tektbook guestioning Strategy Assessment Instrument (TQSAI). The average number of question per topic was only 0.6. The number of all Question In the high school enororunental science textbook was very little : the number of non-experiential Question was 8 and that of experiential one was 3. The total number of sentence was 1,236 and the ratio of the number of Question to that of sentence was 0.9% . The frequency of non-experlential question was higher than that of experiential one. In action part of the textbook, there were more kinds of Question styles than In the matin part.

  • PDF

ThruBook : 전자책을 이용한 e-Learning 플랫폼 개발 (ThruBook : e-Learning Platform Based on e-Book Readers)

  • 나재무;이정훈;이은정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.221-224
    • /
    • 2002
  • 본 논문에서는 전자책을 이용한 e-Learning 플랫폼을 소개한다. 이 시스템은 전자책에 대해 주석(annotation)을 추가하는 방식으로 텍스트의 부분에 대해 하이라이트, 북마크로 메모를 달거나 프리드로잉을 이용하여 설명을 달 수 있다 전자책에 추가된 하이라이트 및 북마크 등의 정보는 학생 리더 시스템에 외부 데이터로 저장되어 개인적인 학습에 사용할 수 있을 뿐 아니라 동기적인 원격 강의 방식으로 교사의 네비게이션과 액션에 따라 그 결과를 학생 터미널에 바로 보여주어 교사가 교재 화면을 칠판 대신 사용하면서 강의 내용을 전달하는 것이 가능하다. 또한 전자책에 기반한 토론을 지원하기 위해 채팅 기능을 구현하였는데, 각 문장은 전자책의 특정 위치(context)에 연결될 수 있다. 본 시스템은 전자책을 이용한 개별학습 자료의 제공 및 실시간 원격 강의를 위한 플랫폼을 제시하였으며, 자바 기반의 전자책 리더 시스템상에 구현하였다[1].

  • PDF

임베딩 자질을 이용한 대화의 감정 분류 (Emotion Classification in Dialogues Using Embedding Features)

  • 신동원;이연수;장정선;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.109-114
    • /
    • 2015
  • 대화 시스템에서 사용자 발화에 대한 감정 분석은 적절한 시스템 응답과 서비스를 제공하는데 있어 매우 중요한 정보이다. 본 연구에서는 단순한 긍, 부정이 아닌 분노, 슬픔, 공포, 기쁨 등 Plutchick의 8 분류 체계에 해당하는 상세한 감정을 분석 하는 데 있어, 임베딩 모델을 사용하여 기존의 어휘 자질을 효과적으로 사용할 수 있는 새로운 방법을 제안한다. 또한 대화 속에서 발생한 감정의 지속성을 반영하기 위하여 문장 임베딩 벡터와 문맥 임베딩 벡터를 자질로서 이용하는 방법에 대해 제안한다. 실험 결과 제안하는 임베딩 자질은 특히 내용어에 대해 기존의 어휘 자질을 대체할 수 있으며, 데이터 부족 문제를 다소 해소하여 성능 향상에 도움이 되는 것으로 나타났다.

  • PDF