• 제목/요약/키워드: 명사화

검색결과 113건 처리시간 0.027초

하이퍼텍스트 한글백과사전의 개발 (Development of Hypertext Encyclopedia)

  • 전경헌;강현규;김용일;박상규;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.59-70
    • /
    • 1993
  • 개인용 컴퓨터가 많이 보급되고, CD-ROM과 같은 대용량의 기록장치가, 널리 퍼지면서, 전자화된 사전이 널리 사용되게 되었다. 그러나 이러한 전자사전들은 대개 매우 단순화된 탐색기능만을 제공하므로, 전자화의 잇점을 크게 살리지 못하고 있다. 따라서, 컴퓨터의 힘을 빌린, 보통의 종이로된 사전보다 훨씬 유용한 전자사전을 생각해 볼 수 있을 것이다. 이러한 노력이 과거 80년대 말에 하이퍼텍스트로 시작되어 이제는 매우 상업적인 곳에까지 사용되어지고있다. 국내에서도 전자사전의 개발은 다양하게 진행되어오고 있으나, 대부분 컴퓨터를 위한 사전, 다시 말하면, 빠른 접근시간, 적은 메모리사용만을 고려한 사전에 그치고 있다. 본 논문에서는 이러한 필요성에 부합하여, 백과사전자료를 가지고 사람을 위한 전자백과사전을 개발하는 방법을 소개한다. 특히, 이러한 개발과정을 자동화 할 수 있음을 보이고, 백과사전을 하이퍼텍스트로 자동변환하는 방법을 자세히 기술한다. 이 방법은 원시 자료를 하이퍼텍스트로 변환하기 좋은 정형화된 중간자료로 바꾸고, 이 중간자료와 기초적인 명사추출 알고리즘을 이용하여, 각 노드들 사이에 링크를 만드는 것이다. 또한, 이 방법을 이용하여 개발한 HE(Hypertext Encyclopedia) 시스템을 소개한다.

  • PDF

효율적인 키워드 검색을 지원하는 학습자료의 구조화 방법 연구 (A Study on Structuring Method of Study Data Supporting Efficient Keyword Search)

  • 김은경;최진오
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1063-1066
    • /
    • 2005
  • 다양한 학습 자료를 저장해두고 검색하는 시스템들은 주로 키워드 검색을 지원하고 있다. 여기서, 키워드 매칭 방식은 같은 분야의 자료라 하더라도 사용자가 입력한 키워드와 정확한 매칭이 되지 않을 경우 검색되지 못하는 문제점을 안고 있다. 또한 학습 테스트를 위한 학습 문제 자료는 키워드로 검색하기에는 포함한 정보의 양이 너무 적어 적용되기 어렵다. 본 논문에서는 이러한 문제점을 해결하기 위하여 학습문서를 입력할 때 문서에 포함되어 있는 각 단어들을 형태소 분석에 의하여 중요 명사들을 추출하고 데이터베이스화하는 기법을 도입하고 미리 마련한 유사한 용어 지식 데이터베이스를 활용하여 지능적이고 효율적인 학습자료 검색 기법을 제안한다.

  • PDF

고등학교 수학교과서의 설명텍스트와 교사 설명담화에 대한 체계기능언어학적 비교 분석 - '이차함수와 이차방정식의 관계'를 중심으로 - (A Study on the Written Texts of a High School Mathematics Textbook and Teacher's Classroom Discourse -A Focus on 'The Relationship between Quadratic Functions and Quadratic Equations'-)

  • 전수경;조정수
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제25권4호
    • /
    • pp.525-547
    • /
    • 2015
  • 본 연구는 교사가 수업에서 사용하는 수학언어의 특징을 분석하기 위하여 고등학교 1학년의 '이차함수와 이차방정식의 관계'를 설명하는 교과서 텍스트와 교사의 수업담화를 비교하였다. 분석 자료는 고등학교 수학1의 '이차함수와 이차방정식의 관계'에 대한 수업의 녹취록과 수업에 사용된 교과서 텍스트이며, 이 자료를 Halliday(1994)의 체계기능언어학에 따라 담화의미 층위와 어휘문법 층위로 구분하여 분석하였다. 연구 결과에 따르면, 교과서는 의미의 상하관계를 이용한 일반화, 명사화를 통한 수학적 대상화, 주제부의 변화를 이용한 의미의 구체화와 같은 어휘문법 전략을 사용하여 구체적인 예시로부터 일반화를 통해 수학적 개념을 구성하는 설명방식을 사용하였고, 이 과정에서 담화의미 층위와 어휘문법 층위의 조직적인 상호작용이 나타났다. 반면에 교사의 설명은 동사성의 변화와 이유 및 절차 담화의 추가를 통해 이차함수와 이차방정식의 관계를 구성해가는 과정으로 이루어졌다. 교사 설명담화의 언어적 특징으로는 맥락적 생략으로 인한 화용적 함축과 어휘소의 누락이 나타났으며, 담화의미 층위에 영향을 주는 구조적인 어휘문법 자원의 사용은 나타나지 않았다. 이러한 결과는 수학수업 담화를 분석하는 새로운 틀을 제공할 것으로 기대한다.

문서 내용의 계층화를 이용한 문서 비교 방법 (Document Clustering Methods using Hierarchy of Document Contents)

  • 황명권;배용근;김판구
    • 한국정보통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.2335-2342
    • /
    • 2006
  • 웹의 비약적인 성장으로 웹에는 무수한 정보를 축적하고 있으며, 특히 텍스트 문서는 인간에 의해 가장 쉽게 그리고 많이 이용되는 형식이라 하겠다. 텍스트 문서의 효율적 검색을 위해 많은 연구가 이루어졌으며, 확률을 이용한 방법, 통계적인 기법을 이용한 방법, 벡터 유사도를 이용한 방법, 베이지안 자동문서 분류 방법 등이 제안되었다. 그러나 이러한 기존의 방법들은 문서의 특징을 정확하게 반영할 수 없고, 의미적 검색이 이루어지지 않는 단점을 가지고 있다 이에 본 논문은 문서를 미리 분류하는 기존의 방법을 개선하기 위해, 유사한 문서를 의미적으로 찾아내기 위한 새로운 문서 분류의 척도를 제안하며 이를 적용하는 방법을 제시한다. 본 방법은 문서의 내용을 의미적인 계층으로 표현하고 중요 도메인에 가중치를 두며, 문서들간의 도메인 가중치와 도메인 내의 개념 일치도를 이용하여 유사도를 구한다.

교실 상황에서 영어 명사구의 초점 실현 양상 (Focus Realization of English Noun Phrases in the Classroom Situation)

  • 전지현;송재영;이동화;김기호
    • 음성과학
    • /
    • 제9권2호
    • /
    • pp.109-132
    • /
    • 2002
  • The purpose of this study is to examine the focus realization of [Adjective+Noun] phrases which are used in English classroom situations. In order to examine this, two production and one perception experiments were designed. The noun phrases in the first two production experiments are divided into three patterns according to the location of focus. The difference between the two production experiments is that in the first experiment the focused words are contextually given in the classroom situation, but in the second experiment they are presented in written form. We compare the native English teachers' focus realization of noun phrases with that of Korean teachers from the point of view of intonational phonology. In the perception test, we examine how the uttered sentences are perceived by English native speakers and Korean native speakers. The results from the three experiments show that native English teachers' focus realization is quite consistent with informational structure. Also, there is a significant difference in pitch range of adjectives and nouns when the native speakers give pitch accents on the two content words, and the uttered sentences are mostly perceived as well as the speakers' intentions. As for Korean speakers, however, they usually focus only on the adjective or they focus on both the adjective and the noun, regardless of the relative informativeness of these words. From these findings, we can conclude that focus realization of Korean teachers is rather inconsistent with respect to informational structure when compared to that of native English teachers.

  • PDF

운율어를 이용한 한국어 위치 정보 데이터의 다중 발음 사전 생성 (Multiple Pronunciation Dictionary Generation For Korean Point-of-Interest Data Using Prosodic Words)

  • 김선희;전재훈;나민수;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-188
    • /
    • 2006
  • 본 논문에서 위치 정보 데이터란 텔레메틱스 분야의 응용을 위하여 웹상에서 수집한 Point-of-Interest (POI) 데이터로서 행정구역 및 지명 인명, 상호명과 같은 위치 검색에 사용되는 어휘로 구성된다. 본 논문은 음성 인식 시스템을 구성하는 발음 사전의 개발에 관한 것으로 250k 위치 정보데이터로부터 운율어를 이용하여 불규칙 발음과 발음 변이를 포함하는 가능한 모든 발음을 생성하는 방법을 제안하는 것을 목적으로 한다. 원래 모든 POI 는 한 번씩만 데이터에 포함되어 있으므로, 그 가운데 불규칙 발음을 포함하는 POI를 검출하거나 발음을 생성하기 위해서는 각각의 POI 하나하나를 일일이 검토하는 방법밖에 없는데, 대부분의 POI 가 복합명사구로 이루어졌다는 점에 착안하여 운율어를 이용한 결과, 불규칙 발음 검출과 다중 발음 생성을 효율적으로 수행할 수 있었다. 이러한 연구는 음성처리 영역에서는 위치정보데이터의 음성인식 성능을 향상하는 데 직접적인 기여를 할 수 있고, 무엇보다도 음성학과 음운론 이론을 음성 인식 분야에 접목한 학제적 연구로서 그 의미가 있다고 할 수 있다.

  • PDF

저자 지정 색인 용어에 따른 컨퍼런스 논문 주제 및 동향 시각화 (Visualization of Conference Paper Topics and Trends According to Author-Assigned Index Terms)

  • 에런 스노버거;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.340-342
    • /
    • 2022
  • 색인 용어 또는 키워드는 가장 중요한 명사를 강조 표시하여 연구 논문 주제에 대한 빠른 개요를 제공하기 때문에 연구 논문의 중요한 구성 요소이다. 본 연구에서는 2018년 이후의 학술대회(KIICE)에 실린 논문과 2016년 이후의 국제학술 대회(ICFICE)에 실린 저자 지정 색인 용어를 추출하였다. 추출된 지표 용어는 연구 주제 동향에 대한 이해를 위해 표준화되고 분석되었다. 또한 과대하게 연구되거나 과소하게 연구된 주제를 분석하였다. 이러한 색인 용어 분석은 연구자가 자신의 연구에 대한 추가적인 주제를 선택하는 데 유용할 뿐만 아니라 연구 논문에 색인 용어를 선택할 때 빈번히 사용되는 키워드를 사용하면 도움이 될 것으로 기대된다.

  • PDF

재난안전 사회관심 분석을 위한 언어모델 활용 정보 네트워크 구축 (A Language Model based Knowledge Network for Analyzing Disaster Safety related Social Interest)

  • 최동진;한소희;김경준;배은솔
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2022년 정기학술대회 논문집
    • /
    • pp.145-147
    • /
    • 2022
  • 본 논문은 대규모 텍스트 데이터에서 이슈를 발굴할 때 사용되는 기존의 정보 네트워크 또는 지식 그래프 구축 방법의 한계점을 지적하고, 문장 단위로 정보 네트워크를 구축하는 새로운 방법에 대해서 제안한다. 먼저 문장을 구성하는 단어와 캐릭터수의 분포를 측정하며 의성어와 같은 노이즈를 제거하기 위한 역치값을 설정하였다. 다음으로 BERT 기반 언어모델을 이용하여 모든 문장을 벡터화하고, 코사인 유사도를 이용하여 두 문장벡터에 대한 유사성을 측정하였다. 오분류된 유사도 결과를 최소화하기 위하여 명사형 단어의 의미적 연관성을 비교하는 알고리즘을 개발하였다. 제안된 유사문장 비교 알고리즘의 결과를 검토해 보면, 두 문장은 서술되는 형태가 다르지만 동일한 주제와 내용을 다루고 있는 것을 확인할 수 있었다. 본 논문에서 제안하는 방법은 단어 단위 지식 그래프 해석의 어려움을 극복할 수 있는 새로운 방법이다. 향후 이슈 및 트랜드 분석과 같은 미래연구 분야에 적용하면, 데이터 기반으로 특정 주제에 대한 사회적 관심을 수렴하고, 수요를 반영한 정책적 제언을 도출하는데 기여할 수 있을 것이다

  • PDF

온톨로지 기반 법령 검색시스템의 개발: 철도·교통 분야 연구개발사업을 중심으로 (A Development of Ontology-Based Law Retrieval System: Focused on Railroad R&D Projects)

  • 원민재;김동희;정해민;이상근;홍준석;김우주
    • 한국전자거래학회지
    • /
    • 제20권4호
    • /
    • pp.209-225
    • /
    • 2015
  • 철도교통 분야의 연구개발사업은 여러 법령과 긴밀하게 관련되어 있기 때문에, 연구개발을 성공적으로 수행했더라도 법령에 의해 제약되어 연구개발 결과의 실질적인 사업화 또는 실용화를 이루어내지 못하는 사례가 발생하고 있다. 본 논문에서는 이러한 사례를 방지하기 위한 방편으로 철도교통 분야에서 진행되는 연구개발사업과 관련된 법령을 검색할 수 있는 법령검색시스템의 모델을 제시하였다. 사업 내용을 설명하는 연구개발계획서가 시스템에 입력되면 요약서의 내용을 대상으로 형태소 분석을 수행하여 명사들만을 남긴다. 국가법령정보센터에서 제공하는 법령정보공동활용서비스를 사용하여 명사들 중 법령용어를 분류하고, 법령용어와 해당 법령용어를 정의하는 법령과의 관계를 지능형 지식 베이스인 온톨로지에 저장한다. 온톨로지에 저장된 법령들은 본 연구에서 개발한 추가적인 지표 계산과정을 거쳐 연구개발사업과 관련된 정도를 기준으로 순위가 매겨진 후, 시스템 사용자에게 제공된다. 사용자는 연구개발에 영향을 미칠 수 있는 법령을 검색할 수 있게 되어 사업 시작 전에 연구 방향을 결정하는 데 참고하거나, 사업 진행하는 과정에서도 참고자료로 사용할 수 있다. 궁극적으로, 법령에 의해 철도교통 분야 연구개발사업이 실패하거나 실용화되지 못하는 경우를 사전에 방지함으로써, 사업에 투자한 예산에 의해 기대되는 충분한 기술적 경제적 효과를 얻을 수 있게 될 것이다.

교육적으로 유의미한 의사소통을 위한 지구과학 관련 전시 라벨의 서술 특징 (Descriptive Characteristics of the Label Texts Related to Earth Science: Toward Educationally Meaningful Communication)

  • 김찬종;박은지;윤세열;이선경
    • 한국지구과학회지
    • /
    • 제33권1호
    • /
    • pp.94-109
    • /
    • 2012
  • 본 연구는 국내 주요 과학관 및 자연사 박물관의 지구과학 관련 전시 라벨 텍스트의 서술 특징을 분석하고자 하였다. 이를 위해, 국립 중앙 과학관과 서대문 자연사 박물관에서 자료를 수집하였고, 체계기능언어학을 일부 적용한 분석틀을 사용하였다. 연구 결과, 라벨들은 1) 대부분 평서형 문장, 2) 적절한 과학적 정보의 양, 3) '사실' 위주의 정보 제시, 4) 모두 논리적 설명 장르로 구성되어 있었다. 특히, 국립 중앙 과학관의 라벨들은 5) 전체 어휘 중 과학 용어의 비율이 높고 6) 주어의 절반 이상이 생략되거나 긴 명사화 형태였다. 결론적으로, 분석 대상 라벨들은 전시물과 관람객들 사이에서 과학 문화에 관한 양 방향적 의사소통을 이끌기보다 일 방향적인 의사소통을 일으킬 가능성이 높은 것으로 해석할 수 있었다. 이를 토대로, 과학 문화와 관람객의 일상 문화 사이의 열린 구조를 만들어 보다 교육적으로 유의미한 의사소통을 가능하게 하는 라벨 텍스트의 서술 특징들을 제안하였다.