• Title/Summary/Keyword: 단어 데이터베이스

Search Result 208, Processing Time 0.029 seconds

Visualizer of Associated Word by Analyzing News Articles (신문 기사 분석을 통한 연관어 비주얼라이저)

  • Kim, Hyun-Jin;Moon, Sung-Young;Jeong, Yong-Gi;Lee, Jeong-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1189-1192
    • /
    • 2013
  • 신문기사 분석을 통한 연관어 비주얼라이저는 신문 기사의 단어를 추출하여 단어 간 연관도를 분석하여 다양한 그래프로 표현하는 시스템이다. 인터넷 신문사의 뉴스 기사들을 수집하고 형태소 분석을 통해 기사별로 단어의 출현 횟수를 데이터베이스에 저장하고 단어와 단어 간의 연관성을 분석한다. 단어 간 연관성을 측정하기 위한 기준으로 두 단어 간 동일기사에 존재여부, 동일날짜에 존재여부를 이용한다. 이 값을 바탕으로 웹 페이지 상에서 다양한 그래프로 상위 연관성을 가진 단어들을 표현한다. 표현 되는 그래프는 다양한 형태의 그래프로 단어와 단어사이에 연관성을 보다 쉽게 파악 할 수 있다.

A Two-Pass Algorithm for Fast Retrieval of Korean Words (한글 단어의 고속 검색을 위한 두 단계 알고리즘)

  • 양진호;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.439-441
    • /
    • 2001
  • 대용량 한글 문서를 대상으로 하는 검색 시스템은 고속의 단어 매칭 알고리즘을 필요로 한다. 이 논문은 두 단계 매칭 접근 방법을 제시하고 그 유용성을 실험을 통해 입증한다. 특징으로는 웨이브렛(wavelet) 계수를 사용하여 첫 단계에서는 적은 수의 특징만을 사용하여, 거친 정합(coarse matching)을 하며 두 번째 단계에서는 미세한 정합(fine matching)을 한다. 거친 정합은 가능성이 없는 단어를 아주 빠른 속도로 걸러내는 역할을 한다. 실제 한글 단어 영상 데이터베이스에 적용한 실험 결과 검색률의 희생 없이 약 7배의 속도 향상을 얻었다.

  • PDF

Pattern Recognition by Section Detection Using Speech Word (음성 단어를 이용한 구간검출에 의한 패턴인식)

  • Choi, Jae-Seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.05a
    • /
    • pp.681-682
    • /
    • 2016
  • 본 논문에서는 화자 식별에서 음성신호의 애매한 점을 보완할 수 있는 신경회로망의 오차역전파학습 알고리즘과 모음구간 검출에 기초하여 입력되는 음성의 화자 패턴을 구분하는 일본어 단어 패턴인식 알고리즘을 제안한다. 제안하는 알고리즘에서는 일본어 데이터베이스로부터의 단어를 사용하여 음성의 특징벡터를 추출하여 분석하고 이러한 음성의 특징벡터의 차이를 이용하여 일본어 화자에 대한 패턴인식 실험을 수행하였다.

  • PDF

Implementation of a Smartphone Application for English words Training Using Google Cloud Messaging Service (구글 클라우드 메세징 서비스를 활용한 영단어 암기용 스마트폰 어플리케이션 개발)

  • Kim, Ki-Hoon;Lim, Dong-Hyeon;Park, Chang-Woo;Jeon, Mi-Young;Jeoung, Gu-Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.986-988
    • /
    • 2013
  • 본 논문에서는 GCM(Google Cloud Messaging) 서비스를 활용한 영단어 암기용 스마트폰 어플리케이션을 개발하였다. 서버에 있는 영단어 데이터베이스에서 스마트폰으로 영단어를 주기적으로 출력하여 사용자가 영단어에 자연스럽게 노출될 수 있는 어플리케이션을 개발하였다. 추가적으로 잠금 화면을 영단어와 뜻을 매칭 시켜 해제시키는 시스템을 구축함으로써 영단어를 더욱 더 효과적으로 암기할 수 있는 환경을 제공한다. 현재 안드로이드 마켓에서 제공되고 있는 영단어 암기 어플리케이션과 달리 개발한 어플리케이션은 한 번 설정 후 직접 실행할 필요가 없도록 한다.

An Information Retrieval System for IT Terminologies Using a Main Memory DBMS (메인 메모리 DBMS를 이용한 정보기술 전문용어 검색 시스템)

  • 강옥선;경원현;조완섭
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.311-322
    • /
    • 2001
  • 대부분의 일반 정보 검색 시스템은 색인어를 통해 이루어지는데 이런 경우 사용자는 원하는 정보를 얻기 위해 데이터베이스에 저장된 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 필요한 색인어를 정확하게 입력하기는 어렵고 특히 원하는 정보가 전문분야의 것일 때는 더욱 그러하다. 따라서 특정 분야의 용어들을 중심으로 전문용어를 관리할 수 있는 시스템의 개발이 요구되고 있다. 정보기술 분야도 빠르게 성장하고 있는 전문분야의 하나로 사용되는 대부분의 단어가 영어이고 한글 표기 또한 다양하여 많은 사용자들이 원하는 정보를 정확하게 찾지 못하고 있다. 이렇듯 단어간의 형태적인 불일치로 인해 생기는 정보 검색의 문제를 해결하고 검색어의 범위를 확장하기 위해 만든 것이 전문용어 검색 시스템이다. 정보 검색시 사용자가 입력한 검색어뿐만 아니라 동의어나 상위어, 하위어까지 검색하여 질의를 확장함으로써 검색 효율을 높일 수 있다. 또한 객체-관계형 데이터베이스로 설계하여 검색이 용이하고, 새로운 단어의 확장이 용이하도록 그 구조를 설계하였다. 제안한 시스템은 메인 메모리 DBMS 를 이용하여 전자상거래와 같이 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다.

  • PDF

A Design and Implementation of Integrated Database Schema Checker (통합 데이터베이스 스키마 검사기의 설계와 구현)

  • 김규백;유경용;김형찬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.205-207
    • /
    • 2004
  • 프로젝트의 경쟁력과 성공을 위해 통합 데이터베이스 관리가 중요해지고 있다. 본 논문에서는 통합 데이터베이스 관리가 스키마 설계에서부터 이루어지도록 지원하는 새로운 스키마 검사기의 설계와 구현 내용을 소개한다. 개발된 스키마 검사기는 데이터베이스 객체의 명명 규칙 검사, 적합한 단어 필터, 유사 객체 찾기. 사용자 지정 규칙 적용의 기능을 가지고 있다. 그리고 일반적인 컴파일러의 구문 분석 과정과 다른 방법을 적용해 작업 효율을 높인 구현 세부 사항에 대해서도 상세히 설명한다. 개발된 도구는 통합 데이터베이스 관리 업무에 중요하게 현재 활용되고 있다.

  • PDF

트랜드리포트- 벤처캐피탈활용방안

  • Lee, Sang-Jin
    • Digital Contents
    • /
    • no.5 s.72
    • /
    • pp.74-76
    • /
    • 1999
  • 90년대 중반 이후 국내에 본격적으로 등장한 가장 유명한 단어중의 하나가 아마 벤처란 단어일 것이다. 특히 국제 통화기금의 지원을 받게 된 이 후부터는 벤처 산업, 벤처 기업만이 황량한 우리 경제를 살릴 수 있는 유일한 대안이라는 다소 경직된 표현으로 국민적 관심사가 되고 있을 정도이다. 그러나 DB 업계를 포함한 많은 기업들은 벤처 자금의 활용할 방법에 대한 지식이 부족한 상태이다. 이 글에서는 DB업체를 포함한 벤처기업의 벤처 캐피탈 활용방법에 대해 살펴본다.

  • PDF

음란사이트 접속방지 기능을 갖는 웹브라우즈 개발

  • 정성용;윤미영;이재욱;권영석;이상균
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2000.11a
    • /
    • pp.757-762
    • /
    • 2000
  • 청소년 유해 사이트의 대명사인 음란 사이트의 증가는 인터넷의 역효과를 대신하는 대표적인 사례라 할 수 있다. 본 연구는 음란 사이트의 접속을 차단하기 위해 웹 브라우즈가 접속한 모든 사이트를 데이터베이스에 기록할 수 있도록 하여, 보호자에 의해 유해 사이트로 판정 받은 사이트는 접속 할 수 없도록 하는 기능을 갖는 웹 브라우즈를 개발하였다. 본 연구에서 개발한 웹 브라우즈는 한번 접속한 모든 사이트를 데이터베이스를 통해 관리할 수 있으며, 유해 사이트에 대한 정보는 패스워드에 의해 데이터베이스의 접근이 가능한 보호자에 의해 보호될 수 있도록 하였다. 특히 아직 한번도 접속하지 않았던 사이트들에 대해서도 보호자에 의해 유해성이 인정되는 특정 단어를 등록함으로서 특정단어가 들어 있는 유해 사이트에 대한 접속을 예방 할 수 있도록 하였다.

  • PDF

A Study on Design and Implementation of Intercepting System on Hurtfulness Information (유해정보 차단 시스템 설계와 구현에 관한 연구)

  • Shim, Jae-Kwon;Lee, Jin-Kwan;Han, Kyoung-Lok;Park, Ki-Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.943-946
    • /
    • 2002
  • 본 논문은 심각한 문제를 일으키고 있는 유해 정보들이 인터넷을 통해 무분별하게 제공되기 때문에 우리의 청소년들이 접근을 차단할 수 있는 시스템의 설계와 구현에 관한 연구이다. 유해 정보를 차단하기 위해 여러 차단 소프트웨어들이 개발되어서 기존의 차단 소프트웨어들은 차단 목록 데이터베이스를 사용해서 목록에 있는 경우 차단을 하거나 등급 표시에 따르도록 한다. 차단 목록 데이터베이스의 지속적인 업데이트, 등급 표시에 따른 오류나 사전 검열 등이 문제점으로 나타났다. 이 문제점 해결을 위해 본 논문에서는 사이트 상에서 제공되어지는 내용을 AC 머신을 이용하여 유해 단어를 추출하고 유해 정보 데이터베이스를 이용해서 유해 단어에 가중치를 부여했다. 그 결과로 유해 정보를 포함한 사이트는 90%의 차단률을 보여 효율적인 시스템으로 판명되었다.

  • PDF

Speech Data Collection for korean Speech Recognition (한국어 음성인식을 위한 음성 데이터 수집)

  • Park, Jong-Ryeal;Kwon, Oh-Wook;Kim, Do-Yeong;Choi, In-Jeong;Jeong, Ho-Young;Un, Chong-Kwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.14 no.4
    • /
    • pp.74-81
    • /
    • 1995
  • This paper describes the development of speech databases for the Korean language which were constructed at Communications Research Laboratory in KAIST. The procedure and environment to construct the speech database are presented in detail, and the phonetic and linguistic properties of the databases are presented. the databases were intended for use in designing and evaluating speech recognition algorithms. The databases consist of five different sets of speech contents : trade-related continuous speech with 3,000 words, variable-length connected digits, phoneme-balanced 75 isolated words, 500 isolated Korean provincial names, and Korean A-set words.

  • PDF