• 제목/요약/키워드: 단어 데이터베이스

검색결과 208건 처리시간 0.028초

신문 기사 분석을 통한 연관어 비주얼라이저 (Visualizer of Associated Word by Analyzing News Articles)

  • 김현진;문성영;정용기;이정준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1189-1192
    • /
    • 2013
  • 신문기사 분석을 통한 연관어 비주얼라이저는 신문 기사의 단어를 추출하여 단어 간 연관도를 분석하여 다양한 그래프로 표현하는 시스템이다. 인터넷 신문사의 뉴스 기사들을 수집하고 형태소 분석을 통해 기사별로 단어의 출현 횟수를 데이터베이스에 저장하고 단어와 단어 간의 연관성을 분석한다. 단어 간 연관성을 측정하기 위한 기준으로 두 단어 간 동일기사에 존재여부, 동일날짜에 존재여부를 이용한다. 이 값을 바탕으로 웹 페이지 상에서 다양한 그래프로 상위 연관성을 가진 단어들을 표현한다. 표현 되는 그래프는 다양한 형태의 그래프로 단어와 단어사이에 연관성을 보다 쉽게 파악 할 수 있다.

한글 단어의 고속 검색을 위한 두 단계 알고리즘 (A Two-Pass Algorithm for Fast Retrieval of Korean Words)

  • 양진호;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.439-441
    • /
    • 2001
  • 대용량 한글 문서를 대상으로 하는 검색 시스템은 고속의 단어 매칭 알고리즘을 필요로 한다. 이 논문은 두 단계 매칭 접근 방법을 제시하고 그 유용성을 실험을 통해 입증한다. 특징으로는 웨이브렛(wavelet) 계수를 사용하여 첫 단계에서는 적은 수의 특징만을 사용하여, 거친 정합(coarse matching)을 하며 두 번째 단계에서는 미세한 정합(fine matching)을 한다. 거친 정합은 가능성이 없는 단어를 아주 빠른 속도로 걸러내는 역할을 한다. 실제 한글 단어 영상 데이터베이스에 적용한 실험 결과 검색률의 희생 없이 약 7배의 속도 향상을 얻었다.

  • PDF

음성 단어를 이용한 구간검출에 의한 패턴인식 (Pattern Recognition by Section Detection Using Speech Word)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.681-682
    • /
    • 2016
  • 본 논문에서는 화자 식별에서 음성신호의 애매한 점을 보완할 수 있는 신경회로망의 오차역전파학습 알고리즘과 모음구간 검출에 기초하여 입력되는 음성의 화자 패턴을 구분하는 일본어 단어 패턴인식 알고리즘을 제안한다. 제안하는 알고리즘에서는 일본어 데이터베이스로부터의 단어를 사용하여 음성의 특징벡터를 추출하여 분석하고 이러한 음성의 특징벡터의 차이를 이용하여 일본어 화자에 대한 패턴인식 실험을 수행하였다.

  • PDF

구글 클라우드 메세징 서비스를 활용한 영단어 암기용 스마트폰 어플리케이션 개발 (Implementation of a Smartphone Application for English words Training Using Google Cloud Messaging Service)

  • 김기훈;임동현;박창우;전미영;정구민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.986-988
    • /
    • 2013
  • 본 논문에서는 GCM(Google Cloud Messaging) 서비스를 활용한 영단어 암기용 스마트폰 어플리케이션을 개발하였다. 서버에 있는 영단어 데이터베이스에서 스마트폰으로 영단어를 주기적으로 출력하여 사용자가 영단어에 자연스럽게 노출될 수 있는 어플리케이션을 개발하였다. 추가적으로 잠금 화면을 영단어와 뜻을 매칭 시켜 해제시키는 시스템을 구축함으로써 영단어를 더욱 더 효과적으로 암기할 수 있는 환경을 제공한다. 현재 안드로이드 마켓에서 제공되고 있는 영단어 암기 어플리케이션과 달리 개발한 어플리케이션은 한 번 설정 후 직접 실행할 필요가 없도록 한다.

메인 메모리 DBMS를 이용한 정보기술 전문용어 검색 시스템 (An Information Retrieval System for IT Terminologies Using a Main Memory DBMS)

  • 강옥선;경원현;조완섭
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.311-322
    • /
    • 2001
  • 대부분의 일반 정보 검색 시스템은 색인어를 통해 이루어지는데 이런 경우 사용자는 원하는 정보를 얻기 위해 데이터베이스에 저장된 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 필요한 색인어를 정확하게 입력하기는 어렵고 특히 원하는 정보가 전문분야의 것일 때는 더욱 그러하다. 따라서 특정 분야의 용어들을 중심으로 전문용어를 관리할 수 있는 시스템의 개발이 요구되고 있다. 정보기술 분야도 빠르게 성장하고 있는 전문분야의 하나로 사용되는 대부분의 단어가 영어이고 한글 표기 또한 다양하여 많은 사용자들이 원하는 정보를 정확하게 찾지 못하고 있다. 이렇듯 단어간의 형태적인 불일치로 인해 생기는 정보 검색의 문제를 해결하고 검색어의 범위를 확장하기 위해 만든 것이 전문용어 검색 시스템이다. 정보 검색시 사용자가 입력한 검색어뿐만 아니라 동의어나 상위어, 하위어까지 검색하여 질의를 확장함으로써 검색 효율을 높일 수 있다. 또한 객체-관계형 데이터베이스로 설계하여 검색이 용이하고, 새로운 단어의 확장이 용이하도록 그 구조를 설계하였다. 제안한 시스템은 메인 메모리 DBMS 를 이용하여 전자상거래와 같이 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다.

  • PDF

통합 데이터베이스 스키마 검사기의 설계와 구현 (A Design and Implementation of Integrated Database Schema Checker)

  • 김규백;유경용;김형찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.205-207
    • /
    • 2004
  • 프로젝트의 경쟁력과 성공을 위해 통합 데이터베이스 관리가 중요해지고 있다. 본 논문에서는 통합 데이터베이스 관리가 스키마 설계에서부터 이루어지도록 지원하는 새로운 스키마 검사기의 설계와 구현 내용을 소개한다. 개발된 스키마 검사기는 데이터베이스 객체의 명명 규칙 검사, 적합한 단어 필터, 유사 객체 찾기. 사용자 지정 규칙 적용의 기능을 가지고 있다. 그리고 일반적인 컴파일러의 구문 분석 과정과 다른 방법을 적용해 작업 효율을 높인 구현 세부 사항에 대해서도 상세히 설명한다. 개발된 도구는 통합 데이터베이스 관리 업무에 중요하게 현재 활용되고 있다.

  • PDF

트랜드리포트- 벤처캐피탈활용방안

  • 이상진
    • 디지털콘텐츠
    • /
    • 5호통권72호
    • /
    • pp.74-76
    • /
    • 1999
  • 90년대 중반 이후 국내에 본격적으로 등장한 가장 유명한 단어중의 하나가 아마 벤처란 단어일 것이다. 특히 국제 통화기금의 지원을 받게 된 이 후부터는 벤처 산업, 벤처 기업만이 황량한 우리 경제를 살릴 수 있는 유일한 대안이라는 다소 경직된 표현으로 국민적 관심사가 되고 있을 정도이다. 그러나 DB 업계를 포함한 많은 기업들은 벤처 자금의 활용할 방법에 대한 지식이 부족한 상태이다. 이 글에서는 DB업체를 포함한 벤처기업의 벤처 캐피탈 활용방법에 대해 살펴본다.

  • PDF

음란사이트 접속방지 기능을 갖는 웹브라우즈 개발

  • 정성용;윤미영;이재욱;권영석;이상균
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2000년도 추계공동학술대회논문집
    • /
    • pp.757-762
    • /
    • 2000
  • 청소년 유해 사이트의 대명사인 음란 사이트의 증가는 인터넷의 역효과를 대신하는 대표적인 사례라 할 수 있다. 본 연구는 음란 사이트의 접속을 차단하기 위해 웹 브라우즈가 접속한 모든 사이트를 데이터베이스에 기록할 수 있도록 하여, 보호자에 의해 유해 사이트로 판정 받은 사이트는 접속 할 수 없도록 하는 기능을 갖는 웹 브라우즈를 개발하였다. 본 연구에서 개발한 웹 브라우즈는 한번 접속한 모든 사이트를 데이터베이스를 통해 관리할 수 있으며, 유해 사이트에 대한 정보는 패스워드에 의해 데이터베이스의 접근이 가능한 보호자에 의해 보호될 수 있도록 하였다. 특히 아직 한번도 접속하지 않았던 사이트들에 대해서도 보호자에 의해 유해성이 인정되는 특정 단어를 등록함으로서 특정단어가 들어 있는 유해 사이트에 대한 접속을 예방 할 수 있도록 하였다.

  • PDF

유해정보 차단 시스템 설계와 구현에 관한 연구 (A Study on Design and Implementation of Intercepting System on Hurtfulness Information)

  • 심재권;이진관;한경록;박기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.943-946
    • /
    • 2002
  • 본 논문은 심각한 문제를 일으키고 있는 유해 정보들이 인터넷을 통해 무분별하게 제공되기 때문에 우리의 청소년들이 접근을 차단할 수 있는 시스템의 설계와 구현에 관한 연구이다. 유해 정보를 차단하기 위해 여러 차단 소프트웨어들이 개발되어서 기존의 차단 소프트웨어들은 차단 목록 데이터베이스를 사용해서 목록에 있는 경우 차단을 하거나 등급 표시에 따르도록 한다. 차단 목록 데이터베이스의 지속적인 업데이트, 등급 표시에 따른 오류나 사전 검열 등이 문제점으로 나타났다. 이 문제점 해결을 위해 본 논문에서는 사이트 상에서 제공되어지는 내용을 AC 머신을 이용하여 유해 단어를 추출하고 유해 정보 데이터베이스를 이용해서 유해 단어에 가중치를 부여했다. 그 결과로 유해 정보를 포함한 사이트는 90%의 차단률을 보여 효율적인 시스템으로 판명되었다.

  • PDF

한국어 음성인식을 위한 음성 데이터 수집 (Speech Data Collection for korean Speech Recognition)

  • 박종렬;권오욱;김도영;최인정;정호영;은종관
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.74-81
    • /
    • 1995
  • 본 논문에서는 한국과학기술원(KAIST) 통신연구실에서 개발한 한국어 음성 데이터베이스의 개발에 관하여 기술한다. 음성 데이터베이스의 구축을 위하여 사용된 절차와 환경, 및 데이터베이스의 음성학적, 언어학적 성질들이 상세히 기술된다. 데이터베이스는 음성인식 알고리듬의 개발 및 평가를 위하여 사용되도록 고안되었다. 데이터베이스는 5종류의 음성 데이터, 즉 3천단어 규모의 무역관련 연속음성, 가변길이 연결 숫자음, phoneme-balanced75 고립단어, 지역명 관련 500 고립단어, 한국어 아-세트로 구성되어 있다.

  • PDF