• 제목/요약/키워드: 불용어

검색결과 93건 처리시간 0.031초

한국어 형태소 분석기 CBKMA와 색인어 추출기 CBKMA/IX (A Korean Morphological Analyzer CBKMA and A Index Word Extractor CBKMA/IX)

  • 김남철;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.50-59
    • /
    • 1999
  • 본 논문은 한국어 형태소 분석기 CBKMA와 이 CBKMA를 이용한 색인어 추출기 CBKMA/IX를 소개하고, 각각의 특징들에 대해서 설명한다. CBKMA는 음절 정보를 이용하는 분석 알고리즘과, 효율적인 사전구성을 이용한 형태소 분석기로서, 과다한 분석 후보의 생성을 줄임으로써 처리 속도를 향상시켰다. 수행시 필요로 하는 컴퓨터 자원은 Main Memory 약 4Mb정도로, 작은 규모의 시스템에서도 수행이 가능한 특징을 갖는다. CBKMA/IX는 CBKMA의 형태소 분석 기능을 이용하는 색인어 자동 추출기로서, 처리 속도 향상을 위하여 대분류 수준의 품사 태그만을 이용한다. 또한 CBKMA의 분석 기능에 색인어 추출을 위해 불용어 사전, 사용자 키워드 사전 처리 부분과, 복합명사와 미등록어 분석 부분 및 한자어, 일본어 등에 대한 처리를 강화시켰다. 특히 비소설류 자료의 분석시 좋은 성능을 발휘한다.

  • PDF

관광 정보 검색을 위한 자연언어 질의 해석 시스템 구현 (A design and implementation of query processor for travel information retrieval system)

  • 김명철;서광준;전경헌;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.449-458
    • /
    • 1992
  • 본 논문은 관광정보검색용 한국어 자연언어 질의 해석 시스템의 모델 정립 및 구현에 대한 것이다. 본 자연언어 질의 해석 시스템은 질의로 부터 정보 검색 시스템의 검색어들을 추출한다. 이를 위하여 1만 단어 수준의 중형사전을 구축하였으며, 불용어 사전, 전거어 사전, 유사어 사전, 복합명사 사전을 구축하였다. 사전의 어휘를 추출하기 위해서 한국어 대화체 문장에 대한 자료수집과 분석을 하였으며, 관광 정보 검색 시스템의 텍스트를 분석하였다. 200여 자연언어 질의 문장으로 실험한 결과는 비교적 좋았다.

  • PDF

퍼지 논리(論理)를 이용한 정보검색(情報檢索) 시스템의 설계(設計) (The Design of Retrieval System Using Fuzzy Logic)

  • 조혜민
    • 정보관리연구
    • /
    • 제24권3호
    • /
    • pp.73-100
    • /
    • 1993
  • 본 연구(硏究)는 불 정보 시스템의 단점을 보완하는 방법으로 퍼지 논리(論理)를 이용한 정보검색시스템을 설계하였다. 퍼지 정보검색 시스템은 질의어(質疑語)와 문헌들을 표현하는 각 용어(用語)들에 가중치(加重値)를 부여하고, 이것을 바탕으로 질의어에 대한 각 문헌들의 적합도(適合度)를 결정하는 것이다. 본 연구에서는 기존의 연구들을 비교 분석한 후, 효과적인 모델을 제시하고 시스템 성능을 평가하였다.

  • PDF

한국어 기반 음성 인식에서 사투리 표현에 관한 연구 (A Study on Dialect Expression in Korean-Based Speech Recognition)

  • 이신협
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.333-335
    • /
    • 2022
  • 음성인식 처리기술의 발전은 STT, TTS 기술과 함께 각종 동영상, 스트리밍 서비스에서 적용되어 사용되고 있다. 그러나 실제 대화내용의 음성인식은 사투리 사용과 불용어, 감탄사, 유사어의 중복 등으로 명료한 문어체적 표현에 장벽이 높은 편이다. 본 연구에서는 음성인식에 모호한 사투리에 대해 범주별 사투리 중요 단어 사전 처리 방식과 사투리 운율을 음성 인식 네트워크 모델 속성으로 적용한 음성인식기술을 제안한다.

  • PDF

기존 건물 리모델링 시장을 위한 태양에너지 응용 기술; 솔라 리모델링 (Solar Remodeling Techniques for building renovation market)

  • 윤종호
    • 건축사
    • /
    • 통권476호
    • /
    • pp.71-82
    • /
    • 2008
  • 1970년 초에 배럴당 1불하던 원유가가 지금은 120불을 상회하고 있다. 더욱 놀라운 것은 3년 전만 하더라도 40불 이하 수준이던 것이 불과 몇 년 사이에 3배 이상 급등해 버린 것이다. 우리는 아직 유가 100불 이상의 고유가 시대에 대한 고통을 실감하지 못하고 있지만, 빠른 시일 안에 대항한 형태로 우리를 불편하게 하고, 더가서는 사회 경제 문화 등 모든 우리의 활동패턴에 근본적 변화를 일으킬 것이라는데는 어느 누구도 이의를 달지 못할 것이다. 한편 90년대만 하더라도 친환경 건축기술은 선택적 사양으로 인식되어 왔으며, 일부 고급건물 또는 데모성격의 건물에만 반영되던 미래의 기술 분야로 간주되어왔다. 하지만 10년 남짓 지난 지금 우리 주변에서 가장 흔하게 접할 수 있는 용어 중의 하나가 친환경, 지속가능, 그린, 에코 등 이며, 최근 많은 건설사가 고민하고 있는 가장 중요한 이슈가 친환경 건축 관련 기술이 되어버렸다. 최근 유가의 급등세 보다는 더디다 할 지라도 몇 년 사이에 벌어지고 있는 제도적, 사회 경제적 변화 동향을 돌이켜 볼 때 건축계 또한 매우 빠른 속도로 변해가고 있으며, 부지불시간에 유가등급과 같이 변화된 환경에 놀라는 시기가 곧 도래할 것이다. 오랜 기간 에너지 및 친환경 관련 요소기술의 개발, 정부의 지원제도 확대, 보급 강화 등 각종 노력을 통해 이제는 건축 설계분야에서도 친환경건축물에 대한 저변이 크게 확대되었다고 볼 수 있다. 하지만 실상 우리주변에서 제대로된 친환경 건축물을 실제로 보고자 한다면 두손으로 꼽기도 힘들 정도인 사실에 놀라게 될 것이다. 이러한 배경하에 이번 연재에서는 그동안 오랜기간 떠들고 노력했음에도 불구하고 실제 제대로된 친환경 건축물을 우리 주변에서 찾기 힘든 이유를 건축실무자 측면에서 재고해 보고, 이에 대한 새로운 해결방안을 모색해 보는 계기를 갖고자 한다. 특히 많은 친환경 건축기술 중 최근 선진국을 중심으로 가장 큰 이슈가 되어 있고, 또한 건축사 입장에서 쉽게 접근하기 어려운 기술분야인 신재생에너지 건축응용 측면에서 다양한 최신 기술 및 실질적 접근방법과 사례를 주제별로 제시하고자 한다.

  • PDF

지속가능미래를 위한 신재생에너지 응용 친환경건축 방향 - 7. BiWP, 건물일체형 풍력 발전 시스템의 새바람 (For Sustainable Future with Sustainable Architecture - BiWP, New Wave of Building integrated Wind Power System)

  • 윤종호
    • 건축사
    • /
    • 통권475호
    • /
    • pp.65-74
    • /
    • 2008
  • 1970년 초에 배럴당 1불하던 원유가가 지금은 120불을 상회하고 있다. 더욱 놀라운 것은 3년 전만 하더라도 40불 이하 수준이던 것이 불과 몇 년 사이에 3배 이상 급등해 버린 것이다. 우리는 아직 유가 100불 이상의 고유가 시대에 대한 고통을 실감하지 못하고 있지만, 빠른 시일 안에 대항한 형태로 우리를 불편하게 하고, 더가서는 사회 경제 문화 등 모든 우리의 활동패턴에 근본적 변화를 일으킬 것이라는데는 어느 누구도 이의를 달지 못할 것이다. 한편 90년대만 하더라도 친환경 건축기술은 선택적 사양으로 인식되어 왔으며, 일부 고급건물 또는 데모성격의 건물에만 반영되던 미래의 기술 분야로 간주되어왔다. 하지만 10년 남짓 지난 지금 우리 주변에서 가장 흔하게 접할 수 있는 용어 중의 하나가 친환경, 지속가능, 그린, 에코 등 이며, 최근 많은 건설사가 고민하고 있는 가장 중요한 이슈가 친환경 건축 관련 기술이 되어버렸다. 최근 유가의 급등세 보다는 더디다 할 지라도 몇 년 사이에 벌어지고 있는 제도적, 사회 경제적 변화 동향을 돌이켜 볼 때 건축계 또한 매우 빠른 속도로 변해가고 있으며, 부지불시간에 유가등급과 같이 변화된 환경에 놀라는 시기가 곧 도래할 것이다. 오랜 기간 에너지 및 친환경 관련 요소기술의 개발, 정부의 지원제도 확대, 보급 강화 등 각종 노력을 통해 이제는 건축 설계분야에서도 친환경건축물에 대한 저변이 크게 확대되었다고 볼 수 있다. 하지만 실상 우리주변에서 제대로된 친환경 건축물을 실제로 보고자 한다면 두손으로 꼽기도 힘들 정도인 사실에 놀라게 될 것이다. 이러한 배경하에 이번 연재에서는 그동안 오랜기간 떠들고 노력했음에도 불구하고 실제 제대로된 친환경 건축물을 우리 주변에서 찾기 힘든 이유를 건축실무자 측면에서 재고해 보고, 이에 대한 새로운 해결방안을 모색해 보는 계기를 갖고자 한다. 특히 많은 친환경 건축기술 중 최근 선진국을 중심으로 가장 큰 이슈가 되어 있고, 또한 건축사 입장에서 쉽게 접근하기 어려운 기술분야인 신재생에너지 건축응용 측면에서 다양한 최신 기술 및 실질적 접근방법과 사례를 주제별로 제시하고자 한다.

  • PDF

기존건물 리모델링 시장을 위한 태양에너지 응용 기술; 솔라 리모델링 (Solar Remodeling Techniques for building renovation market)

  • 윤종호
    • 건축사
    • /
    • 통권477호
    • /
    • pp.71-78
    • /
    • 2009
  • 1970년 초에 배럴당 1불하던 원유가가 지금은 120불을 상회하고 있다. 더욱 놀라운 것은 3년 전만 하더라도 40불 이하 수준이던 것이 불과 몇 년 사이에 3배 이상 급등해 버린 것이다. 우리는 아직 유가 100불 이상의 고유가 시대에 대한 고통을 실감하지 못하고 있지만, 빠른 시일 안에 대항한 형태로 우리를 불편하게 하고, 더가서는 사회 경제 문화 등 모든 우리의 활동패턴에 근본적 변화를 일으킬 것이라는데는 어느 누구도 이의를 달지 못할 것이다. 한편 90년대만 하더라도 친환경 건축기술은 선택적 사양으로 인식되어 왔으며, 일부 고급건물 또는 데모성격의 건물에만 반영되던 미래의 기술 분야로 간주되어왔다. 하지만 10년 남짓 지난 지금 우리 주변에서 가장 흔하게 접할 수 있는 용어 중의 하나가 친환경, 지속가능, 그린, 에코 등 이며, 최근 많은 건설사가 고민하고 있는 가장 중요한 이슈가 친환경 건축 관련 기술이 되어버렸다. 최근 유가의 급등세 보다는 더디다 할 지라도 몇 년 사이에 벌어지고 있는 제도적, 사회 경제적 변화 동향을 돌이켜 볼 때 건축계 또한 매우 빠른 속도로 변해가고 있으며, 부지불시간에 유가등급과 같이 변화된 환경에 놀라는 시기가 곧 도래할 것이다. 오랜 기간 에너지 및 친환경 관련 요소기술의 개발, 정부의 지원제도 확대, 보급 강화 등 각종 노력을 통해 이제는 건축 설계분야에서도 친환경건축물에 대한 저변이 크게 확대되었다고 볼 수 있다. 하지만 실상 우리주변에서 제대로된 친환경 건축물을 실제로 보고자 한다면 두손으로 꼽기도 힘들 정도인 사실에 놀라게 될 것이다. 이러한 배경하에 이번 연재에서는 그동안 오랜기간 떠들고 노력했음에도 불구하고 실제 제대로된 친환경 건축물을 우리 주변에서 찾기 힘든 이유를 건축실무자 측면에서 재고해 보고, 이에 대한 새로운 해결방안을 모색해 보는 계기를 갖고자 한다. 특히 많은 친환경 건축기술 중 최근 선진국을 중심으로 가장 큰 이슈가 되어 있고, 또한 건축사 입장에서 쉽게 접근하기 어려운 기술분야인 신재생에너지 건축응용 측면에서 다양한 최신 기술 및 실질적 접근방법과 사례를 주제별로 제시하고자 한다.

  • PDF

서울시 일부 지하공간에서의 실내공기질 평가에 관한 연구 (A Study on Assessment of IAQ(Indoor Air Quality) for Underground Environments in Seoul)

  • 정진원;김윤신;윤동원;권성안
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2000년도 춘계학술대회 논문집
    • /
    • pp.304-306
    • /
    • 2000
  • 오늘날 경제적 생활 환경의 개선으로 인하여 현대인의 생활에 많은 변화를 가져오고 있다 제한된 공간에서 인간 활동은 지하생활공간이라는 새로운 활동영역을 창출하였고, 이에 따라 실내에서의 거주 시간은 더욱 증가하고 있다. 지하생활공간이라는 용어가 일반인들에게는 다소 생소하게 받아들여질 수 있지만 여기서 말하는 지하생활공간이라 함은 불특정 다수인이 이용하는 지하철, 지하상가, 지하주차장, 지하 보·차도, 지하터널 등을 말하며 개인의 생활 양식에 따라 단시간 이용하거나 또는 생활터전으로 장시간 거주할 수 있는 공간이라고 할 수 있다. (중략)

  • PDF

시소러스를 기반으로 하는 자동색인 시스템에 관한 연구 (The Development of an Automatic Indexing System based on a Thesaurus)

  • 임형묵;정상철
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.213-242
    • /
    • 1993
  • 그동안 자동색인 기법에 대해서는 단일어 색인,구색인,시소러스 기반 색인 등의 연구가 이루어져 왔는데,단일어 색인 기법이 단일어에 기초한 단순한 색인 방법 임에도 불구하고 다른 두가지 기법보다 일반적으로 우수하다고 알려져왔다. 시소러스 기반 색인은 이중에서도 검색효율이 낮은 것으로 알려져 왔는데,이는 일반적으로 시소러스가 포함하고 있는 색인용어들이 한정되어 있어 색인하려는 자료들이 이색인 용어에 부합(match)되지 않을 경우 색인 자체가 이루어 지지 않기 때문이다. 본 연구에서는 시소러스 기반 색인이 지금까지 기법으로는 검색효율이 좋지 않지만 실제 전문 색인들이 하는 색인과 매우 유사하다는 장범에 기초하여,입력 자료를 구문분석하고,분석된 자료들과 색인용어들을 정확부합(exact match)이 아닌 부분부합(partial match)을 통하여 색인 함으로써 검색효율이 우수한 시소러스기반 자동 색인 시스템을 개발하고자 한다. 본 연구에서 개발된 색인 시스템이 THINS는 우선 시소러스를 트리형태로 구성하고 입력자료들을 KAIST에서 개발한 언어번역기 MATES/EK를 통하여 구문분석한 후 명사구들만 뽑아낸다.그다음 명사구에 있는 용어들중 불용어를 제거하고 스테밍작업을 진행한후 생기는 형태를 색인 용어들과 부분부합 과정을 반복하여,유사한 색인 용어들과 가능하면 색인이 되도록 한다. 본 연구에서는 CACM 데이타 집합을 가지고 본 시소러스 기반 색인 시스템과 단일어 색인방식을 혼성지식기반 시스템인 HYKIS에서 성능을 평가하였다.이 성능평가에서 시소러스를 기반으로 하는 색인 시스템이 단일어 색인방식보다 회상도에서는 8-9%떨어지지만 정확도에서는 10%정도 높은 결과를 나타내었다.그러나 이는 기존의 시소러스 기반시스템이 단일어 색인 방식보다 정확도가 25%-30%정도 떨어진다는 것을 비추어 볼때 기존의 방식보다 우수한 것이라 평가된다.또한 CACM 에서 제공하는 시소러스인 CRCS 가 1000여개의 색인어밖에 포함하고 있어 매우 불완전한 것이라는 것을 고려하면,THINS가 최근에 개발되고 있는 시소러스와 접속된다면 매우 우수한 검색효율을 내리라 사료된다.

동적 정보 저장을 위한 자동 하이퍼텍스트 색인 기법의 개발 (Development of an Automatic Hypertext Indexer for Dynamic Information Storage)

  • 이동애;장덕성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2333-2341
    • /
    • 1997
  • 하이퍼텍스트 정보를 저장할 때 정보가 삽입, 삭제, 변경되면, 인접한 정보들에 대한 하이퍼텍스트 링크도 변화되어야 한다. 하이터텍스트 링크는 하이터텍스트 색인어를 기준으로 관련있는 다른 정보를 찾는 수단을 제공한다. 따라서 하이퍼텍스트 색인어를 관리하는 것이 동적 정보 저장의 핵심이 된다. 본 논문에서는 새로운 정보가 삽입, 삭제, 변경될지라도 시스템이 안정성을 유지하며, 변경된 부분에 대한 하이퍼텍스트 색인어와 하이퍼텍스트 링크가 동적으로 결정될 수 있는 방법을 제시한다. 이를 위해 동적 색인기를 만들고, 동적 색인기의 동작을 돕기 위해 색인어 사전, 불용어 사전, 조사 사전, 역색인 파일, 시소러스 등을 구성한다.

  • PDF