• 제목/요약/키워드: 사전이도

검색결과 6,786건 처리시간 0.029초

WordNet을 이용한 한국어 명사 의미지표 자동 구축 (Automatic Construction of Korean Noun Semantic-Marker using WordNet)

  • 이지선;전현경;김남수;이용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.333-335
    • /
    • 2000
  • 컴퓨터는 자연언어로 된 문장을 올바르게 이해하기 위해 의미지식을 필요로 하며 이러한 의미지식을 정확하게 구축하기 위해서는 수작업을 필요로 한다. 그러나 수작업에 의한 의미지식 구축은 많은 비용과 시간을 필요로 하고, 작성자의 주관이 개입되며, 응용 도메인에 따라 의미지표 테이블이 수정되면 의미지표 사전의 재구축이 불가피하다. 이러한 문제점을 해결하기 위해 본 논문에서는 영어 WordNet과 한영 사전을 이용한 한국어 명사 의미지표 사전의 자동 구축 방법을 제안한다.

  • PDF

양방향 검색을 지원하는 전자사전 구조의 설계 및 구현 (A Design and Implementation of Electronic Dictionary for support bidirectional searching)

  • 김철수;박인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.367-370
    • /
    • 2000
  • 본 논문에서는 빠른 검색 시간을 가지면서 단어의 역문자열도 검색할 수 있는 사전 구조를 설계하고 구현한다. 빠른 검색 시간을 지원하고, 역문자열 검색을 효율적으로 하기 위해 트라이 구조를 이용하였으며 트라이 성질 잘 표현하는 배열을 이용한 구현 방법을 사용하였다. 이 사전 구조는 형태소분석, 정보검색, 음성인식 및 문자 인식 과정 등 다양한 분야에서 유용하게 이용할 수 있다.

  • PDF

캐나다 정보기술보안 제품 사전 검증 제도에 관한 분석

  • 김준섭;손경호;이완석;곽진
    • 정보보호학회지
    • /
    • 제19권2호
    • /
    • pp.87-98
    • /
    • 2009
  • 국내 외 IT 제품은 그 제품이 가지고 있는 안전성 및 신뢰성에 대한 검증을 통해 국가 및 공공기관에 제품 공급 및 이용 촉진을 도모하고 있다. 또한 각 국가마다 보안제품 특징과 성격에 맞는 평가라 인증을 수행하기 위한 보안성 평가 서비스를 제공하고 있으며, 시스템 평가 기준과 방법론이 개발 및 운영되고 이에 따라 캐나다에서는 정보기술보안 제품의 안전성을 사전에 검증하기 위한 제도를 시행하고 있다. 본 고에서는 캐나다의 정보기술보안 제품 사전 검증 제도에 대한 분석을 통해 국내 적용가능성에 대하여 분석한다.

영광원자력 5$\cdot$6호기의 환경영향평가 - 건설영향 경미, 온배수대책 수립계획

  • 김형렬
    • 원자력산업
    • /
    • 제16권3호통권157호
    • /
    • pp.14-31
    • /
    • 1996
  • 과학기술처는 지난 2월 10일 영광원자력 5$\cdot$6호기 건설용 부지에 대하여 사전사용을 승인하였다. 이는 지난 2월 8일 원자력안전전문위원회의 부지사전승인안 심의결과에 따른 것으로, 한국전력공사는 이에 따라 영광원자력 5$\cdot$6호기 원자로 및 관련시설을 설치할 지점의 굴착, 암반보호를 위한 무근콘크리트공사를 착공할 수 있게 되었다. 이 글은 영광원자력 5$\cdot$6호기 건설사업에 대한 환경영향평가 결과를 살펴봄으로써, 본 원자력건설사업 시행으로 인한 주변지역 환경에 미치는 영향과 대책에 대한 이해를 돕기 위한 것이다.

  • PDF

대용량 전자사전 구축을 위한 국어 대사전의 통계 정보 (Statistical Information of Korean Dictionary to Construct an Enormous Electronic Dictionary)

  • 김철수;김양범
    • 한국콘텐츠학회논문지
    • /
    • 제7권6호
    • /
    • pp.60-68
    • /
    • 2007
  • 언어 정보 처리 응용 분야는 정보검색, 형태소분석, 철자검색, 음성인식, 문자 인식 등 다양하다. 이러한 정보처리 과정은 전자 사전이 필수적이다. 본 논문에서는 국어대사전에 대한 기본적인 통계 정보들을 살펴보고, 전자사전 구축에 대하여 알아보았다. 대상 정보는 고어 및 불완전음절을 포함하는 단어를 제외한 표제어들에 대하여, 대사전의 표제어수, 전자사전의 엔트리수, 사용된 전체음절수, 서로 다른 음절수, 엔트리들의 평균 길이, 품사별 분포, 전자사전을 트라이로 구축할 때 사용되는 노드 수 등 이다. 전자사전의 전체 엔트리 수는 361,980개, 사용된 음절수는 1,289,659개로 엔트리들의 평균 길이는 3.56이었으며 서로 다른 음절수는 2,463개였다. 이러한 통계 정보들은 전자사전 구축 및 한국어 정보처리에 도움이 될 것이다.

융합적 시대에서 종합병원 간호사의 임종기 치료, 연명치료, 사전의료의향서에 대한 지식과 사전의료의향서 작성에 대한 교육요구도의 관계 (Relationship of Knowledge of End-of-life care, Life-Sustaining Treatment, and Advance Directive with the Educational Needs regarding Advance Directives Writing among Nurses in General Hospital in Convergence Era)

  • 정지현;천주영
    • 사물인터넷융복합논문지
    • /
    • 제6권1호
    • /
    • pp.45-53
    • /
    • 2020
  • 본 연구는 일 종합병원 간호사의 임종기 치료, 연명치료, 사전의료의향서에 대한 지식과 사전의료의향서 작성에 대한 교육요구도의 상관관계를 확인하는데 그 목적이 있다. 연구의 대상자는 서울시 소재 일 종합병원에 근무하는 임상경력 3개월 이상의 간호사 169명이다. 자료수집기간은 2018년 7월 19일부터 7월 26일까지였고, 수집된 자료는 SPSS/WIN 23.0을 이용하여 분석되었다. 간호사의 임종기 치료에 대한 지식은 8.56±1.61점(11점 만점), 연명치료에 대한 지식은 5.11±0.94점(6점 만점), 사전의료의향서에 대한 지식은 8.02±1.33점(9점 만점)이었고, 사전의료의향서 작성에 대한 교육요구도는 4.31±0.58점(5점 만점)이었다. 사전의료의향서 작성에 대한 교육요구도는 연명치료에 대한 지식수준이 높을수록 높았고(r=.182, p=.018), 사전의료의향서에 대한 지식수준이 높을수록 높은 것으로 나타났다(r=.234, p=.002). 본 연구결과는 향후 사전의료의향서 교육프로그램 개발을 위한 기초자료를 제공하는데 그 의의가 있다.

DP 알고리즘에 의한 발음사전 전처리와 문맥종속 자소별 MLP를 이용한 영어 발음사전 생성기의 개선 (Improvements of an English Pronunciation Dictionary Generator Using DP-based Lexicon Pre-processing and Context-dependent Grapheme-to-phoneme MLP)

  • 김회린;문광식;이영직;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.21-27
    • /
    • 1999
  • 본 논문에서는 가변어휘 단어 인식기에 사용하기 위한 개선된 MLP 기반 영어 발음사전 생성기를 제안한다. 가변어휘 단어 인식기는 인식대상 도메인이 수시로 바뀌는 상황에서 현재의 인식 도메인에 의해 결정되는 임의의 한국어 어휘들에 대해 처리 할 수 있다. 이 시스템을 영어 단어에 대해서도 처리할 수 있도록 하기 위해서는 미리 정의된 사전에 포함할 수 없는 영어 고유명사와 같은 단어의 발음열을 구할 수 있는 방법이 필요하다. 영어 발음사전 생성기를 구현하기 위하여 본 연구에서는 각 자소를 음소로 변환해 주는 문맥종속 다층 퍼셉트론 구조를 제안한다. 각 자소별 다층 퍼셉트론을 훈련하기 위해서는 표준 발음사전으로부터 각 자소에 대응하는 음소 학습용 데이터를 준비해야 한다. 이를 위해 본 연구에서는 적절한 거리척도를 사용하는 동적 프로그래밍 알고리즘을 사용한다. 훈련 및 평가를 위한 데이터로는 116,191개 영어 단어의 발음사전을 사용하였다. 평가 결과 각각 30~50개의 히든 노드를 가지는 26개 자소별 MLP와 예외 자소 발음사전을 가지고 표준 발음사전에 대하여 72.8%의 단어 정확도를 얻었으며, 이것은 기존의 규칙 에 기반한 발음사전 생성의 정확도인 24.0% 보다 매우 우수한 결과임을 보여주었다.

  • PDF

한국어 자연어생성에 적합한 사전훈련 언어모델 특성 연구 (A Study of Pre-trained Language Models for Korean Language Generation)

  • 송민채;신경식
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.309-328
    • /
    • 2022
  • 본 연구는 자연어처리의 분석목적과 추론데이터 성격에 적합한 한국어 사전훈련 언어모델의 특성을 실증분석했다. 이를 위해 자연어생성이 가능한 대표적 사전훈련 언어모델인 BART와 GPT 모델을 실험에 사용했다. 구체적으로 한국어 텍스트를 BART와 GPT 모델에 학습한 사전훈련 언어모델을 사용해 문서요약 생성 성능을 비교했다. 다음으로 추론데이터의 특성에 따라 언어모델의 성능이 어떻게 달라지는지 확인하기 위해 6가지 정보전달성과 4가지 창작물 유형의 한국어 텍스트 문서에 적용했다. 그 결과, 모든 문서유형에서 인코더와 디코더가 모두 있는 BART의 구조가 디코더만 있는 GPT 모델보다 더 높은 성능을 보였다. 추론데이터의 특성이 사전훈련 언어모델의 성능에 미치는 영향을 살펴본 결과, KoGPT는 데이터의 길이에 성능이 비례한 것으로 나타났다. 그러나 길이가 가장 긴 문서에 대해서도 KoGPT보다 KoBART의 성능이 높아 다운스트림 태스크 목적에 맞는 사전훈련 모델의 구조가 자연어생성 성능에 가장 크게 영향을 미치는 요소인 것으로 나타났다. 추가적으로 본 연구에서는 정보전달성과 창작물로 문서의 특징을 구분한 것 외에 품사의 비중으로 문서의 특징을 파악해 사전훈련 언어모델의 성능을 비교했다. 그 결과, KoBART는 어미와 형용사/부사, 동사의 비중이 높을수록 성능이 떨어진 반면 명사의 비중이 클수록 성능이 좋았다. 반면 KoGPT는 KoBART에 비해 품사의 비중과 상관도가 낮았다. 이는 동일한 사전훈련 언어모델이라도 추론데이터의 특성에 따라 자연어생성 성능이 달라지기 때문에 다운스트림 태스크에 사전훈련 언어모델 적용 시 미세조정 외에 추론데이터의 특성에 대한 고려가 중요함을 의미한다. 향후 어순 등 분석을 통해 추론데이터의 특성을 파악하고, 이것이 한국어 생성에 미치는 영향을 분석한다면 한국어 특성에 적합한 언어모델이나 자연어생성 성능 지표 개발이 가능할 것이다.

한국어 오픈 워드넷 (KWN) : 사전 기반의 반자동 구축 (Open Korean WordNet (KWN): Dictionary-based Semi-Automatic Development)

  • 이인근;황도삼;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.193-196
    • /
    • 2014
  • 본 논문에서는 사전자원에 기반한 한국어 워드넷(Open Korean WordNet: KWN)의 반자동 구축 방법을 제안한다. 제안한 방법에서는 각 전문분야별로 분류된 영어-한국어 대역사전, 일본어-한국어 대역사전을 이용하여 영어 워드넷(Princeton WordNet 3.0)과 일본어 워드넷(Japanese WordNet 1.1)의 어휘를 번역하였다. 그리고 번역 결과의 애매성을 해소하기 위하여, (1)영어와 일본어에 대한 한국어 대역어의 중복 여부, (2)사전의 분야 정보와 워드넷의 계층구조를 고려하였다. 제안한 방법으로 117,659 개의 워드넷 synset 중 63,221 개(약 54 %)의 synset에 대한 자동번역을 수행하여 한국어 워드넷을 구축하였다. 그리고 워드넷 synset의 정의문은 한국어 사전의 정의문을 참조하여 한글화 할 수 있도록 하고, 이 과정을 지원하기 위한 정의문 추천 알고리즘을 제안한다. 제안한 방법에 기반하여 전문가들이 상호 협력하여 한국어 워드넷을 구축할 수 있는 시스템을 개발한다.

  • PDF

분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출 (Automatic Term Recognition using Domain Similarity and Statistical Methods)

  • 오종훈;이경순;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.258-269
    • /
    • 2002
  • 지금까지 전문용어를 자동으로 추출 (Automatic Term Recognition: ATR)하기 위한 많은 연구들이 있어 왔다. 이들 연구들은 주로 문서 내의 용어의 빈도수와 같은 단순한 통계정보를 이용하여 전문용어를 추출하였다. 하지만 전문분야의 기계가독형 사전의 구축으로 인하여 전문용어를 추출하는 데 있어 전문분야 사전의 사용이 가능하게 되었다. 본 논문에서는 이러한 기계가독형 전문분야 사전들을 이용하여 사전 간의 계층관계를 구축하고 이를 이용하여 전문용어를 추출하는 방법을 제시한다. 또한 전문용어 사전에서 나타나지 않는 전문용어를 추출하기 위하여 용어의 빈도수, 외래어 및 외국어, 내포관계 등을 포함한 통계기법을 이용한다. 본 논문에서 제안하는 기법은 기존의 방법에 비해 좋은 성능을 나타내었다.