• 제목/요약/키워드: Standard Korean Dictionary

검색결과 79건 처리시간 0.029초

거리변환법에 의한 한글패턴의 특징분류 (Feature Classification of Hanguel Patterns by Distance Transformation method)

  • 고찬;이대영
    • 한국통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.650-662
    • /
    • 1989
  • 본 논문에서는 한글문자패턴의 새로운 특징추출 및 분류 알고리즘을 제안하였다. 입력된 패턴을 한글기본 6형식으로 분류하고 자소분리를 시행한 후 각 자소별 위치에 따른 굴곡특징점을 추출하였다. 이 특징점에 의해 입력문자의 내용을 정의하고 이를 색인-순차 파일로 구성하였다. 이 파일과 표준사전화일과의 검색으로 인식처리토록 하였다. 간단한 알고리즘으로 인한 처리시간의 단축과 소프트웨어 작성이 용이함을 보였다. 실험의 결과는 입력패턴의 특징추출과 분류의 결과를 나타내준다. 제안된 알고리즘은 문자를 이루는 최소 4각형 안에서 거리변환을 시켜 굴국특성을 추출하여 이들이 갖고 있는 상대 위치 정보를 이용한 것이 특징으로 실험을 통해 97%의 인식율을 나타내었다.

  • PDF

국제표준 기반의 임상정보 관리체계 구축에 관한 연구 (A Study on System for International Standard(IS) based Clinical Information Management)

  • 최용정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.429-432
    • /
    • 2014
  • 국내 제약산업의 경쟁력을 제고시키기 위해서는 신약의 심사/허가 기간을 단축시켜 급변하게 변하는 글로벌 제약시장에서 경쟁 우위적 위치를 선점할 수 있도록 기회를 제공할 수 있도록 체계 개선이 시급하다. 신약허가를 위해서는 임상시험 결과에 대한 안전성과 유효성 등에 대한 심사가 수행되게 된다. 하지만 현재 신약허가를 위해서 제약사와 임상시험수탁기관(Contract Research Organization, CRO)에서 데이터 정보체계인 Domain, Variable 및 Parameter 등의 표준을 따르지 않고 다양한 유형의 임상정보데이터를 심사기관에 제출하고 있어 이로 인한 심사기간 증가와 심사업무 비효율성을 야기시키고 있다. 따라서 본 연구에서는 국제민간기구인 CDISC (Clinical Data Interchange Standards Consortium)에서 제정한 글로벌 임상데이터 표준인 CDISC 표준을 준용한 국내 임상시험정보관리 체계 (eCTD 시스템)및 의약품 전주기적 관리체계를 제시하고자 하며, 본 연구를 통한 기대효과로는 국제표준의 임상정보관리 인프라 구축으로 인한 국내 신약개발 및 해외 진출 환경을 마련하여 글로벌 시장선점의 기회를 제공할 수 있고, 규제기관 차원에서는 의약품 허가, 심사업무의 효율성 증가는 물론 전주기적 의약품 안전관리체계를 마련할 수 있을 것으로 사료된다.

  • PDF

텍스트마이닝을 위한 패션 속성 분류체계 및 말뭉치 웹사전 구축 (Development of Online Fashion Thesaurus and Taxonomy for Text Mining)

  • 장세윤;김하연;김송미;최우진;정진;이유리
    • 한국의류학회지
    • /
    • 제46권6호
    • /
    • pp.1142-1160
    • /
    • 2022
  • Text data plays a significant role in understanding and analyzing trends in consumer, business, and social sectors. For text analysis, there must be a corpus that reflects specific domain knowledge. However, in the field of fashion, the professional corpus is insufficient. This study aims to develop a taxonomy and thesaurus that considers the specialty of fashion products. To this end, about 100,000 fashion vocabulary terms were collected by crawling text data from WSGN, Pantone, and online platforms; text subsequently was extracted through preprocessing with Python. The taxonomy was composed of items, silhouettes, details, styles, colors, textiles, and patterns/prints, which are seven attributes of clothes. The corpus was completed through processing synonyms of terms from fashion books such as dictionaries. Finally, 10,294 vocabulary words, including 1,956 standard Korean words, were classified in the taxonomy. All data was then developed into a web dictionary system. Quantitative and qualitative performance tests of the results were conducted through expert reviews. The performance of the thesaurus also was verified by comparing the results of text mining analysis through the previously developed corpus. This study contributes to achieving a text data standard and enables meaningful results of text mining analysis in the fashion field.

명사 워드넷과 단일어 사전을 이용한 한국어 동사 워드넷 구축 (Construction of Korean Verb Wordnet Using Preexisting Noun Wordnet and Monolingual Dictionary)

  • 이주호;배희숙;김은혜;김혜경;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.92-97
    • /
    • 2002
  • 의미기반 정보 검색, 자연어 질의 응답, 지식 자동 습득, 담화 처리 등 높은 수준의 자연언어처리 시스템에서 의미처리를 위한 대용량의 지식 베이스가 필요하다. 이러한 지식 베이스 중에서 가장 기본적인 것이 워드넷이다. 이러한 워드넷을 이용함으로써 여러 의미 사이의 의미 유사도를 구할 수 있고, 속성을 물려받을 수 있기 때문에 비슷한 속성을 가진 의미들을 한꺼번에 다루는 데 유용하다. 본 논문에서는 기본 어휘를 바탕으로 기존의 명사 워드넷과 단일어 사전을 이용하여 한국어 동사 워드넷을 구축하는 방법을 제시한다. 본 논문에서 1차 작업을 통하여 구축한 동사 워드넷에는 동사 1,757개에 대한 4,717개의 의미(중복을 포함하면 모두 5,235개의 의미)를 포함하고 있으며 특별히 의미가 많이 편중된 14개의 개념에 속한 571개의 의미를 53개의 세부 개념으로 재분류하여 최종적으로 모두 767개의 계층적 개념으로 구성된 동사 워드넷이 만들어 졌다.

  • PDF

인터넷을 기반으로 하는 EDI 신조류 (A Study on the New Trends of EDI based Internet)

  • 조원길
    • 정보학연구
    • /
    • 제4권1호
    • /
    • pp.125-139
    • /
    • 2001
  • 전자상거래의 글로벌한 움직임과 관련하여 여전히 EDI는 전자상거래의 핵심요소로서 중요성을 더해 가고 있지만, 전세계를 하나로 연결하는 인터넷의 등장과 비즈니스 환경의 변화로 말미암아 그 역할과 구현방법에 새로운 변화가 일어나고 있다. 따라서 본 연구는 전자상거래 구현의 중심적인 역할을 하고 있는 기존의 EDI와 현재의 인터넷을 기반으로 하는 EDI까지의 새로운 EBI조류에 대하여 살펴보았다.

  • PDF

그룹 사용자간 안전한 콘텐츠 전송을 위한 검증자를 이용한 패스워드 기반 다자간 키 교환 프로토콜 (Verifier-Based Multi-Party Password-Authenticated Key Exchange for Secure Content Transmission)

  • 권정옥;정익래;최재탁;이동훈
    • 방송공학회논문지
    • /
    • 제13권2호
    • /
    • pp.251-260
    • /
    • 2008
  • 본 논문에서는 서로 다른 패스워드를 가지는 그룹의 구성원들이 자신의 패스워드만을 사용하여 공통된 그룹 키(세션 키)를 공유할 수 있는 패스워드의 검증자(verifier)를 이용하는 두 개의 패스워드 기반 다자간 키 교환 프로토콜을 제안한다. 공유된 키는 그룹 사용자간 안전한 콘텐츠 전송을 위해 사용될 수 있다. 제안 프로토콜들은 서버의 DB가 노출되었을 경우에 기존의 스킴들 보다 강한 안전성을 제공하도록 설계되었다. 첫 번째 제안 프로토콜은 전방향 안전성(forward secrecy)과 기지 키 공격에 대한 안전성(known-key secrecy)을 제공하며, 두 번째 제안 프로토콜은 추가적으로 서버에 대한 키 기밀성(key secrecy)을 제공한다. 제안 프로토콜들은 상수 라운드를 가지며 표준 모델(standard model)에서 안전성이 증명되었다. 기존에 서버의 DB 노출공격에 안전한 패스워드 기반 다자간 그룹 키 교환 프로토콜이 제안된 적이 없으며, 본 논문에서 처음으로 제안한다.

발음열 자동 생성기를 이용한 한국어 음운 변화 현상의 통계적 분석 (Statistical Analysis of Korean Phonological Variations Using a Grapheme-to-phoneme System)

  • 이경님;정민화
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.656-664
    • /
    • 2002
  • 본 논문에서는 한국어 발음열 자동 생성기를 이용하여 한국어의 음운 규칙에 대한 통계적 분석을 수행하였다. 실험에 사용한 발음열 자동 생성기는 한국어 음운 변화 현상에 대해 형태음운론에 기반 한 언어학적 분석과 문교부 표준어 규정의 표준 발음법에서 유도된 필수 및 수의적 음소 변동 규칙과 변이음 규칙의 단계적 적용 모델을 사용해서 구현되었으며, 특히 연속음성 인식을 위한 학습용 발음열과 인식용 발음사전 생성의 최적화를 목표로 하였다. 본 논문에서는 대어휘 연속음성 인식기의 음향 모델을 구축하기 위해 만들어진 삼성 PBS(Phonetically Balanced Sentence) 음성 데이터 베이스의 60,000문장에 적용된 발음열 생성기의 음소 변동규칙들의 분포 및 그 통계를 사용해서 한국어 음운 변화 양상을 분석하였다. 적용된 빈도수를 기준으로 분석한 결과, 필수음소 변동규칙의 경우는 연음법칙, 경음화, 격음화, 장애음의 비음화순으로, 수의적 음소 변동규칙의 경우는 초성 ㅎ 탈락, 중복 자음화, 동일 조음위치 자음탈락 순으로 음운 변화가 발생하였다. 이러한 적용 규칙들의 통계적 자료를 기반으로 한국어 음운 변화 양상을 파악할 수 있었으며, 나아가 본 논문의 연구 결과는 음성 인식 시스템을 개발하는데 유용하게 사용할 수 있을 것이다.

국립과천과학관의 천문영역 패널 설명의 용어 분석 (Analysis of Terms on Panel Descriptions of the Domain for Astronomy at the Gwacheon National Science Museum)

  • 윤혜련;손정주
    • 과학교육연구지
    • /
    • 제36권2호
    • /
    • pp.329-340
    • /
    • 2012
  • 이 연구의 목적은 국립과천과학관내 천문학을 주제를 다루고 있는 전시물의 패널에 사용된 용어를 분석하여 용어의 특성을 알아보고, 관람객이 이해할 수 있는 적절한 수준으로 제시되었는가를 알아보기 위한 것이다. 이를 위해 국립과천과학관내에 있는 천체 투영관에서 14개, 자연사관에서 17개, 전통과학관에서 21개, 총 52개의 패널에 대해 조사하였고, 중복되는 용어를 제외하고 총 965개의 용어가 추출되었다. 이 용어들을 표준국어대사전과 천문학용어집을 근거로 패널에 적용된 용어들의 근거를 살펴보았다. 또한 패널에 사용된 용어들이 관람객의 대부분을 차지하는 초 중 고등학생들이 이해 하기에 적절한 수준으로 제시되었는지를 교육과정과 연계하여 알아 위해 초 중 고등학교 현직교사 24명을 대상으로 학생들이 용어에 대한 이해도에 대한 설문 조사를 실시하였다. 그 결과, 패널 용어 중 정확한 일반화된 전문용어가 제시된 정도는 68.5%이며, 모든 학년의 학생들은 전문용어에 대해 어려움을 겪을 것으로 확인되었다. 학년이 올라감에 따라 친숙해지는 용어가 많아지고 그에 따라 어려움을 겪을 용어의 개수도 점차 줄어 들것을 설문결과에서 확인하였다. 따라서, 전시물에 대한 흥미를 유지하면서 충분한 이해를 돕기 위해서는 일반화되지 않은 전문용어의 사용빈도를 최소화하고, 친숙하지 않은 용어의 사용 시 실생활과의 연관성을 높여 제시하는 방식의 개선이 제안된다.

  • PDF

우리나라 숭어과 어류의 어명 및 자원 활용에 대한 고찰 (Review of Fish Name on the Fishes of the Family Mugilidae in Korea and Resource Utilization)

  • 고은영;박종오;이경선
    • 한국해양생명과학회지
    • /
    • 제4권2호
    • /
    • pp.96-105
    • /
    • 2019
  • 숭어과 어류는 연안에서부터 담수역까지 서식하고 있는 대표적인 광염성 어류이다. 이들의 형태적인 유사성 때문에 분류학적인 면에서나 명명법에 있어 많은 논란이 있다. 숭어과 어류 중 국내에서 주로 소비되고 있는 어종은 숭어(Mugil cephalus)와 가숭어(Chelon haematocheilus)로, 일반적으로 숭어와 가숭어를 구별하지 않고 숭어라 불리기도 한다. 이에 본 연구에서는 국내의 학술적인 자료 및 옛 문헌을 조사하여 국내에서 혼용되고 있는 숭어류의 학명 및 어명에 대해 정리해보고자 하였다. 숭어의 학명은 M. cephalus로 사용되고 있지만, 가숭어는 Chelon, Mugil, Liza 속명이 혼용되고 있다. 숭어류의 어명에 대해 국내사전에는 숭어와 가숭어를 구별하지 않고 있으나, 일어, 영어, 중국어사전에서는 숭어와 가숭어가 명확히 구분되어 있었다. 옛 문헌에서는 숭어류를 '치어' 또는 '수어'라 이르고 있다. 대부분의 문헌에서는 숭어와 가숭어의 구분이 명확하게 나타나지 않았으나, 자산어보에서는 가숭어를 치어(참치어)로, 숭어를 가치어로 기록하고 있어 '가(假)'자의 붙임이 현재와 달리 사용되고 있었다. 가숭어는 양식되고 있는 종으로 앞으로 산업적인 활용이 모색되고 있는 단계에서, '가'자에 대한 부정적인 인식을 고려하였을 때 가숭어라는 어명 대신에 '참숭어'로의 어명 변경을 제안한다.

나이브 베이즈 기반 소셜 미디어 상의 신조어 감성 판별 기법 (Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification)

  • 김정인;박상진;김형주;최준호;김한일;김판구
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.51-59
    • /
    • 2020
  • 인터넷의 발달과 스마트폰의 보급으로 인하여 그에 따른 소셜 미디어 문화가 형성됨에 따라 PC통신부터 지금까지 소셜 미디어 신조어가 그 문화로 자리 잡아가고 있다. 소셜 미디어의 등장과 사람들의 가교역할을 해주는 스마트폰의 보급화로 신조어가 생기고 빈번하게 사용되고 있는 추세이다. 신조어의 사용은 다양한 문자 제한 메신저의 문제점을 해결하고 짧은 문장을 사용하여 데이터를 줄이는 등 많은 장점을 가지고 있다. 그러나 신조어에는 사전적인 의미가 없으므로 데이터 마이닝 기술이나 빅데이터와 같은 연구에서 사용되는 알고리즘의 성능 저하와 연구에 제약사항이 발생한다. 따라서 본 논문에서는 웹 크롤링을 통해 텍스트 데이터를 추출하고, 텍스트 마이닝과 오피니언 마이닝을 통해 의미부여 및 단어들에 대한 감정적 분류를 통한 문장의 오피니언 파악을 진행하고자 한다. 실험은 다음과 같이 3단계로 진행하였다. 첫째, 소셜 미디어에서 새로운 단어를 수집하여 수집된 단어는 긍정적이고 부정적인 학습을 받게 하였다. 둘째, 표준 문서를 사용하여 감정적 가치를 도출하고 검증하기 위해 TF-IDF를 사용하여 데이터의 감정적 가치를 측정하기 위해 명사 빈도수를 측정한다. 신조어와 마찬가지로 분류된 감정적 가치가 적용되어 감정이 표준 언어 문서로 분류되는지 확인하였다. 마지막으로, 새로 합성된 단어와 표준 감정적 가치의 조합을 사용하여 장비 기술의 비교분석을 수행하였다.