• 제목/요약/키워드: 어휘데이터베이스

검색결과 79건 처리시간 0.021초

유로워드넷 기반의 어휘 데이터베이스 활용을 위한 한국어-독일어 ILI 대응 방법론 연구 (Eine methodologische Untersuchung der koreanisch-deutschen ILI-Verbindung zur Anwendung der auf dem EuroNet basierten lexikalisch-semantischen Datenbasis)

  • 오장근
    • 한국독어학회지:독어학
    • /
    • 제6집
    • /
    • pp.323-344
    • /
    • 2002
  • EuroNet ist eine multilinguale Datenbasis mit WordNets $f\"{u}r\;einige\;europ\"{a}ische$ Sprachen ($holl\"{a}ndisch$, italienisch, spanisch, deutsch, $franz\"{o}sisch$, tschechisch und estnisch). Die WordNets werden genauso wie das amerikanische WordNet $f\"{u}r$ Englisch (Princeton WordNet, Miller et al. 1990) in Synsets (Zusammensetzen der synonymen $W\"{o}rter$) mit grundlegenden lexikalisch-semantischen Relationen zwischen ihnen $ausgedr\"{u}ckt$ strukturiert. Jedes WordNet stellt also ein einzigartiges innersprachliches System $f\"{u}r$ die lexikalischen und konzeptuellen Relationen dar. $Zus\"{a}tzlich$ werden diese auf dem Princeton WordNet basierten WordNets (z.B. GermaNet) mit einem Inter-Linguale-Index (kurz, ILI) verbunden. $\"{U}ber$ diesem Index werden die Sprachen zusammengeschaltet, damit zu gehen ist $m\"{o}glich$, von den $W\"{o}rtern$ in einer Sprache zu den $\"{a}hnlichen\;W\"{o}rtern$ in jeder $m\"{o}glicher$ anderen Sprache. Der Index gibt auch Zugang zu einer geteilten Top-Ontologie von 63 semantischen Unterscheidungen. Diese Top-Ontologie stellt einen allgemeinen semantischen Rahmen $f\"{u}r$ aile Sprachen zur $Verf\"{u}gung,\;w\"{a}hrend$ sprachspezifische Eigenschaften in den einzelnen WordNets beibehalten werden. Die Datenbasis kann, unter anderen, $f\"{u}r$ einsprachige und multilinguale Informationsretrieval benutzt werden. In der vorliegenden Arbeit handelt sich also um eine methodologische Untersuchung der koreanisch-deutschen ILI-Verbindung zur Anwendung der auf dem EuroNet basierten lexikalischen, semantischen Datenbasis. Dabei werden einzelnen Lexeme in koreanischen, deutschen WordNets $zun\"{a}chst$ mit Hilfe der Sense-Analyse semantisch differenziert, und dann durch lexikalische und konzeptuelle Relationen(ILI) miteinander verbunden. Die Equivalezverbindungen dienen, sprachspezifische Konzepte zum ILI abzubilden. Sie werden von einem anderen Synset der moglichen Relationen aus der Euronet-Spezifikation genommen. Wenn es keinen ILI-Rekord gibt, der ein direktes Equivalenz zu einem gegebenen Konzept darstellt, kann das Konzept in der Frage $\"{u}ber$ EQ-Near-Synonymie, EQ-Hyperonymie oder EQ-Hyponymie Relationen verbunden werden.

  • PDF

고립단어 인식 시스템에서의 거절기능 구현 (An Implementation of Rejection Capabilities in the Isolated Word Recognition System)

  • 김동화;김형순;김영호
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.106-109
    • /
    • 1997
  • 고립단어 음성인식 시스템이 실용적이 되려면 인식 대상 이외의 단어를 거절할 수 있는 기능이 요구된다. 본 논문에서는 집단화된 음소 모델과 likelihood ratio에 의한 후처리 방법을 사용하여 거절기능을 구현하는 방법을 제안하였다. 기본적인 음성인식 시스템은 단어 단위 연속 HMM을 사용하였고, 6개의 집단화된 음소 모델들은 음성학적으로 균형잡힌 음성 데이터베이스를 이용하여 훈련된 45개의 문맥독립 음소 모델들로부터 통계적 방법에 의하여 생성되었다. 22개의 부서 명칭을 대상으로 한 화자독립 고립단어 인식시스템에서 거절성능을 시험하여 본 결과, 가장 높은 확률값과 두 번째 높은 확률값을 가지는 후보단어들 간의 차이값에 의하여 거절기능을 수행하는 기존의 후처리 방법보다 성능이 향상됨을 알 수 있었다. 또한 이 집단화된 음소모델은 인식 대상 어휘가 다른 고립단어 인식 시스템에도 재훈련 없이 그대로 사용될 수 있다.

  • PDF

온톨로지 기반의 자연어 검색 시스템 설계 및 구현 (Design and Implementation of Ontology-Based Natural Language Search System)

  • 강래구;임동일;정채영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.875-878
    • /
    • 2007
  • 지금까지의 상품 검색 방법으로는 찾고자하는 정보를 검색할 때 주로 단어의 빈도수나 어휘 정보를 이용하는 키워드 기반의 검색이 주로 쓰이고 있었다. 키워드 기반의 검색에서는 사용자의 질의와 관련이 없는 문서들까지도 같은 결과로 나타내 주고 이로 인해 사용자는 제시된 결과를 한번 더 수동적으로 검색해야하는 부담을 않게 되었다. 이러한 문제점을 해결하기 위해 온톨로지가 대두되었다. 본 논문에서는 온톨로지를 이용한 상품 검색 시스템을 직접 구축하여 분류별 검색을 통해 얼마나 정확한 검색을 하는지 실험하였다. 실험을 위해 전국적으로 On/Off라인 할인점을 운영 중에 있는 A할인점의 상품 데이터 약 40,000여개를 데이터베이스로 구축하였고 User Interface 개발환경은 JSP와 PowerBuilder9.0을 사용하여 검색 시스템을 개발하여 실험하였다. 그 결과 본 논문에서 제안하고 설계한 상품 도메인 온톨로지를 이용한 검색 방법이 기존의 키워드 기반의 검색 방법보다 우수한 결과를 나타내고 있음을 입증하였다.

  • PDF

FAES : 감성 표현 기법을 이용한 얼굴 애니메이션 구현 (On the Implementation of a Facial Animation Using the Emotional Expression Techniques)

  • 김상길;민용식
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.147-155
    • /
    • 2005
  • 본 논문은 여러 가지 감정들 중에서 4가지 감정의 범주 즉, 중성, 두려움, 싫증 및 놀람을 포함한 음성과 감성이 결합되어진 얼굴의 표정을 좀 더 정확하고 자연스러운 3차원 모델로 만들 수 있는 FAES(a Facial Animation with Emotion and Speech) 시스템을 구축하는데 그 주된 목적이 있다. 이를 위해서 먼저 사용할 훈련자료를 추출하고 난후에 감성을 처리한 얼굴 애니메이션에서는 SVM(Support vector machine)[11]을 사용하여 4개의 감정을 수반한 얼굴 표정을 데이터베이스로 구축한다. 마지막으로 얼굴 표정에 감정과 음성이 표현되는 시스템을 개발하는 것이다. 얼굴 표정을 위해서 본 논문에서는 한국인 청년을 대상으로 이루어졌다. 이런 시스템을 통한 결과가 기존에 제시된 방법에 비해서 감정의 영역을 확대시킴은 물론이고 감정인지의 정확도가 약 7%, 어휘의 연속 음성인지가 약 5%의 향상을 시켰다.

  • PDF

감정분석과 오피니언 마이닝: 2007-2016 (Sentiment Analysis and Opinion Mining: literature analysis during 2007-2016)

  • 이가베;이효맹;유효문;강선경;이현창;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.160-161
    • /
    • 2017
  • 감정 분석 및 의견 마이닝은 지난 15 년 동안 연구 분야가 등장하면서 사람들의 의견, 감정, 평가, 태도 및 감정을 글쓰기 언어의 광산 및 감정 분석 (OMSA)에서 분석하고 계산 방법론을 제공하는 분야입니다 주로 비 구조화 된 데이터를 처리하여 의견을 추출하고 그들의 감정을 파악합니다. 상대적으로 새롭지 만 빠르게 성장하는 연구 분야는이 기간 동안 많이 바뀌 었습니다. 이 논문은 2007-2016 년 동안 OMSA에서 수행 된 연구 작업의 과학적 분석을 제시합니다. 문헌 분석을 위해 Web of Science (WoS) 데이터베이스에서 색인 된 연구 출판물을 입력 자료로 사용합니다. 출판 데이터는 계산 방식으로 분석되어 연도 별 출판 패턴, 출판물, 연구 분야의 성장률을 파악합니다. 이 간행물에서 사용되는 대중적 접근법 (기계 학습 및 어휘 기반), OMSA의 주요 응용 분야 및 정서 분석 작업의 수준 (문서, 문장 또는 측면 수준)을 식별하기 위해 데이터에 대한보다 상세한 수동 분석도 수행됩니다.

  • PDF

호주의 레코드키핑 시스템에 대한 연구 (A Study on Recordkeeping System in Australia)

  • 이영숙
    • 한국기록관리학회지
    • /
    • 제4권2호
    • /
    • pp.76-90
    • /
    • 2004
  • 기록되는 정보가 축적되어 다양한 지식이 되고, 이를 원하는 사람에게 제공하는 전 과정이 기록관리이다. 호주의 기록관리 절차에 대한 정형화 및 표준화에 대하여 시드니 주립기록보존소(Sydney Records Center) 및 연방기록보존소를 포함한 각계각층의 사람들이 모여 개발한 기록관리 지침이 호주기록관리(Australian Standard Records Management, 이하 AS 4390이라 한다)이다. AS 4390을 기초로 하여 국제 기록관리 표준(ISO 15489)이 만들어졌다. 이 논문은 AS 4390을 모태로 하여 호주에서 활발하게 진행 중인 레코드키핑 시스템의 정의, 체제, 설계 및 실행지침, 메타데이터 항목개발 프로젝트 동향을 소개하면서, 아울러 호주 기록관리의 현안 사항인 시드니 주립기록보존소의 타뷰렘(Tabularium), 캔버라 연방기록보존소의 소장기록물 데이터베이스시스템인 CRS(Commonwealth Records Series) 및 호주정부 정보소재서비스(Australian Government Locator Service)등 각 시스템을 연동시키기 위하여 표준화의 중요성을 살펴보고자 한다. 한편 우리나라의 경우는 2005년부터 <공공기관의기록물관리에관한법률>에 의하여 의무적으로 자료관시스템과 전문관리기관 시스템을 사용하고 있으며, 각 시스템간 자료의 호환성을 갖추기 위해 국제 표준을 따르는 것이 바람직하다. 아울러 정부 부처별로 수행하는 업무 영역과 하위 업무에 대한 어휘통제용어사전을 하루바삐 만들어 자료 검색 시 효율성을 높여야 할 것이다.

Topiramate의 신경성 폭식증 치료효과: 국내외 보고된 임상연구결과 및 치험사례 중심으로 (Topiramate for the Treatment of Binge Eating Disorder or Bulimia Nervosa : A Systemic Review of Human Clinical Studies and Case Reports)

  • 이유정;방준석
    • 한국임상약학회지
    • /
    • 제17권1호
    • /
    • pp.6-12
    • /
    • 2007
  • 지난 20 여 년 간 서구 선진사회에서는 식사장애(Eating disorder) 중에서 신경성 폭식증(Bulimia nervosa)의 발병률이 급격히 상승하였고, 우리나라는 특히 젊은 여성층에서 발병률이 빠르게 상승하고 있다. 치료약물로는 주로 항우울제가 선택되지만, 치료효과가 미흡한 바, 항경련제인 topiramate가 효과가 있다는 보고들이 있어 이를 신경성 폭식증치료에 적극 사용할 수 있는가에 관심이 고조되었다. 본 연구는 topiramate가 지닌 신경성 폭식증 치료효과에 대한 최신 지견을 얻고자, 1990년부터 2006년 사이 MEDLINE과, 한국의학논문데이터베이스에 등재된 국내외 자료를 binge eating disorder, bulimia nervosa, topiramate라는 3개의 주요어휘로 검색하여 추출한 자료중에서, 대조군이 사용된 무작위 배정, 이중맹검 임상연구 및 치험사례 만을 선별하여 임상적유용성을 평가하였다. 국외 임상연구 및 치험사례에 따르면, topiramate가 신경성 폭식증에 수반되는 유해한 증상의 발생빈도를 경감시키는데 유효함을 나타내었다. 국내에는 아직 topiramate의 신경성 폭식증 치료효과를 검증한 체계화된 임상연구나 치험사례가 보고된 바 없었다. 피험자의 규모가 작다는 한계에도 불구하고, 일일 투여량 25 mg로 시작하여 점차 증량후 최대 600 mg까지 투여한 국외의 연구결과는, topiramate가 신경성 폭식증 치료에 유효한 결과를 보인다고 사료되므로, 국내 신경성 폭식증 임상치료와 연구에 반영되기를 기대한다.

  • PDF

최신 웹 크롤링 알고리즘 분석 및 선제적인 크롤링 기법 제안 (A proposal on a proactive crawling approach with analysis of state-of-the-art web crawling algorithms)

  • 나철원;온병원
    • 인터넷정보학회논문지
    • /
    • 제20권3호
    • /
    • pp.43-59
    • /
    • 2019
  • 오늘날 스마트폰의 보급과 SNS의 발달로 정형/비정형 빅데이터는 기하급수적으로 증가하였다. 이러한 빅데이터를 잘 분석한다면 미래 예측도 가능할 만큼 훌륭한 정보를 얻을 수 있다. 빅데이터를 분석하기 위해서는 먼저 대용량의 데이터 수집이 필요하다. 이러한 데이터가 가장 많이 저장되어 있는 곳은 바로 웹 페이지다. 하지만 데이터의 양이 방대하기 때문에 유용한 정보를 가진 데이터가 많은 만큼 필요하지 않은 정보를 가진 데이터도 많이 존재한다. 그렇기 때문에 필요하지 않은 정보를 가진 데이터는 거르고 유용한 정보를 가진 데이터만을 수집하는 효율적인 데이터 수집의 중요성이 대두되었다. 웹 크롤러는 네트워크 대역폭, 시간적인 문제, 하드웨어적인 저장소 등의 제약으로 인해 모든 페이지를 다운로드 할 수 없다. 그렇기 때문에 원하는 내용과 관련 없는 많은 페이지들의 방문은 피하며 가능한 빠른 시간 내에 중요한 페이지만을 다운로드해야한다. 이 논문은 위와 같은 이슈의 해결을 돕고자한다. 먼저 기본적인 웹 크롤링 알고리즘들을 소개한다. 각 알고리즘마다 시간복잡도와 장단점을 설명하며 비교 및 분석한다. 다음으로 기본적인 웹 크롤링 알고리즘의 단점을 개선한 최신 웹 크롤링 알고리즘들을 소개한다. 더불어 최근 연구 흐름을 보면 감성어휘 수집과 같은 특수한 목적을 가진 웹 크롤링 알고리즘의 대한 연구가 활발히 이루어지고 있다. 특수 목적을 가진 웹 크롤링 알고리즘에 대한 연구로써 선제적인 웹 크롤링 기법으로 감성 반응 웹 크롤링(Sentiment-aware Web Crawling) 기법을 소개한다. 실험결과 데이터의 크기가 커질수록 기존방안보다 높은 성능을 보였고 데이터베이스의 저장 공간도 절약되었다.

지휘통제 관련 정보교환모델 비교분석 및 시사점 (Comparative Analysis and Implications of Command and Control(C2)-related Information Exchange Models)

  • 김건영;박규동;손미애
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.59-69
    • /
    • 2022
  • 효과적인 전장상황 인식 및 지휘결심을 위해서는 체계 간의 솔기없는 정보교환이 핵심적이다. 그러나 각 체계는 각자의 목적에 맞게 독립적으로 개발되었기 때문에, 효과적으로 정보를 교환하기 위해서는 체계 간 상호운용성을 보장하여야 한다. 우리 군의 경우 데이터 교환을 위한 공통 메시지 포맷을 활용함으로써 문법적 상호운용성(Syntactic interoperability)을 보장하고 있다. 그러나 단순히 교환되는 데이터의 형식을 표준화하는 것으로는 체계 간 상호운용성을 충분히 보장할 수 없다. 현재 미국과 NATO에서는 데이터 교환 형식을 보장하는 데에서 더 나아가 의미적 상호운용성(Semantic interoperability)을 달성하기 위해 정보교환모델을 개발·활용하고 있다. 정보교환모델은 공통 어휘(Common vocabulary) 또는 참조 모델(Reference model)로, 체계 간에 정보 교환을 내용적·의미적인 수준에서 보장하기 위해 활용된다. 미국에서 개발·활용하는 정보교환모델은 초기에는 전장상황과 직접 관련된 정보를 교환하는 데에 초점을 맞추었으나, 이후 각 정부 부처 및 민간 기관이 함께 활용할 수 있는 범용적인 형태로 발전되었다. 반면 NATO의 경우 이에 속한 각 국가의 군 간 연합 작전을 수행하는 데에 필요한 개념을 엄격히 표현하는 데에 초점을 맞추었으며, 모델의 범위 역시 지휘통제에 관련된 개념으로 한정되었다. 본 논문에서는 미국과 NATO에서 개발·활용하였던 정보교환모델의 개발 배경, 목적 및 특성을 식별하였고, 이들의 비교분석을 수행하였다. 이를 통해 추후 한국형 정보교환모델 개발 시 시사점을 제시하고자 한다.