• 제목/요약/키워드: 한글표현

검색결과 514건 처리시간 0.132초

단어의 의미와 문맥을 고려한 순환신경망 기반의 문서 분류 (Document Classification using Recurrent Neural Network with Word Sense and Contexts)

  • 주종민;김남훈;양형정;박혁로
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권7호
    • /
    • pp.259-266
    • /
    • 2018
  • 본 논문에서는 단어의 순서와 문맥을 고려하는 특징을 추출하여 순환신경망(Recurrent Neural Network)으로 문서를 분류하는 방법을 제안한다. 단어의 의미를 고려한 word2vec 방법으로 문서내의 단어를 벡터로 표현하고, 문맥을 고려하기 위해 doc2vec으로 입력하여 문서의 특징을 추출한다. 문서분류 방법으로 이전 노드의 출력을 다음 노드의 입력으로 포함하는 RNN 분류기를 사용한다. RNN 분류기는 신경망 분류기 중에서도 시퀀스 데이터에 적합하기 때문에 문서 분류에 좋은 성능을 보인다. RNN에서도 그라디언트가 소실되는 문제를 해결해주고 계산속도가 빠른 GRU(Gated Recurrent Unit) 모델을 사용한다. 실험 데이터로 한글 문서 집합 1개와 영어 문서 집합 2개를 사용하였고 실험 결과 GRU 기반 문서 분류기가 CNN 기반 문서 분류기 대비 약 3.5%의 성능 향상을 보였다.

시맨틱 기술 개발을 지원하기 위한 Open API (Opne API for semantic technology)

  • 박정원;남세진;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-115
    • /
    • 2009
  • 현재 Open API는 프로그램 개발 및 정보의 제공 등 다양한 방향에서 많이 활용 되고 있다. Open API는 개발된 기술을 웹으로 공개하여 네트워크가 연결된 곳이라면 어디서든지 그 기술을 활용할 수 있다. 잘 개발된 Open API는 매쉬업을 통해 또 다른 기술과 합쳐 새로운 서비스를 개발하는 등 그 활용빈도가 높다. 이미 개발된 기술을 활용할 수 있어서 개발 속도가 단축되고 새로운 서비스를 개발하면서 기존의 부족한 부분을 합쳐 더욱 창의적인 정보 제공이 가능하다. 이러한 Open API의 특성을 이용하여 시맨틱 기술 개발을 지원할 수 있으며, 개발 시간 단축 및 관계 설정, 온톨로지 제공 등을 네트워크를 통해 사용자들에게 제공하고 활용할 수 있는 방법을 제시한다. 시맨틱 기술은 사람이 글을 읽고 의미를 이해하는 것처럼 컴퓨터가 이해할 수 있는 언어와 규칙들을 정해 놓아 컴퓨터 사이의 의사소통을 가능하게 하는 지능형 기술이다. 이런 시맨틱 기술 개발을 지원하기 위하여 Open API를 통해 온톨로지의 개념 및 속성, 관계 설정, 코퍼스 등을 제공하기 하기 위해 CoreOnto API라는 것을 구축했다. CoreOnto API는 네트워크에서 사용할 수 있는 Open API로 세가지의 큰 형태의 Open API를 제공하고 있다. 첫 번째, 온톨로지에 대한 클래스, 속성, 관계를 제공하는 APIs, 두 번째, 트리플(두개의 용어가 어떤 관계인지를 표현한 형태로 구성(용어1, 관계, 용어2)) 생성 및 구축된 트리플을 검색할 수 APIs, 세 번째, 온톨로지를 생성하기 위해 필요한 자원(온톨로지 명, 개체명, 관계, 코퍼스 등)을 제공하는 APIs로 구성했다. 이상과 같이 시맨틱 기술 개발을 지원하기 위한 큰 형태의 세 가지 APIs를 구축하는 방법과 APIs의 활용, 그리고 서비스를 테스트한 결과를 제시한다.

  • PDF

FoxPro를 이용한 오이와 토마토의 생육장해 진단 전문가 시스템 개발 (Expert System for Stress Diagnosis of Cucumber and Tomato Using FoxPro)

  • 고병진;서상룡;최영수
    • 생물환경조절학회지
    • /
    • 제12권1호
    • /
    • pp.30-37
    • /
    • 2003
  • Visual FoxPro를 사용하여 한글 사용과 대용량 정보처리에 문제가 없고 비전문가의 사용이 용이한 전문가 시스템을 개발하였다. 본 시스템에서는 추론 방식으로 패턴매칭을 이용한 순방향 추론을 채택하였으며, 지식베이스는 IF∼THEN 규칙으로 표현하였다. 또한 추론결과의 확신도 계산에는 MYCIN 규칙을 이용하였으며, 윈도우에서의 추론을 위한 제반 자료와 규칙의 수정과 보완이 용이하도록 컨트롤 기능을 채택하였다. 개발된 추론엔진, 데이터베이스 그리고 사용자 인터페이스를 기반으로 모이와 토마토를 대상으로 한 생육장해진단 관련 데이터 베이스를 구축하여, 농민과 같은 비전문가의 활용이 용이한 생육장해 진단용 전문가 시스템을 개발하였다. 개발한 시스템의 사용상 편리성과 정확성을 농민과 농업 종사자들을 대상으로 조사한 결과, 사용자에 따라서 결론의 확신도에는 약간씩 차이가 있었으나 관행의 장해 진단방법과 비교할 때 유용한 것으로 나타났다. 또한 개발된 전문가 시스템의 기본 구조 및 추론엔진은 오이와 토마토 이외의 농작물 생육장해 진단에도 해당 데이터 베이스의 변경을 통하여 직접 응용이 가능할 것으로 기대된다.

인터넷 지리 정보 시스템을 위한 HVF (Hnagul Vector Format)의 개발 (A Development of HVF (Hnagul Vector Format) for Internet GIS)

  • 문진용;구용완
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.321-327
    • /
    • 2000
  • 지리 정보 시스템(GIS; Geographical Information System)은 하드웨어, 소프트웨어, 데이터, 사람, 그리고 메소드로 구성된다. 이중 데이터는 GIS 의 가장 중요한 요소 중 하나이다. 본 논문에서는 GIS 개발자들에 의해 개척되고 있는 최신의 기술인 인터넷 GIS에서 공간 데이터의 효율적 사용을 위한 공간 객체 표현, 저장 및 전송을 위한 파일 포맷인 HVF를 개발하였다. 본 논문에서는 먼저 HVF의 문법을 정의하고, API를 통한 HVF 생성을 위해 헤드섹션 생성모듈과 메인섹션 생성모듈을 구현하였다. 그리고 HVF를 여러 응용 분야에서 데이터의 공유가 가능한 자료 구조의 형태로 변환하기 위해 HVF를 위한 공간객체 변환기를 개발하였다. 이를 위해 변환기를 구성하는 3개의 단위 모듈인 파일 처리 모듈, HVF 수입 모듈, 그리고 HVF 수출 모듈들을 설계 및 구현하였다. 특히, 인터넷 GIS를 위해 개발된 HVF는 네트워크의 트래픽을 감소하기 위한 공간 데이터의 크기와 이용 효율을 위한 한글 처리에 대해 고려 하였다.

  • PDF

경상북도 지방자치단체의 도시 브랜드 슬로건 분석 (Analysis of Urban Brand Slogans of Gyeongsangbuk-do's Local Authorities)

  • 배진희;권기창
    • 한국콘텐츠학회논문지
    • /
    • 제20권12호
    • /
    • pp.206-220
    • /
    • 2020
  • 글로컬 시대 지방자치단체의 경쟁력은 국가경쟁력으로 이어진다. 이에 따라 지방자치단체들은 주민 결속과 도시 이미지 구축을 통한 경쟁력 확보를 위해 도시 브랜드 슬로건을 활용하고 있다. 본 연구는 경상북도 24개 지방자치단체에서 2020년 4월 현재 사용 중인 48건의 슬로건을 브랜드 슬로건 24건과 서브 슬로건 24건으로 구분하여 슬로건 언어 표기, 의미전달, 소재유형 측면에서 분석하였다. 그 결과 브랜드 슬로건은 여러 가지 언어가 혼용되었고 자연·생태, 역사·문화 등을 소재로 한 의미전달은 정보제공형이 많았다. 서브 슬로건은 대부분 한글을 사용하였고 행복, 공동체 등의 추상적 가치를 소재로 한 의미전달은 이미지 제고 형이 많았다. 도시 브랜드 강화를 위한 슬로건 표현에서 정체성과 일관성의 맥락이 요구되었다. 본 연구 결과 도시 브랜드 슬로건의 효과적인 개발과 활용에 도움이 될 수 있기를 기대한다.

초등학교 1학년 수학 교과서의 어휘 및 문장 적합성 분석 (An Analysis on Suitability of Words and Sentences in Mathematics Textbooks for Elementary First Grade)

  • 장혜원;임미인
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제26권2호
    • /
    • pp.247-267
    • /
    • 2016
  • 2009 개정 교육과정에 따른 초등학교 수학 교과서가 한글 교육을 시작한지 얼마 되지 않은 1학년 학생들에게 수학적 내용 지식 이외에 부수적으로 어휘 및 문장의 양과 수준에 의한 어려움을 야기한다는 지적이 있어 왔다. 이에 본 연구는 1학년 수학 교과서의 어휘와 문장의 적합성을 분석하여 시사점을 얻는 것을 목적으로 한다. 어휘 차원에서 난이도와 친숙도, 문장 차원에서 구조, 길이, 표현의 적합성을 분석 내용으로 한다. 분석 결과, 어휘 차원에서 1학년 수준에 난이도가 높은 어휘 108개, 친숙도가 낮은 어휘 6개가 확인되었다. 문장 차원에서는 단문에 비해 구조가 복잡한 중문 37개, 복문 727개, 중복문 38개가 포함된 것으로 나타났으며, 8개 어절을 초과하여 구성된 긴 문장도 237개 추출되었다. 표현 측면에서는 2가지 이상의 활동을 동시에 지시하는 문장 168개, 명사나 형용사가 3개 이상 연속적으로 연결되어 있는 문장 52개 등 어려움의 원인을 확인하였다. 이러한 결과에 기초한 논의로부터 차후 초등 저학년 수학 교과서 개발을 위한 몇 가지 시사점을 제안하였다.

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.

이상(Lee Sang)의 시작품에 구사되는 프랑스어와 반문체 (A Command of French and anti-style used in Lee Sang's poetic work)

  • 이병수
    • 비교문화연구
    • /
    • 제49권
    • /
    • pp.229-248
    • /
    • 2017
  • 본 논고는 한국 시문학사에서 형이상학적 스캔들로 불리는 이상의 시편들에 구사 되는 프랑스어 연구이다. 이상의 시에서 프랑스어가 차지하는 비중은 식민지 시대에 일본어를 제외하면 가장 중요한 시어로 활용되고 있음을 알 수 있다. 우리의 연구는 기호적인 프랑스어, 기하학적이고 회화적인 프랑스어 활용에 대해 분석하고, 아울러 반복적이고 나열적인 단어와 문장의 구성에 응용되는 프랑스어에 대해 분석했다. 이상의 시편들에서 프랑스어의 활용은 비시어적인 기호의 혼용으로 볼 수 있으며, 전통적인 모국어와 시창작의 문법을 거부한 반문체적인 특성으로 나타남을 확인 할 수 있다. 그의 시에서 프랑스어는 아방가르드적인 시적 재료와 실험적인 창작기법의 중요한 요소 중에 하나로 나타난다. 시인에게 프랑스어는 언어의 범주를 벗어난 건축학적이고 회화적인 재료들과 함께 한글의 틀을 거부한 전혀 낯선 표현기법의 중요한 요소로 적용되고, 시인의 예술정신을 구현하기 위한 전위적인 언어로 응용되고 있다. 이상에게 프랑스어는 분열적이고 열패적인 자신의 내면적 갈등을 표현하기 위한 도구로 활용되고 있으며, 시인은 프랑스어가 갖는 기표와 기의적인 특성을 이용하여 근대한국문학에 유래를 찾아 볼 수 없는 실험적인 문체를 보여주었다. 이상의 시에서 프랑스어는 식민지하의 억눌린 자의식을 해방시킨 자유의 언어이며, 한국문학뿐만 아니라 세계문학 속에서도 유례를 찾아볼 수 없는 반문체적이고, 형이상학적인 시편들을 구성하는 중요한 요소로 볼 수 있다.

<>의 형태논적(形態論的) 고찰(考察) (Morphological Study Of The 「Kyeong Syeong Baek In Baek Saek()」 - Focusing On the Declensions)

  • 전병용
    • 동양고전연구
    • /
    • 제41호
    • /
    • pp.407-444
    • /
    • 2010
  • 본 연구의 목적은 개화기 풍자소설인 <>을 대상으로 형태론적 특징을 고찰하고, 창작 시기를 추정하는 데 목적이 있다. 이를 위하여 먼저 조어의 특징을 살핀 다음 조사를 중심으로 분석하였으며, <경셩>의 창작 시기에 대한 형태론적 분석 결과를 바탕으로 창작시기에 대한 의견을 제시하였다. <경셩>의 창작시기에 대한 기존의 논의를 타당한 것으로 본다. 문학전공자를 중심으로 선행 연구에서 <경셩>의 창작시기를 대체로 1901년 이후 1907년 이전으로 잡았는데, 본고의 형태론적 고찰을 통한 결과와도 일치하기 때문이다. 조어 특징에서, 조건법 표현인 '~ 말이면' 등장은 <경셩>의 창작시기를 추정하는 데 도움이 되었다. <경셩>의 창작시기(1910년 전후) 이전의 문헌에서는 이에 상응하는 조건법 표현은 '~ 작시면'이었는데, <경셩> 시기의 신소설에서는 '~ 말이면'으로 나타나고, 그 이후에는 '~ 것 갓흐면'이나 '~'으로 바뀌면서 현대국어의 양상에 근접하기 때문이다. 조어의 특징으로 오기(誤記)를 분석하였다. 단순한 오기와 무지(無知)에서 비롯한 오기로 나누어 살펴본 바, <경셩>의 필사자는 창작자는 물론 아니고 원전(原典)에 대한 이해가 깊은 교양인도 아닐 것으로 추정할 수 있었다. 조사의 특징에서 주격조사 '-가'의 전면적 사용이 특기(特記)할 만하였다. 주격조사 '-가'는 근대국어 초기에 이미 등장하였으나, <이언(易言)>의 한글본의 언해시기(1883년)까지는 전면적으로 쓰이지 않고 '-ㅣ'가 대신하였다. 하지만 <경셩> 시기에서는 '-ㅣ'가 화석형으로 흔적만 남기고 대부분 '-가'로 대체되었음을 알 수 있었다. 이를 근거로 <경셩>의 창작시기는 최소한 1883년 이후일 것으로 추정하였다.

우리나라 시·군·구 지역보건의료계획의 비전(Vision) 문구 분석 (Analysis of Vision Statements in 6th Community Health Plan of Local Government in Korea)

  • 안치영;김현수;김원빈;오창훈;홍지영;김은영;이무식
    • 농촌의학ㆍ지역보건
    • /
    • 제42권1호
    • /
    • pp.1-12
    • /
    • 2017
  • 지역보건의료계획서에서 비전은 각 지역의 보건의료계획을 나타내는 핵심요소임에도 불구하고 작성방법에 대한 구체적인 지침이 부재하여 각 지역의 비전은 매우 다양하게 표현되어 있다. 이에 이 연구에서는 제6기 지역보건의료계획에서 제시한 비전 문구를 보건소 유형별, 권역별로 분석하였다. 전국 229개 지역의 제6기 지역보건의료계획서의 비전 문구와 이와 관련된 미션, 전략체계도, 중장기 추진과제 등을 대상으로 하였다. 지역을 권역별 4개, 읍 면 동 구성에 따른 보건소 유형을 4개로 분류하였고, 각 지역 비전의 글자 수, 문장 평가, 단어 빈도, 문구 평가를 빈도분석과 카이제곱검정, 일원배치분산분석을 이용하여 분석하였다. 비전의 글자 수가 17자 이하인 보건소가 172개소(75.1%)였고, 보건소 유형별로 유의한 차이가 있었다(p<0.05). 문구에 대한 수사표현에서 비유법(37.1%)이, 한글 외에 표현 언어 사용에서는 특수문자(43.2%)가 많았으며, 보건소 유형별로 유의한 차이가 있었다(p<0.01). 비전에 사용된 단어들은 '건강', '행복', '함께', '군민' 또는 '시민', '도시', '100세' 등이었다. 문구 평가 점수에서는 특 광역시 및 수도권에서 가장 높았으며, 보건소 유형 및 권역별로 유의한 차이를 보였다(p<0.05). 보건소 유형별로 과정 및 평가 영역, 공유가능성 등에서 유의한 차이가 있었다(p<0.01). 방향성은 충청권, 수도권 순으로 권역별로 유의한 차이가 있었으며(p<0.01), 미래지향성 및 공유가능성은 영남권이 가장 높아 권역별로 유의한 차이가 있었다(p<0.01). 비전은 지역보건의료계획에 가장 중요 요소 중 하나이다. 이 연구는 지역사회 특성별로 비전의 설정이 다름을 확인하였으며, 이러한 결과를 통하여 지역보건의료계획 등 보건소 비전 수립시 참고가 될 수 있는 기초적인 자료가 될 것으로 판단된다.