• 제목/요약/키워드: Standard Korean Dictionary

검색결과 79건 처리시간 0.025초

나이브 베이즈 기반 소셜 미디어 상의 신조어 감성 판별 기법 (Sensitivity Identification Method for New Words of Social Media based on Naive Bayes Classification)

  • 김정인;박상진;김형주;최준호;김한일;김판구
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.51-59
    • /
    • 2020
  • 인터넷의 발달과 스마트폰의 보급으로 인하여 그에 따른 소셜 미디어 문화가 형성됨에 따라 PC통신부터 지금까지 소셜 미디어 신조어가 그 문화로 자리 잡아가고 있다. 소셜 미디어의 등장과 사람들의 가교역할을 해주는 스마트폰의 보급화로 신조어가 생기고 빈번하게 사용되고 있는 추세이다. 신조어의 사용은 다양한 문자 제한 메신저의 문제점을 해결하고 짧은 문장을 사용하여 데이터를 줄이는 등 많은 장점을 가지고 있다. 그러나 신조어에는 사전적인 의미가 없으므로 데이터 마이닝 기술이나 빅데이터와 같은 연구에서 사용되는 알고리즘의 성능 저하와 연구에 제약사항이 발생한다. 따라서 본 논문에서는 웹 크롤링을 통해 텍스트 데이터를 추출하고, 텍스트 마이닝과 오피니언 마이닝을 통해 의미부여 및 단어들에 대한 감정적 분류를 통한 문장의 오피니언 파악을 진행하고자 한다. 실험은 다음과 같이 3단계로 진행하였다. 첫째, 소셜 미디어에서 새로운 단어를 수집하여 수집된 단어는 긍정적이고 부정적인 학습을 받게 하였다. 둘째, 표준 문서를 사용하여 감정적 가치를 도출하고 검증하기 위해 TF-IDF를 사용하여 데이터의 감정적 가치를 측정하기 위해 명사 빈도수를 측정한다. 신조어와 마찬가지로 분류된 감정적 가치가 적용되어 감정이 표준 언어 문서로 분류되는지 확인하였다. 마지막으로, 새로 합성된 단어와 표준 감정적 가치의 조합을 사용하여 장비 기술의 비교분석을 수행하였다.

Development of Sensibility Vocabulary Classification System for Sensibility Evaluation of Visitors According to Forest Environment

  • Lee, Jeong-Do;Joung, Dawou;Hong, Sung-Jun;Kim, Da-Young;Park, Bum-Jin
    • 인간식물환경학회지
    • /
    • 제22권2호
    • /
    • pp.209-217
    • /
    • 2019
  • Generally human sensibility is expressed in a certain language. To discover the sensibility of visitors in relation to the forest environment, it is first necessary to determine their exact meanings. Furthermore, it is necessary to sort these terms according to their meanings based on an appropriate classification system. This study attempted to develop a classification system for forest sensibility vocabulary by extracting Korean words used by forest visitors to express their sensibilities in relation to the forest environment, and established the structure of the system to classify the accumulated vocabulary. For this purpose, we extracted forest sensibility words based on literature review of experiences reported in the past as well as interviews of forest visitors, and categorized the words by meanings using the Standard Korean Language Dictionary maintained by the National Institute of the Korean Language. Next, the classification system for these words was established with reference to the classification system for vocabulary in the Korean language examined in previous studies of Korean language and literature. As a result, 137 forest sensibility words were collected using a documentary survey, and we categorized these words into four types: emotion, sense, evaluation, and existence. Categorizing the collected forest sensibility words based on this Korean language classification system resulted in the extraction of 40 representative sensibility words. This experiment enabled us to determine from where our sensibilities that find expressions in the forest are derived, that is, from sight, hearing, smell, taste, or touch, along with various other aspects of how our human sensibilities are expressed such as whether the subject of a word is person-centered or object-centered. We believe that the results of this study can serve as foundational data about forest sensibility.

중간언어 문맥벡터의 정제를 통한 이중언어 사전 구축의 성능개선 (Enhancing Performance of Bilingual Lexicon Extraction through Refinement of Pivot-Context Vectors)

  • 권홍석;서형원;김재훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제41권7호
    • /
    • pp.492-500
    • /
    • 2014
  • 본 논문은 중간언어 기반 이중언어 사전 구축 방법에서 문맥벡터의 정제 방법을 제안한다. 중간언어 기반 이중언어 사전 구축 방법은 두 언어 간의 사전이나 병렬말뭉치 등 언어 자원이 부족한 언어쌍에 매우 효과적인 방법이다. 본 논문은 두 가지 정제 방법을 통해서 성능을 개선한다. 첫 번째 방법은 양방향 번역확률을 통하여 문맥벡터를 정제하였고 두 번째 방법은 품사 정보를 이용하여 문맥벡터를 정제하였다. 본 논문은 두 개의 서로 다른 언어 쌍으로 한국어-스페인어 그리고 한국어-프랑스어 양방향에 대해서 각각 이중언어 사전을 추출하는 실험을 하였다. 높은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 48.5%를, 상위 20에서 최대 88.5%의 정확도를 얻었고, 낮은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 26.5%를, 상위 20에서 최대 66.5%의 성능을 보였다.

전북 서해안권 국가지질공원 지질명소 안내 표지판에 사용된 용어 분석 (An Analyses of the Terms used in the Information Boards of Geosites at Jeonbuk West Coast National Geopark)

  • 신영준;조규성
    • 한국지구과학회지
    • /
    • 제41권1호
    • /
    • pp.40-47
    • /
    • 2020
  • 본 연구는 전북 서해안권 국가지질공원 지질명소의 안내 표지판에 기술된 용어를 분석하였다. 안내 표지판에 기술된 용어들 중 명사만을 추출하여 표준국어대사전, 지구과학 학술용어집, 2015개정 교육과정에 따른 교과용 도서 개발을 위한 편수 자료를 기준으로 등재 여부를 확인하여 8가지 유형으로 분류하였다. 추출된 용어 중 71개(10.8%)의 용어는 어느 용어집에도 등재되지 않은 [유형 8]에 해당하는 용어들이었다. 이 유형의 용어들은 대부분이 [명사]+[명사] 또는 [명사]+[접사]가 결합하여 파생된 합성어로 그 의미를 명확하게 해석하여 이해하기란 쉽지 않은 것으로 판단되었다. 또한 256개(46%)의 용어가 전문 분야에서 사용되는 전문 용어로 확인되었다. 따라서 국가지질공원 안내 표지판의 제작에 있어 일반인들과 학생들이 더 쉽게 읽고 이해할 수 있도록 전문 용어를 가급적 쉽게 풀어서 기술하고 전문 용어를 사용할 경우에는 용어에 대한 주석을 달아 부연 설명을 통해 충분한 교육적 효과를 얻을 수 있도록 해야 할 것이다.

10학년 과학 교과서 지구과학 용어 분석 (An Analysis of Earth Science Vocabularies Used in the 10th Grade Science Textbooks)

  • 최행임;이효녕;조현준
    • 한국지구과학회지
    • /
    • 제29권4호
    • /
    • pp.363-371
    • /
    • 2008
  • 이 연구의 목적은 10학년 과학 교과서의 지구과학 용어들을 SWA 프로그램을 통해 분석하여 그 중 학생들이 어려워하는 용어들을 알아보는데 있다. 연구 목적을 위해, 먼저 11종의 10학년 과학교과서에서 지구과학 용어들을 추출한 다음, 표준국어대사전을 기반으로 한 SWA 프로그램으로 과학 전문어와 비과학 전문어로 분류를 하였다. 분류된 과학전문어와 비과학 전문어에 대해 560명의 10학년 학생들에게 이해하기 어려운 용어를 선택하도록 하였다. 프로그램을 통해 어휘의 수를 분석한 결과, 교과서별로 다소 차이는 있지만, 등급 외의 과학 전문어 빈도가 모든 교과서에서 다른 등급에 비해 가장 높았다. 또한 학생들에게 설문한 결과, 어렵다고 하는 용어들의 대부분이 등급 외에 속해 있었다. 이 연구 결과를 통해, 교과서 집필 과정에서 학생들의 인지 수준을 고려해야 하며 어려운 용어는 과학적 의미의 변화가 없는 범위 내에서 쉬운 용어로 대체되어야 한다는 것을 제안하였다.

일본공업규격 "정보교환용한자부호" 에 포함된 일본한자에 대한 연구 (A Study on the Chinese Characters Originated in Japan in Japanes in Industrial Standard)

  • 이춘택
    • 한국문헌정보학회지
    • /
    • 제22권
    • /
    • pp.219-257
    • /
    • 1992
  • Among the Chinese Characters originated in Japan, some of them are very ancient in their origin and others come to exist as different forms by being used widely in forged books in Chinese. These Characters can be divided into three groups. First, the Chinese Characters whose forms are different. Most of these are 'hoiui' (회의)character, being made by imitating the forms of the original Chinese Letters. These characters do have meaning but not pronunciation. This is one distinct feature of Chinese Characters originated in Japan. Second, the Chinese Characters whose meaning has been assigned by the Japanese people. These letters can be grouped into two. One is the letters whose meanings are entirely different from original Chinese Characters, and the other is the letters whose meanings are not known although their pronunciations are known. It can be explained that the letters with different forms are made because of the ignorance of letter's existence. Or, the letters were made on purpose in ordoer to be used in different meanings. Third, the Characters with a partial modification of original Chinese Characters. Among the Characters in three groups above, pure Japanese-made Chinese Characters are those in group one and three since those in group two are Chinese Letters whose meanings (or pronunciation) only are Japanese. As a results of detailed investigation of pure Japanese-made Chinese Character in JIS X 0208-1990, the followings are discovered: 1. Pure Japanese-made Chinese Characters are 147 in numbers. 2. The Characters which were originally Chinese but now considered to be Japanese-made are 5 in numbers. Among these letters, 39 Characters are not listed in TaeHanHwaSaJon(Whose fame is well known as the authoritative dictionary of Chinese Characters), 47 Characters are not found in the dictionaries of Chinese Characters compiled in Korea. 3. 14 Characters seem to be Japanese-made Chinese Characters although it cannot be said so with accuracy because of various meanings found in several dictionaries of Chinese Characrters.

  • PDF

REDIS를 활용한 학급경영 웹 애플리케이션 프레임워크의 설계 (Design of Web Application Framework Using REDIS for Class Management)

  • 박준석;전석주
    • 정보교육학회논문지
    • /
    • 제18권3호
    • /
    • pp.381-390
    • /
    • 2014
  • 전통적인 학급경영시스템은 교사의 독단적인 의사에 의해 운영되는 경우가 일반적이다. 그러나 오늘날에는 자질을 갖춘 민주시민을 양성하기 위해 학생과 교사 모두 함께 자치 규범을 만들어 스스로 학급을 운영하도록 요구하고 있다. 그래서 기존의 학급 경영시스템은 이러한 다양성을 가진 오늘날의 학급에 더 이상 적합하지 않다. 본 연구에서는 REDIS를 활용한 학급경영 웹 어플리케이션 프레임워크를 설계한다. REDIS는 일종의 다양한 키 값을 저장하는 데이터 저장소인데 보통 공유 메모리를 가진 웹 어플리케이션을 개발하기 위한 솔루션을 제공한다. 개발될 웹 어플리케이션 프레임워크는 사용의 편의성과 접근성을 최대화하도록 설계되어진다. 이러한 학급경영시스템은 프레임워크에서 기본적으로 제공되는 다양한 템플릿 함수들을 사용하여 효과적으로 시스템의 확장성이 향상될 수 있다.

종속격 정보를 적용한 동사 의미 중의성 해소 (Verb Sense Disambiguation using Subordinating Case Information)

  • 박요셉;신준철;옥철영;박혁로
    • 정보처리학회논문지B
    • /
    • 제18B권4호
    • /
    • pp.241-248
    • /
    • 2011
  • 동형이의어는 여러 가지 의미를 가진 단어를 의미한다. 문장의 의미를 이해하기 위해서는 필수적으로 문장에 포함된 동형이의어의 의미를 결정해야 한다. 기존의 단어 의미 중의성 연구들은 공기 빈도를 기반으로 해결하였다. 하지만, 동사의 경우에는 정확도 향상을 위해서 격 정보가 중요하다. 왜냐하면, 동사 동형이의어의 의미는 행위의 주체나 객체에 따라 결정되어서 종속격(목적격, 부사격, 보격) 정보가 필요하며, 동사동형이의어 의미마다 서로 다른 격 정보가 필요하기 때문이다. 본 논문에서는 한국어 격 정보를 적용한 동사 의미 중의성 해소를 제안한다. 격정보는 표준국어대사전에 명시된 조사 정보를 이용하였다. 실험은 고빈도 동형이의어 12개를 대상으로 하였으며, 실험결과 정확도가 기존의 97.3%에서 98.7%로 1.34% 향상되었다. 이는 원래의 오류율을 2.7%에서 1.3%으로 절반정도 줄였다.

소셜 네트워크와 데이터 마이닝 기법을 활용한 학문 분야 중심 및 융합 키워드 추천 서비스 (Recommending Core and Connecting Keywords of Research Area Using Social Network and Data Mining Techniques)

  • 조인동;김남규
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.127-138
    • /
    • 2011
  • 대부분의 연구포털 사이트는 관심 분야의 논문을 획득하고자 하는 연구자를 대상으로 한 서비스를 주로 제공하고 있다. 하지만 이러한 서비스는 정확한 서지사항을 알고 있는 일부 사용자의 경우 손쉽게 이용할 수 있지만, 대부분의 이용자는 원하는 자료를 획득하기 위해 키워드 검색을 통한 반복적 시행착오를 겪게 된다. 특히 사용자가 익숙하지 않은 분야의 논문을 검색하는 경우에는, 찾고자 하는 논문의 적절한 키워드 자체를 알지 못하여 검색에 큰 어려움을 겪게 된다. 이러한 한계를 극복하기 위해 일부 연구포털 사이트에서는 온라인 쇼핑몰의 상품 추천에 주로 사용되어온 연관관계 분석 기반 키워드 추천 서비스를 채택하고 있다. 하지만 연관관계 분석에만 기반한 키워드 추천 방식은 두 키워드간의 단편적인 관계만을 알려줄 뿐, 해당 학술 분야와 관련된 전체 키워드 간의 복합적 연결 관계를 보여주기에는 한계가 있다. 따라서 본 논문에서는 연관관계 분석을 통해 빈발 출현 키워드 쌍을 추출하고 이를 근거로 전체 키워드 간 네트워크를 구축함으로써, 학술 분야별 중심 키워드 및 분야 간 융합을 위한 연계 키워드를 추천하기 위한 방법을 제시하고자 한다.

저출산·고령사회 대비 관점에서 중학교 기술·가정 교과서에 제시된 직업 내용 분석 (An Analysis Study on the Contents of Occupation in Technology & Home Economics Textbooks for Middle School : focusing on preparation for Low Birthrate & Aging Society)

  • 이수정
    • 직업교육연구
    • /
    • 제37권1호
    • /
    • pp.139-156
    • /
    • 2018
  • 저출산 고령사회에 대비하기 위해서는 중학교 시기부터 전생애적 관점에서 자신의 진로를 설계하여 미래를 준비할 수 있는 역량을 길러주는 것이 중요하다. 따라서 이 연구에서는 2009개정 교육과정에 따른 중학교 기술 가정 교과서 (1). (2)권 총 24종에 직업 내용이 제시되어 있는 양상을 분석하였다. 교과서에 제시된 직업의 종류는 한국표준직업분류(대분류)를 근거로 하여 유형별로 빈도(비율)를 분석하였고, 교과서 단원별, 자료유형별 직업내용 제시 경향을 함께 분석하여 직업내용을 다양한 관점에서 이해할 수 있는 기초 자료를 제공하였다. 연구 결과 중학교 기술 가정 교과서에 제시된 직업명은 한국직업사전 상 제시된 직업의 5.27% 수준의 정보를 제공하고 있으며, 특히 한국표준직업분류(대분류) 유형 중 '2.전문가 및 관련종사자'에 편중되어 있어 저출산 고령사회에 대비하여 학생들이 진로 설계를 하는데 필요한 직업과 관련된 정보를 제공하는 데는 한계가 있다. 그리고 교과서 별로 '가정생활' 대영역이 '기술의 세계'에 비해 상대적으로 높은 비율로 직업 내용을 제시하였는데, 출판사별, 대영역별, 단원별로 직업내용 제시의 빈도(비율)에 있어 큰 차이를 보이고 있었다. 향후 저출산 고령사회를 대비하는 관점에서 중학교 기술 가정 교과서는 중학생들이 모든 직업을 소중하게 생각하며 자신의 적성과 흥미를 고려하여 진로를 탐색하며 미래를 준비하는 역량을 향상시킬 수 있도록 다양한 직업 관련학습 기회를 제공할 필요가 있다.