• 제목/요약/키워드: portal dictionary

검색결과 12건 처리시간 0.02초

과학용어에 대한 '포털 사전', '표준국어대사전', '과학교과서' 설명의 비교 분석 (Comparison of the Explanation Texts for Science Terminology in Portal Dictionary, Pyojun Korean Dictionary and Science Textbooks)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권1호
    • /
    • pp.1-8
    • /
    • 2017
  • 학생들의 과학 학습 및 일반 대중의 과학적 소양 함양 측면에서 과학용어에 대한 이해도는 매우 중요하다. 본 연구에서는 학교 교육을 통한 과학용어 교육 이외에 학생들이나 일반 대중이 직접 과학용어의 의미를 찾아보고 학습할 수 있는 보조 자료가 필요하다는 전제에서 출발하여, 학생이나 일반인들이 스스로 과학용어를 학습하기 위한 보조 자료들인 포털사전, 표준국어대사전, 과학교과서에서 과학용어를 설명하는 글의 텍스트적 특성이 학생들이 읽고 이해하기에 얼마나 용이한지, 그리고 실제 학생들은 어떻게 인식하고 있는지를 살펴보았다. 그 결과 포털사전이나 표준국어대사전에 비해 과학교과서가 상대적으로 학생들이 읽고 이해하기에 쉬운 자료로 나타나기는 했으나, 세 자료 모두 학생들의 수준에 비해 이독성이 낮은 편에 속하며 이독성을 높이기 위해 개선해야 할 사항이 있는 것으로 나타났다.

포털사이트의 사전과 학술정보 연계 검색 방안 연구 (A Study on Service Integration of Research Information and Dictionary in Portal Site)

  • 양창진
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.7-22
    • /
    • 2011
  • 포털사이트는 검색엔진을 넘어 사이버스페이스 자체를 의미할 정도로 개념과 영역이 확대되었다. 일반인들뿐만 아니라, 필요로 하는 학술정보가 서비스되기 때문에 연구자도 포털사이트를 많이 이용한다. 그동안 포털의 검색은 얼마나 많은 정보를 검색하게 해 줄 것인가 하는 양적인 면에 관심을 두었다. 그러나 최근에는 검색의 질에 보다 관심이 많아지고 있다. 이 논문은 포털이 제공하는 학술정보검색의 문제점을 분석하고, 비교적 신뢰성을 인정받는 사전 서비스와 학술정보를 연계함으로써 학술정보검색의 질을 향상하기 위한 시범적인 시도이다. 즉, 검증되고 압축적으로 정리된 사전의 표제어와 해당 표제어를 키워드로 하는 권위 있는 연구 성과를 연계시킴으로써, 사전을 검색할 때 주제어 관련 연구 성과까지 검색할 수 있게 하는 방안을 제시하고자 한다.

한글 음소 단위 딥러닝 모형을 이용한 감성분석 (Sentiment Analysis Using Deep Learning Model based on Phoneme-level Korean)

  • 이재준;권순범;안성만
    • 한국IT서비스학회지
    • /
    • 제17권1호
    • /
    • pp.79-89
    • /
    • 2018
  • Sentiment analysis is a technique of text mining that extracts feelings of the person who wrote the sentence like movie review. The preliminary researches of sentiment analysis identify sentiments by using the dictionary which contains negative and positive words collected in advance. As researches on deep learning are actively carried out, sentiment analysis using deep learning model with morpheme or word unit has been done. However, this model has disadvantages in that the word dictionary varies according to the domain and the number of morphemes or words gets relatively larger than that of phonemes. Therefore, the size of the dictionary becomes large and the complexity of the model increases accordingly. We construct a sentiment analysis model using recurrent neural network by dividing input data into phoneme-level which is smaller than morpheme-level. To verify the performance, we use 30,000 movie reviews from the Korean biggest portal, Naver. Morpheme-level sentiment analysis model is also implemented and compared. As a result, the phoneme-level sentiment analysis model is superior to that of the morpheme-level, and in particular, the phoneme-level model using LSTM performs better than that of using GRU model. It is expected that Korean text processing based on a phoneme-level model can be applied to various text mining and language models.

게임 도메인 웹 코퍼스를 이용한 감성사전 구축 및 평가 (Construction and Evaluation of a Sentiment Dictionary Using a Web Corpus Collected from Game Domain)

  • 정우영;배병철;조성현;강신진
    • 한국게임학회 논문지
    • /
    • 제18권5호
    • /
    • pp.113-122
    • /
    • 2018
  • 본 논문은 게임 도메인에서 웹 코퍼스를 이용하여 감성사전을 구축하는 방법과 구축한 감성사전의 평가 결과를 기술한다. 감성사전 구축을 위해 먼저 트위터 형태소 분석기를 이용해 국내 한 포털 사이트의 게임 관련 웹 문서를 기반으로 어휘를 수집하여 감성 사전 어휘 목록을 만들었고, 목록에 있는 단어들 중 동사와 형용사 품사의 단어들에 대해 감성 사전을 구축하였다. 구축된 감성 사전의 평가를 위해 영어 기반의 Senti-word Net(SWN)을 한글로 번역한 한국어 SWN을 이용하여 정밀도와 재현율 값을 계산하였다. 평가 결과 긍정과 부정 감성의 F-1 값에 대한 평균이 형용사의 경우 0.85, 동사에 대해 0.77을 각각 보여 주었다.

소셜 네트워크와 데이터 마이닝 기법을 활용한 학문 분야 중심 및 융합 키워드 추천 서비스 (Recommending Core and Connecting Keywords of Research Area Using Social Network and Data Mining Techniques)

  • 조인동;김남규
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.127-138
    • /
    • 2011
  • 대부분의 연구포털 사이트는 관심 분야의 논문을 획득하고자 하는 연구자를 대상으로 한 서비스를 주로 제공하고 있다. 하지만 이러한 서비스는 정확한 서지사항을 알고 있는 일부 사용자의 경우 손쉽게 이용할 수 있지만, 대부분의 이용자는 원하는 자료를 획득하기 위해 키워드 검색을 통한 반복적 시행착오를 겪게 된다. 특히 사용자가 익숙하지 않은 분야의 논문을 검색하는 경우에는, 찾고자 하는 논문의 적절한 키워드 자체를 알지 못하여 검색에 큰 어려움을 겪게 된다. 이러한 한계를 극복하기 위해 일부 연구포털 사이트에서는 온라인 쇼핑몰의 상품 추천에 주로 사용되어온 연관관계 분석 기반 키워드 추천 서비스를 채택하고 있다. 하지만 연관관계 분석에만 기반한 키워드 추천 방식은 두 키워드간의 단편적인 관계만을 알려줄 뿐, 해당 학술 분야와 관련된 전체 키워드 간의 복합적 연결 관계를 보여주기에는 한계가 있다. 따라서 본 논문에서는 연관관계 분석을 통해 빈발 출현 키워드 쌍을 추출하고 이를 근거로 전체 키워드 간 네트워크를 구축함으로써, 학술 분야별 중심 키워드 및 분야 간 융합을 위한 연계 키워드를 추천하기 위한 방법을 제시하고자 한다.

영화리뷰 감성 분석을 통한 평점 예측 연구 (Sentiment Analysis of movie review for predicting movie rating)

  • 조정태;최상현
    • 경영과정보연구
    • /
    • 제34권3호
    • /
    • pp.161-177
    • /
    • 2015
  • 인터넷 포털은 많은 양의 정보를 빠르고 쉽게 이용 할 수 있다는 특성 때문에 지속적으로 영향력이 커지고 있다. 웹 이용자들은 다양한 정보 습득, 네티즌 간의 정보 교환 등 다양한 목적을 위해 포털 사이트를 사용하고 있다. 문화콘텐츠 이용자들은 타인의 경험을 미리 알아보기 위해 포털 사이트에서 정보를 검색한 후 해당콘텐츠를 사용하고 개인적인 의견을 게시하기도 한다. 영화를 보고자 하는 이용자들은 관련 정보를 검색하고 얻는 과정에서 영화에 대한 다른 이용자들이 게시한 다양한 정보들을 접하게 된다. 영화 관련 포털사이트에서는 영화에 대한 제한된 글자수의 리뷰와 평점을 제공하는데 이와 같은 정보의 영향으로 영화에 대한 태도를 형성할 뿐 아니라, 영화 관람 여부를 결정하도록 만들 수 있다. 하지만 영화 리뷰는 사용자가 전체를 읽을 수 없기 때문에 일부 리뷰와 리뷰 개개의 평점보다는 전체 평점을 참고 하여 의사결정을 하는 정도가 대부분이다. 이처럼 전체 평점만을 참고하게 되면 편향적인 정보 습득으로 인하여 잘못된 판단을 할 수 있게 된다. 이러한 리뷰의 특성에도 불구하고 리뷰는 사용자의 의견을 풍부하게 드러내고 영화를 보지 않은 다른 이용자들의 선택에 영향을 미친다는 점에서 다양한 실용적 활용성을 갖는 데이터임은 분명하다. 본 연구에서는 리뷰 데이터를 활용하여 평점을 예측하기 위한 평점예측 연구를 수행하였다. 리뷰테이터를 형태소로 추출하고 형태소별로 극성값을 계산하여 리뷰에 대한 평점을 예측하는 모형으로서, 기존의 긍부정 값만을 근거로 하는 모형에 비해 정확도가 높아진 것을 확인하였다.

  • PDF

인터넷을 기반으로 하는 EDI 신조류 (A Study on the New Trends of EDI based Internet)

  • 조원길
    • 정보학연구
    • /
    • 제4권1호
    • /
    • pp.125-139
    • /
    • 2001
  • 전자상거래의 글로벌한 움직임과 관련하여 여전히 EDI는 전자상거래의 핵심요소로서 중요성을 더해 가고 있지만, 전세계를 하나로 연결하는 인터넷의 등장과 비즈니스 환경의 변화로 말미암아 그 역할과 구현방법에 새로운 변화가 일어나고 있다. 따라서 본 연구는 전자상거래 구현의 중심적인 역할을 하고 있는 기존의 EDI와 현재의 인터넷을 기반으로 하는 EDI까지의 새로운 EBI조류에 대하여 살펴보았다.

  • PDF

명사후문자열을 이용한 미등록어 인식 (Korean Unknown-noun Recognition using Strings Following Nouns in Words)

  • 박기탁;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제17권4호
    • /
    • pp.576-584
    • /
    • 2017
  • 사전에 등록되지 않은 미등록어는 형태소분석에서 뿐만 아니라 자연언어처리의 모든 분야에서 문제를 발생시킨다. 본 논문에서는 명사후문자열을 이용하여 미등록어를 인식하는 방법을 제안한다. 명사후문자열이란 명사를 포함하고 있는 어절에서 명사 뒤에 나오는 문자열을 의미하며, 조사, 접미사+조사, 동사화접미사+어미 등이 이에 속한다. 문서에 출현한 미등록어 포함 어절들을 모아 정렬한 다음, 동일한 앞부분을 가지는 어절이 두 개 이상일 경우에 한하여 미등록어 인식을 시도한다. 이 어절들에서 동일한 앞부분을 미등록 명사로, 그 다음 음절부터 끝 음절까지를 명사후문자열로 추정한다. 그리고 세종말뭉치에서 추출한 명사후문자열 정보를 이용하여 미등록 명사를 결정한다. 포털사이트 기사를 이용하여 실험한 결과, 2가지 형태 이상으로 출현한 미등록어에 대해 정확률 99.64%, 재현율 99.46%의 높은 인식 성능을 보였다.

텍스트마이닝 기법을 활용한 한국인의 행복과 불행 탐색연구 (An Exploratory Study of Happiness and Unhappiness Among Koreans based on Text Mining Techniques)

  • 박상현;도강혁;김학영;박가은;윤진혁;김경일
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.10-27
    • /
    • 2018
  • 본 연구에서는 텍스트 마이닝 분석을 통해 한국 사회에서 행복과 불행이 갖는 의미를 탐색하였다. 자료수집 및 분석을 위하여 온라인 뉴스 포털에서 Word2Vec과 TF-IDF 방법을 사용하여 '행복' 및 '불행' 키워드와 유사한 단어를 추출했다. 또한 K-LIWC 사전을 사용하여 행복 및 불행과 연관된 단어들의 감성 속성에 대해 알아보았다. TF-IDF 분석 결과, 행복과 불행은 사회적 요인과 해당 년도의 사회적 이슈들과 각각 높은 관련성이 있는 것으로 관찰됐다. Word2Vec 분석에서는 '희망'이 6년 연속으로 행복과 유사성이 높은 단어로 나타났다. K-LIWC 분석에서 '돈재정적이슈', '학교', '의사소통'은 행복 및 불행과 모두 관련성이 높았다. 그밖에 '몸 상태와 증상'이 불행과 높은 관련성이 있는 범주로 나타났다. 이러한 결과를 바탕으로 본 연구의 의의, 제한점 및 후속연구에 대한 필요성을 논의하였다.

한의학술논문 데이터베이스 구축을 위한 입력 및 검수 시스템 개발 (The Implementation of Database Building System for Korean Medical Paper Database)

  • 예상준;김익태;장윤지;성보석;장현철;김상균;김안나;송미영;김철
    • 한국한의학연구원논문집
    • /
    • 제18권3호
    • /
    • pp.141-146
    • /
    • 2012
  • Objectives : KIOM(Korean Institute of Oriental Medicine) built up korean medical paper database and services it through information portal OASIS. The database are updated about 1,600 papers and 48,000 references annually. Because lots of manpower and time are needed to update database, it is very important to raise up efficiency and quality of it. Methods : In this paper, we implemented web based database building system utilizing pre-built OASIS' database to improve the working process, data quality and ease of management. Results : First we designed and implemented web based system to input bibliography of the paper efficiently. It raised efficiency using OASIS' paper and reference database. Second we improved the refining process using web based system to raise up data quality. And third we developed the manager functions of web based system to control and check the working process. Conclusions : If we add korean medical dictionary and link outside paper database in the future, we hope that work efficiency and data quality will be raised more. And because the database schema of OASIS system and developed system are different, we are implementing the data transformation system.