• 제목/요약/키워드: 위키

검색결과 169건 처리시간 0.024초

소셜 미디어를 활용한 소셜 러닝 체제 연구 (A research for Social Learning method of using Social Media)

  • 장일수;홍명희
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2011년도 동계학술대회
    • /
    • pp.233-240
    • /
    • 2011
  • 소셜 미디어 (Social Media)는 사람들이 자신의 생각과 의견, 경험, 관점 등을 서로 공유하고 참여하기 위해 사용하는 개방화된 온라인 툴과 미디어 플랫폼으로서 소비와 생산의 일반적인 흐름이 동작하지 않으며, 양방향성을 활용하여 사람들이 참여하고 정보를 공유하며 사용자들이 만들어 나간다. 이런 소셜 미디어에는 블로그(Blog), 소셜 네트워킹서비스(Social Networking Service, SNS), 위키(Wiki), 손수제작물(UCC), 마이크로 블로그(Micro Blog) 5가지가 있다. 소셜 러닝은 넓게는 사람들이 소셜 미디어를 통해 서로 협업과 집단지성을 나누며 스스로 학습하는 것으로 좁게는 소셜 미디어를 통한 학습이라고 정의할 수 있다. 본 논문에서는 소셜 미디어와 Social Learning에 대해 자세히 알아보고 초등학교에서 어떻게 활용할 수 있는지 연구하였다.

  • PDF

한글 DBpedia 온톨로지 스키마 구축 (Building a Schema of the Korean DBpedia Ontology)

  • 강민서;김재성;김선동;이재길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.139-142
    • /
    • 2014
  • 시맨틱웹의 구현 도구로써 온톨로지가 있다. 온톨로지는 지식개념의 의미적 연결을 하는데 사용된다. 영어 위키피디아를 토대로 한 영어 DBpedia 온톨로지는 스키마(owl파일 형태)와 인스턴스 모두 잘 구축이 되어있다. 그리고 영어 DBpedia의 각 Class에 한글은 레이블의 형태로 달려있다. 하지만 한글 레이블을 가지고 있지 않은 영어 DBpedia의 Class들이 절반이 넘기 때문에 한글 Class들만으로 된 스키마 구축은 의미가 있다. 한글 Class들로 만들어진 스키마가 있다면 두 한글 온톨로지 사이의 클래스 매칭 알고리즘을 위한 실험이나 한글 온톨로지 자동 증강 알고리즘의 연구 등에 유용하게 쓰일 수 있을 것이다. 본 논문에서 구축한 한글 DBpedia 온톨로지 스키마는 영문 DBpedia 온톨로지의 계층구조와 한글 클래스와 영문 클래스 사이의 매핑정보를 바탕으로 구축되었다. 그리고 기존에 제공되는 한글 DBpedia 온톨로지 클래스의 영어매핑 정보가 있는 한글 프로퍼티와 영어매핑 정보가 없는 한글 프로퍼티를 모두 한글 클래스의 프로퍼티로 입력해주었다.

  • PDF

위키피디아를 이용한 영-한 개체명 대역어 쌍 구축 (Extracting English-Korean Named-Entity Word-pairs using Wikipedia)

  • 김은경;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.101-105
    • /
    • 2009
  • 본 논문은 공통적으로 이용할 수 있는 웹 환경에서의 한국어 정보로 획득할 수 있는 정보의 양이 영어권 정보의 양보다 상대적으로 적다는 것을 토대로, 웹정보 이용의 불균형을 해소하고자 하는 목적으로부터 출발하였다. 최근에는 지식 정보의 세계화, 국제화에 따라 동일한 정보를 각국 언어로 제공하고자하는 연구가 꾸준히 증가하고 있다. 온라인 백과사전인 위키피디아 역시 현재 다국어로 제공이 되고 있지만 한국어로 작성된 문서는 영어로 작성된 문서의 5% 미만인 것으로 조사되었다. 본 논문에서는 위키피디아 내에서 제공하는 다국어간의 링크 정보와 인포박스 데이터를 활용하여 위키피디아 문서 내에서 개체명을 인식하고, 자동으로 개체명의 영-한 대역어 쌍을 추출하는 것을 목표로 한다. 개체명은 일반 사전에 등재 되지 않은 경우가 많기 때문에, 기계번역에서 사전 데이터 등을 활용하여 개체명을 처리하는 것은 쉽지 않으며 일반적으로 음차표기 방식을 함께 사용하여 해결하고 있다. 본 논문을 통해 위키피디아 데이터를 활용해 만들어진 영-한 개체명 대역어 사전을 구축하기 위해 사용된 기술은 추후 위키피디아 문서를 기계번역하는데 있어 동일한 방법으로 사용이 가능하며, 구축된 사전 데이터는 추후 영-한 자동 음차표기 연구의 사전 데이터로도 활용이 가능하다.

  • PDF

RAMP를 활용한 EAC 기반 전거레코드의 연계 및 공유 관한 연구 - 박경리의 전거레코드를 중심으로 - (Linking and Sharing EAC Authority Records Using RAMP: Focusing on the Records of "Park, Kyung-ni")

  • 박지영
    • 한국기록관리학회지
    • /
    • 제14권2호
    • /
    • pp.61-82
    • /
    • 2014
  • 기록전거레코드는 이용자가 기록물에 접근하고, 기록물을 이해하는 것을 지원한다. 그런데 기록물의 생산자는 기록 외에 다른 출판물의 생산자이기도 하며, 이용자도 정보에 통합적으로 접근하기를 원한다. 게다가 기록전거레코드와 서지제어를 위한 전거레코드는 상이한 특성을 지니면서도 상호 연계가능한 공통점을 지니고 있다. 이에 본 연구에서는 기록전거레코드를 구축하거나 확장하는데 기존의 전거레코드를 반입하여 이용하고, 확장된 기록전거레코드를 다시 공유할 수 있도록 위키피디아와 같은 웹 환경에 반출하는 방안을 제안하였다. 그리고 시범적인 연계 및 공유결과를 바탕으로 도출된 시사점과 향후 과제를 제안하였다.

OntoCloud와 워드넷 연결 (Linking OntoCloud to WordNet)

  • 박광희;김은경;최동현;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.172-176
    • /
    • 2010
  • 본 논문에서는 위키피디아의 '틀(temp late)'을 기조로 하여 작성된 온톨로지인 OntoCloud의 신뢰도를 보장하고 공유 및 재사용을 가능하게 하기 위하여 또 다른 어휘집합체인 워드넷(WordNet)과의 매핑을 한다. 온톨로지 매핑 기술은 온톨로지 개발 기술의 한 방법으로, 서로 비슷한 도메인을 대상으로 이미 구축되어진 서로 다른 다수의 온롤로지를 연결시킴으로서 하나의 풍부한 정보를 가지고 있는 연결망을 구축하는 방법이다. 본 논문에서는 OntoCloud와 워드넷을 두개의 온톨로지로 정의하고 각 온톨로지의 개념에 대한 정의문 비교 방법을 통해서 두개의 온톨로지에 존재하는 유사한 개념을 연결한다. 이렇게 매핑된 정보들은 OntoCloud 개념을 워드넷 어휘로 연결함으로써 개념에 대한 직관적인 이해를 돕고, 워드넷에 연결된 다른 시소러스 (예: SUMO, CoreNet 등)와 간접적으로 연결할 수 있는 틀을 마련한다. 또한 온톨로지의 상하위 계층정보를 자동으로 보강하는 등의 OntoCloud 유지보수에 활용될 수 있다. 본 논문의 실험에서는 두개의 서로 다른 온톨로지의 정의문에 사용된 어휘의 겹침 정도로 두개의 개념의 유사성을 판별하는 방법을 보인다. 본 논문에서 제시한 방법으로 약 73%의 개념 매핑에 성공하였으나, 추후 매핑 프로세스의 전처리 과정(약자 처리 및 복합명사 대응 모듈)을 추가하고 온톨로지의 구조적 특성을 활용하여 유사 개념 자동 매핑 기술을 향상시키고자 한다.

  • PDF

KorBERT와 Popularity 정보에 기반한 한국어 개체연결 (Korean Entity Linking based on KorBERT and Popularity )

  • 허정;배경만;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.502-506
    • /
    • 2022
  • 본 논문에서는 KorBERT와 개체 인기정보(popularity)를 이용한 개체연결 기술을 소개한다. 멘션인식(mention detection)은 KorBERT를 이용한 토큰분류 문제로 학습하여 모델을 구성하였고, 개체 모호성해소(entity disambiguation)는 멘션 컨텍스트와 개체후보 컨텍스트 간의 의미적 연관성에 대한 KorBERT기반 이진분류 문제로 학습하여 모델을 구성하였다. 개체 인기정보는 위키피디아의 hyperlink, inlink, length 정보를 활용하였다. 멘션인식은 ETRI 개체명 인식기를 이용한 모델과 비교하였을 경우, ETRI 평가데이터에서는 F1 0.0312, 국립국어원 평가데이터에서는 F1 0.1106의 성능 개선이 있었다. 개체 모호성해소는 KorBERT 모델과 Popularity 모델을 혼용한 모델(hybrid)에서 가장 우수한 성능을 보였다. ETRI 평가데이터에서는 Hybrid 모델에서의 개체 모호성 해소의 성능이 Acc. 0.8911 이고, 국립국어원 평가데이터에서는 Acc. 0.793 이였다. 최종적으로 멘션인식 모델과 개체 모호성해소 모델을 통합한 개체연결 성능은 ETRI 평가데이터에서는 F1 0.7617 이고, 국립국어원 평가데이터에서는 F1 0.6784 였다.

  • PDF

LUKE 기반의 한국어 문서 검색 모델 (LUKE based Korean Dense Passage Retriever)

  • 고동률;김창완;김재은;박상현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.131-134
    • /
    • 2022
  • 자연어처리 분야 중 질의응답 태스크는 전통적으로 많은 연구가 이뤄지고 있는 분야이며, 최근 밀집 벡터를 사용한 리트리버(Dense Retriever)가 성공함에 따라 위키피디아와 같은 방대한 정보를 활용하여 답변하는 오픈 도메인 QA(Open-domain Question Answering) 연구가 활발하게 진행되고 있다. 대표적인 검색 모델인 DPR(Dense Passage Retriever)은 바이 인코더(Bi-encoder) 구조의 리트리버로서, BERT 모델 기반의 질의 인코더(Query Encoder) 및 문단 인코더(Passage Encoder)를 통해 임베딩한 벡터 간의 유사도를 비교하여 문서를 검색한다. 하지만, BERT와 같이 엔티티(Entity) 정보에 대해 추가적인 학습을 하지 않은 언어모델을 기반으로 한 리트리버는 엔티티 정보가 중요한 질문에 대한 답변 성능이 저조하다. 본 논문에서는 엔티티 중심의 질문에 대한 답변 성능 향상을 위해, 엔티티를 잘 이해할 수 있는 LUKE 모델 기반의 리트리버를 제안한다. KorQuAD 1.0 데이터셋을 활용하여 한국어 리트리버의 학습 데이터셋을 구축하고, 모델별 리트리버의 검색 성능을 비교하여 제안하는 방법의 성능 향상을 입증한다.

  • PDF

탄소중립적 데이터 센터 운영을 위한 LSTM기반 서버 관리 모델 (LSTM-based server management model for carbon-neutral data center operation)

  • 마상균;박재현;서영석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.487-490
    • /
    • 2022
  • 최근 데이터 활용이 중요해지고 있는 시대인 만큼 데이터센터의 중요도도 높아지고 있다. 하지만 데이터센터는 24시간 가동되는 막대한 전력을 소모하는 시설이기 때문에 환경적, 경제적 측면에서 문제가 되고 있다. 최근 딥러닝 기법들을 사용하여 데이터센터나 서버에서 사용되는 전력을 줄이거나, 트래픽을 예측하는 연구들이 다양한 관점에서 이루어지고 있다. 그러나 서버에서 처리되는 트래픽 데이터양은 변칙적이며 이는 서버를 관리하기 어렵게 만든다. 또한, 가변적으로 서버를 관리하는 기법에 대한 연구들이 여전히 많이 요구되어지고 있다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 시계열 데이터 예측에 강세를 보이는 장단기 기억 신경망(Long-Term Short Memory, LSTM)을 기반으로 한 가변적인 서버 관리 기법을 제안한다. 제안된 모델을 통해 현업환경에서 이전보다 안정적이고 효율적으로 서버를 관리할 수 있게 되며, 서버에서 사용되는 전력을 보다 효과적으로 줄일 수 있게 된다. 제안된 모델의 검증을 위해 위키 피디아(WikiPedia) 서버의 트래픽 데이터양을 수집한 뒤 실험을 수행하였다. 실험 결과 본 논문에서 제안된 모델이 유의미한 성능을 보이며, 서버 관리를 안정적이고 효율적으로 수행할 수 있음을 보여주었다.

KorQuAD 2.0: 웹문서 기계독해를 위한 한국어 질의응답 데이터셋 (KorQuAD 2.0: Korean QA Dataset for Web Document Machine Comprehension)

  • 김영민;임승영;이현정;박소윤;김명지
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-102
    • /
    • 2019
  • KorQuAD 2.0은 총 100,000+ 쌍으로 구성된 한국어 질의응답 데이터셋이다. 기존 질의응답 표준 데이터인 KorQuAD 1.0과의 차이점은 크게 세가지가 있는데 첫 번째는 주어지는 지문이 한두 문단이 아닌 위키백과 한 페이지 전체라는 점이다. 두 번째로 지문에 표와 리스트도 포함되어 있기 때문에 HTML tag로 구조화된 문서에 대한 이해가 필요하다. 마지막으로 답변이 단어 혹은 구의 단위뿐 아니라 문단, 표, 리스트 전체를 포괄하는 긴 영역이 될 수 있다. Baseline 모델로 구글이 오픈소스로 공개한 BERT Multilingual을 활용하여 실험한 결과 F1 스코어 46.0%의 성능을 확인하였다. 이는 사람의 F1 점수 85.7%에 비해 매우 낮은 점수로, 본 데이터가 도전적인 과제임을 알 수 있다. 본 데이터의 공개를 통해 평문에 국한되어 있던 질의응답의 대상을 다양한 길이와 형식을 가진 real world task로 확장하고자 한다.

  • PDF

유의어 사전 기반 환경기술 검색 시스템 설계 (Design of environmental technology search system using synonym dictionary)

  • ;;구영현;유성준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.582-586
    • /
    • 2020
  • 국가기후기술정보시스템은 국내 환경기술과 국외의 수요기술 정보를 제공하는 검색 시스템이다. 그러나 기존의 시스템은 유사한 뜻을 가진 단일 단어와 복수 단어들을 모두 식별하지 못하기에 유의어를 입력했을 경우 검색 결과가 다르다. 이런 문제점을 해결하기 위해 본 연구에서는 유의어 사전을 기반으로한 환경기술 검색 시스템을 제안한다. 이 시스템은 Word2vec 모델과 HDBSCAN(Hierarchical Density-Based Spatial Clustering of Application with Noise) 알고리즘을 이용해 유의어 사전을 구축한다. Word2vec 모델을 이용해 한국어와 영어 위키백과 코퍼스에 대해 형태소 분석을 진행한 후 단일 단어와 복수 단어를 포함한 단어를 추출하고 벡터화를 진행한다. 그 다음 HDBSCAN 알고리즘을 이용해 벡터화된 단어를 군집화 해주고 유의어를 추출한다. 기존의 Word2vec 모델이 모든 단어 간의 거리를 계산하고 유의어를 추출하는 과정과 대비하면 시간이 단축되는 역할을 한다. 추출한 유의어를 통합해 유의어 사전을 구축한다. 국가기후기술정보시스템에서 제공하는 국내외 기술정보, 기술정보 키워드와 구축한 유의어 사전을 Multi-filter를 제공하는 Elasticsearch에 적용해 최종적으로 유의어를 식별할 수 있는 환경기술 검색 시스템을 제안한다.

  • PDF