• Title/Summary/Keyword: 웹뉴스

Search Result 170, Processing Time 0.032 seconds

Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization (Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별)

  • Lee, Changsu;Cheon, Juryong;Kim, Joogeun;Kim, Taeil;Kang, Inho
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.76-81
    • /
    • 2017
  • 외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

  • PDF

A Study on the Comparison Analysis of Travel Agencies using Social Big Data (소셜 빅 데이터를 이용한 여행사 비교 분석에 관한 연구)

  • Song, Eun-Jee;Kong, Hyou-Soon
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.05a
    • /
    • pp.771-772
    • /
    • 2015
  • 소셜미디어 상 고객들이 쏟아내는 말을 실시간으로 분석, 조사하는 방법으로 버즈 모니터링 이라는 시스템을 이용하여 웹상의 다양한 정보를 자동으로 검색하고 수집하고 있다. 본 논문에서는 여행사에 관해 소셜 미디어 상의 빅 데이터를 이용하여 보다 정확하고 효율적인 정보 수집과 분석이 가능하도록 하기위한 분석 모델을 제안하고 실제 국내 여행사에 관해 비교 분석한다. 먼저 여행사별 인지도,이미지와 선호도 분석을 하고 관광관련 상품과 서비스에 대한 분석과 함께 소비자 분석으로서 관광의 목적, 동행인 등 소비자의 생활패턴에 대한 분석을 한다. 또한 여행사 관련 영향력자 경향을 트위터 상에서 살펴본 결과 해당 여행사 이용경험자와 관련 뉴스를 제공하는 언론, 이벤트에 관심 있는 사용자들로 유형화 할 수 있었다.

  • PDF

Learning Bayesian Networks for Text Documents Classification (텍스트 문서 분류를 위한 베이지안망 학습)

  • 황규백;장병탁;김영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.262-264
    • /
    • 2000
  • 텍스트 문서 분류는 텍스트 형태로 주어진 문서를 종류별로 구분하는 작업으로 웹페이지 검색, 뉴스 그룹 검색, 메일 필터링 등이 분야에 응용될 수 있는 기반 작업이다. 지금까지 문서를 분류하는데는 k-NN, 신경망 등 여러 가지 기계학습 기법이 이용되어 왔다. 이 논문에서는 베이지안망을 이용해서 텍스트 문서 분류를 행한다. 베이지안망은 다수의 변수들간의 확률적 관계를 표현하는 그래프 모델로 DAG 형태인 망 구조와 각 노드에 연관된 지역확률분포로 구성된다. 그래프 모델을 사용할 경우 학습에 이용되는 각 속성들간의 관계를 사람이 알아보기 쉬운 형태로 학습할 수 있다는 장점이 있다. 실험 데이터로는 Reuters-21578 문서분류데이터를 이용했으며 베이안망의 성능은 나이브 베이즈 분류기와 비슷했다.

  • PDF

Content Recommendation Using High-Speed Association Rule Generation for Contextual Advertisement (고속연관규칙을 이용한 문맥광고에서의 콘텐츠 추천)

  • Kim, Sung-Ming;Lee, Seong-Jin;Lee, Soo-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.362-365
    • /
    • 2006
  • 인터넷 사용자가 급증함에 따라 온톨로지를 이용한 지능형 웹이나 인터넷 사용자에게 개인 맞춤형 서비스를 제공하기 위한 다양한 연구가 진행되고 있다. 대표적인 예로 문맥광고는 인터넷 사용자들이 뉴스나 커뮤니티 사이트에서 콘텐츠를 조회하고, 해당 콘텐츠와 일치하거나 관련성이 높은 제품 또는 서비스 정보를 제공하는 광고기법이다. 그러나 문맥 광고는 사용자에게 다양한 콘텐츠 및 사이트 추천 서비스를 제공하지 못하고 있다. 따라서 다양한 콘텐츠 및 사이트 추천 서비스를 제공하기 위해 본 논문에서는 사용자가 조회한 콘텐츠의 내용을 대표할 수 있는 중요 키워드를 선정하고, 콘텐츠 내에서 추출된 키워드간의 연관성을 분석하여 관련 콘텐츠 및 사이트를 추천하는 방법에 대해 제안한다. 또한 연관키워드리스트 생성방법을 고속연관규칙을 이용하여 처리속도를 줄이고, 사용자가 선호할 만한 다양한 콘텐츠와 관련된 사이트를 제공하는 방법에 대해 제안한다.

  • PDF

IABSE 홈페이지 소개

  • 황윤국
    • Computational Structural Engineering
    • /
    • v.12 no.1
    • /
    • pp.146-149
    • /
    • 1999
  • 본 학회의 Newsletter Vol. 11. No. 4의 "전산 구조 자료실"에서 소개한 인터넷을 이용한 "토목공학분야의 웹사이트(web site)"에 이어서 토목구조공학분야의 전문 웹사이트 중의 하나인 IABSE (International Association for Bridge and Structural Engineering)에 대해 간단히 소개하고자 한다. 먼저, 인터넷망을 이용하여 IABSE의 홈페이지를 찾기 위한 웹주소 즉, URL은 http://iabse.ethz.ch/iabse.html이고 홈페이지의 초기화면 구성은 그림 1과 같다. 그림에서 볼 수 이TSms 바와 같이 유럽을 중심으로 구성된 국제적인 학회인 특색 때문에 3개 언어로 학회명을 표기하고 있는점이 특이하게 느껴진다. 홈페이지에서 제시한 바와 같이 IABSE는 비영리 단체로서 구조공학분야의 관련 지식을 국제적으로 교류하고자 1929년 설립되어 70년 남짓의 오랜 역사를 가지고 있다. 현재 전세계에 걸쳐 약 101개국에서 4000여명 이상의 회원을 확보하고 있는 구조공학관련 국제 전문학회로서 사무국은 스위스의 취리히에 두고 있다. 우리 나라의 경우에는 아시아에서 일본, 인도, 중구에 이어 네 번째로 많은 회원을 보유한 국가이다. 홈페이지는 다음과 같은 7개의 항목으로 구성되어 있다. 뉴스와 정보교류(News-Info Exchange) IABSE의 소개(About IABSE) 학술회의(Conferences) 출판물(Publications) Structural Engineering International(국제 학회지) 회원(Membership-Directory) 유용한 연결 사이트(Links) 각 항목에 대하여 소개되고 있는 내용을 간략하게 살펴보면 다음과 같다.

  • PDF

Development of Marine Life Database (바다생물 데이터베이스 개발)

  • Yang, Ki-Sung;Choi, Seung-Chul;Kim, Hyun-Jung;Yun, Hong-Won
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.1077-1079
    • /
    • 2005
  • The development of marine life database is insufficient and information service through internet is short now. We collect and analysis data of marine life and develop the database and provide information about marine life through internet. Also internet shopping, news, leisure information are serviced.

  • PDF

English Corpus Construction Tool Based Using Cloud Services (클라우드 서비스를 이용한 영어 말뭉치 구축 도구)

  • Kim, Sung-Dong;Kim, Minwoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1122-1124
    • /
    • 2019
  • 본 논문에서는 영어 신문 사이트를 크롤링하여 뉴스 기사를 수집하여 영어 말뭉치를 구축하는 도구를 제안한다. 클라우드 서비스를 이용함으로써 장소와 시간에 구애받지 않고 말뭉치를 지속적으로 확장시킬 수 있을 뿐만 아니라 쉽게 구축된 말뭉치를 활용할 수 있다. 제안한 도구는 수집된 영어 신문 기사에 대한 통계 정보 즉, 문장 수, 단어 수 등을 제공한다. 웹 플랫폼에서 동작하므로 여러 명이 동시에 많은 데이터를 수집할 수 있다 수집된 데이터는 자연어 처리 및 기계학습 연구에 활용될 수 있다.

Trackback Spam Detection using Similarity Analysis by LSA (LSA 유사도 비교를 통한 트랙백 스팸 탐지)

  • Jun, Hyek-Su;Kim, Tae-Hwan;Choi, Joong-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.339-344
    • /
    • 2010
  • 오늘날 인터넷 사용자들은 블로그나 뉴스 등의 매체에서 트랙백을 사용해 자신의 의견을 보다 자유롭게 나타낸다. 그러나 이러한 자유로움을 악용해 트랙백 스팸을 유발하여 네트워크의 자원을 낭비하고 방문자들에게 잘못된 정보를 전달해 해당 포스트의 신뢰를 떨어뜨린다. 트랙백 스팸은 유명한 포스트와 연계하여 자신의 포스트로 사용자들을 유도하는 특징을 가지기 때문에 일반적인 웹 스팸을 탐지하는 기술을 적용하기 어렵다. 따라서 본 논문에서는 자신이 작성한 글이 다른 사람의 글과 관련이 있다고 생각하여 다른사람의 글에 자신의 글을 링크시키는 트랙백의 특성을 이용하여 원본 페이지와 트랙백 페이지 그리고 트랙백 페이지의 아웃링크 내용상의 유사도와 동시 출현(co-occurrence) 정보를 이용하여 트랙백 스팸을 처리하고자 한다.

  • PDF

Investigating the influence of personality traits and usage motivation on information seeking behavior of undergraduate students (성격 특성 및 동기에 따른 대학생의 정보탐색행위에 관한 연구)

  • Jang, Yoo-Ri;Kim, Hyun-Hee
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2013.08a
    • /
    • pp.167-170
    • /
    • 2013
  • 본 연구는 이용자의 개인적 특성인 성격특성과 이용동기에 따라 대학생의 온라인 정보탐색행위에서 어떤 유의미한 차이가 나타나는지 살펴봄을 목적으로 한다. 연구 방법은 설문지를 이용하였다. 인문사회과학 대학생 134명을 대상으로 KEPTI 에니어그램 성격유형검사 도구를 사용해 측정하고, 이용 동기는 학습동기, 취업동기, 생활동기, 뉴스동기의 4가지로 나누어 조사하고 정보 탐색 행위는 도서관 OPAC 및 인터넷 웹 자원 이용을 중심으로 살펴보았다.

  • PDF

Visualizer of Associated Word by Analyzing News Articles (신문 기사 분석을 통한 연관어 비주얼라이저)

  • Kim, Hyun-Jin;Moon, Sung-Young;Jeong, Yong-Gi;Lee, Jeong-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1189-1192
    • /
    • 2013
  • 신문기사 분석을 통한 연관어 비주얼라이저는 신문 기사의 단어를 추출하여 단어 간 연관도를 분석하여 다양한 그래프로 표현하는 시스템이다. 인터넷 신문사의 뉴스 기사들을 수집하고 형태소 분석을 통해 기사별로 단어의 출현 횟수를 데이터베이스에 저장하고 단어와 단어 간의 연관성을 분석한다. 단어 간 연관성을 측정하기 위한 기준으로 두 단어 간 동일기사에 존재여부, 동일날짜에 존재여부를 이용한다. 이 값을 바탕으로 웹 페이지 상에서 다양한 그래프로 상위 연관성을 가진 단어들을 표현한다. 표현 되는 그래프는 다양한 형태의 그래프로 단어와 단어사이에 연관성을 보다 쉽게 파악 할 수 있다.